Indice
- Prefazione
- Introduzione
- PARTE PRIMA. QUESTIONI DI TEORIA E DI METODO
- 1 Prospettive di analisi e concetti generali
- 1.1 Che cos’è l’analisi automatica dei testi in una logica di tipo metrico
-
1.2 Definizioni e concetti generali
- 1.2.1. Idioma, contesto, situazione
- 1.2.2. Corpus, testo, frammento, sezione, chunk, concordanza
- 1.2.3. Occorrenza, parsing, parola, segmento
- 1.2.4. Lessico, dizionario, vocabolario, rango
- 1.2.5. Sulla definizione di parola: forma grafica, lessia, lemma
- 1.2.6. Altre nozioni di rilievo per l’analisi automatica dei testi
- 2 Tipi di corpora
- 2.1 Corpora per analisi specifiche
- 2.2 Corpora come risorse di riferimento
- 2.3 Problematiche generali del trattamento automatico di un corpus
- 3 Unità di analisi, dati e meta-dati
- 3.1 Le unità di contesto
- 3.2 Obiettivi di studio e scelta delle unità lessicali
- 3.3 Le unità di testo
- 3.4 Il trattamento del testo
- 3.5 Criteri per individuare le unità lessicali su cui intervenire
- 3.6 Meta-dati sulle unità lessicali e sulle unità testuali
- 3.7 Integrazione fra dati non strutturati e dati codificati
- 4 Tipi, livelli e fasi dell’analisi automatica dei testi
- 4.1 In cosa consiste l’analisi di tipo lessicale
- 4.2 Selezione di keywords nel vocabolario del corpus
- 4.3 Meta-informazioni delle unità di testo
- 4.4 In cosa consiste l’analisi di tipo testuale
- 4.5 Criteri per valorizzare, selezionare e categorizzare le unità di contesto
- 4.6 Meta-informazioni delle unità di contesto
- 4.7 Riepilogo sulle annotazioni di tipo lessicale e testuale
- 4.8 Le matrici dei dati per l’analisi del contenuto
- 5 Estrazione di informazione e costruzione di modelli
- 5.1 Definizioni e criteri per il recupero ed estrazione di informazioni
- 5.2 Query di tipo lessicale
- 5.3 Query di tipo testuale
- 5.4 Il processo di trasformazione di informazioni non strutturate in dati strutturati
- 5.5 Ricerca di entità complesse
- 5.6 Sui tipi di modelli e loro utilizzi
- 5.7 Modelli per la costruzione di risorse
- 5.8 Modelli per la rappresentazione del senso
- 6 Elementi di statistica testuale e text mining
- 6.1 Regolarità dei dati linguistici e altre misure lessicometriche
- 6.2 Sul concetto di frequenza delle parole
- 6.3 Un indice diacronico sul ciclo di vita delle parole
- 6.4 Misure di associazione fra parole e di distanza o similarità fra testi
- 6.5 Alcune tecniche di posizionamento o mapping multidimensionale
- 6.6 Soluzioni per il text mining
- PARTE SECONDA. RISORSE E STRUMENTI
- 7 Risorse statistico-linguistiche
- 7.1 Corpus di riferimento
- 7.2 Risorse linguistiche
- 7.3 Risorse statistiche
- 7.4 Liste di frequenza in forme flesse
- 7.5 Impieghi dei lessici e delle liste di frequenza
- 7.6 Come misurare il sentiment di un testo
- 8 Esperienze d’uso delle risorse: esempi di linguistica dei corpora
- 8.1 Quadro di riferimento in letteratura
- 8.2 Analisi di strutture a elementi variabili
- 8.3 Studio di una grammatica locale di locuzioni verbali
- 8.4 Tendenze diacroniche del linguaggio della stampa
- 9 Software: strumenti e logiche di studio
- 9.1 Software di Analisi Automatica dei Testi
- 9.2 Gli attrezzi fondamentali per l’analisi automatica dei testi
- 9.3 TaLTaC2: logica delle operazioni e fasi del trattamento
-
9.4 Strategie di analisi in TaLTaC2
- 9.4.1. Un’analisi di contenuto a scopo esplorativo
- 9.4.2. Ricercare e analizzare relazioni fra concetti
- 9.4.3. Costruire una risorsa linguistica mediante una grammatica locale
- 9.4.4. Individuare lessie complesse a partire da una lista di segmenti
- 9.4.5. Una categorizzazione automatica multi-classe di documenti
- PARTE TERZA. CASI DI STUDIO E APPLICAZIONI
- 10 Uno studio sul linguaggio della critica enogastronomica
- 10.1 Obiettivi e materiali
- 10.2 Una prima impronta: l’abbondanza di qualificazione
- 10.3 Le tipologie di sostantivi
- 10.4 Il linguaggio peculiare
- 10.5 Le specificità del gustare e degustare
- 10.6 Le parole discriminanti
-
10.7 Dal lessicale al testuale attraverso differenti analisi del contenuto
- 10.7.1. La qualità dei ristoranti nelle regioni italiane
- 10.7.2. Lo studio della tabella lessicale
- 10.7.3. La mappa dei ristoranti nello spazio delle parole rilevanti
- 10.7.4. Individuazione di tipologie della ristorazione
- 10.7.5. Dalla classificazione non supervisionata univoca alla categorizzazione supervisionata fuzzy
- 10.8 Una estensione dalle parole ai concetti: fra tradizione e innovazione
- 11 Ricerca e misura di entità e concetti sull’uso del tempo in un vasto corpus di diari individuali
- 11.1 Introduzione
- 11.2 Lo studio preliminare di alcune entità
- 11.3 Misurare il concetto del “parlare con qualcuno”
- 11.4 Sulle attività contemporanee
- 11.5 L’individuazione dei luoghi delle attività quotidiane
- 12 Modelli di senso nell’analisi del contenuto
- 12.1 Un’analisi degli scambi epistolari di emigrati
- 12.2 Una rassegna stampa sugli sbarchi di immigrati
- 12.3 Un’analisi di interviste sulla percezione della banca
- 13 Analisi sul linguaggio politico
- 13.1 Il lessico programmatico di governo
- 13.2 Le parole di Berlusconi
- 13.3 Alcuni tratti del linguaggio dei leader politici della prima e seconda Repubblica
- Riferimenti bibliografici