- Questo evento è passato.
Distant reading
28 Gennaio 2019 @ 16:00 - 18:00
Il corso rientra nell’ambito dell’iniziativa “didattica sperimentale su strumenti digitali, mini-corsi 2019” del LabCD.
28 gennaio,
1, 6, 8 febbraio 2019
Il corso si propone di introdurre strumenti per l’analisi automatica del linguaggio naturale e per la rappresentazione dell’informazione in esso contenuta. In particolare, il corso si articolerà intorno a due macro-temi affrontati da una duplice prospettiva, teorica e applicativa: l’estrazione di conoscenza linguistica da collezioni di documenti (corpora) e l’analisi del contenuto semantico-lessicale. Durante il corso lo studente userà per lo più software disponibili online per risolvere diversi task legati all’analisi del linguaggio, partendo dall’annotazione linguistica multi-livello (morfo-sintattica e sintattica) fino a strumenti di semantica distribuzionale, named entity recognition, term extraction e topic modeling per la modellazione dei contenuti semantici. Verranno affrontati gli aspetti metodologici relativi all’analisi stilistica e loro applicazione nella valutazione di complessità linguistica. Infine, saranno mostrate due piattaforme di visualizzazione e navigazione delle informazioni linguistiche estratte legate a due diversi contesti applicativi; i documenti della Pubblica Amministrazione e testi del periodo della Grande Guerra.
Docenti: Lucia Passaro, Giulia Venturi
Lucia Passaro. È assegnista di ricerca presso il Dipartimento di Filologia, Letteratura e Linguistica. Laurea in Informatica Umanistica, laurea magistrale in Business Informatics, Dottorato di ricerca Ingegneria dell’Informazione. I suoi interessi di ricerca riguardano: Emotion Detection, Sentiment Analysis, Opinion Mining e Information Extraction.
Giulia Venturi. Assegnista di ricerca presso l’Istituto di Linguistica Computazionale “A. Zampolli” del CNR, laurea specialistica in Lingua e Letteratura Italiana, dottorato in Studi Umanistici (indirizzo di Linguistica) presso l’Università di Torino. Ha partecipato a progetti europei e nazionali nell’ambito della Linguistica Computazionale e in particolare si occupa di estrazione di informazione linguistica e extra-linguistica da testi in domini specifici, come il dominio legale, in ambito educativo e in ambito storico.