- Oggetto:
- Oggetto:
ANALISI AUTOMATIZZATA DEL CONTENUTO (NON ATTIVO 2023-24)
- Oggetto:
AUTOMATED CONTENT ANALYSIS (INACTIVE 2023/24)
- Oggetto:
Anno accademico 2023/2024
- Codice attività didattica
- CPS0764
- Corso di studio
- Corso di laurea magistrale in Comunicazione pubblica e politica (Classe LM-59)
- Anno
- 2° anno
- Periodo
- Primo semestre
- Tipologia
- Affine o integrativo
- Crediti/Valenza
- 6
- SSD attività didattica
- SPS/04 - scienza politica
- Erogazione
- Tradizionale
- Lingua
- Italiano
- Frequenza
- Facoltativa
- Tipologia esame
- Prova pratica
- Tipologia unità didattica
- corso
- Prerequisiti
- Il corso è introduttivo e non assume conoscenze pregresse, però trattandosi di un corso pratico quello che faremo sarà molto più semplice per gli studenti che hanno già (1) conoscenze teoriche di concetti statistici base e (2) un minimo di esperienza in programmazione (meglio ancora se con R). Tuttavia l'obiettivo è quello di portare TUTTI, anche chi parte da zero, allo stesso (buon) livello di comprensione e capacità di applicazione degli argomenti trattati.
- Oggetto:
Sommario insegnamento
- Oggetto:
Avvisi
- Oggetto:
Obiettivi formativi
Questo corso si pone due obiettivi principali:
1) Dare agli studenti una panoramica delle tecniche più comuni di analisi automatizzata dei contenuti, in particolare contenuti testuali, compresa una comprensione base della loro logica e del loro funzionamento.
2) Fornire agli studenti alcuni strumenti pratici per applicarsi in tali tecniche utilizzando software open source e altre risorse gratuite.
This course has two main goals:
1) Provide the students an overview of the most common techniques for automated content analysis, in particular of textual data, together with a basic understanding of their logic and working.
2) Provide the students some practical tools to implement such techniques using open source software and other free resources.
- Oggetto:
Risultati dell'apprendimento attesi
Per la fine del corso gli studenti avranno una comprensione generale di cosa comporta fare analisi automatizzata dei contenuti, di quello che è e non è possibile possibile fare utilizzando queste tecniche, e di come implementarne alcune con il software R.
By the end of the course the students will have a general understanding of what it is to do automated content analysis, of what you can and can not do with such techniques, and how to implement some of them in R.
- Oggetto:
Programma
Il corso si occuperà principalmente dell'analisi di contenuti testuali, che all'oggi rappresentano la fonte più comunemente utilizzata di dati non strutturati presenti in rete. Dato che ci saranno 2 lezioni da 2 ore a settimana, il corso alternerà sessioni teoriche e pratiche.
Il programma, che potrà comunque essere aggiornato in corso d'opera in base al passo e alle esigenze degli studenti, è il seguente:
Settimana 1) 20-21/09
Lezione - Introduzione
Lab - Introduzione a R per quantitative text analysisSettimana 2) 27-28/09
Lezione - Text preprocessing: logica e avvertenze
Lab - Introduzione a R per quantitative text analysis & Text preprocessingSettimana 3) 04-05/10
Lezione - Sentiment analysis e dizionari
Lab - Sentiment analysis e dizionariSettimana 4) 11-12/10
Lezione - Scaling di testi & introduzione ai topic models
Lab - Scaling di testi & introduzione ai topic modelsSettimana 5) 18-19/10
Lezione - Topic models
Lab - Topic modelsSettimana 6) 25-26/10
Lezione - Classificazione di testi con machine learning
Lab - Classificazione di testi con machine learningSettimana 7) 02/11
Lab - Classificazione di testi con machine learning 2 (se necessario) OPPURE intro a web scrapingSettimana 8) 08-09/11
Lezione - Intro a word embeddings
Lab - Intro a word embeddingsSettimana 9) 15-16/11
Lezione - Intro a image recognition
Lab - Intro a image recognitionSettimana 10) 22/11
Ripasso- Oggetto:
Modalità di insegnamento
Il corso alternerà sessioni teoriche (lezione frontale con slide) a sessioni pratiche di laboratorio. Per queste ultime, è richiesto agli studenti di portare il proprio computer portatile a lezione. In caso questo non fosse possibile verranno comunque messi a disposizione materiali che renderanno possibile rifare a casa tutto quello che si è visto nelle sezioni di laboratorio.
- Oggetto:
Modalità di verifica dell'apprendimento
Trattandosi di un corso principalmente pratico, l'esame consisterà in un elborato finale da svolgere a casa, nel quale agli studenti verrà richiesto di implementare alcune tecniche imparate durante il corso.
Testi consigliati e bibliografia
- Oggetto:
Il corso non segue un libro di testo. Alcune letture di approfondimento (facoltative) potranno essere consigliate di volta in volta. Un paio di letture consigliate prima di iniziare sono:
- Grimmer J., Stewart B.M. (2013). "Text as Data: The Promise and Pitfalls of Automatic Content Analysis Methods for Political Texts". Political Analysis
- Welbers K., Van Atteveldt W., Benoit K. (2017). "Text Analysis in R". Communication Methods and Measures
- Registrazione
- Chiusa
- Apertura registrazione
- 01/09/2022 alle ore 00:00
- Chiusura registrazione
- 22/11/2022 alle ore 23:55
- Oggetto: