Vai al contenuto principale
Coronavirus: aggiornamenti per la comunità universitaria / Coronavirus: updates for UniTo Community
Oggetto:

ANALISI AUTOMATIZZATA DEL CONTENUTO

Oggetto:

AUTOMATED CONTENT ANALYSIS

Oggetto:

Anno accademico 2022/2023

Codice attività didattica
CPS0764
Docente
Federico Vegetti (Titolare dell'insegnamento)
Corso di studio
Corso di laurea magistrale in Comunicazione pubblica e politica (Classe LM-59)
Anno
2° anno
Periodo
Primo semestre
Tipologia
Affine o integrativo
Crediti/Valenza
6
SSD attività didattica
SPS/04 - scienza politica
Erogazione
Tradizionale
Lingua
Italiano
Frequenza
Facoltativa
Tipologia esame
Prova pratica
Prerequisiti
Il corso è introduttivo e non assume conoscenze pregresse, però trattandosi di un corso pratico quello che faremo sarà molto più semplice per gli studenti che hanno già (1) conoscenze teoriche di concetti statistici base e (2) un minimo di esperienza in programmazione (meglio ancora se con R). Tuttavia l'obiettivo è quello di portare TUTTI, anche chi parte da zero, allo stesso (buon) livello di comprensione e capacità di applicazione degli argomenti trattati.
Oggetto:

Sommario insegnamento

Oggetto:

Obiettivi formativi

Questo corso si pone due obiettivi principali:

1) Dare agli studenti una panoramica delle tecniche più comuni di analisi automatizzata dei contenuti, in particolare contenuti testuali, compresa una comprensione base della loro logica e del loro funzionamento.

2) Fornire agli studenti alcuni strumenti pratici per applicarsi in tali tecniche utilizzando software open source e altre risorse gratuite.

 

This course has two main goals:

1) Provide the students an overview of the most common techniques for automated content analysis, in particular of textual data, together with a basic understanding of their logic and working.

2) Provide the students some practical tools to implement such techniques using open source software and other free resources.

Oggetto:

Risultati dell'apprendimento attesi

Per la fine del corso gli studenti avranno una comprensione generale di cosa comporta fare analisi automatizzata dei contenuti, di quello che è e non è possibile possibile fare utilizzando queste tecniche, e di come implementarne alcune con il software R.

 

By the end of the course the students will have a general understanding of what it is to do automated content analysis, of what you can and can not do with such techniques, and how to implement some of them in R.

Oggetto:

Programma

Il corso si occuperà principalmente dell'analisi di contenuti testuali, che all'oggi rappresentano la fonte più comunemente utilizzata di dati non strutturati presenti in rete. Dato che ci saranno 2 lezioni da 2 ore a settimana, il corso alternerà sessioni teoriche e pratiche.

Il programma, che potrà comunque essere aggiornato in corso d'opera in base al passo e alle esigenze degli studenti, è il seguente:

Settimana 1) 20-21/09
Lezione - Introduzione
Lab - Introduzione a R per quantitative text analysis

Settimana 2) 27-28/09
Lezione - Text preprocessing: logica e avvertenze
Lab - Introduzione a R per quantitative text analysis & Text preprocessing

Settimana 3) 04-05/10
Lezione - Sentiment analysis e dizionari
Lab - Sentiment analysis e dizionari

Settimana 4) 11-12/10
Lezione - Scaling di testi & introduzione ai topic models
Lab - Scaling di testi & introduzione ai topic models

Settimana 5) 18-19/10
Lezione - Topic models
Lab - Topic models

Settimana 6) 25-26/10
Lezione - Classificazione di testi con machine learning
Lab - Classificazione di testi con machine learning 

Settimana 7) 02/11
Lab - Classificazione di testi con machine learning 2 (se necessario) OPPURE intro a web scraping

Settimana 8) 08-09/11
Lezione - Intro a word embeddings
Lab - Intro a word embeddings

Settimana 9) 15-16/11
Lezione - Intro a image recognition
Lab - Intro a image recognition

Settimana 10) 22/11
Ripasso

 

 

Oggetto:

Modalità di insegnamento

Il corso alternerà sessioni teoriche (lezione frontale con slide) a sessioni pratiche di laboratorio. Per queste ultime, è richiesto agli studenti di portare il proprio computer portatile a lezione. In caso questo non fosse possibile verranno comunque messi a disposizione materiali che renderanno possibile rifare a casa tutto quello che si è visto nelle sezioni di laboratorio.

 

Oggetto:

Modalità di verifica dell'apprendimento

Trattandosi di un corso principalmente pratico, l'esame consisterà in un elborato finale da svolgere a casa, nel quale agli studenti verrà richiesto di implementare alcune tecniche imparate durante il corso.

 

 

Testi consigliati e bibliografia

Oggetto:

Il corso non segue un libro di testo. Alcune letture di approfondimento (facoltative) potranno essere consigliate di volta in volta. Un paio di letture consigliate prima di iniziare sono:

- Grimmer J., Stewart B.M. (2013). "Text as Data: The Promise and Pitfalls of Automatic Content Analysis Methods for Political Texts". Political Analysis

- Welbers K., Van Atteveldt W., Benoit K. (2017). "Text Analysis in R". Communication Methods and Measures



Registrazione
  • Aperta
    Apertura registrazione
    01/09/2022 alle ore 00:00
    Chiusura registrazione
    22/11/2022 alle ore 23:55
    Oggetto:
    Ultimo aggiornamento: 17/09/2022 18:28
    Non cliccare qui!