Un anno Contro l’odio

Imgprogetto
  • Contro l’odio è un progetto di ricerca atto a studiare e comprendere il fenomeno dell’Hate Speech promosso da ACMOS, Università degli Studi di Torino1 e Università degli Studi di Bari2 e altre no profit italiane.

    La caratteristica principale del nostro lavoro è la raccolta e classificazione automatica dei tweet3 che contengono un incitamento all’odio. Infatti, ogni giorno raccogliamo tutti questi testi in lingua italiana e, successivamente, li filtriamo usando alcune parole chiave. Queste ci permettono di tenere solo i testi rivolti a tre categorie vulnerabili alle discriminazioni: rom, minoranze etniche e religiose. Dopo aver fatto ciò, un classificatore sviluppato per questo progetto distingue automaticamente i testi che contengono Hate Speech da quelli che non lo contengono. Infine, pubblichiamo sul nostro sito diverse visualizzazioni dei dati, aggiornate quotidianamente.

    • La mappa coropletica, ossia una mappa che presenta diverse sfumature di colore all’interno di confini geografici con l’intento di mostrare la proporzione di una variabile di interesse, nel nostro caso la quantità di hate speech su Twitter da utenti che scrivono dall’Italia e rivolti a minoranze etniche, religiose e rom
    • Il grafico ad area che permette di seguire l’andamento dell’Hate Speech giorno per giorno
    • La Liquid fill gauge, che presenta la percentuale d’odio in tutti i tweet in lingua italiana attraverso la rappresentazione di un calibro circolare e di un liquido al suo interno.
    • Il grafico delle parole più ricorrenti e dei termini che co-occorrono insieme ad esse

    I dati del primo anno di raccolta dei tweet con Hate Speech

    La raccolta dei dati è partita il 1 ottobre 2018. Da quel giorno al 30 settembre 2019 sono stati collezionati 7,9 milioni di tweet rivolti alle tre categorie vulnerabili. Secondo il classificatore, in media il 17,6% di questi testi contiene Hate Speech con una deviazione standard di 1,59. Ciò significa che non ci sono forti variazioni della quantità mensile di odio pubblicato su Twitter.

    Invece, il numero di testi collezionati mostra alcune differenze. Come possiamo osservare dal grafico, soltanto a ottobre e gennaio abbiamo raccolto e analizzato più di 1 milione di tweet, mentre Febbraio, con i suoi 28 giorni, è l’unico mese in cui i testi collezionati sono stati meno di 500.000. Infine, da marzo in poi sembra esserci una quantità costante di dati, che oscilla tra i 500 e i 700 mila testi

    Un’ultima caratteristica relativa ai dati è che non emergono chiaramente delle regioni o province da dove viene diffuso maggiormente l’Hate Speech, ma ciò è dovuto a un vincolo con cui tutte le persone che studiano questi dati devono confrontarsi: la scarsa quantità di tweet geolocalizzati.

    Odio di sottofondo ed eventi scatenanti: l’esempio della Seawatch 3

    Il primo aspetto che emerge da un anno di raccolta dati è che, se si considera il livello mensile, questi sono omogenei da un punto di vista delle percentuali di Hate Speech, mentre il flusso di tweet, dopo un picco iniziale, risulta stabile. Esiste quindi un odio di sottofondo, costante durante tutto l’arco dell’anno.

    Se però osserviamo l’andamento di un mese, ci accorgiamo che esistono importanti oscillazioni. Per esempio, prendiamo in esame il mese di giugno 2019, durante il quale c’è stato lo sbarco della Sea Watch 3.

    Il flusso di tweet pubblicati nel mese di giugno 2019.

    I dati dell’ISPI relativi a questo sbarco dicono che la nave è stata in mare per 18 giorni, dal 12 al 29 giugno. Eppure, abbiamo un picco di dati soltanto dal 25 giugno in poi: in 6 giorni, è stato pubblicato il 38,3% dei contenuti mensili che parlano delle categorie vulnerabili. D’altra parte, in questo lasso di tempo il livello di Hate Speech è stato del 12,5%, tre punti in meno rispetto alla media di giugno, che tocca il 16,3%.

    I dati relativi a questo evento ci permettono di formulare alcune ipotesi. La prima è che potrebbe essere necessario distinguere tra l’evento in sé e la sua narrazione mediatica. Infatti, per 13 giorni su 18 non si è parlato di questo argomento, che poi è esploso con forza soltanto alla fine del mese. La seconda riguarda il calo di Hate Speech. Forse ciò è accaduto perché molti utenti che solitamente non pubblicano contenuti su Twitter, hanno deciso di intervenire in difesa della ONG. Ciò sembra essere confermato dall’analisi dei tweet più ricondivisi durante quei giorni

    Un confronto tra lo sbarco della Sea Watch 3 e quello di Open Arms

    Lo sbarco della Open Arms, che invece è durato 20 giorni durante il mese di agosto, è speculare a quello della Sea Watch da un punto di vista dei flussi di dati.

    Il flusso di tweet pubblicati nel mese di agosto

    Infatti, c’è un picco che dura soltanto 5 giorni, dal 14 al 18 del mese, e che rappresenta il 39% dei contenuti di agosto rivolti alle categorie vulnerabili. Contrariamente ai fatti di giugno, c’è anche un forte aumento dell’Hate Speech. In particolare, si passa dal 9% di Hate Speech rivolti ai migranti il 13 agosto, al 27% del 15 agosto. In totale, in quei 5 giorni i testi che incitano all’odio superano il 22% contro una media mensile del 19,6%.

    Se osserviamo i tweet più ricondivisi per ogni giorno nel periodo 14-18 agosto, ci accorgiamo dell’assenza di contenuti a difesa della ONG.

    Conclusioni e prospettive di ricerca

    Questo primo anno di raccolta di dati sull’odio ci mostra che l’Hate Speech è una costante significativa. Per comprendere meglio il fenomeno è però necessario osservare cosa succede durante alcuni fatti di cronaca che hanno come protagonisti i membri appartenenti alle categorie vulnerabili alle discriminazioni. Dall’analisi dei due sbarchi di migranti emergono due aspetti rilevanti:

    • C’è uno scostamento tra l’evento in sé e la sua narrazione. Spesso i picchi di discussione si manifestano soltanto dopo diversi giorni di crisi diplomatica.
    • Nel dibattito, gli utenti favorevoli all’accoglienza e all’inclusione delle categorie vulnerabili non sembrano sempre presenti. Ciò potrebbe avere una ripercussione sulla quantità di odio diffusa online. Tuttavia, bisogna fare attenzione a non ridurre la questione a una mera quantità di tweet. Infatti, alcuni post di utenti di area riformista, come per esempio Laura Boldrini e Gad Lerner, hanno scatenato picchi d’odio anziché reazioni positive.

    Sembra quindi che per comprendere meglio l’Hate Speech sia necessario capire come questo si propaghi tra le comunità di utenti che partecipano al dibattito, focalizzandosi soprattutto sui più importanti fatti di cronaca che si verificano in Italia.


    1. Cristina Bosco, Viviana Patti, Giancarlo Ruffo, Arthur Capozzi, Mirko Lai
    2. Cataldo Musto, Marco Polignano, Giovanni Semeraro
    3. È stato scelto Twitter perché, a differenza di Facebook e altri social network, ha poche limitazioni per l’ottenimento di contenuti tramite API