Community detection: chi parla su Twitter di migranti, religione e rom?

Imgprogetto
  • Le persone manifestano alcuni comportamenti sociali riscontrabili sia nel mondo reale, sia online. Alcuni esempi sono l’aggregazione in comunità, l’omofilia, ossia la tendenza a relazionarsi con persone considerate simili e le camere d’eco.

    Su Twitter, le relazioni tra utenti si sviluppano attraverso due strumenti costitutivi del social network. Il primo è la reply, cioè la pubblicazione di un tweet in risposta a un altro utente; il secondo è il retweet, ovvero la ricondivisione di un contenuto, spesso considerato come un endorsement.

    Il lavoro che presentiamo in questo articolo ha come obiettivo l’individuazione delle principali comunità di utenti Twitter che ritwittano contenuti su rom, minoranze etniche e religiose.

    La ricerca: dati, metodologia e visualizzazione

    Teminologia degli elementi di una comunità (community detection)
    Sezione di una visualizzazione di comunità di utenti

    I dati usati per la ricerca sono tutti quelli raccolti dal progetto Contro l’odio tra gennaio e giugno del 2019. In questo lasso di tempo abbiamo preso in considerazione tutti gli utenti che hanno o sono stati ritwittati almeno una volta. Gli utenti sono stati clusterizzati utilizzando l’algoritmo di Luvain1

    Come si può osservare dall’immagine, ogni utente è un nodo della rete, collegato ad altri utenti da uno o più link. Il valore in-degree corrisponde al numero totale di link entranti verso un nodo. In altre parole, la quantità di retweet ricevuti da un utente.

    L’assortativity è un valore compreso tra -1 e 1. Più questa è vicina a 1, maggiore è la tendenza degli utenti a ritwittare altri utenti con in-degree simili. Al contrario, se il valore è vicino a -1 significa che gli utenti ricondividono tweet di utenti con un maggiore in-degree.

    Ad ogni comunità individuata è associato un colore specifico, che permette di osservarne la struttura a un livello più generale. Per ognuno dei sei mesi analizzati sono stati elaborati una visualizzazione e un set di metriche.

    Le principali comunità di utenti

    Le reti analizzate sono composte in media da 53.150 nodi e 237.293 link. Sono tre le comunità principali di utenti, che insieme raccolgono il 76% degli utenti e il 80,5 dei retweet.
    La prima comunità, rappresentata con il colore verde, è quella con il maggior numero di nodi. La rossa, invece, è caratterizzata da un alto numero di link. Infine, la gialla è quella con l’assortativity più bassa, ossia sembra che ci sia una piccola frazione di utenti molto popolari (in-degree molto alto) i cui tweet sono riproposti da una larga maggioranza di utenti ‘normali’. In particolare sembra che ci siano due nodi, Matteo Salvini e Giorgia Meloni (anche se in alcuni casi è presente solo il primo) che ricevono un grande numero di retweet da parte di utenti che ricondividono solo i loro contenuti.

    comunità_1
    (verde)
    comunità_2
    (rossa)
    comunità_3
    (gialla)
    numero medio di nodi
    (percentuale)
    0.460.200.10
    numero medio di link
    (percentuale)
    0.330.450.27
    assortativity media-0.17-0.24-0.35

    Comunità e utenti

    Anche l’osservazione dei nodi i cui tweet sono molto popolari ci permette di far emergere differenze significative tra di esse. Infatti, soltanto la comunità gialla ha un’unica persona con sempre il più alto in-degree (retweet ricevuti): Matteo Salvini.

    Quella rossa invece ha, come utenti principali, giornalisti e blogger di area sovranista: Francesca Totolo, Claudio Perconte, Cesare Sacchetti e Giancarlo De Risi.

    Infine, la comunità verde è quella che presenta la più alta variazione, perché al suo vertice si alternano politici, giornalisti e utenti comuni, tutti apparentemente facenti parte di un’area più riformista e liberale.

    utente con più
    retweet della
    comunità_1
    (verde)
    utente con più
    retweet della
    comunità_2
    (rossa)
    utente con più
    retweet della
    comunità_3
    (gialla)
    gennaiogadlernertweetClaudioPercontematteosalvinimi
    febbraiojacopo_iacobonifrancescatotolomatteosalvinimi
    marzolauraboldriniGiancarloDeRisimatteosalvinimi
    aprileSegreLilianaCesareSacchettimatteosalvinimi
    maggioMarco_dreamsfrancescatotolomatteosalvinimi
    giugnoAnnaLeonardi1francescatotolomatteosalvinimi

    Spunti conclusivi

    Da questa prima analisi emergono quindi alcuni spunti interessanti:
    – La comunità verde è la più numerosa, ma non produce una quantità di link (retweet) altrettanto significativa. Inoltre, non sembra avere degli utenti che vengono stabilmente ritwittati dagli altri membri della rete.
    – La comunità rossa è invece caratterizzata dalle molte ricondivisioni di tweet e da un gruppo di giornalisti, blogger e influencer sovranisti in grado di diffondere in maniera capillare i loro contenuti
    – La comunità gialla, infine, è molto piccola sia in termini di nodi sia di link, ma è altamente organizzata. La bassa assortativity può fare ipotizzare che sia in gran parte costruita attorno a due utenti: Matteo Salvini e, seppur in misura minore, Giorgia Meloni.


    1. Uno degli algoritmi più famosi per l’individuazione automatica di comunità (o cluster) in una rete complessa è il cosidetto “metodo di Louvain [1], che prende il nome dall’università belga dove esso è stato inventato. È considerato uno degli algoritmi più efficienti per identificare parti della rete con un’alta densità di link (o collegamenti, o link, o connessioni) al suo interno rispetto alle connessioni con altre comunità della rete. L’algoritmo è efficiente perché propone un’approssimazione rispetto alla soluzione perfetta, la cui individuazione è considerata non calcolabile su reti molto grandi. Diverse esecuzioni del metodo, pertanto, possono produrre delle soluzioni leggermente diverse tra di loro. Tali analisi, quindi, sono sottoposte in genere a meccanismi di validazione quantitativa che ne valutano la significatività effettiva.
      [1] Blondel, Vincent D; Guillaume, Jean-Loup; Lambiotte, Renaud; Lefebvre, Etienne (9 October 2008). “Fast unfolding of communities in large networks”. Journal of Statistical Mechanics: Theory and Experiment. 2008 (10). doi:10.1088/1742-5468/2008/10/P10008