- Global Voices in Italiano - https://it.globalvoices.org -

Ecco come ho analizzato l'armata di troll del Cremlino

Categorie: Europa centrale & orientale, Russia, Ucraina, Citizen Media, Cyber-attivismo, Politica, Tecnologia, RuNet Echo
Profile pictures from a large network of pro-Kremlin Twitter accounts. Image by Lawrence Alexander.

Foto tratte da un network di account twitter sostenitori del Cremlino. Immagine di Lawrence Alexander.

Con l’aiuto di strumenti open-source, il ricercatore Lawrence Alexander ha raccolto e visualizzato i dati relativi a circa 20,500 account Twitter sostenitori del Cremlino, rivelando la massiccia estensione dei tentativi di manipolazione delle notizie su RuNet (l'internet in lingua russa, ndt). Nella prima parte di questa analisi, Lawrence spiega come ha fatto e quali risultati ha raggiunto.

In precedenza, RuNet Echo si era già occupato delle azioni dell’ “Armata di Troll” russa volte a diffondere nei social network e nei siti web di notizie una retorica favorevole al Cremlino. Twitter non fa eccezione, e diversi utenti hanno osservato che molti account hanno twittato dichiarazioni simili durante o in prossimità di fatti di cronaca o avvenimenti chiave. Questi account falsi, o “bot”, sempre più attivi con l’intervento russo in Ucraina, sono stati creati in modo da apparire come utenti veri, completi di avatar.

Ma le prove raccolte in quest'analisi di due parti, evidenziano il ruolo che tali account svolgono all'interno di un esteso programma di disinformazione. 

Alec Luhn [1], un giornalista statunitense che si occupa di Russia, ha osservato come poche ore dopo l’uccisione di Boris Nemtsov il 27 febbraio, un gruppo di account twitter stessero già tentando di influenzare l’esposizione dei fatti.

I bot diffondono storie sulla morte di Nemtsov come quella [secondo cui] lo avrebbero ucciso gli Ucraini… stava rubando una delle loro ragazze

Usando il programma open-source NodeXL [4], ho raccolto e inserito in un foglio di calcolo una lista completa di account che twittavano la stessa frase. A partire da questa lista, ho radunato e importato nel documento una estesa comunità di utenti twitter, composta dagli amici e follower di ciascun account. Si trattava di un test interessante: qualora gli insulti contro Nemtsov non fossero altro che un caso isolato di diffusione di pettegolezzi, probabilmente non avrebbero coinvolto che poche decine di utenti.

Ma non appena il programma ha terminato di processare i dati, le dimensioni reali del network sono apparse evidenti: ben 2,900 account. Questa cifra è probabilmente comprensibile: affinché un account falso risulti credibile, necessita di molti followers, il che a sua volta richiede altri bot che li supportino. 

Successivamente ho usato Gephi [5], un altro strumento gratuito di analisi di dati, per visualizzarli in un grafico che rispecchiasse le relazioni tra i vari elementi. I cerchi colorati – chiamati Nodi – rappresentano gli account twitter, mentre le linee di intersezione – detti Bordi – indicano le connessioni di Follow/Follower tra gli account. Gli account sono raccolti in gruppi codificati per colore, basati sull'algoritmo Modularity, che rileva gruppi strettamente interconnessi tra loro. La grandezza di ciascun nodo è basata sul numero di connessioni che un account ha con gli altri nel network.

Extended network of 2,900 bots taken from Nemtsov thread sample.

L'esteso network di 2,900 bot, ricavato dal thread su Nemtsov. Immagine di Lawrence Alexander.

Osservando come sono densi e vicini gli uni agli altri i nodi nel grafico, è chiaro che si tratta di un network ampio e altamente interconnesso. La maggior parte dei bot si seguono l’un l’altro, accrescendo i follower reciproci. Ai margini vi sono alcuni cerchi che segnalano gli account meno connessi, il che potrebbe forse indicare che il network del bot era ancora in fase di crescita quando è stato rilevato: lo si potrebbe pensare come un albero, con rami che spingono verso l’esterno.

Ma la domanda cruciale in questa analisi è: com'è possibile esser sicuri che il network consista principalmente di bot e non di persone vere e proprie?

NodeXL non raccoglie semplicemente informazioni su chi segue chi. Questo software acquisisce anche metadata, ovvero i dettagli disponibili pubblicamente su ciascun account twitter e le sue azioni. Qui vediamo che tra i 2,900 account che compongono il network, l’87% dei profili non ha indicato il fuso orario e il 92% non ha selezionato nessun tweet come “preferito”. Invece è possibile notare, prendendo un campione casuale di 11,282 utenti di Twitter (basato su account che hanno twittato la parola “e”) che solo il 51% non ha fuso orario e – dettaglio significativo – solo il 15% non ha indicato preferiti (entrambe le caratteristiche possono venire classificate come comportamento ”umano”).

Per aggiungere altri elementi al confronto, sotto è presentato un grafico raffigurante le relazioni tra utenti appartenenti al network di controllo, dove gli utenti twitter erano stati selezionati in modo casuale. A differenza della visualizzazione sulle connessioni tra bot, questo network ha molti gruppi che non sono connessi tra di loro e risultano quindi isolati: gruppi di utenti Twitter che non sono connessi gli uni agli altri – un fatto del tutto normale in un gruppo casuale di utenti.

Le condivisioni della parola “e” risultano in raggruppamenti sconnessi e isolati nel campione casuale di utenti twitter. Immagine di Lawrence Alexander.

Dopo aver scoperto con l’utilizzo di una sola fonte l’esistenza di un network di tali dimensioni, ho deciso di proseguire nella mia ricerca sui bot. Digitando su Twitter frasi come “Bot del Cremlino”, “Trolls pro-Russia” e “le marionette di Putin”, ho trovato diversi utenti che hanno condiviso uno screenshot con attività presumibilmente riconducibili a bot. Alcuni hanno anche usato l’hashtag  #Botdelcremlino (#Кремлеботы) per segnalare tali contributi.

Utilizzando lo stesso metodo adoperato per i tweet anti-Nemtsov, ho raccolto dei network di account sulla base dell’uso di alcune frasi chiave che rivelavano la presenza di comunità più ampie o, in alcuni casi, solo una lista di utenti apparsi sulla schermata. Questi network sono stati divisi in gruppi chiamati A, B, C e D. (Nella seconda parte dell’analisi spiegherò i motivi di questi raggruppamenti).

@PressRuissa [6] è un account parodia (ora sospeso), che prende in giro i media pro-Russia, un misto di satira e commenti su disinformazione e faziosità. Uno dei suoi tweet si è rivelato la fonte per la definizione del network del Gruppo A:

Gli utenti di Twitter russi rivelano che “Novaya Gazeta nasconde l'attività dei suoi bot” sorprendentemente all'unisono

Il Gruppo B è stato creato sulla base di sospetti account di bot, le cui azioni sembravano accordarsi a quelle dei campioni precedenti. Alcuni sono stati identificati dalla loro tendenza a passare dal russo all’inglese con il messaggio di errore “RSS in modalità offline”, probabilmente per via di un problema nel loro software di controllo.

Per le risorse rimanenti, un tweet di Devin Ackles [11], analista per il think tank CASE Ukraine, ha offerto le basi per il Gruppo C.

I bot pro-Russia sono sulla difensiva dopo l'attacco a Mariupol

Infine, Vitaliy Moroz [15] di Internews Ukraine, ha condiviso uno screenshot di account bot che hanno costituito il campione per il Gruppo D

I bot russi hanno diffuso il messaggio di guerra: “Credo che la Grande Guerra comincerà!”

Tutti i quattro gruppi sono stati uniti in un singolo set di dati, portando ad un totale di 17,590 account di Twitter. Come nel caso dei tweet anti-Nemtsov, i metadati anche in questo caso hanno confermato che la maggioranza degli account sono bot. Il 93% non mostrava una locazione del profilo, il 96% non mostrava informazioni sul fuso orario e il 97% non aveva salvato nessun preferito.

Inoltre, nonostante una produzione media di 2,830 tweet, gli account non avevano quasi mai interagito con altri utenti twitter tramite risposte o menzioni.

 Reply and Mention Network

I bots inviano tweet, ma non interagiscono. Immagine di Lawrence Alexander.

Stranamente, molti dei bot sono stati nominati con nomi apparentemente occidentali come barnardgrant, terancebarnaby, terencecoward e duncanstarks.

Ma ancor più sorprendente è il risultato raggiunto quando ho visualizzato le relazioni di follower del gruppo di bot. Anche se i campioni sono stati presi da quattro fonti distinte, il network composto dai diversi gruppi è apparso essere fortemente  interconnesso.

Network of Combined Bot Groups

Tutti i 17,590 account relativi alle quattro fonti. Notate le forti interconnessioni e l'assenza di raggruppamenti isolati. Immagine di Lawrence Alexander.

Questo contrasta in maniera evidente con il campione di controllo: l’ultimo set di dati non mostra nessun gruppo isolato o eccezione. Ciò supporta l’idea che i bot siano stati creati da un’entità singola — e le prove puntano chiaramente verso Mosca.

Nel mio prossimo post mi occuperò della tempistica nella creazione di questi bot, indagando su come è correlata agli avvenimenti politici in Russia e in Ucraina.