La storia

Privacy e Google, cosa succede quando le informazioni sono false: il caso Kirchner

La vicepresidente dell’Argentina Cristina Kirchner ha chiesto al tribunale una perizia informatica dopo che a maggio, sulla sua scheda biografica su Google, sono comparsi termini offensivi. L’analisi della storia permette di capire come sta cambiando il rapporto tra privacy e motori. Ecco in che modo e come tutelarsi

Pubblicato il 04 Set 2020

Paolo Dal Checco

Consulente Informatico Forense

“Ladrona” invece di “vicepresidente” della nazione Argentina. Questo compariva nella scheda informativa della politica Cristina Kirchner su Google a maggio, a chiunque cercasse il suo nome. L’accaduto è stato trattato dai media all’epoca ma nessuno l’ha approfondito abbastanza per coglierne alcuni significati ulteriori.

Rivelatori del nuovo rapporto che si sta stabilendo tra privacy e motore di ricerca. Anche perché non è la prima volta che Google viene tirato in ballo in merito a informazioni che compaiono nella pagina di ricerca, ritenute diffamatorie, errate o contro la Privacy. In Italia, tutti ricorderanno il famosissimo caso Vivi Down Vs. Google o il più recente episodio emerso dopo la scomparsa del Garante Europeo della Privacy Giovanni Buttarelli, quando qualcuno ha notato che sul motore di ricerca comparivano le cause della morte del Garante che però non erano mai state rese pubbliche.

Proprio in Argentina, qualche anno fa è successo alla modella Maria Belén Rodriguez, che ha citato in Giudizio Google perché il suo nome risultava legato a siti pornografici nei risultati delle ricerche. La modella ha perso la causa, ma ha aperto una questione che per anni a venire è stata spesso oggetto di discussione. Cristina Kirchner tramite un tweet il 6 agosto 2020 ha comunicato al mondo di aver richiesto al tribunale una perizia informatica per acquisire prove contro Google per la pubblicazione di informazioni offensive.

Indice degli argomenti

La denuncia di Cristina Fernández de Kirchner

Le schede informative dei personaggi pubblici saltano subito all’occhio e danno l’idea di “ufficialità”, dato che Google le mostra immediatamente prima dei risultati della ricerca quasi fossero una sorta di biografia ufficiale del soggetto cercato. Chiaramente questo evento ha mandato su tutte le furie la Vice Presidente che ha minacciato su Twitter di aver dato mandato per una perizia informatica contro Google, aggiungendo che “quando le menzogne e la diffamazione sono lanciate da piattaforme di massa, la loro circolazione non conosce confini, non può esser arginata e il danno che fanno al calunniato è incalcolabile”. La Kirchner precisa ancora che “l’azione legale mira anche a sollevare una questione complessa e profonda, tipica dei tempi moderni: c’è qualche difesa per le vittime di questo tipo di azioni perpetrate da giganti come Google?”.

Prestando attenzione alle immagini della scheda informativa che compariva dopo il 17 maggio 2020 cercando il nome della vicepresidente, si nota un particolare: Google cita la fonte delle informazioni che riporta e che provengono, come spesso accade, da Wikipedia. Google in sostanza copia pedestremente la definizione di Wikipedia, riorganizzandola un minimo in modo che occupi soltanto la prima parte della pagina di ricerca, così da dare una risposta agli utenti senza bisogno che questi vadano oltre con la loro indagine. Per Google questo è un aspetto importante, perché mantiene il visitatore sulla pagina di ricerca senza che questo la abbandoni e ne esca cliccando sui link d’interesse. La cosa paradossale è che Wikipedia, proprio a causa di questo fenomeno – che ricorda una sorta di “scraping” o “cloaking”, entrambe pratiche che Google osteggia se fatte dagli utenti – perde ogni minuto una buona quantità di visitatori che, ottenuta la risposta alla loro ricerca direttamente sulla pagina di Google, evitano di cliccare e visitare la pagina completa di Wikipedia. Il problema è che se la pagina di Wikipedia riportata da Google contiene degli errori – volontari o meno – Google li ripropone conferendo ulteriore autorità al testo ed è proprio ciò che è successo con la Vice Presidente: Google ha riportato una parte della pagina di Wikipedia di Cristina Kirchner in lingua spagnola, copiandone anche la definizione artificiosamente modificata.

Il meccanismo

Si tratta quindi di una “reazione a catena”: qualcuno modifica la definizione di Wikipedia inserendo frasi diffamatorie, Google la riprende e la ripropone pedestremente sul motore di ricerca, i visitatori che cercano il nome trovano il testo e lo prendono per buono, senza sapere che tutto deriva da una modifica artificiosa a monte. Abbiamo provato ad approfondire tecnicamente la questione e sono emersi particolari interessanti. Partiamo dal presupposto che le pagine di Wikipedia sono sì modificabili da chiunque, ma mantengono lo storico di ogni singola modifica: è quindi possibile risalire al testo della voce enciclopedica così come è stato ripreso da Google e mostrato al pubblico il 17 maggio.

Per ritornare al passato, scorriamo lo storico delle modifiche occorse alla pagina in lingua spagnola relativa a Cristina Fernández de Kirchner e notiamo innanzitutto che la infobox a destra contiene la definizione corretta di “Vicepresidente de la Nación Argentina”: come è stato possibile che Google abbia invece prelevato e mostrato ai visitatori un testo diverso? La spiegazione non risiede nella pagina Wikipedia o in sue eventuali modifiche, bensì nelle definizioni multilingua relative al ruolo del soggetto descritto, prelevate non dal testo indicato nella voce enciclopedica bensì su una risorsa esterna ospitata presso l’archivio Wikimedia, chiamata “elemento Wikidata”. In sostanza, chi ha fatto la modifica, non ha agito direttamente sulla pagina, bensì su un elemento che viene ripreso dalla pagina per essere inserito nella definizione enciclopedica con supporto multilingua. Nel caso della voce oggetto di analisi, le definizioni sono contenute in un cosiddetto “item” avente codice identificativo Q2914766, che descrive proprio le definizioni legate al ruolo di “Vice Presidente dell’Argentina”, cui attingono le varie pagine di Wikipedia nelle diverse lingue per mostrare una descrizione strutturata della voce enciclopedica.

La definizione che ha subito il defacement – se così possiamo definirlo – è visibile pubblicamente, come è visibile pubblicamente anche il momento preciso in cui è avvenuta la modifica, che non si è verificata il 17 maggio 2020, bensì qualche giorno prima, il 13 maggio, come si può osservare dalla comparazione tra la versione precedente e quella successiva all’affronto. Il componente della voce enciclopedica è rimasto così, con “Ladrona de la Nación Argentina” soltanto nell’etichetta spagnola (le restanti etichette sono rimaste inalterate) fino al 17 maggio, quando la Vice Presidente si è accorta della problematica (ripresa da Google e pubblicata nella pagina dei risultati di ricerca) e deve aver richiesto a qualcuno di ripristinare la corretta definizione. Prima che la Vice Presidente si accorgesse della diffamazione, quindi, la voce Wikipedia è rimasta per quattro giorni alterata, fino a che Google non ha amplificato l’effetto della – se così possiamo definirla – “piccola” modifica fatta da un utente anonimo scatenando le opportune reazioni da parte di chi ha tentato poi di porvi rimedio.

La risposta di Google

Vista l’importanza della situazione, la risposta di Google ai tweet della Vice Presidente dell’Argentina non si è fatta attendere. La società di Mountain View ha commentato in un breve comunicato come non risultano avviati procedimenti legali relativamente al caso sollevato su Twitter dalla Kirchner aggiungendo che in ogni caso “hanno dedicato tutta l’attenzione per risolvere prontamente, così come per gli altri casi relativi a personaggi politici”. Dal punto di vista tecnico, non è necessaria in realtà alcuna perizia informatica: Google ha precisato che la scheda informativa viene generata in modo automatico, prelevando informazioni da diverse fonti sul web, confermando quindi come qualunque testo ivi riportato non venga né vagliato né tantomeno approvato dal motore di ricerca, che si limita invece semplicemente a copiarne il contenuto da altre fonti più o meno attendibili.

In sostanza, Google si è quindi smarcata, dicendo di non avere responsabilità sul testo che si limita a copiare, dimostrandosi comunque pronta a correggere o inibire eventuali elementi diffamatori, così come è avvenuto anche in passato in altri casi non poi molto dissimili.

L’effetto Streisand

Come spesso accade, un singolo episodio negativo che viene tamponato e pubblicamente condannato, può diventare la scintilla per ampliare in modo esponenziale la notizia e scatenare episodi di emulazione, squadrismo, bullismo e squatting al punto da rendere difficile se non impossibile arginare definitivamente il fenomeno. Una sorta di “effetto Streisand”, ben noto agli esperti di comunicazione e web reputation, che anche questa volta non si è fatto attendere e ha scatenato una reazione che tarda ad attenuarsi. Da quando la Kirchner ha reso pubblica la sua intenzione di citare in Giudizio Google con una perizia informatica, è infatti possibile osservare una rincorsa continua tra chi ha tentato di ripristinare la definizione diffamatoria – rendendola ulteriormente sconveniente e andando ad agire anche, questa volta, nel testo della voce – e gli esperti di reputazione online che hanno cercato di ripristinare lo stato corretto della pagina, delle definizioni e persino delle immagini.

Scorrendo l’elenco delle revisioni dell’elemento “Vice Presidente dell’Argentina”, troviamo ogni qualche giorno modifiche contenenti insulti e atti di vandalismo che vengono più o meno prontamente annullati ma lasciano, in ogni caso, la loro storia all’interno delle revisioni di Wikipedia. Quando gli attaccanti sembrano essersi stancati e aver fatto pausa per qualche giorno, prontamente riprendono le modifiche con nuova e rinnovata energia, contando anche sul fatto che probabilmente si tratta di diverse persone e non di una soltanto.

Come rimediare

I contesti sui quali lavorare per ridurre questo tipo di problemi sono sostanzialmente due e riguardano i due veri protagonisti della storia: Google e Wikipedia. Da un lato, Google potrebbe fare più attenzione ai dati che riporta nella sua pagina e che preleva da siti come Wikipedia, proprio per il fatto che questi dati possono essere alterati dagli utenti ma resi da Google quasi “istituzionali” con la pubblicazione. Dall’altro, Wikimedia Foundation potrebbe – e lo sta facendo da anni, in realtà – tentare di limitare il defacement delle voci enciclopediche, gestendo al meglio i privilegi sulle utenze, i controlli sulle pagine, i filtri sugli indirizzi IP. La Fondazione vuole che gli utenti siano liberi di aggiungere o migliorare definizioni, secondo il principio dell’enciclopedia libera, limitando però quelli che invece le definizioni le intendono danneggiare. Il compromesso è difficile da raggiungere: esistono già blocchi su indirizzi IP anonimi, punizioni per gli utenti, controlli incrociati, pagine che diventano “osservati speciali” il tutto finalizzato a impedire o quanto meno prontamente rilevare attività negative.

Ad esempio, nel caso specifico, oltre alle continue attività di ripristino e pulizia svolte da numerosi utenti Wikipedia sulla voce enciclopedica della Vice Presidente, il 18 maggio 2020 un utente Wikipedia ha persino attivato una protezione sulla pagina, motivandola con “eccessivo vandalismo”, per evitare che gli attaccanti continuassero con il defacement. In sostanza, ha impostato un vincolo di “allow only autoconfirmed users” che fa sì che soltanto utenti con uno storico di almeno quattro giorni e dieci modifiche siano autorizzati a lavorare sulla pagina. Chiaramente, utenti con account validi e utilizzati difficilmente si metterebbero a vandalizzare pagine, in primo luogo perché avrebbero maggior probabilità di essere identificati, in secondo luogo perché probabilmente sono utenti che hanno dedicato tempo a Wikipedia, facendo crescere il loro account. Un vandalo, tipicamente non ha il tempo di registrare e dar vita a un profilo “legit”, talvolta fa prima a rubarlo (deve però essere un minimo esperto) oppure prova a registrarne uno nuovo con dati falsi, sperando di poterlo utilizzare fin da subito per i suoi fini illeciti, venendo quindi però tagliato fuori dal meccanismo di protezione sugli autoconfirmed users che limita gli account appena creati o comunque poco utilizzati.

Il problema è che questi vincoli di protezione hanno una durata di alcuni giorni o settimane, un tempo spesso sufficiente per placare gli animi e sperare che gli attaccanti siano passati a fare danni altrove. Nel caso della voce enciclopedica della Kirkner, purtroppo, terminato il vincolo di protezione durato un paio di settimane, gli attacchi sono ripresi come e più di prima. Molto spesso, piuttosto che rimediare, è meglio monitorare lo stato della reputazione online dei soggetti, tramite tecniche di web reputation, OSINT, alerting, così da reagire subito e prontamente a eventuali attacchi.

La ricerca dei colpevoli

Fortunatamente, Wikipedia mantiene non soltanto l’elenco delle singole modifiche (chiamate “revisioni”) applicate dagli utenti alle voci enciclopediche e ai relativi elementi, ma anche le informazioni circa gli indirizzi IP da cui sono state applicate tali modifiche. Quando l’utente che ha eseguito le modifiche alla voce non è registrato, l’indirizzo IP da cui era connesso viene reso pubblico, altrimenti compare il suo username. Analizzando tramite banali strumenti di Osint i vari indirizzi IP dai quali sono state inserite le modifiche diffamatorie, emerge un aspetto interessante: si tratta d’indirizzi IP apparentemente non anonimizzati, non provenienti cioè da tradizionali VPN o dalla rete anonima Tor. Uno dei motivi può essere il fatto che Wikipedia impedisce le modifiche alle voci se l’utente è connesso in modo anonimo, proprio per evitare – guarda caso – situazioni come quella occorsa alla Kirchner. Per poter “imbrattare” una voce, quindi, gli utenti devono in qualche modo rendersi riconoscibili a Wikipedia, registrandosi oppure utilizzando indirizzi IP “normali”, cioè non anonimi.

Questo fa sì che gli utenti si trovino costretti a uscire da Tor, scollegare la VPN e utilizzare il loro indirizzo IP (oppure collegarsi a qualche rete aperta nelle vicinanze) e così è avvenuto anche per i danneggiamenti alla pagina della Vice Presidente. La cosa interessante è che gli indirizzi IP visibili pubblicamente da cui sono partiti gli attacchi sono tutti localizzati in Argentina, a indicare che chi sta insistendo con i continui defacement è presumibilmente posizionato nello Stato del quale la persona diffamata è Vice Presidente. Osserviamo così, partendo dalle ultime modifiche diffamatorie, indirizzi IP di Tartagal, Cordoba, Esperanza fino ad arrivare al primo defacement dell’elemento Wikimedia, eseguita il 13 maggio 2020 da un indirizzo IPV6 geolocalizzato a Burzaco, Buenos Aires.

Dal punto di vista dell’identificazione dei colpevoli, quindi, probabilmente una perizia informatica come richiesto dalla Kirchner avrebbe anche senso, non tanto però nei confronti di Google né di Wikimedia Foundation, quanto invece nei termini di una richiesta da parte dell’Autorità o Polizia Giudiziaria ai provider di connettività i cui indirizzi IP risultano aver eseguito le modifiche diffamatorie sugli elementi Wikipedia dal 13 maggio 2020 a oggi, per tentare quantomeno di tracciarne gli autori.