Ecco “FLoC”: ovvero come Google controllerà il web fingendo di tutelare la privacy - Agenda Digitale

La fine dei cookie?

Ecco “FLoC”: ovvero come Google controllerà il web fingendo di tutelare la privacy

Sulla carta, la tecnologia FLoC dovrebbe essere la soluzione in grado di mettere d’accordo i sostenitori della privacy e gli interessi economici dietro alla pubblicità personalizzata. Ma sarà davvero così?

08 Mar 2021
Riccardo Berti

avvocato Centro Studi Processo Telematico

Franco Zumerle

Avvocato Coordinatore Commissione Informatica Ordine Avv. Verona

google

Google spinge sull’acceleratore per la tecnologia che, secondo il colosso di Mountain View, un giorno sostituirà i cookie, mettendo d’accordo privacy e personalizzazione dell’advertisement.

Questa tecnologia si chiama FLoC (Federated Learning of Cohorts) e non è che una API (Application Programming Interface) che verrà implementata in Google Chrome (dapprima come estensione e quindi, progressivamente, come elemento presente di default sul browser di casa Google e su altri browser concorrenti che volessero unirsi all’esperimento).

Il concetto chiave di queste FLoC è l’individuazione di serie di utenti con interessi comuni, ovvero le “cohorts” (che non sono che le “coorti”, suddivisione militare che ci è familiare anche grazie al nostro inno nazionale, ma che hanno un preciso significato in statistica, indicando i soggetti accomunati da eventi, interessi o circostanze).

Google senza cookie? Ma per la privacy bisogna restituire controllo agli utenti

L’idea di Google è semplice: rinunciare all’ultimo livello di targettizzazione degli annunci, per evitare problemi privacy, e mettere a disposizione degli inserzionisti queste “coorti” anonime di utenti che hanno determinati interessi e che quindi potrebbero essere i candidati ideali alla visione dei loro spot.

A ben guardare, però, le cose sono diverse da come ci vengono raccontate e le ombre del sistema sono parecchie.

L’algoritmo SimHash

L’implementazione tecnica (il cui fulcro è l’efficiente riunione di utenti in gruppi divisi per interessi di acquisto) passa per un raffinato meccanismo di machine learning che, secondo Google, mantiene l’efficienza delle inserzioni al 95% rispetto a quella ottenuta con profilazione personale.

Un tassello importante di FLoC è l’algoritmo SimHash, ovvero il sistema che Google utilizza già oggi per individuare con i suoi crawler le pagine web duplicate (così da penalizzare il posizionamento nel suo motore di ricerca di quella duplicata e successiva).

Questo stesso algoritmo dovrebbe esaminare il nostro traffico web degli ultimi sette giorni e creare (e in seguito aggiornare) un “profilo” che risiede sul nostro dispositivo (come un unico grande cookie) ed è poi oggetto di un nuovo processo che consente di unire il nostro profilo ad altri soggetti così da creare la coorte o le coorti in cui siamo inseriti.

Google, in questo modo, non conosce la nostra esperienza di navigazione (che rimane residente sui nostri dispositivi) e non vende il nostro “FLoC ID” individuale agli inserzionisti, ma solamente l’informazione che un gruppo di utenti (individuabile da Google) ha determinati interessi.

I problemi di FLoC

A prima vista quella ideata da Google sembra una soluzione che potrebbe mettere d’accordo tutti, anche se in realtà il sistema FLoC presenta numerose ombre.

In primo luogo, puntare tutta la profilazione su un unico ID raccolto dal browser aggrava le problematiche di browser fingerprinting (tecnica che consente, raccogliendo tante piccole informazioni condivise dal browser di un utente, di tracciarne un profilo). È chiaro che se un soggetto che intende tracciare un profilo dalle informazioni che scambia il mio browser (dimensione schermo, sistema operativo, impostazioni di navigazione, etc.) sarà molto facilitato in questo compito conoscendo anche il mio FLoC ID.

Cookie e profilazione

Un inserzionista potrebbe infatti creare sottoclassi sempre più dettagliate partendo dalla coorte di Google, dividendo tra i vari componenti della coorte quelli che possiedono un Mac da quelli che possiedono un PC, quelli che hanno uno schermo ad alta risoluzione e quelli che invece navigano da un dispositivo meno definito, e così via fino ad arrivare ad una profilazione pressoché individuale.

Google, all’interno del suo Privacy Sandbox (progetto nato lo scorso anno e che ha dato i natali anche alla tecnologia FLoC) ha creato progetti ad hoc per contrastare il fenomeno e conta quindi di superare la problematica per quando il progetto FLoC diventerà operativo.

Inoltre, con questo sistema, Google non ha limiti di accesso alla nostra navigazione. Mentre con i cookie Google è vincolato alle nostre scelte e può seguire la nostra esperienza sul web solo fintantoché uno dei suoi cookie è presente sul sito che stiamo visitando, con FLoC Google accede alla nostra intera cronologia di navigazione per fare un profilo completo.

Va detto che Google promette di limitare la profilazione nel caso di blocco dei cookie di terze parti su un sito, ma è evidente che in tanto un utente blocca i cookie di terze parti in quanto tali cookie sono presenti e rilevanti. Se con il tempo questi cookie scompariranno, scomparirà altresì l’esigenza del loro blocco e quindi l’algoritmo di Google per la creazione delle coorti avrà accesso alla completa esperienza di navigazione (fatte salve le schede in incognito).

La dimensione delle coorti

Questa grande mole di informazioni amplifica poi (invece di diminuire) la conoscenza di un utente da parte di un inserzionista Google che sia in grado di individuare il soggetto che appartiene ad una certa coorte (pensiamo ad esempio ad un sito che richiede l’accesso con le credenziali Google e poi acquisisce dalla stessa azienda il nostro FLoC ID, così mettendo a sistema il nostro profilo e i nostri interessi di acquisto per annunci mirati sullo stesso sito web).

Inoltre, Google non si è ancora sbottonata sulla dimensione di queste coorti (ci dice solo che la grande maggioranza comprenderà diverse migliaia di utenti), ma è evidente che se alcune di queste si rivelassero particolarmente ridotte potrebbero rendere ben poco “anonimi” gli utenti che sono inclusi in queste categorie.

La definizione di dato personale ai sensi del GDPR include i dati relativi non solo ad un soggetto identificato, ma anche ad un soggetto identificabile ed è quindi evidente che l’inclusione in una “coorte” particolarmente dettagliata e poco popolata potrebbe consentire all’inserzionista di risalire all’identità del soggetto destinatario della comunicazione promozionale, riproponendo il problema privacy che Google cerca di evitare con questa nuova tecnologia.

Categorie delle coorti

Altra questione importante è quella della definizione delle “categorie” in cui verranno incasellati gli utenti delle coorti, in quanto il livello di dettaglio di tali categorie potrebbe consentire l’identificazione degli utenti e rivelare dati anche appartenenti a categorie particolari.

Il FLoC ID che dovesse individuare i “malati di una determinata malattia” sarebbe evidentemente una categoria che rivelerebbe un dato estremamente sensibile per tutti i componenti della “coorte” individuata da FLoC.

Per limitare i danni Google promette di utilizzare, per FLoC, la stessa black list di categorie che attualmente utilizza il colosso USA per gli annunci personalizzati (disponibile qui e che esclude la possibilità di categorizzare dati sanitari, orientamento sessuale, affiliazioni politiche, etc.), anche se non è possibile escludere che un inserzionista, utilizzando dati vicari, possa ricostruire un numero maggiore di dati anche sensibili dell’utente (o della coorte) dalla categorizzazione apparentemente innocua offerta da Google (cosa che già accade spesso con gli annunci personalizzati basati su cookie).

Questo fenomeno (di deduzione di categorie ulteriori da quelle offerte da Google) potrebbe aggravare i problemi che già oggi caratterizzano gli annunci pubblicitari, ovvero il rischio di “segregazione” dei soggetti che ricevono annunci, con una targettizzazione che di fatto discrimina in base, ad esempio, al sesso o alla razza gli utenti.

Il valore dei cookie

Secondo una stima di Google diffusa nel 2019 la disabilitazione da parte dell’utente dei cookie di terze parti comporta una perdita media del 50% per il publisher e il sito web che ospita le inserzioni.

Questo è evidentemente un grave problema per Google, che guadagna vendendo questi servizi e vince rispetto alla concorrenza proprio per la sua capacità di “seguire” l’utente attraverso cookie di terze parti su quanti più siti possibili.

A ben vedere quindi Google oggi è in grado di vendere le proprie inserzioni a un prezzo “maggiorato” in UE solo grazie alle inefficienze che caratterizzano la gestione dal punto di vista normativo dei cookies da parte di numerosissimi siti web, con dark pattern che cercano di scoraggiare l’utente dal rifiutare i cookies invasivi, cookie wall che bloccano i contenuti fino all’acquisizione del consenso (espressamente censurati nelle ultime linee guida EDPB diffuse nel maggio 2020) o, peggio, cookie banner che ignorano le scelte dell’utente e continuano, a prescindere, a generare ogni sorta di cookie.

Il lento e inevitabile adeguamento che stanno portando avanti i siti web europei e la propensione degli utenti (quando effettivamente gli viene proposta una scelta libera e consapevole sui cookie) a rifiutare i cookie di profilazione e di terze parti, potrebbero mettere in seria difficoltà Google.

Questo problema di Google è stato amplificato (e non solo in Unione Europea) dalle iniziative di Apple che promette di rimuovere i cookie di terze parti come impostazione di default su mobile e Mac e dalle pressioni su Google stesso (per mantenere la propria quota di mercato con il browser Chrome) per una impostazione simile anche sul proprio browser.

Per questo Google, per precorrere i tempi e superare un problema che dovrà necessariamente affrontare in un prossimo futuro sta cercando soluzioni alternative, che propongano un approccio più rispettoso della privacy mantenendo però l’aspetto lucrativo dell’advertisement targettizzato.

FLoC è la soluzione migliore a cui sono arrivati a Mountain View, una quadratura del cerchio a prima vista impossibile ma che, e visti gli interessi in gioco non dovrebbe sorprendere, ovviamente è più orientata a garantire gli interessi economici di Google che i nostri diritti di cittadini sul web.

Cosa ci aspetta in futuro

Che ci piaccia o no, il sistema FLoC proseguirà il proprio corso e Google intende rendere disponibili le coorti basate su FLoC per test pubblici su Chrome già nella prossima release di questo mese, mentre prevede di iniziare a testare le coorti basate su FLoC con gli inserzionisti di Google Ads nel prossimo trimestre.

Molti vedono però questa mossa di Google come un’occasione mancata.

La fine dei cookie poteva essere un momento storico, di responsabilizzazione degli utenti e di navigazione web più libera e meno tracciata. Google, con la sua mossa, ci riporta nei ranghi e non rinuncia a seguire passo passo la nostra esperienza sul web, con un’efficienza inferiore solo del 5% rispetto alla profilazione individuale.

Se pensiamo che in Europa Google rinuncia al 5% del valore di un mercato del tutto adulterato dalle cattive prassi dei gestori dei siti e da una situazione frutto di una proliferazione incontrollata (ed illegittima) dei cookie, ci rendiamo conto che il sacrificio di Google è davvero poco significativo rispetto a quello che richiederebbe una seria presa di posizione per lasciare gli utenti davvero liberi di scegliere sul web.

@RIPRODUZIONE RISERVATA

Articolo 1 di 4