intelligenza artificiale

In Illinois la class action che scuote il mercato delle voci AI

Sei professionisti della voce accusano Amazon, Google, Meta e altre Big Tech di avere usato impronte vocali e dati biometrici senza consenso per addestrare sistemi di intelligenza artificiale. Al centro ci sono il BIPA dell’Illinois, i danni economici subiti dai ricorrenti e i possibili riflessi europei

Pubblicato il 18 mag 2026

Aggiungi tra i preferiti su Google

Guido Scorza

Avvocato

Chiedi all'AI

Riassumi questo articolo

Approfondisci con altre fonti

Sono datati 12 maggio, gli atti introduttivi di una serie di azioni di classe (class action) proposte nei confronti di Amazon, Adobe, Alphabet/Google, Apple, ElevenLabs, Meta, Microsoft, NVIDIA e Samsung da sei super star vocali, giornalisti radiofonici, podcaster, attori vocali e doppiatori, residenti in Illinois.

Il J’accuse rivolto all’industria dell’intelligenza artificiale vocale è tanto semplice nella sua struttura, quanto duro e dirompente nelle sue possibili conseguenze: aver raccolto e trattato – e continuare a trattare – i dati biometrici presenti nelle voci con le quali i ricorrenti lavorano senza il loro consenso e, quindi, in violazione del BIPA, Biometric Information Privacy Act, una delle leggi sul trattamento dei dati biometrici più avanzate degli Stati Uniti d’America.

Indice degli argomenti

In Illinois la class action sulle voci AI

Gli atti introduttivi contestano alle bigtech di settore di aver costruito un’industria multimilionaria, addestrando i propri modelli utilizzando, tra le altre, proprio le voci dei ricorrenti.

Nell’atto di citazione notificato a Amazon – non diverso dagli altri – gli avvocati dei ricorrenti scrivono: “Amazon ha acquisito centinaia di migliaia di ore di parlato umano ed ha estratto le impronte biometriche uniche, le impronte vocali, dei parlanti presenti in tali registrazioni. Tra questi parlanti figurano alcuni dei più affermati giornalisti televisivi, podcaster investigativi, narratori di audiolibri e doppiatori che operano oggi negli Stati Uniti. Le voci dei ricorrenti sono tra queste.”.

E i ricorrenti sono “Philip Rogers, giornalista televisivo vincitore di un Emmy e del Premio Edward R. Murrow, che ha condotto i suoi servizi in onda da Chicago per quattro decenni; Carol Marin, giornalista televisiva con cinque decenni di carriera alle spalle, tre volte vincitrice del Premio Peabody e insignita dell’Ordine di Lincoln 2025, la più alta onorificenza civile dell’Illinois; Robin Amer, ideatrice, conduttrice e showrunner di The City di USA Today e tre volte vincitrice del duPont-Columbia; Lindsey Dorcus, narratrice vincitrice del SOVAS Voice Arts Award di oltre duecento audiolibri per le principali case editrici americane; Yohance Lacour, il cui podcast investigativo You Didn’t See Nothin’ ha vinto il Premio Pulitzer 2024 per il giornalismo audio; e Victoria Nassif, narratrice di audiolibri e attrice libanese-palestinese-americana, le cui narrazioni con accento arabo di opere di autori arabi e palestinesi-americani sono state pubblicate commercialmente da Penguin Random House, Hachette e Simon & Schuster”.

Insomma, in tribunale ci sono o, meglio, potrebbero esserci preso giganti della voce, contro giganti della tecnologia.

“A nessuno di loro [ndr i ricorrenti] è stato detto che la propria voce sarebbe stata utilizzata per addestrare l’IA vocale commerciale di Amazon. A nessuno di loro è stato chiesto. Nessuno di loro ha dato il proprio consenso”, aggiungono i legali dei ricorrenti.

BIPA e impronte vocali nell’Illinois

Che cosa contestano i ricorrenti

Che poi spiegano così al Giudice i termini della questione: “Un’impronta vocale è un’impronta digitale della voce umana, una rappresentazione matematica delle caratteristiche acustiche (tono, timbro, risonanza) che derivano dalla fisiologia distintiva di una persona, combinate con i modelli di discorso sviluppati nel corso di una vita: accento, cadenza, articolazione. Come un’impronta digitale, un’impronta vocale identifica l’individuo e non può essere modificata. Un numero di previdenza sociale può essere riemesso. Una carta di credito può essere cancellata. Una persona di cui è stata rilevata l’impronta vocale non può recuperarla alterando la propria voce: i modelli biologici e comportamentali che hanno prodotto l’impronta vocale sono gli stessi utilizzati per parlare ogni giorno. […] La moderna sintesi vocale basata sull’intelligenza artificiale funziona addestrando reti neurali su registrazioni di voce umana, apprendendo le caratteristiche acustiche che rendono distintive le singole voci e codificando tali caratteristiche come rappresentazioni matematiche all’interno dei parametri del modello. Gli stessi parametri vengono poi utilizzati per generare nuovi discorsi che presentano le caratteristiche acustiche delle voci utilizzate per l’addestramento. Le rappresentazioni condizionate dal parlante estratte durante l’addestramento non vengono memorizzate separatamente in un database che può essere cancellato su richiesta; esse sono codificate nei parametri stessi del modello. Quando uno qualsiasi dei Prodotti Vocali produce un discorso, il discorso sintetico è una riproduzione matematica delle caratteristiche biometriche estratte dai parlanti le cui registrazioni hanno addestrato il modello. Il prodotto è il dato; il dato è il prodotto.”.

Tutto chiaro, palese, evidente, cristallino.

La legge – il BIPA – vieta l’utilizzo di questo genere di dati senza che l’interessato sia stato adeguatamente informato e abbia espresso uno specifico consenso.

Niente di diverso, in effetti, rispetto a quanto previsto da questa parte dell’oceano dal GDPR.

Perché l’impronta vocale è un dato biometrico

E gli avvocati dei ricorrenti aggiungono qualcosa di più e di non trascurabile.

Non è accaduto per sbaglio.

Non è accaduto per errore.

Non è accaduto per la legge non è chiara o non è stata correttamente interpretata.

Le aziende hanno deliberatamente scelto di farlo, per far prima, per esser più veloci, per correre di più sul mercato, per vincere, in termini competitivi, l’una sull’altra.

Servivano più voci, serviva disporne prima dei concorrenti, serviva disporne in enormi quantità e rispettare le regole non lo avrebbe consentito.

Tutte, nessuna esclusa, le società resistenti, quindi, hanno scelto di imboccare una scorciatoia, ignorando, però e travolgendo, i diritti dei ricorrenti.

Amazon e le voci AI nel mercato degli audiolibri

E oltre il danno, scrivono gli avvocati, nel ricorso contro Amazon, per i loro clienti, i proponenti l’azione di classe, anche la beffa.

Che spiegano così: “Per i narratori di audiolibri, la scelta di Amazon è particolarmente grave. Audible è il distributore commerciale dominante di narrazioni di audiolibri negli Stati Uniti. Le ricorrenti Lindsey Dorcus e Victoria Nassif distribuiscono le loro narrazioni umane tramite Audible, che già possiede e controlla direttamente copie delle loro registrazioni. Il percorso commerciale di Amazon è, per il mercato degli audiolibri, un circuito chiuso: Amazon distribuisce le narrazioni umane tramite Audible, le acquisisce come dati di addestramento per i Modelli Vocali Fondamentali e vende narrazioni AI — tramite la narrazione AI di Audible, le repliche vocali dei narratori ACX e la Voce Virtuale di Kindle Direct Publishing — nuovamente tramite Audible, Kindle e Amazon Music. Il prodotto con cui Amazon compete contro i narratori è costruito proprio dalle voci dei narratori stessi.”.

Un cortocircuito difficile da negare per Amazon quello descritto dai legali dei ricorrenti.

Per quanto, naturalmente, sin qui, sia nota una sola campana.

Troppo poco per fare pronostici sull’epilogo o anche solo ipotizzare chi potrebbe aver torto e chi ragione.

Ma abbastanza per ritenere che l’azione non sia priva di fondamento, non sia pretestuosa, non sia temeraria.

I danni rivendicati per le impronte vocali AI

E lo si capisce ancora meglio leggendo la qualificazione del danno che i ricorrenti assumono di aver subito.

“I danni subiti dai ricorrenti sono concreti e specifici. Amazon ha estratto le impronte vocali dei ricorrenti senza informativa preventiva, né consenso, privandoli del diritto garantito dal BIPA di prendere una decisione informata in merito alla raccolta e all’utilizzo dei propri dati biometrici. Amazon conserva tali impronte vocali nei propri modelli commerciali e continua a trarne profitto. Amazon ha inoltre diffuso tali impronte vocali, codificate nei parametri dei modelli, attraverso le sue reti di affiliate, subappaltatori e partner di integrazione. La tecnologia basata su tali impronte vocali ora soppianta i ricorrenti nei mercati in cui si guadagnano da vivere — i mercati del giornalismo radiotelevisivo, dei podcast di inchiesta, della narrazione di audiolibri, doppiaggio e recitazione vocale a cui i Prodotti Vocali sono destinati e per cui sono venduti.”.

Muovendo da qui, trarre le conclusioni, quelle che traggono i ricorrenti è un esercizio quasi algoritmico se si consente la battuta in una questione nella quale, evidentemente, gli algoritmi sono parte in causa, sul banco dei resistenti: “I ricorrenti intentano questa causa ai sensi del BIPA, sostenendo che Amazon abbia illegalmente raccolto, conservato, commercializzato e diffuso le loro impronte vocali, non le abbia protette dalla divulgazione e lo abbia fatto senza preavviso, consenso scritto informato, liberatoria scritta o alcuna politica di conservazione e distruzione pubblicamente disponibile applicabile ai non utenti. I ricorrenti affermano inoltre che l’uso commerciale da parte di Amazon delle loro voci e identità per creare e vendere prodotti di intelligenza artificiale che li imitano viola l’Illinois Right of Publicity Act (“IRPA”), l’Illinois Consumer Fraud and Deceptive Business Practices Act (“ICFA”), l’Illinois Uniform Deceptive Trade Practices Act (“IUDTPA”) e il diritto comune sull’arricchimento senza causa.”.

Le richieste presentate contro Amazon

Su questi presupposti “I ricorrenti chiedono (i) il risarcimento dei danni previsti dalla legge (ii) il risarcimento dei danni effettivi e la restituzione dei profitti che Amazon ha ricavato dallo sfruttamento commerciale dei dati biometrici dei ricorrenti; (iii) provvedimento inibitorio che imponga ad Amazon, tra l’altro, di cessare la raccolta non autorizzata di impronte vocali da registrazioni vocali effettuate in Illinois, di identificare le fonti dei propri dati di addestramento vocale, di distruggere le impronte vocali ottenute illegalmente dai Ricorrenti e dalla Classe, e di distruggere o riaddestrare i Modelli Vocali Fondamentali in cui tali impronte vocali sono codificate e i Prodotti Vocali basati su tali modelli; e (iv) spese legali, costi e spese ragionevoli.”.

Sembra una di quelle azioni che nessuna delle aziende resistenti può permettersi il lusso di rischiare arrivi fino in fondo.

Sembra una di quelle cause che, come già successo in passato, è destinata a concludersi con un accordo milionario che, probabilmente, per quanto alto fosse il prezzo, costerebbe sempre di meno del soddisfacimento delle richieste dei ricorrenti, qualora risultassero fondate, cosa che, probabilmente, allo stato, nessuno può escludere.

Voci AI, BIPA e possibili effetti in Europa

E, a leggere agli atti del procedimento appena iniziato in Illinois, da qui, dal Vecchio continente, la prima cosa che viene da pensare è che non c’è ragione al mondo, o, meglio, semplicemente in Europa, per la quale chiunque abbia il sospetto che la sua voce sia finito nel ventre degli stessi modelli delle stesse società, non dovrebbe seguire l’esempio delle super star vocali americane, che si tratti o non si tratti di una super star a casa nostra.

Le regole del GDPR, infatti, sono, sul punto sovrapponibili a quelle del BIPA e se le cose sono effettivamente andate come raccontano i ricorrenti negli atti introduttivi, verosimilmente, sono decine, centinaia di migliaia o magari milioni le voci di cittadini europei utilizzate allo stesso modo, per l’estrazione di dati biometrici con i quali addestrare i modelli di Meta, Amazon & C.

Giornalisti radiofonici e televisivi, podcaster, attori e doppiatori, magari cantanti ma anche gente comune che ha caricato contenuti audio o anche audio sui social, le voci di chiunque potrebbero aver avuto la stessa sorte e, quindi, chiunque o, almeno in tanti, oggi, potrebbero reclamare giustizia, anche davanti ai Giudici di casa nostra.

E questo è vero, forse, soprattutto, in una penisola che è però un’isola linguistica come l’Italia.

Perché se i servizi basati su quei modelli “parlano” anche in italiano è altamente probabile, per non dire certo, che è sulle nostre voci, voci raccolte nel bel Paese, che sono stati addestrati.

@RIPRODUZIONE RISERVATA