Anche se i chatbot possono produrre risposte sensate e approfondite a volte generano output del tutto falsi e immaginari. Ma cosa succede quando avviene?

L’impatto dei chatbot di IA generativa

Ad oggi oltre 100 milioni di persone hanno fatto due chiacchiere con un chatbot di intelligenza artificiale (IA) avanzata come ChatGPT, sperimentando il livello di accuratezza e profondità della risposta, l’immensa varietà di domande alle quali può rispondere, quanto è capace di mantenere una conversazione in maniera soddisfacente e quanto può essere utile nel risolvere problemi o dubbi.

ChatGPT di OpenAI, BlenderBot3 di Meta, Bard di Google: tutte le più grandi aziende tecnologiche si stanno muovendo per dire la loro.

Anche se presentate al pubblico più vasto solo da pochi mesi, le intelligenze artificiali così evolute sono destinate ad avere un enorme impatto in molti settori tra cui ricerca, istruzione, assistenza sanitaria, scrittura, sviluppo di altre tecnologie; possono supportare nell’esecuzione di task non troppo complessi, nell’elaborazione di molte informazioni, sollevando molti professionisti da compiti lunghi e gravosi, liberando tempo e risorse che possono essere dedicate a compiti più strategici.

Che ci sia molto lavoro ancora da fare per migliorare raffinatezza e affidabilità di sviluppo è noto non solo agli addetti al settore. È possibile che non colgano il significato implicito di un passaggio conversazionale, che una domanda venga interpretata in maniera incorretta, che producano risposte incongruenti o inaccurate.

Ma cosa succede quando quello che ci dicono è totalmente inventato e falso?

Cosa sono le allucinazioni nei chatbot

Un’allucinazione è una percezione sensoriale immaginaria; chi la sperimenta però avverte lo stimolo sensoriale come reale. L’allucinazione può essere di tipo visivo, uditivo, gustativo, olfattivo, tattile e coinvolgere uno o più sensi insieme.

Negli esseri umani questo fenomeno può avere molte spiegazioni, non tutte necessariamente di tipo patologico. In ogni caso, l’effetto è di generare nella persona la convinzione che quello che ha percepito sia vero anche se non ha alcun fondamento; viene generato qualcosa che non esiste ma è reale per chi lo sta provando.

Anche le intelligenze artificiali possono avere allucinazioni.

Lo stato di “allucinazione dell’intelligenza artificiale” (AI Hallucination State) è un fenomeno che si manifesta quando l’output generato non è basato sul set di dati su cui è stato addestrato né è previsto dal modello con cui è stato realizzato; avviene quando vengono prodotti risultati che non sono corretti.

Nello stato di allucinazione viene fornita una risposta esaustiva, efficace, chiara, logica, ma inventata, che riporta informazioni completamente false e infondate. Questo fenomeno può riguardare tutti i tipi di dati come testo, immagini, audio, video e codice informatico.

Avviene anche quando le risposte fornite sono bizzarre, eccentriche, fuori luogo. Ci sono diverse testimonianze online di conversazioni in cui il chatbot ha elargito consigli strani, minacce, amore incondizionato, contestazioni e perfino rivendicazioni su eventuali conquiste del mondo da parte proprio di sistemi di IA.

Questi casi tanto singolari (quanto poco comuni in verità) sono un esempio di hallucination state, casi in cui è molto evidente quando la risposta del chatbot sia stata un mancato compromesso tra combinazione delle fonti da cui ha attinto, la domanda o richiesta che gli è stata posta, il contesto del dialogo ed il comportamento appropriato.

L’allucinazione per essere tale non deriva da un errore nei codici di programmazione; non dipende da un addestramento inadeguato, ad esempio da un set di dati compromesso; non è legata all’input, come l’uso di diverse lingue.

L’allucinazione è propria quindi dell’IA che mette insieme delle informazioni di cui dispone secondo modelli di apprendimento su cui è stata testata ma producendo un output inedito, originale, infondato e falso.

Perché i chatbot hanno allucinazioni?

Uno dei punti di forza del modelli generativi di elaborazione del linguaggio naturale (NLP) è che raccolgono, sintetizzano, riformulano una mole potenzialmente infinita di dati.

E per far questo non hanno particolari vincoli: un chatbot AI può attingere da informazioni di diversa provenienza. Dei vincoli, almeno dichiarati, ci sono, ma riguardano l’approccio: i chatbot non offendono e non discriminano, sono programmati per avere un linguaggo polite, per rispondere in modo rispettoso e fermarsi di fronte a parole scortesi o viziate da bias (per esempio, discriminatorie).

Questi sistemi non riproducono interamente le informazioni ma, sulla base di ciò che hanno imparato, producono autonomamente un nuovo contenuto. Però, lo fanno a prescindere dalla verifica di queste informazioni. Dato che il loro output viene generato ad ogni richiesta, i chatbot possono dare risposte diverse alla stessa domanda posta in due conversazioni o momenti diversi.

Il loro unico scopo è fornire un output che risponda al meglio ad una richiesta e che sia sensato; il loro scopo non è (oggi) produrre un output di cui si sia verificata la fonte e l’attendibilità; inoltre, non hanno la capacità di prendere in considerazione eventuali incongruenze fattuali o contestuali.

Ricevono un prompt, un comando, raccolgono tutte le informazioni, producono un output; quanto più una informazione è diffusa tanto più è probabile che venga utilizzata; anche per questo possono dare risposte errate, dato che basarsi su dati largamente condivisi non implica che le informazioni siano corrette e tratte dalla fonte originale.

Solo un piccolo incidente

I grandi modelli linguistici costruiscono output sulla base di relazioni tra parole e contenuti attraverso diversi strati di reti collegate e attingendo a molti dato allo stesso tempo. In linea teorica, si ritiene che le allucinazioni siano più probabili in sessioni di chat lunghe e prolungate (oltre quindici domande); ciò avverrebbe perché il chatbot tiene conto anche delle frasi precedenti nella stessa conversazione, frasi che vanno quindi ad aggiungere un altro livello di complessità all’analisi. C’è da ricordare che questi chatbot sono basati su intelligenza artificiale e apprendimento automatico: sono addestrati ad imparare, a fornire rispose sempre nuove, ad operare autonomamente senza la supervisione di un umano. Non dovrebbe stupire quindi che ci siano fenomeni come le allucinazioni.

La possibilità di errori e risposte false o incongruenti è un problema su cui i ricercatori sono già all’opera. Ottimizzare i set di dati di addestramento sono i primi passi. La qualità dei dati è fondamentale: utilizzare set di dati convalidati limita di molto la possibilità che, anche sintentizzandoli ed elaborandoli, ne esca un output falsato.

Assieme all’addestramento su input realistici e validati, la revisione da parte di valutatori umani è lo step successivo. Un ciclo di feedback che preveda la supervisione di ricercatori addestrati ad analizzare e vagliare le risposte riduce ancora di più non solo la possibilità di allucinazioni vere e proprie, ma anche di risposte bizzarre che, sebbene possano avere un senso, non lo hanno nel contesto della conversazione.

La stessa OpenAI sta lavorando per ridurre le allucinazioni e migliorare il modello linguistico attraverso revisori umani, come pubblicato nel loro blog ufficiale. Nvidia, altra azienda tecnologica statunitense, ha annunciato il lancio di un software, NeMo Guardrails, in grado di ridurre sensibilmente le allucinazioni dei chatbot di intelligenza artificiale per garantire un elevato livello di qualità, sicurezza e fondatezza delle informazioni.

Conclusioni

Le allucinazioni nelle IA possono risvegliare nell’immaginario comune scenari distopici in cui le intelligenze artificiali acquisiscono coscienza e prendono il sopravvento sull’umanità; sebbene suggestiva, questa circostanza appare decisamente remota.

Lo stato delle cose oggi è che le intelligenze artificiali possono supportarci in molti ambiti: medicina, istruzione, sviluppo. Come ogni tecnologia hanno punti di forza e di debolezza, punti su cui bisogna lavorare per renderle ancora più efficaci e funzionali ai nostri scopi.

Nel cammino verso macchine ancora più evolute le allucinazioni sono solo un piccolo incidente di percorso; possiamo utilizzarlo come promemoria per ricordarci che siamo noi a dettare la direzione e che siamo gli unici responsabili di ciò che progettiamo.

Nel frattempo, non crediamo a tutto ciò che ci dice un chatbot.

