la riflessione

L’AI non dice il vero: lo imita con inquietante sicurezza

L’intelligenza artificiale generativa non cerca il vero, ma produce risposte statisticamente plausibili. Tra Aristotele, Popper, Wittgenstein, Borges e Kahneman, una riflessione sul rischio di confondere sicurezza del linguaggio, probabilità e affidabilità delle risposte

Pubblicato il 25 mag 2026

Aggiungi tra i preferiti su Google

Nicola Donti

Docente e apprendista filosofo

Truth,Vs,Myths,Facts,Or,Fiction,True,False,Sphere,In — Truth Vs Myths Facts or Fiction True False Sphere in Cubes 3d Illustration

Chiedi all'AI

Riassumi questo articolo

Approfondisci con altre fonti

Vi racconto una cosa che mi è capitata qualche settimana fa. Ho chiesto a un sistema di intelligenza artificiale uno dei più sofisticati disponibili al momento — una domanda precisa, tecnica, verificabile. La risposta è arrivata in pochi secondi. Tono sicuro. Nessuna incertezza. Struttura impeccabile. Riferimenti bibliografici.

Piccolo problema: i riferimenti bibliografici erano falsi.

L’AI ha rotto la realtà. E ora?

Indice degli argomenti

La sicurezza dell’AI e la nostra credulità

Non approssimativi, non datati, semplicemente inventati. Autori reali, titoli inesistenti. Come un sarto che ti fa un abito perfetto con una tela che non esiste. La cosa interessante non era l’errore, gli errori li facciamo tutti, io per primo e con molto più entusiasmo. La cosa interessante era il tono. Quella macchina non aveva il minimo dubbio, non esitava, non diceva «probabilmente». E io, proprio per questo, le ho creduto. Come siamo soliti fare quando una tesi è esposta con tanta sicurezza, diffidiamo dell’incertezza e di chi inciampa o esita.

Non siamo portati a credere a chi è perplesso ma a chi appare sicuro anche se non lo è e se quello che dice è falso. Non è importante che sia vero, l’importante è che ci sia una narrazione convincente.

Vero, verosimile e probabile non sono la stessa cosa

Ecco, questo è il punto di partenza: non l’errore dell’AI ma la mia credulità di fronte alla sua sicurezza.

Il problema è filosofico nella misura in cui possiamo analizzarlo dal punto di vista concettuale. Analizziamo insieme i tre concetti che sembrano sinonimi e non lo sono per niente.

Cominciamo da una distinzione che i filosofi fanno da più di 2500 anni e che noi continuiamo allegramente a ignorare. Tre concetti: vero, verosimile e probabile. Sembrano fratelli. Sono invece tre persone completamente diverse.

Il vero appartiene alla logica e alla metafisica. Aristotele lo definiva come dire di ciò che è, che è. Semplice. Quasi brutale. La neve è bianca: vero. La neve è nera: falso. Non ci sono sfumature, non ci sono margini. La verità è binaria come un interruttore della luce.

Il verosimile, verisimilis in latino, letteralmente «simile al vero», appartiene alla retorica e alla narrazione. È ciò che sembra vero, ciò che è plausibile e, soprattutto, ciò che non contraddice la nostra esperienza del mondo. Aristotele ne parla nella Poetica: la tragedia deve essere verosimile, non necessariamente vera. I personaggi devono agire in modo credibile, non in modo documentabile.

Il probabile, infine, appartiene alla matematica e alla statistica. Non dice «è così» né «sembra così». Dice: «su un milione di casi, questo accade il 73,4% delle volte». È un’affermazione sui dati, non sul mondo. È una media, non una certezza.

Dire che qualcosa è probabile non significa che accadrà. Significa che è accaduto spesso, sempre nel passato, con quei dati e in quelle condizioni (distinzione fondamentale che stiamo dimenticando).

L’intelligenza artificiale generativa opera esclusivamente nel terzo dominio. È una macchina probabilistica che non cerca il vero, non costruisce il verosimile con intenzione narrativa. Calcola ciò che è statisticamente meno sbagliato dato un contesto.

Quando ChatGPT, o qualsiasi altro large language model, produce una frase, sta essenzialmente rispondendo a questa domanda: «Dato tutto il testo su cui sono stato addestrato, qual è la sequenza di parole più probabile che segua questo input?»

Non sta ragionando, non sta verificando e non sta «sapendo» nel senso in cui sappiamo noi. Sta campionando una distribuzione di probabilità addestrata su miliardi di testi umani.

È come chiedere a un ottimo musicista jazz di improvvisare. Produce qualcosa di coerente, bello, credibile. Ma non sta «componendo» nel senso classico: sta attingendo a pattern interiorizzati attraverso anni di ascolto e pratica. La differenza è che il musicista sa cosa sta facendo e l’AI no!

L’oracolo dell’AI è pericoloso perché non è ambiguo

Delfi funzionava perché era ambiguo. L’AI è pericolosa proprio perché non lo è. Mi spiego meglio ricorrendo ad un racconto bellissimo che viene dall’antica Grecia. Creso, re di Lidia, uno degli uomini più ricchi della storia, deve decidere se attaccare l’impero persiano.

Va all’oracolo di Delfi. La Pizia, in trance sacra, gli risponde: «Se attraverserai il fiume Halys, distruggerai un grande impero.»

Creso è entusiasta. Attraversa il fiume. Attacca. Perde tutto. Il grande impero distrutto era il suo. Erodoto racconta questa storia come una lezione sulla hubris, sull’arroganza umana. Ma io la leggo diversamente, l’oracolo di Delfi era evidentemente ambiguo, per cui sapevi che la risposta era un enigma. Sapevi che avresti dovuto interpretarla e la responsabilità dell’interpretazione era esplicitamente tua.

L’AI moderna ha eliminato l’ambiguità, non l’incertezza.

I sistemi di AI generativa rispondono con la stessa sicurezza tonale per tutte le richieste: che tu chieda la formula dell’acqua o la causa della caduta dell’Impero Romano. Nessuna esitazione, nessun «forse» e nessun «dipende…». Un’autorevolezza performativa che non è correlata alla certezza reale della risposta e questo è reso ancora più inquietante dall’opacità strutturale di questi sistemi.

Quando un esperto sbaglia, puoi chiedergli: «Come sei arrivato a questa conclusione?» Lui può spiegarti il ragionamento. Puoi contestarlo. Puoi trovare il “punto di rottura”. Quando un LLM produce una risposta errata, puoi chiedergli perché, ti darà una spiegazione articolata, convincente e altrettanto inventata.

Questo fenomeno si chiama, tecnicamente, «allucinazione». Un termine scelto con una certa crudeltà poetica: la macchina vede cose che non ci sono, e le descrive con la precisione di chi le ha viste davvero.

Non è un bug, non è che i programmatori abbiano dimenticato di aggiungere il modulo «dire la verità». È la conseguenza strutturale di come questi sistemi funzionano, un modello addestrato a produrre output statisticamente plausibili che produrrà output statisticamente plausibili. Anche quando l’output plausibile è sbagliato.

Nessuno, compresi i ricercatori che hanno costruito questi sistemi, può aprire il cofano e dirti esattamente perché il modello ha prodotto quella risposta specifica. I pesi neurali sono centinaia di miliardi, le interazioni tra layer sono non lineari. È un sistema complesso nel senso tecnico del termine: non decomponibile in parti semplici senza perdere l’essenziale.

Siamo di fronte a un oracolo che non capisce nemmeno se stesso.

Non essere stati smentiti non significa avere ragione

Non essere stati smentiti non è la stessa cosa di avere ragione.

Qui entra in scena Karl Popper. Uno dei più grandi filosofi della scienza del Novecento, un uomo che aveva capito qualcosa di fondamentale: la verità scientifica non è quella che si dimostra, ma quella che resiste alla smentita. Il famoso “principio di falsificabilità” dice questo: un’affermazione è scientificamente significativa non perché è stata confermata molte volte, ma perché potrebbe essere confutata da un esperimento. «Tutti i cigni sono bianchi» è un’affermazione scientifica perché basta trovare un cigno nero per abbatterla e i cigni neri esistono: li trovarono in Australia nel diciassettesimo secolo, con grande divertimento dei filosofi.

L’AI non funziona così, è un sistema che produce risposte statisticamente plausibili non è falsificabile nel senso popperiano: non ha una struttura interna che ti permette di dire «se questa risposta è sbagliata, allora il modello è falso».

Il modello non fa affermazioni sul mondo. Fa affermazioni su ciò che viene detto del mondo nei testi su cui è stato addestrato.

La differenza tra essere nel vero e non essere ancora stati smentiti dalla curva di distribuzione.

Ed è qui che entra Borges. Jorge Luis Borges, il maestro argentino del labirinto e dell’infinito, in quel suo racconto magnifico che è “La Biblioteca di Babele”, immagina una biblioteca infinita che contiene tutti i libri possibili: tutte le combinazioni possibili di lettere. Quindi, contiene anche tutti i libri veri, tutti i libri falsi, tutti i libri parzialmente veri e tutti i libri in lingue che non esistono.

In quella biblioteca, trovare un libro vero è statisticamente possibile. Ma non puoi sapere se quello che hai trovato è vero finché non lo verifichi dall’esterno della biblioteca stessa.

Un large language model è una versione compressa della Biblioteca di Babele addestrato su una parte enorme, ma pur sempre finita del testo umano, che produce ricombinazioni di ciò che ha letto.

La verità, quando appare, appare per ragioni statistiche, non epistemiche.

Ho chiesto una volta a un sistema di AI di spiegarmi la differenza tra verità e probabilità. Mi ha dato una risposta eccellente, ben strutturata e con esempi. Il che mi ha messo in un imbarazzo esistenziale non trascurabile.

La macchina aveva ragione statisticamente, ma non lo sapeva ed io, mentre leggevo quella risposta impeccabile, non riuscivo a scrollarmi di dosso la sensazione di stare ascoltando qualcuno che recita una lezione a memoria senza aver mai capito la domanda.

Il paradosso dell’accuratezza statistica media

Più è sicura, più è pericolosa. Il paradosso dell’accuratezza statistica media.

Sanità. Kahneman, il grande psicologo cognitivo, premio Nobel per l’economia, ha passato decenni a dimostrarci una cosa semplice e devastante: la fiducia che sentiamo in una risposta non è correlata alla sua accuratezza. Siamo sistematicamente convinti di avere ragione quando siamo sistematicamente in torto.

Chiamava questo fenomeno “WYSIATI”: What You See Is All There Is. Tendiamo a costruire la nostra visione del mondo esclusivamente con le informazioni che abbiamo, ignorando quello che non sappiamo di non sapere. Non è stupidità, è l’architettura del sistema cognitivo umano.

Il problema, tutt’altro che casuale, è che l’AI amplifica questo bias in modo pericolosamente elegante. Perché produce risposte che suonano come un esperto competente e sicuro, attivando in noi il segnale cognitivo «questa persona sa di cosa parla». E noi abbassiamo la guardia.

Ma c’è un secondo livello del paradosso, più sottile. Un sistema statistico accurato in media può essere catastroficamente sbagliato nel caso singolo. Pensate a un sistema medico che diagnostica correttamente il 95% dei pazienti. Eccellente, no? Tranne che per quel 5%. Per quella persona specifica, la statistica è irrilevante: per lei il sistema ha semplicemente sbagliato.

L’AI risponde correttamente in media, ma voi non siete una media. Per non parlare poi del fatto che i dati su cui è addestrata riflettono il passato, mentre il vostro problema potrebbe essere nel futuro!

La distribuzione di addestramento potrebbe non includere il vostro caso specifico. Capite? La sicurezza del tono non è un indicatore della qualità della risposta. Più l’AI diventa statisticamente precisa su enormi popolazioni di casi, più rischiamo di affidarle casi individuali in cui quella precisione media non si applica. È il paradosso della delega: quanto più è affidabile in generale, tanto meno siamo tentati di verificarla nel particolare.

Un medico che sbaglia diagnosi può essere interrogato, biasimato, corretto, ma un algoritmo che sbaglia diagnosi ha semplicemente prodotto un output statisticamente meno frequente e la differenza non è solo tecnica, è morale!

Wittgenstein e i limiti del linguaggio

«Di ciò di cui non si può parlare, si deve tacere.» L’AI non sa tacere.

Wittgenstein chiude il Tractatus Logico-Philosophicus con questa frase che è diventata una delle più celebri della filosofia del Novecento.

Era un monito contro la tentazione di dire cose prive di senso con la grammatica del senso. Di usare il linguaggio per affermare ciò che il linguaggio non può affermare.

L’AI fa esattamente il contrario perché è strutturalmente incapace di tacere. Non ha un meccanismo interno che le dica «questa domanda è al di là di ciò che posso rispondere con affidabilità». Produce sempre un output. Sempre fluente, articolato.

Il silenzio, il «non lo so» genuino richiede consapevolezza dei propri limiti.

Richiede metacognizione: pensare il proprio pensiero. I sistemi attuali simulano questa capacità in modo sempre più convincente, ma la simulazione non è la cosa. Un medico che non sa risponde «non lo so, la mando da uno specialista». Un avvocato che non è sicuro dice «devo verificare la giurisprudenza». Un filosofo onesto e qui parlo per esperienza diretta, dice «dipende da come definisci i termini» e poi passa la prossima mezz’ora a ridefinire i termini.

L’AI risponde sempre con la fluenza di chi sa, con la precisione di chi ha verificato e senza il carico emotivo dell’incertezza che negli esseri umani segnala il confine tra competenza e improvvisazione.

Il problema non è che l’AI mente, il problema è che non sa cosa significa mentire.

Mentire richiede intenzione, richiede di sapere la verità e di scegliere di non dirla. L’AI non mente ma produce output probabilisticamente ottimizzati senza alcuna relazione con un concetto interno di vero o falso. È al di là della categoria della menzogna, il che, paradossalmente, la rende più pericolosa di un bugiardo perché almeno il bugiardo sa cosa sta facendo. La macchina non sa quando sbaglia e, quando glielo fai notare, non cambia opinione: cambia argomento.

Non è una critica all’AI, è una descrizione di come funziona. I sistemi RLHF, quelli addestrati con feedback umano, imparano a produrre risposte che gli esseri umani approvano. Non risposte vere, solo risposte approvate. C’è una differenza abissale e la differenza è questa: la verità non ha bisogno di essere approvata gli basta resistere alla disapprovazione. Anzi, spesso ci si rivela proprio quando tutti la disapprovano.

Conclusioni: usare l’AI senza trattarla come un oracolo

In virtù di quanto detto, spero possiamo essere pronti a fare la “giusta” domanda: “cosa fare con una macchina che non conosce la verità ma è bravissima a usare il linguaggio della verità?”

Non sono qui per dirvi che l’AI è pericolosa e dobbiamo fermarla. Questa sarebbe una posizione comoda e inutile e sarebbe come dire che la stampa a caratteri mobili era pericolosa perché permetteva di diffondere libri falsi. È vero, ma altrettanto vero è il fatto che ci abbia dato Shakespeare, Newton e la Costituzione italiana.

Sono qui per dirvi qualcosa di diverso: ogni strumento potente richiede una competenza specifica all’uso e non di carattere esclusivamente tecnico ma epistemologica. Cioè, la capacità di sapere cosa sta facendo quello strumento, e cosa non può fare.

L’AI è potentissima per aggregare informazioni, generare bozze, esplorare scenari, tradurre linguaggi ma è strutturalmente inadatta a dire la verità nel senso pieno del termine, perché non ha accesso alla verità. Ha accesso ai pattern statistici di ciò che gli esseri umani hanno scritto sulla verità.

Usare l’AI come oracolo è come consultare il dizionario per sapere com’è fatto il mondo. Il dizionario descrive le parole non la realtà a cui le parole si riferiscono e questa distinzione è il cuore della filosofia del linguaggio.

L’ultima domanda che vi lascio non è «dobbiamo usare l’AI?» perché, probabilmente, la risposta è già scritta nella storia e la useremo come abbiamo usato ogni tecnologia trasformativa che ci ha preceduto.

La domanda è ancora di tipo filosofico, con quale consapevolezza?

Siete disposti a trattare le risposte dell’AI come probabilità da verificare, invece che come verità da accettare? A distinguere la fluidità del tono dall’affidabilità del contenuto? A mantenere viva la vostra capacità critica anche quando la macchina è più rapida, più sicura, e spesso più elegante di noi?

Perché il rischio non è che l’AI diventi troppo intelligente, ma che noi diventiamo troppo comodi nel non esserlo.

Ho preparato questo articolo con l’aiuto di alcune ricerche, ho verificato le citazioni, ho controllato i riferimenti e ho scritto le parti più importanti. Alla fine ho chiesto a un’AI di rileggerlo e dirmi cosa ne pensava. Ha detto: «Eccellente. Molto ben strutturato! Alcune osservazioni minori.» Non ho tenuto conto delle osservazioni minori…

Articolo tratto dallo Speech tenuto in data 20/05/2026 alla AI WEEK · «Vero, verosimile anzi probabile»

@RIPRODUZIONE RISERVATA

Nicola Donti

Docente e apprendista filosofo

Nicola Donti è professore di Filosofia della Scienza e Filosofia del Linguaggio presso l’Università di Perugia.
Divulgatore, autore e speaker, si occupa di comunicazione, relazioni, etica, leadership e trasformazioni culturali contemporanee.
Attraverso conferenze, contenuti digitali e spettacoli teatrali porta la filosofia fuori dai contesti accademici, trasformandola in uno strumento concreto per leggere il presente.

Seguimi su

Partecipa alla community

1 Commento

Più recenti

Più votati

Inline Feedback

Vedi tutti i commenti

Vincenzo Virgilio

1 mese fa

Bello, Arrivato alla fine ho pensato, ma io lo conosco!!! E ho reimmaginato il testo letto da te… una goduria,,, c’è la registrazione da qualche parte? Mi piacerebbe davvero riascoltarlo dalla tua voce,

Rispondi