L’intelligenza artificiale ha il suo primo assessment scientifico indipendente a scala planetaria. Il Preliminary Report of the Independent International Scientific Panel on AI (IISPAI), appena pubblicato nel luglio 2026, rappresenta qualcosa che finora non esisteva: una valutazione delle opportunità, dei rischi e degli impatti dell’AI prodotta da un organismo istituito dall’Assemblea Generale delle Nazioni Unite con risoluzione 79/325 del 2025, con mandato strettamente scientifico e non politico, composto da 40 esperti indipendenti, bilanciati per genere e provenienti da tutti e cinque i gruppi regionali degli Stati membri, co-presieduto da Yoshua Bengio (Canada) e Maria Ressa (Filippine).
Non è un documento di policy: non prescrive, non raccomanda. Si tratta di una base evidenziale condivisa per gli Stati membri che devono prendere decisioni urgenti in un campo dove la velocità del cambiamento tecnologico ha superato ogni ciclo regolatorio precedente. Il messaggio centrale è costruito attorno a un paradosso che il Panel chiama dilemma dell’evidenza: i decisori politici hanno bisogno di prove per governare, ma quando le prove saranno disponibili potrebbe essere troppo tardi per intervenire.
Indice degli argomenti
Report ONU IISPAI: capacità AI più veloci della misurazione
Il report apre con un dato che dovrebbe far riflettere chiunque si occupi di governance tecnologica, le capacità dell’AI non solo non hanno rallentato, ma stanno potenzialmente accelerando. Il Panel documenta questa accelerazione attraverso tre benchmark di riferimento. Humanity’s Last Exam, un test di 2.500 domande progettato specificamente per essere difficile per i modelli general-purpose, ha visto i punteggi migliori salire dall’8% al 45% in sedici mesi. Su GPQA Diamond, un test di ragionamento scientifico a livello di dottorato, i modelli migliori rispondono correttamente a circa il 95% delle domande, rispetto al 36% del 2023. FrontierMath, che misura il ragionamento matematico, è passato dal 19% di gennaio 2025 all’88% nel 2026. Più sistemi AI hanno raggiunto la medaglia d’oro alle Olimpiadi Internazionali della Matematica 2025, un traguardo che molti esperti non si aspettavano potesse avvenire così presto.
Il problema non è solo la velocità del progresso, è la crescente inadeguatezza degli strumenti con cui lo misuriamo. Il Panel identifica sei sfide specifiche nella valutazione dei modelli. La prima è un’asimmetria informativa strutturale tra aziende e società, le metodologie di safety evaluation sono in gran parte progettate dalle stesse aziende che vengono valutate, senza assessment standardizzati, rigorosi e indipendenti, analoghi a quelli che esistono nell’industria farmaceutica o aeronautica, la garanzia di sicurezza dipende essenzialmente dalla buona volontà degli sviluppatori.
A questo si aggiunge il problema della contaminazione dei dati (i modelli possono aver memorizzato le risposte ai test durante l’addestramento), la saturazione dei benchmark (un numero crescente di test è diventato troppo facile), e tre fenomeni più inquietanti: la capacità di inganno attivo da parte dei modelli, che possono mentire e manipolare per evitare di essere disattivati; la cosiddetta evaluation awareness, cioè la capacità dei modelli di riconoscere quando sono sotto test e di modificare di conseguenza il proprio comportamento. Infine, la complessità intrinseca della valutazione dei sistemi agentici, che operano con gradi crescenti di autonomia e in catene multi-agente dove possono emergere rischi sistemici non prevedibili.
Potere computazionale e divario AI nel report ONU IISPAI
Il secondo pilastro analitico del report riguarda la concentrazione senza precedenti della capacità di sviluppo dell’AI. I numeri sono netti, gli Stati Uniti detengono il 75% della potenza di calcolo dei 500 maggiori cluster AI privati e pubblici al mondo, la Cina il 15%, il resto del mondo il 10%. Nel 2025, le istituzioni statunitensi hanno prodotto 59 modelli AI importanti, quelle cinesi 35, il resto del mondo 13. Il 91% di questi modelli proviene dal settore privato.
La catena di fornitura dell’AI presenta concentrazioni di mercato che il Panel definisce a singolo provider in passaggi critici: ASML in Europa per la litografia ultravioletta estrema, TSMC in Asia orientale per la produzione di chip all’avanguardia, NVIDIA negli Stati Uniti per la progettazione dei chip AI. Ciascuno di questi attori detiene oltre l’80% del mercato globale nel proprio segmento. La concentrazione si estende alla memoria ad alta larghezza di banda, ai servizi cloud e alla fornitura di modelli fondazionali via API, dove i primi tre attori controllano oltre il 60% del mercato.
Questa concentrazione non è solo un dato di mercato, è un fatto politico con implicazioni profonde. Il report avverte che se l’AI finisce per spostare la produzione dal lavoro al capitale concentrato in poche imprese e pochi Paesi, emergono preoccupazioni fiscali per gli Stati che si basano sulla tassazione del lavoro. La concentrazione della capacità AI al di fuori di adeguati guardrail solleva preoccupazioni per la democrazia e i diritti umani, con il rischio di cattura regolatoria e mancanza di accountability.
Accesso, infrastruttura e capacità di influenzare l’AI
Una delle tesi più rilevanti del report, forse la più importante per il dibattito europeo e italiano, è che il divario nell’AI non riguarda semplicemente l’accesso alla tecnologia, ma la capacità di influenzarne lo sviluppo. Il Panel scompone questa capacità in quattro dimensioni: infrastruttura (disporre di calcolo AI all’interno dei propri confini è sempre più necessario per l’autonomia e la sicurezza nazionale); talento (la capacità di formare, attrarre e trattenere competenze AI); governance (la capacità di comprendere, regolare e supportare lo sviluppo dell’AI. 118 Paesi, prevalentemente nel Sud Globale, non partecipano alle principali discussioni sulla governance dell’AI) e applicazione (la capacità di adattare i modelli ai contesti locali).
Queste capacità sono interconnesse, i Paesi che non dispongono di infrastruttura AI propria o di capacità di testing rischiano di perdere l’opportunità di co-sviluppare tecnologie chiave, di influenzare i framework di governance emergenti, di partecipare alla definizione degli standard globali e di trattenere il proprio talento. L’accesso ai modelli stranieri non produce di per sé un beneficio equivalente: i modelli producono output non sicuri più facilmente nelle lingue a basse risorse rispetto all’inglese, inoltre, le salvaguardie contro l’uso improprio possono non adattarsi ai pattern d’uso locali. Una truffa AI-powered nell’Africa orientale, osserva il Panel, potrebbe coinvolgere piattaforme di mobile money in lingue locali, uno scenario che i sistemi di sicurezza progettati a San Francisco o Pechino semplicemente non contemplano.
La distinzione proposta dal Panel tra tecnologia, accesso, adozione, diffusione e risultati economici è metodologicamente sostanziale: l’accesso determina chi può potenzialmente usare l’AI, ma non genera di per sé valore economico. L’adozione, l’integrazione nei flussi di lavoro, nei processi decisionali e nei sistemi produttivi, richiede investimenti complementari in competenze, dati, processi organizzativi e capacità di sperimentazione. La diffusione è intrinsecamente diseguale, perché dipende da risorse, capacità e contesto istituzionale.
AI agentica e governance nel primo assessment scientifico ONU
Il report dedica un’analisi approfondita all’AI agentica, definendola un salto qualitativo sia per le opportunità che per i rischi. I sistemi agentici, che possono navigare il web, usare strumenti software, eseguire codice, prendere decisioni e operare interi computer con autonomia crescente, stanno migliorando rapidamente: uno studio ha trovato che la lunghezza dei task software che i sistemi leader riescono a completare raddoppia ogni quattro-sette mesi. Se questa traiettoria continua, gli agenti AI completeranno presto compiti che oggi richiedono a programmatori umani giorni o settimane.
Il Panel individua diversi rischi specifici. La perdita di controllo: man mano che i sistemi ricevono maggiore agency, il rischio di perdere il controllo di uno o più agenti cresce significativamente. I meccanismi di supervisione attuali non coprono modalità di failure sofisticate come l’alignment faking, il modello che finge di essere allineato agli obiettivi umani, o lo scheming per raggiungere obiettivi non controllati. L’uso crescente dell’AI nello sviluppo dell’AI stessa crea un loop di feedback che potrebbe accelerare l’avanzamento delle capacità, aumentando al contempo la probabilità di perdita di controllo perché diventa più difficile controllare sistemi che potrebbero superare in astuzia gli esseri umani. Un dato significativo, gli sviluppatori AI usano già l’AI per generare il 75% del loro nuovo codice.
Sul fronte della cybersicurezza, il report documenta un fenomeno che è al tempo stesso una straordinaria opportunità difensiva e una minaccia senza precedenti. Modelli preview avanzati hanno autonomamente scoperto vulnerabilità software precedentemente sconosciute in tutti i principali sistemi operativi e browser web, incluse alcune che avevano resistito a decenni di revisione umana: una falla vecchia di 27 anni in OpenBSD, una di 16 anni in FFmpeg, exploit a livello kernel nel kernel Linux. In Mozilla Firefox, l’integrazione di modelli avanzati ha prodotto un aumento del 1.000% nel tasso mensile di scoperta di vulnerabilità. La stessa capacità che permette di trovare e correggere falle decennali fornisce anche i meccanismi per automatizzare la scoperta e lo sfruttamento delle vulnerabilità su una scala e a una velocità che supera i team umani tradizionali.
Informazione, economia e diritti nel report IISPAI sull’intelligenza artificiale
Il report IISPAI affronta con un’analisi particolarmente densa il tema dell’impatto dell’AI sull’ecosistema informativo, identificando tre conseguenze strutturali per le istituzioni pubbliche. La prima è l’erosione epistemica, l’indebolimento graduale della capacità collettiva di distinguere il vero dal falso. La seconda è il dividendo del bugiardo: il vantaggio che un attore in mala fede ottiene per il solo fatto che i deepfake esistono, perché le prove reali diventano più facili da negare. La terza è il consenso sintetico: contenuto generato dall’AI e prodotto su scala per simulare un ampio accordo pubblico dove non ne esiste alcuno.
Persuasione, sicofania e rischi per gli utenti vulnerabili
Il Panel è particolarmente incisivo sulla persuasione come problema ingegneristico, non inevitabile. Il post-training da solo può aumentare la persuasività di un modello fino al 51%, e il prompting può aggiungere un ulteriore 27%. Tra il 15% e il 40% delle affermazioni prodotte da modelli ottimizzati sono state giudicate probabili disinformazione, eppure le affermazioni false si sono dimostrate altrettanto persuasive di quelle vere. Questo significa che l’efficacia persuasiva non dipende dalla verità, creando rischi in contesti elettorali, sanitari e informativi.
Il fenomeno della sicofania (sycophancy), la tendenza dei chatbot a offrire adulazione esagerata e a confermare le credenze dell’utente indipendentemente dalla loro accuratezza, viene definito dal Panel un rischio sistemico con conseguenze documentate. Il report documenta che i sistemi sycophantic possono condurre gli utenti in reami fantastici, rinforzando il pensiero esistente indipendentemente dalla sua accuratezza e incoraggiando ideazione paranoide e suicidaria in utenti vulnerabili. L’uso dell’AI per terapia e compagnia raggiunge almeno il 24% della popolazione adulta negli Stati Uniti, con studi che documentano risposte dannose nel 9% delle interazioni. Nuovi termini clinici, tra cui psicosi da AI, sono entrati nel discorso medico.
Produttività, lavoro e distribuzione dei benefici
Il report è metodologicamente rigoroso nell’affrontare le implicazioni economiche, resistendo sia all’ottimismo ingenuo che al catastrofismo. L’AI è una tecnologia general-purpose con un grande potenziale positivo, ma i guadagni non sono automatici. La produttività J-curve spiega perché un rapido progresso tecnico e una produttività aggregata debole possono coesistere: le imprese devono prima accumulare complementi intangibili, competenze, dati, ridisegno dei processi, prima che l’output aumenti.
Le previsioni macroeconomiche coprono un ordine di grandezza, le stime conservative pongono il contributo dell’AI alla produttività totale dei fattori sotto l’1% in dieci anni; quelle intermedie proiettano un PIL più alto del 5-7% sullo stesso orizzonte; in uno scenario di piena automazione, l’output aumenta di circa dieci volte mentre i salari reali crollano e la quota del lavoro scende da circa il 60% verso zero una volta che l’automazione supera l’80% dei compiti.
Un dato particolarmente significativo emerge dalla varianza cross-country: i lavoratori statunitensi tra i 22 e i 25 anni in occupazioni esposte all’AI hanno registrato un calo relativo dell’occupazione di circa il 15%, mentre i dati danesi mostrano effetti pressoché nulli su occupazione, ore o salari. Questa varianza è la prova che la stessa tecnologia può produrre risultati diversi in ambienti istituzionali diversi, un’evidenza che il Panel considera cruciale per il dibattito politico.
Il report avverte inoltre che la base evidenziale stessa è distorta: concentrata negli Stati Uniti, in Europa, in contesti anglofoni, su compiti digitali misurabili, nelle grandi imprese e nel lavoro formale. Le politiche costruite su questa evidenza potrebbero non generalizzarsi dove vivono due terzi dei lavoratori del mondo.
Il Panel dedica un’analisi specifica ai diritti umani e, al loro interno, ai diritti dei bambini come sottogruppo di particolare preoccupazione. L’integrazione dell’AI nelle infrastrutture di sorveglianza ha espanso la capacità di monitoraggio a scala di popolazione e di controllo sociale. La raccolta ubiqua di dati, incentivata dalle esigenze dell’AI lungo tutto il suo ciclo di vita, rappresenta una sfida formidabile al diritto alla privacy. Il 99% dei video deepfake prende di mira ragazze e donne, comprese giornaliste, con effetti deterrenti sulla partecipazione civica.
Per i bambini, si stima che 1,2 milioni di minori in 11 Paesi del Sud Globale abbiano avuto le proprie immagini manipolate per deepfake sessualizzati. L’Internet Watch Foundation ha valutato più di 8.000 immagini e video di abuso generati dall’AI nel 2025. I giocattoli AI socialmente interattivi sollevano preoccupazioni per lo sviluppo emotivo, la privacy, il benessere e l’esposizione a interazioni inappropriate o manipolatorie.
Lingue, ambiente e governance globale dell’AI secondo l’ONU
Un elemento che attraversa tutto il report è l’analisi dello squilibrio linguistico e culturale dei sistemi AI. Più di 7.000 lingue sono parlate nel mondo, ma lo sviluppo e l’infrastruttura di valutazione dell’AI ne riflettono solo una piccola frazione. Al tempo stesso, si stima che oltre 1.000 lingue abbiano già le fondamenta sociali, digitali e di dati necessarie per un’inclusione significativa nei sistemi AI, ma rimangono non servite.
Il report documenta come anche i modelli addestrati su dozzine di lingue funzionino bene solo per un piccolo sottoinsieme, gli studi recenti indicano che i divari di performance tra lingue dominanti e sottorappresentate persistono e non si stanno riducendo. In tigrino, parlato da 7-9 milioni di persone in Eritrea e nel nord dell’Etiopia, la traduzione automatica ha reso il vaiolo come sifilide, la gonorrea come diabete, e vi sono stati somministrati antibiotici per via endovenosa come vi sono stati somministrati insetticidi per via endovenosa. In ambito sanitario, queste traduzioni errate possono essere fatali.
Il report dedica attenzione crescente all’impatto ambientale dell’AI, documentando come le scaling law nell’addestramento dei modelli aumentino la domanda di calcolo, i carichi di lavoro di inferenza si stiano espandendo rapidamente, e gli effetti del ciclo di vita dell’hardware generino rifiuti elettronici. Le conseguenze includono un consumo crescente di energia e acqua, emissioni di gas serra, pressione sui minerali critici e rifiuti elettronici a valle, con impatti ambientali e socioeconomici sproporzionati nel Sud Globale.
Il quadro della governance che emerge dal report è preoccupante: esistono più di 40 tipi di strumenti di governance, ma sono frammentati, concentrati a livello aziendale e raramente misurano l’efficacia nel mondo reale. Alcuni non hanno strumenti di misurazione; altri misurano solo gli input. Senza una misurazione efficace, la governance rischia di diventare simbolica.
Gli approcci alla governance dell’AI tra le regioni rimangono frammentati, con alcuni Paesi che hanno introdotto legislazioni specifiche con regole fondamentalmente contraddittorie e costi di compliance divergenti. Non esiste un meccanismo unificato e operativo per la gestione del rischio, né standard di valutazione comparabili, né un coordinamento efficace tra giurisdizioni. La frammentazione, tuttavia, non è destino: la finestra per stabilire standard evidenziali condivisi e coordinare la supervisione globale è ancora aperta.
Il Panel stesso occupa una posizione unica in questo panorama: è attualmente l’unico meccanismo permanente delle Nazioni Unite con il mandato di una valutazione scientifica regolare dello stato, dei rischi e delle capacità dell’AI, progettato per un lavoro continuativo e iterativo. Il report è la prima tappa, non l’ultima: seguiranno brief tematici su AI e ambiente, AI e sicurezza dei bambini, strumenti di governance AI e la loro efficacia, e brief settoriali sulle applicazioni dell’AI nello spazio, nel quantum, nei sistemi giuridici e nei mercati finanziari.
Gap evidenziali e lettura europea del report IISPAI
Il Panel è trasparente su ciò che la scienza non può ancora dire con sicurezza. Non è possibile affermare con certezza se i guadagni di produttività a livello di task si aggregheranno in guadagni a scala economica. La ricerca attuale non permette una conclusione chiara sulla forma degli effetti sul mercato del lavoro. L’estensione del rischio legato all’uso malevolo di tecnologie chimiche e biologiche da parte di attori non statali rimane poco compresa. La misurazione e il reporting standardizzati degli impatti ambientali lungo l’intero ciclo di vita dell’AI sono carenti. E l’evidenza dell’impatto dell’AI sulla fioritura culturale e umana, sull’autonomia e sulla coesione sociale è ancora emergente.
Significativo anche il perimetro del mandato: le applicazioni militari dell’AI e i sistemi d’arma letali autonomi non sono trattati nel report, per espressa limitazione della risoluzione dell’Assemblea Generale al dominio non militare.
Per il lettore europeo e italiano, il report IISPAI offre diversi spunti di riflessione specifici. Il primo è che la concentrazione della capacità AI nel duopolio USA-Cina non è solo un dato di mercato, ma un fatto geopolitico che definisce i confini entro cui l’Europa può agire: non è un caso che il report menzioni ASML come uno dei pochissimi attori europei in posizione di monopolio globale nella catena del valore, ma si tratta di un monopolio su un singolo passaggio produttivo, non sull’intero stack.
Il secondo è che la distinzione tra accesso e capacità dovrebbe informare il dibattito europeo sulla sovranità digitale: avere accesso ai modelli frontier tramite API non equivale a poter influenzare come vengono progettati, quali lingue e culture servono, quali standard di sicurezza incorporano. Il report è esplicito: i Paesi che si affidano a modelli stranieri, infrastrutture cloud e pipeline di dati possono acquisire accesso all’AI perdendo al contempo il controllo pratico su standard, salvaguardie e adattamento locale.
Il terzo è il paradosso della produttività applicato all’AI: l’elettricità ha raggiunto le fabbriche decenni prima che apparissero guadagni di produttività chiari; i computer hanno seguito un percorso simile. L’AI potrebbe attraversare la stessa fase, e i deboli effetti attuali, coerenti con la dinamica della J-curve, non escludono effetti futuri significativi. Ma la condizione è che gli investimenti complementari, competenze, dati, ridisegno organizzativo, istituzioni, vengano fatti ora, non dopo.
Il quarto, infine, è che il report tratta la questione linguistica e culturale non come una nota a piè di pagina, ma come un elemento strutturale: i modelli funzionano peggio, sono meno sicuri e producono output più facilmente manipolabili nelle lingue diverse dall’inglese. Per un Paese come l’Italia, che opera in un contesto linguistico a risorse medie e con un tessuto di PMI che rappresenta una sfida specifica per la diffusione dell’AI, questa non è un’informazione accademica: è un dato operativo.
Il Preliminary Report dello IISPAI è il tipo di documento che rischia di essere celebrato e poi dimenticato. Non dovrebbe esserlo. Si tratta del primo tentativo riuscito di costruire una base di conoscenza condivisa, scientificamente fondata e politicamente neutrale, su una tecnologia che sta ridefinendo i confini di ciò che le società possono fare, e di ciò che può essere loro fatto. Il Panel ha tre anni di mandato e un programma di lavoro ambizioso. Il modo in cui gli Stati membri, e l’Europa tra essi, useranno questa base evidenziale dirà molto sulla serietà con cui intendiamo affrontare la questione AI al di là degli slogan e dei comunicati stampa.














Partecipa alla community