Intelligenza artificiale

GPT 5, la nostra prova: i punti chiave del nuovo modello AI

Home Industry 4.0/Innovazione in azienda

Un miglioramento a tutto tondo. OpenAI ha consolidato i progressi con il nuovo modello AI GPT 5, che ha competenze da dottorato di ricerca, sceglie da solo quando ragionare ed è bravo a programmare quanto Claude. L’abbiamo anche provato: ecco le prime impressioni

Pubblicato il 8 ago 2025

Antonio Cisternino

Università di Pisa

OpenAI ha rilasciato il nuovo modello GPT 5 segnando una forte discontinuità col passato con Sam Altman che ha sottolineato come con questo nuovo rilascio la compagnia ritenga di aver fatto ulteriori passi in direzione del raggiungimento dell’AGI.

Da notare che in Chatgpt il modello GPT 5 è disponibile anche gratis per tutti.

Ma quali sono le vere novità? E quali sono gli aspetti interessanti sia da un punto di vista tecnologico che di strategia del colosso dell’AI?

Indice degli argomenti

GPT 5: una nuova interfaccia semplice

La prima cosa che salta all’occhio quando si apre l’interfaccia di ChatGPT è che i vecchi modelli sono spariti: da oggi ChatGPT supporta solo il nuovo modello semplificando la vita agli utenti che non devono saper scegliere il modello adatto allo svolgimento di un compito particolare. I modelli precedenti restano accessibili via API ma è evidente come la compagnia voglia sottolineare come il nuovo modello si adatti alle richieste decidendo in autonomia quanto ragionamento sia necessario per generare una risposta.

Sceglie in autonomia se ragionare

La versatilità del nuovo modello è stata uno degli elementi chiave dell’annuncio: il modello decide in autonomia se rispondere rapidamente oppure ragionare, superando la dicotomia tra ragionamento o meno nella risposta ad una richiesta.

Restano invariati invece gli strumenti anche se la funzione “pensa più a lungo” (che può anche essere ottenuta imponendo nel prompt di pensare approfonditamente) può forzare il modello a pensare di più per fornire una risposta.

GPT 5: tre punti chiave

Il messaggio principale dell’annuncio è stato quindi che GPT 5 è un modello con conoscenza di livello dottorale capace di usare strumenti e decidere autonomamente quanto ragionare prima di dare una risposta.

Ecco GPT-5, il modello di OpenAI “più veloce di sempre”

Coding in Gpt 5

Sam Altman ha anche annunciato un significativo miglioramento del modello nella generazione e nell’analisi di codice con intelligenza artificiale, lanciando una chiara sfida ad Anthropic considerata avanti in questa particolare area.

Sugli aspetti di programmazione si sono susseguiti numerosi sviluppatori nel corso dell’annuncio, dimostrando quanta attenzione pone OpenAI a questo aspetto tecnico. E le demo si sono concentrate sia sulla generazione di micro applicazioni analoghe agli artefatti di Anthropic e a quelle generate da Spark di GitHub, ma anche nello sviluppo e gestione di grandi progetti con il supporto al software engineering come testimoniato al CEO di Cursor Michael Truell, un editor di codice basato su AI. È stato anche messo in evidenza un’attenzione prestata nell’addestramento del modello agli aspetti di design, mostrando come il codice generato presti attenzione non solo alle funzionalità ma anche al design.

Sanità e allucinazioni

Il terzo aspetto degno di nota è sicuramente l’attenzione dedicata agli aspetti medici del modello: GPT5 mostra un fattore 10x di riduzione nelle allucinazioni su un benchmark di area medica. Si tratta di un aspetto molto importante visto che molti utenti ricorrono a ChatGPT per porre domande mediche e chiedere la spiegazione di referti che non capiscono fino in fondo.

Interazione vocale, più memoria, più contesto

Sono stati poi annunciati numerosi miglioramenti tra cui non possiamo non menzionare un chiaro miglioramento dell’interazione vocale, un potenziamento della memoria di ChatGPT ed una migliorata capacità di sfruttare le informazioni in un contesto molto grande (elemento di grande importanza in molte applicazioni soprattutto basate su API). Apprezzabile anche una ridotta accondiscendenza che hanno caratterizzato il comportamento dei modelli degli ultimi anni.

Al di là dell’uso del numero 5 il modello sembra combinare in modo equilibrato le capacità del modello o3 di ragionare e di 4o fornire risposte efficacemente. Questo viene testimoniato dai risultati in vari benchmark.

Miglioramento negli agenti

GPT-5 è progettato per eseguire flussi di lavoro complessi in modo autonomo, concatenando azioni come ricerca, generazione di codice e gestione di dati, senza richiedere un input umano costante.

Supporta plugin integrati, azioni API, automazioni, catene di task, e collegamento diretto con Gmail, Google Calendar e modalità vocale.

GPT 5: versioni disponibili (per sviluppatori e aziende)

GPT-5 Standard
Modello più potente, con massima capacità di ragionamento e comprensione del contesto (fino a 256 k token). Ideale per progetti complessi, sviluppo agenti e automazioni multi-passo.
GPT-5 Mini
Versione più leggera e veloce, con costi ridotti e latenza minore. Adatta a interazioni rapide, chatbot a basso costo e applicazioni in tempo reale.
GPT-5 Nano
Ottimizzata per girare localmente o su dispositivi edge. Minor consumo di risorse, contesto ridotto, ma tempi di risposta istantanei.

Costi indicativi (per utilizzo con API)

I prezzi si riferiscono all’elaborazione su 1 milione di token, divisi tra input (prompt) e output (risposta):

Modello	Input 1M token	Output 1M token
GPT-5 Standard	~$25	~$100
GPT-5 Mini	~$3	~$12
GPT-5 Nano	~$0,30	~$1,20

GPT 5, la nostra prova: le prime impressioni

È sempre più difficile farsi delle impressioni su un modello AI appena rilasciato, sono ormai lontani i giorni in cui con un semplice prompt si misuravano i miglioramenti. Possono quindi solo fornire le mie impressioni dopo poche interazioni con la nuova AI.

La conversazione vocale è decisamente più naturale, capita meno spesso di sentire una pausa tra un’interazione e l’altra. E la velocità di risposta anche con il prompt sembra migliorata.

Il generatore di immagini non è cambiato nello stile, ma sicuramente la capacità di capire cosa si intende con un prompt semplice sembra più capace. Ho provato con la generazione di una vignetta satirica e il modello si è comportato bene anche se ha seguito uno schema che segue anche il suo predecessore.

Ho poi provato a generare delle mini applicazioni per testare il comportamento. Sono partito dalla realizzazione di un simulatore di gravi lanciati dalla torre di Pisa.

Il risultato eseguito direttamente nel canvas è sicuramente molto migliore di quanto riuscissero a fare i predecessori. L’impressione che però si ha è che la scelta di generare codice Python come linguaggio di generazione ogni tanto porta a generazione di codice JavaScript non interamente corretto (mi è capitato un paio di volte che fosse il modello stesso nella correzione di un bug ad informarmi che era stato usato ‘#’ come si fa in Python e andava rettificato). L’impressione è che siano stati fatti importanti passi avanti ma il codice generato sia meno “robusto” della controparte di Anthropic. Ma si tratta di prime impressioni, ci vorrà un po’ di tempo per effettuare delle vere e proprie valutazioni (un simulatore di sistema solare ha funzionato al primo colpo in Claude mentre ho faticato molto con GPT a causa di problemi di librerie e riferimenti errati).

Un aspetto che mi ha colpito è però che il codice generato da GPT5 è molto compatto e molto ben leggibile, anche rispetto a quello generato da Anthropic.

Ho poi provato a far generare un’applicazione per visualizzare dei dati in formato GeoJson con gli edifici della mia Università. Ho anche chiesto di integrare le informazioni con informazioni sui vari edifici che trovava on-line. Il risultato è stata un’applicazione NPM basata su leaflet che ho dovuto scaricare per eseguire ma che ha funzionato decisamente bene e che mi ha sorpreso dato il semplice prompt che ho usato.

GPT 5: un bilancio

GPT-5 sembra essere un consolidamento di tutte le esperienze di OpenAI degli ultimi due anni in un modello unico e flessibile che sembra dalle prime prove comportarsi meglio dei predecessori. Anche la scelta di quanto ragionare sembra dalle prime esperienze adeguata fornendo sempre risposte piuttosto rapidamente. È interessante che tutti useranno GPT 5, anche la versione gratuita.

Le allucinazioni del modello sembrano inferiori, ma si tratta di esperienza empirica (ho provato qualche prompt che in passato allucinava) che richiederà più tempo per essere verificata, così come la maggiore competenza medica.

Ho provato il modello anche su prompt usati da Oraculum via API e il funzionamento è decisamente più rispettoso del prompt dei modelli della versione 4.x. Anche il modello GPT 5 nano, il più economico, è significativamente migliore dei predecessori.

Complessivamente GPT 5 sembra un significativo passo avanti di OpenAI che sembra aver colmato, almeno in parte, il gap sulla generazione di codice con altri modelli come Claude Sonnet.

La sfida governance, test, sicurezza

L’arrivo di Gpt 5 ha acceso un dibattito intenso nella stampa tecnica internazionale e non solo per le sue capacità.

Gli osservatori più attenti (Platformer, BleepingComputer, PanelsAI, VentureBeat) riconoscono che il salto tecnologico apre un nuovo capitolo sulle responsabilità e sui controlli necessari. Il modello infatti è in grado di gestire flussi di lavoro complessi, generare artefatti articolati e, soprattutto, orchestrare azioni su risorse esterne senza intervento umano. Con costi e condizioni di accesso che lo rendono per altro fruibile da una più vasta base di utenti.

Progressi che hanno come contro altare un aumento dei rischi. Proprio questo aspetto è al centro di un filone di analisi prudente che emerge con forza nella stampa specializzata.

Gli esperti notano che l’aumento della capacità di contesto e l’integrazione con sistemi esterni trasformano Gpt 5 in un “motore decisionale” potenzialmente autonomo. In questo scenario, la questione non si limita alla riduzione delle allucinazioni — che pure resta un obiettivo dichiarato da OpenAI — ma si sposta sulla gestione delle dipendenze tra il modello e l’infrastruttura aziendale.

Gli esperti tecnici intervistati da Panels AI mettono in guardia: quando un modello è autorizzato ad agire su dati o applicazioni mission-critical, la priorità non è più soltanto l’accuratezza, ma la tracciabilità. Chi verifica una risposta? Chi si assume la responsabilità dell’output? Come si documenta la catena di decisioni quando il modello, o un agente che lo utilizza, compie scelte autonome? Sono domande che, nelle redazioni di settore, trovano risposte operative: logging dettagliato di ogni interazione, test in ambienti isolati prima della messa in produzione, approvazioni umane obbligatorie sugli output sensibili, e procedure chiare per dismettere rapidamente funzionalità considerate rischiose.

In Europa, tali preoccupazioni suonano particolarmente familiari. Dal 2 agosto sono scattati gli obblighi previsti dall’AI Act per i fornitori di modelli di uso generale — categoria in cui rientra a pieno titolo Gpt 5 — con ricadute per le aziende che li implementano. La normativa impone requisiti di trasparenza, gestione del rischio e supervisione umana che, di fatto, formalizzano molte delle pratiche già discusse dalla comunità tecnica: dalla documentazione completa del modello alla definizione di policy operative che limitino l’uso in contesti ad alto rischio.

@RIPRODUZIONE RISERVATA