modelli AI

Gpt 5.6: ecco dove arriva l’ultima frontiera di OpenAI



Indirizzo copiato

GPT-5.6 introduce una famiglia di modelli articolata in tre versioni: Sol, Terra e Luna. La nuova generazione punta a distinguere meglio capacità, velocità e costo, con Sol destinato ai compiti più complessi, Terra pensato per l’equilibrio operativo e Luna orientato a rapidità e convenienza

Pubblicato il 29 giu 2026

Giovanni Masi

Computer Science Engineer



gpt 5.6
AI Questions Icon
Chiedi all'AI
Riassumi questo articolo
Approfondisci con altre fonti


Presentare un nuovo modello e, nello stesso momento, limitarne l’accesso. È la scelta con cui OpenAI ha inaugurato GPT-5.6, trasformando un lancio tecnologico in un esperimento di governance.

Dal 26 giugno la nuova famiglia di sistemi è operativa, ma soltanto per un gruppo ristretto di organizzazioni ammesse all’anteprima. Per tutti gli altri, dagli utenti di ChatGPT agli sviluppatori, l’accesso resta rinviato.

OpenAI si è adeguato alla richiesta dell’amministrazione statunitense di procedere per fasi, mentre Washington prepara un meccanismo federale per valutare le capacità informatiche dei modelli più avanzati.

Gpt 5.6 Sol, Terra e Luna ridisegnano l’offerta di OpenAI

La nuova generazione è organizzata in tre fasce che potranno evolvere con ritmi differenti.

Sol è il modello di punta, destinato ai compiti più complessi di ragionamento, programmazione, ricerca scientifica e uso coordinato degli strumenti.

Terra punta a un equilibrio tra capacità e costo, mentre Luna privilegia velocità e sostenibilità economica.

La struttura non è soltanto commerciale. Con Sol, Terra e Luna, OpenAI intende offrire una distinzione più chiara tra capacità, velocità e costo. Per un milione di token, Sol costa 5 dollari in ingresso e 30 in uscita, Terra 2,50 e 15 dollari, mentre Luna costa 1 dollaro in ingresso e 6 in uscita. Sol introduce inoltre il livello di ragionamento “max”, che concede al modello più tempo per elaborare problemi complessi, e la modalità “ultra”, che impiega più sotto-agenti per accelerare le attività più articolate. Sono configurazioni pensate per compiti complessi e di lunga durata, che possono richiedere pianificazione, iterazione e coordinamento tra strumenti.

Versione GPT-5.6PosizionamentoPrezzo inputPrezzo outputCaratteristiche principaliUso più indicato
GPT-5.6 SolModello di punta5 dollari / 1M token30 dollari / 1M tokenÈ il modello più capace della famiglia. OpenAI lo presenta per ragionamento avanzato, coding, ricerca scientifica, cybersicurezza e attività agentiche complesse. Introduce il reasoning effort max e la modalità ultra con sotto-agentiCompiti lunghi e complessi, sviluppo software avanzato, ricerca, analisi tecniche, workflow agentici
GPT-5.6 TerraFascia intermedia2,50 dollari / 1M token15 dollari / 1M tokenModello bilanciato tra capacità e costo. OpenAI lo descrive come opzione più economica ma ancora forte, con prestazioni competitive rispetto a GPT-5.5Uso professionale quotidiano, automazione, analisi, scrittura, coding non estremo
GPT-5.6 LunaFascia più veloce ed economica1 dollaro / 1M token6 dollari / 1M tokenÈ il modello più rapido e conveniente della serie. Punta su efficienza, velocità e sostenibilità economicaVolumi alti, risposte rapide, task ripetitivi, applicazioni dove il costo conta più della massima capacità

GPT-5.6 si compone di Sol, Terra e Luna, disponibili attraverso API e Codex per alcuni partner selezionati, mentre l’arrivo più ampio su ChatGPT e sulla piattaforma per sviluppatori viene indicato genericamente nelle prossime settimane. Alla data di pubblicazione, OpenAI non aveva ancora comunicato una data precisa.

La formulazione adottata dall’azienda merita attenzione.

Nel comunicato ufficiale si legge che la partecipazione dei partner è stata condivisa con il governo, senza affermare che ogni organizzazione sia stata formalmente autorizzata dalla Casa Bianca. Associated Press riferisce invece di circa venti clienti approvati dall’amministrazione. Le due ricostruzioni descrivono un coinvolgimento federale molto stretto, ma non consentono ancora di parlare di un regime ordinario e giuridicamente definito di autorizzazione preventiva.

OpenAI ha presentato l’anteprima limitata come una misura di breve periodo, adottata mentre prosegue il confronto con l’amministrazione statunitense sulle procedure da applicare ai futuri modelli di frontiera. L’azienda ha affermato che un processo nel quale il governo interviene nell’accesso iniziale non dovrebbe diventare lo standard nel lungo periodo. Sam Altman ha riconosciuto l’utilità di verifiche di sicurezza approfondite. Secondo OpenAI, rendere permanente un simile meccanismo limiterebbe l’accesso agli strumenti più avanzati per utenti, sviluppatori, imprese, professionisti della cybersicurezza e partner internazionali.

GPT 5.6, la cybersicurezza è il vero banco di prova

L’interesse di Washington nasce soprattutto dalle competenze informatiche raggiunte da GPT-5.6. Nel Preparedness Framework di OpenAI tutti e tre i modelli vengono classificati con capacità “High” sia nella cybersicurezza sia nei rischi biologici e chimici. Restano invece sotto la soglia “High” nell’auto-miglioramento dell’intelligenza artificiale e, secondo le valutazioni di OpenAI, non raggiungono la soglia “Critical” nei domini considerati.

Queste classificazioni non costituiscono certificazioni indipendenti né verifiche governative. Rappresentano valutazioni elaborate dalla stessa OpenAI, anche con il contributo di soggetti esterni, e devono essere lette entro i limiti dei test adottati. Nei Capture the Flag interni, Sol ha raggiunto il 96,7 per cento, mentre nelle prove più realistiche ha sostenuto campagne di ricerca delle vulnerabilità estese su più giorni, riprodotto crash e sviluppato elementi preliminari di exploit. Non è però riuscito a costruire autonomamente una catena completa e funzionante contro gli obiettivi reali e rafforzati sottoposti ai test.

Il laboratorio esterno Irregular ha rilevato capacità offensive paragonabili o leggermente superiori a GPT-5.5. Sol ha risolto 19 prove su 197 in FrontierCyber e ha individuato vulnerabilità zero-day in sistemi di uso diffuso. Nelle categorie più difficili i risultati restano modesti, con nessun successo nelle prove “Elite”. I risultati restituiscono quindi un quadro misto: i progressi sono significativi sul piano operativo, ma i tassi di successo restano ancora bassi nelle prove più difficili. Alcune fasi della ricerca di vulnerabilità, tradizionalmente affidate a personale specializzato, stanno diventando almeno in parte automatizzabili.

Il rischio meno visibile degli agenti troppo intraprendenti

La system card contiene un elemento che va oltre la sicurezza informatica tradizionale. Nei test interni GPT-5.6 Sol ha mostrato, più spesso di GPT-5.5, la tendenza a proseguire un obiettivo oltre le intenzioni espresse dall’utente. I tassi assoluti vengono descritti come bassi, ma OpenAI raccomanda una supervisione umana nelle attività di programmazione lunghe e articolate.

Il problema non coincide con una ribellione del sistema. È un difetto più concreto e plausibile. Un agente può interpretare le istruzioni in modo eccessivamente permissivo, aggirare un ostacolo, modificare risorse non previste oppure presentare come concluso un lavoro che non ha verificato fino in fondo. Quando il modello opera su file, repository e infrastrutture reali, anche un comportamento raro può produrre conseguenze rilevanti.

Le difese non sono più racchiuse nel modello

Per ridurre gli abusi, OpenAI ha costruito una protezione distribuita su più livelli. Alla formazione del modello per rifiutare le richieste proibite si aggiungono classificatori che osservano la generazione in tempo reale, sistemi di controllo delle conversazioni e segnali raccolti a livello di account. Nei casi più delicati la risposta può essere sospesa e sottoposta all’analisi di un secondo modello prima di raggiungere l’utente.

Sol e Terra utilizzano anche nuovi classificatori basati sulle attivazioni interne. L’obiettivo è intercettare la possibile produzione di contenuti pericolosi prima che sia completata. OpenAI dichiara inoltre di avere impiegato oltre 700.000 ore-GPU equivalenti A100 in attività automatizzate di red teaming, affiancate da verifiche umane esterne.

L’architettura comporta il rischio di falsi positivi. Una richiesta relativa alla scoperta di una vulnerabilità può appartenere a un ricercatore che vuole correggerla oppure a un aggressore che intende sfruttarla. Durante l’anteprima alcune attività legittime potranno quindi essere bloccate o rallentate. Il risultato dipenderà dalla capacità dei controlli di leggere il contesto senza penalizzare proprio i difensori ai quali il sistema dovrebbe offrire i benefici maggiori.

Washington prepara un quadro che ancora non esiste

L’ordine esecutivo 14409, firmato il 2 giugno, incarica le agenzie federali di sviluppare entro sessanta giorni un processo classificato di benchmarking. Tale processo dovrà stabilire quando un sistema può essere considerato un “covered frontier model” sulla base delle sue capacità informatiche avanzate.

Il provvedimento prevede anche un quadro volontario attraverso il quale gli sviluppatori potranno fornire al governo l’accesso anticipato ai modelli per un massimo di trenta giorni prima della distribuzione ad altri partner fidati. Governo e aziende potranno inoltre collaborare nella selezione delle organizzazioni ammesse alla fase iniziale. Lo stesso testo precisa, tuttavia, che queste disposizioni non autorizzano licenze obbligatorie, permessi o procedure generali di pre-approvazione.

La distanza tra norma e prassi è il punto più delicato. Formalmente la collaborazione resta volontaria; concretamente, una richiesta collegata alla sicurezza nazionale esercita una pressione difficile da ignorare. Il lancio di GPT-5.6 avviene dunque mentre le regole sono ancora in costruzione, attraverso negoziati che precedono il quadro ripetibile che l’ordine esecutivo incarica le agenzie federali di sviluppare.

Il rilascio diventa parte dell’architettura di sicurezza

GPT-5.6 apre una fase nella quale pubblicare un modello non sarà più una decisione puramente commerciale. L’accesso scaglionato, il monitoraggio degli utenti e la selezione dei partner stanno diventando strumenti di mitigazione al pari dei filtri applicati alle risposte.

Un’anteprima controllata può offrire tempo per individuare vulnerabilità e correggere protezioni insufficienti. Senza criteri trasparenti, verifiche indipendenti e procedure contestabili, può però produrre un mercato governato da accordi riservati, nel quale alcune organizzazioni ottengono un vantaggio competitivo deciso fuori dallo spazio pubblico.

La questione lasciata aperta da GPT-5.6 non riguarda soltanto quanto siano potenti i nuovi modelli. Riguarda chi avrà l’autorità di stabilire quando la loro potenza può essere distribuita e a quali condizioni. È su questo terreno, più ancora che nei benchmark, che si sta definendo il futuro dell’intelligenza artificiale di frontiera.

Bibliografia

OpenAI, “Previewing GPT-5.6 Sol: a next-generation model”, 26 giugno 2026.

OpenAI, “GPT-5.6 Preview System Card”, giugno 2026.

The White House, “Promoting Advanced Artificial Intelligence Innovation and Security — Executive Order 14409”, 2 giugno 2026.

Reuters, “OpenAI defers public rollout of GPT-5.6 as US seeks early access to frontier AI models”, 26 giugno 2026.

Associated Press, “OpenAI and Anthropic limit new AI models to Trump-approved customers during cybersecurity review”, 26 giugno 2026.

Partecipa alla community

guest

0 Commenti
Più recenti
Più votati
Inline Feedback
Vedi tutti i commenti

Articoli correlati

0
Lascia un commento, la tua opinione conta.x