Il confronto tra i grandi provider di AI si inasprisce con continui rilasci di modelli sempre più capaci per catturare quote di mercato. OpenAI sente la pressione dei due competitor principali (Google e Anthropic) e, a poche settimane dal rilascio di Google del modello Nano Banana in Gemini 3, risponde con una versione aggiornata del proprio modello di generazione immagini.
Al modello si affianca una nuova sezione nell’app dedicata alla generazione e alla modifica delle immagini. Come già accaduto con l’annuncio di Sora 2 (seguito a Veo 3 di Google e ultimi sviluppi interessanti di Runway Gen 4.5), il rilascio è accompagnato da una vera e propria applicazione che ne supporta l’uso.
Indice degli argomenti
Cosa cambia con il nuovo generatore di immagini di ChatGPT
Uno degli aspetti evidenziati da OpenAI è la capacità del modello di modificare immagini esistenti senza stravolgerle, cosa che in precedenza accadeva più spesso. Provando la funzione con la foto di una chitarra, il miglioramento è evidente: diventa davvero possibile intervenire su dettagli specifici rispettando l’immagine originale.

Editing più fedele sulle foto esistenti
La sensazione è che l’editing sia più “conservativo” e meno incline a reinventare la scena. In pratica, quando si chiede una modifica mirata, il modello tende a preservare composizione e contenuti, riducendo l’effetto “rigenerazione totale” che molti avevano sperimentato nelle versioni precedenti.

Stili predefiniti e prompt generati
L’interfaccia propone anche l’applicazione di stili predefiniti alle immagini, anche se la funzione — di fatto — genera un prompt in una nuova chat. Ecco il prompt associato allo stile schizzo:


Testo nelle immagini: perché il nuovo generatore di immagini di ChatGPT è più preciso
Una novità importante è la capacità di realizzare immagini con molto testo, come avviene, per esempio, in una locandina. In una chat, ho chiesto gli eventi del Capodanno Pisano e poi di generare una locandina con un’immagine di sfondo e una mappa dei luoghi principali.
A parte un piccolo errore (Cronaza invece di Cronaca), la locandina risulta corretta dal punto di vista del testo. La rappresentazione della mappa cittadina è invece inesatta: Palazzo Gambacorti viene posizionato dall’altra parte del fiume Arno.


Istruzioni e limiti: cosa fa meglio il nuovo generatore di immagini di ChatGPT
Il nuovo modello segue le istruzioni in modo più accurato rispetto al precedente, e anche le restrizioni nella generazione sembrano più tolleranti nell’applicazione dei limiti quando si usano riferimenti potenzialmente soggetti a copyright.
Per esempio, con il prompt “Genera la board del Monopoly ma usa i nomi delle capitali del mondo per i vari posti” si ottiene una board che soddisfa la richiesta, anche se molte delle scritte tipiche del campo di Monopoly risultano solo accennate e non sono riportate correttamente.

Dove si inceppa: limiti del modello e risultati inattesi
OpenAI indica che il nuovo modello ha anche alcune limitazioni, anche nello svolgimento di compiti che il predecessore gestiva in modo più accurato. È il caso dell’applicazione dello stile “dark fantasy anime” a una foto, che viene mantenuta come foto e non renderizzata come cartone animato.

Anche la modifica di immagini che includono molte persone può portare a risultati inattesi, secondo quanto segnalato dalla stessa OpenAI.

Dall’era DALL·E al nuovo generatore di immagini di ChatGPT
Il modello di generazione di immagini di GPT che ha sostituito DALL·E ha reso possibile l’uso del testo nelle immagini, ma molti hanno percepito una perdita di creatività nelle immagini generate. In particolare, diagrammi e infografiche erano facilmente riconoscibili, con una scarsa capacità di variare font e colori.
La versione 1.5 invece fa un uso più sofisticato dei font, variando da quelli medievali usati nella locandina del Capodanno Pisano a quelli della seguente infografica generata con il prompt “Crea un’infografica che mostri il pizza box model applicato al cloud”:

Stili artistici, policy e riferimenti: la linea (ancora) sottile
Anche la generazione di immagini artistiche è migliorata e, a quanto pare, le limitazioni sono state ridotte, consentendo di citare stili di artisti come Keith Haring.

Ma è ancora possibile incorrere nelle limitazioni delle policy, come mostrato dalla richiesta di realizzare una vignetta in stile XKCD. Rimuovendo il riferimento allo stile, la richiesta ha prodotto un’immagine comunque influenzata dal prompt precedente.

Velocità e usabilità: un salto concreto
Il nuovo modello è decisamente più veloce del predecessore nella generazione delle immagini. Questo lo rende più fruibile, soprattutto considerando che il modello precedente spesso falliva nella generazione e, in ogni caso, impiegava molto tempo per produrre un output.
La maggiore velocità incide direttamente sulla praticità: meno attese e più iterazioni, soprattutto quando si lavora per tentativi su layout, testo e dettagli.

Disney e personaggi: cosa potrebbe cambiare
Resta da capire l’impatto che avrà l’accordo stretto da OpenAI e Disney, che autorizza l’uso dei personaggi in Sora (e magari anche nella generazione immagini). Almeno per ora, il modello si rifiuta di generare immagini che includano i popolari personaggi.

Conclusioni
Qualcuno ha definito in modo un po’ enfatico la versione 1.5 del modello di OpenAI come il “nano banana killer”. Personalmente, penso sia più corretto dire che OpenAI si sia messa al passo di Google in questo settore e che, in alcune applicazioni specifiche con uso intensivo di testo, sia forse anche più avanti.

Trovo però più interessante l’introduzione di un’interfaccia dedicata alle immagini, con l’album di tutte le immagini generate in passato, che enfatizza gli aspetti visuali senza “annegare” i contenuti multimediali dentro le chat.
Una funzione che mi ha colpito molto è stata quella del restauro di vecchie foto, che spesso recupera dettaglio. In alcuni casi, però, le modifiche ai volti sono sufficienti a cambiarli, come nell’esempio riportato.
Restano comunque innegabili i miglioramenti: si può parlare di un significativo passo avanti per OpenAI













