intelligenza artificiale

GPT Images 2, la prova: come avere un designer visivo con AI

Home Industry 4.0/Innovazione in azienda

GPT Images 2 amplia il ruolo dell’AI visiva: più controllo su testo, layout e composizione. Il nuovo modello di OpenAI migliora fotorealismo, infografiche e sintesi grafica di contenuti e codice, aprendo usi più concreti in ambito professionale, editoriale e aziendale. Vediamo come usarlo al meglio

Pubblicato il 6 mag 2026

Antonio Cisternino

Università di Pisa

Chiedi all'AI

Riassumi questo articolo

Approfondisci con altre fonti

Ma che salto in avanti il nuovo GPT Images 2.0, di OpenAI la nuova versione del modello AI che genera immagini.

L’abbiamo provato a fondo per apprezzarne i progressi fatti.

Già nel passaggio da DALL-e a GPT Images la compagnia aveva reso il modello meno “artistico” e capace di gestire quasi correttamente i testi parte delle immagini, e con la nuova versione è evidente che l’intenzione è proseguire sulla stessa strada.

Indice degli argomenti

GPT Images 2: cosa cambia davvero nella generazione di immagini AI

L’uso del generatore di immagini sembra quindi essere passato da un generatore di immagini con tocchi artistici a un editor e generatore di immagini per poi divenire un vero e proprio designer capace di combinare testo e immagini in composizioni di design. Questa transizione è stata sottolineata dalla notizia del lancio del nuovo modello, ricca di esempi che sembrano più pagine di riviste che immagini generate da AI come ce le siamo immaginate negli ultimi anni.

Questa evoluzione nell’addestramento del modello da parte di OpenAI è nella scia di rendere più “enterprise” le funzioni delle AI per assicurare la sostenibilità economica del prodotto. Recentemente sembra che la compagnia stia continuando la trasformazione da laboratorio di ricerca a grande corporation “for profit” (motivo per cui Musk è in causa proprio in questi giorni). Cerchiamo quindi di capire le novità del nuovo modello e come può essere impiegato nel lavoro quotidiano grazie alle nuove capacità.

GPT Images 2, prova e analisi del nuovo modello di OpenAI: l’evoluzione nella generazione di immagini

Al lancio di GPT Images 1 nel novembre 2024 avevo provato la prima versione del nuovo modello con un prompt che chiedeva di generare una rosa al tramonto. Il confronto tra DALL-e GPT Images mostrava chiaramente l’abbandono della vena artistica del modello, ma il risultato dal nuovo modello mostra chiaramente una crescita da un punto di vista di fotorealismo.

Testo nelle immagini

Analogamente la rappresentazione con testo di “Precipitevolissimevolmente” segue un’evoluzione in cui DALL-e genera immagini artistiche ma con scritte errate, GPT Images 1 un fumetto e la nuova versione una composizione che sembra essere la pagina di un libro.

Anche quando si chiede “Puoi generare un’immagine che rappresenti l’AI che cambia il futuro dell’umanità?” il nuovo modello genera immagini meno “fumettose” della prima versione ma si sente in dovere di introdurre del testo scritto (che possiamo comunque chiedere di non inserire nel prompt).

GPT Images 2, Un generatore di infografiche

L’abilità di unire grafica a testo rende il nuovo modello molto efficace per la realizzazione di rapide infografiche. L’output del prompt “Puoi generare un’infografica che spiega il motore a scoppio a 4 tempi?” mostra come in poco più di un anno il modello si sia evoluto significativamente verso la generazione di grafica che unisce testo ad immagini.

Sintesi grafica di un articolo

Per capire le potenzialità del nuovo modello ho provato a chiedere di riassumere in un’immagine la pagina del mio articolo sull’AI index di Stanford e il risultato è sicuramente degno di nota. Si vede come GPT si sia prima avvalso delle capacità di analisi e di navigazione Web per poi generare un’immagine utilizzando il nuovo modello. Va però detto che l’immagine ha colto alcuni elementi dell’articolo ma ha anche aggiunto altre informazioni in esso assenti ed evidentemente provenienti da altre fonti.

Resta il fatto che si apre una nuova pagina nella sintesi: adesso l’AI può sintetizzare non solo un sommario di un testo, ma anche fornirne una rappresentazione grafica, aprendo nuovi scenari di utilizzo, soprattutto in ambito aziendale. È infatti possibile realizzare elementi grafici rapidamente per tutte le forme di comunicazione, soprattutto quelle interne dove è poco plausibile l’impiego di un grafico.

Schemi dal codice

L’abilità di schematizzare è sicuramente utile anche in agenti come Codex, rendendo possibile la generazione di schemi illustrativi del funzionamento del codice. Ad esempio ho chiesto al mio Codex di spiegare a partire dal codice come il sistema open source Eligere per il voto elettronico riesca ad anonimizzare l’elettore pur verificando il diritto di voto. Lo schema è stato ottenuto dal codice e non da una mia spiegazione, è sicuramente rivoluzionario come impiego dell’AI nella generazione di immagini.

Come succede anche per i grafici umani, anche GPT Images 2 tende ad usare un linguaggio grafico che lo identifica a meno che non si facciano richieste esplicite nel prompt.

Controllare la grafica con Gpt Images 2

È possibile sia descrivere un layout nel prompt, magari ispirandosi ad uno stile noto come ad esempio la copertina del Times. Ad esempio, se si chiede “Puoi generare la copertina in stile Times che mostra l’Università di Pisa con i numeri della classifica CENSIS 2026?” si ottiene la seguente immagine.

Template grafici

È anche possibile fornire un template grafico a cui il modello deve attenersi e per la prima volta ho ottenuto risultati abbastanza buoni (anche se il generatore non è riuscito a non reinterpretare leggermente il tema grafico):

Da una foto a un’altra immagine

È anche possibile generare foto a partire a altre foto. Ad esempio, ho trasformato una mia foto di una presentazione con il prompt “Puoi generare un’immagine di me che spiego usando una lavagna a gesso l’equazione di rendering (che sia leggibile) accenna anche qualche mesh per illustrarla” allegando l’immagine a sinistra.

Scrittura simulata nelle immagini

La possibilità di creare immagini con testo apre anche nuovi fronti, ad esempio il prompt “Genera una pagina in formato protocollo con un semplice tema scritto a mano su una storia basata sulla torre di Pisa” ha prodotto un’immagine che a prima vista sembra davvero la foto di un compito scritto a mano.

Un bilancio su Gpt Images 2

Il nuovo modello GPT Images 2 è molto di più di un semplice generatore di immagini: la capacità di manipolare testo e grafica con una certa precisione apre numerose applicazioni che prima erano impensabili. Le infografiche e la sintesi di documenti in grafica sembrano le nuove applicazioni che possono trovare numerosi usi in ambito professionale e non solo privato. La possibilità di usare il modello all’interno di Codex apre poi interessantissimi scenari nella descrizione visiva del software (e non solo) a partire dai sorgenti. Come si usa dire, “un’immagine vale più di mille parole”…

@RIPRODUZIONE RISERVATA

Antonio Cisternino

Università di Pisa

Seguimi su

0 Commenti

Più recenti

Più votati

Inline Feedback

Vedi tutti i commenti

Canali

Industry 4.0/Innovazione in azienda

GPT Images 2, la prova: come avere un designer visivo con AI

GPT Images 2: cosa cambia davvero nella generazione di immagini AI