intelligenza artificiale

Agent di OpenAI, la nostra prova: cosa farci e perché



Indirizzo copiato

L’interfaccia grafica dell’Agent è molto usabile, e consente anche di osservarne il comportamento, mettendo in pausa l’esecuzione quando si vuole per poter interagire col Web browser usato dal modello. Abbiamo provato l’agente di OpenAI per vari compiti. Ed è impressionante

Pubblicato il 21 lug 2025

Antonio Cisternino

Università di Pisa



GPT-OSS OpenAI 2025
OpenAI Codex logo on phone screen and OpenAI Codex logo in the background. Indonesia – May 22, 2025

Abbiamo provato l’Agent di OpenAI. Novità che combina le capacità di navigazione Web di Operator con quelle dell’agente Deep Research e, aggiungerei, anche con capacità che assomigliano a quelle che si osservano durante l’esecuzione di Codex.

Per ora l’Agent è disponibile solo negli Stati Uniti e, come già per gli altri agenti, è limitato nel numero di interazioni a seconda del livello di sottoscrizione ChatGPT (400 pro, 40 plus, team e a breve enterprise e Edu).

L’annuncio sembra promettere molto, ma si tratta davvero di un cambiamento importante? O si tratta di un annuncio per mantenere alta l’attenzione sul tema AI?

Le prime impressioni dalla nostra prova: soprattutto è affascinante osservare il suo funzionamento mentre opera.

Il funzionamento di Agent di OpenAI

L’agente di OpenAI si attiva tra gli strumenti della chat e modifica semplicemente il comportamento del sistema a fronte di una richiesta. Come nel caso di Operator e di Codex viene allocato un ambiente virtuale nel cloud al fine di consentire all’AI di interagire sia con un Web browser che con un terminale dove vengono eseguiti numerosi comandi per analizzare i dati recuperati dai vari connettori che consentono di collegare fonti di informazione oltre al Web (es. GitHub, Office 365, Google Workspaces, etc.).

Per default solo il connettore Web è abilitato, se si attivano altri connettori si ottiene una schermata di avviso che raccomanda di fare attenzione poiché l’uso dell’agente potrebbe fornire involontariamente accesso all’esterno dei dati disponibili attraverso quel connettore.

Come nel caso degli altri agenti di OpenAI, Agent può eseguire a lungo (nelle mie prove ho superato la mezz’ora in alcuni casi) ed è davvero affascinante osservarlo mentre funziona. Per provarlo ho immaginato tre scenari d’uso: l’analisi di dati, la ricerca e la sintesi, e lo svolgimento di un compito.

Analizzare dati con l’Agent di OpenAI

Una delle capacità sbandierate di Agent è quella di analizzare dati disponibili in file, per questo ho pensato di fornire i dati presi dal sito Open Data della Regione Toscana con le informazioni sulle prestazioni ambulatoriali della sanità regionale.

Oltre ad allegare i file recuperati dal sito della regione con dati del 2024 e 2025 ho effettuato questa richiesta:

Ho scaricato questi file dal sito degli Open Data della Regione Toscana, devo fare una presentazione powerpoint che mostri trend interessanti presenti in questi dati che mostrino lo stato delle prestazioni sanitarie regionali.

L’agente ha lavorato per 18 minuti per poi fornire una breve analisi ed ha poi generato una presentazione PowerPoint con la sintesi dei risultati.

La presentazione è decisamente migliore di quelle che normalmente si ottengono da una AI (che se va bene sono liste puntate con immagini), anche se in alcuni casi sono stati generati grafici vuoti o non proprio adeguati e anche un tentativo di chiedere di sistemare la presentazione non ha portato i frutti sperati. In ogni caso il risultato è decisamente il migliore che ho visto fino ad oggi a fronte di un prompt semplice.

Agent: abbiamo provato a fargli fare ricerca e sintesi

Un secondo compito che ho affidato all’Agent è quello di reperire lo stato dell’arte delle linee guida delle Università Italiane nel contesto del disegno di legge in discussione alle camere e dell’AI Act e di proporre una linea guida che ne riassuma i punti salienti. Si tratta di un lavoro che avevo già provato a chiedere a Deep Research, quindi ho potuto anche confrontare la qualità dei risultati con i due agenti ed effettivamente la qualità del risultato con Agent è stata superiore a quella condotta da Deep Research in termine di sintesi e preparazione del risultato finale.

Ci vorrebbe più attività sperimentale, ma l’impressione che si ha è che l’uso del Web browser per navigare condizioni in qualche modo l’agente che fruisce dell’informazione in modo più vicino a quello che facciamo noi, ed evidentemente questo processo aiuta ad individuare la rilevanza delle informazioni in modo diverso da quello in cui la macchina scarica tutto il dato e lo analizza.

Svolgere compiti con l’agente di OpenAI

Come avevo già fatto al tempo della prova dell’Operator ho chiesto all’Agent di prepararmi un carrello della spesa sul sito di Esselunga. Ecco il prompt che ho usato:

Voglio organizzare una cena romana per quattro persone con il seguente menu:

– Carciofi alla romana

– Carbonara

– Saltimbocca

– Frutta

– Tiramisu

Mi prepari il carrello della spesa sul sito esselunga?

Durante il processo mi sono autenticato sul sito grazie alla possibilità di interagire col browser (e l’ho fatto poiché è presente il secondo fattore di autenticazione, elemento essenziale per la sicurezza), ed ho osservato l’agente navigare il catalogo. Purtroppo dopo un po’ il sito deve aver percepito che l’interazione non era umana ed ha bloccato la connessione, ma per il tempo per cui Agent ha funzionato ha svolto in modo più che ragionevole il compito assegnato come si può osservare nel video (che ho accelerato a velocità 8x).

Il punto di vista di OpenAI sul suo Agent: benchmark

Nel dare l’annuncio della disponibilità di Agent, OpenAI ha anche rilasciato svariati benchmark per mostrare le prestazioni del nuovo arrivato. Come è lecito aspettarsi il comportamento del nuovo arrivato è decisamente superiore ai predecessori, anche quando viene confrontato con la Deep Research.

Tra i numerosi grafici ho trovato interessanti quelli che confrontano l’Agent con gli umani, in termini di tempo di completamento e correttezza del risultato e nella manipolazione di fogli di calcolo.

È decisamente sorprendente come in poco meno di tre anni le AI si siano sviluppate al punto tale da avvicinarsi alle prestazioni umane in numerosi compiti. Non dobbiamo però dimenticare che, almeno per ora, il contributo dell’uomo nell’usarne le capacità è un aspetto fondamentale nel determinare la qualità dei risultati che si ottengono.

Agent di OpenAI è impressionante, ecco perché

L’Agent è semplicemente impressionante, e il comportamento che esibisce quando usato sembra molto più maturo di quello di Suna di cui abbiamo parlato recentemente.

Appare evidente che se l’AI ha a disposizione di più tempo produce risultati migliori (fatto noto), ma quello che sorprende di Agent è come la combinazione di numerosi strumenti consenta di essere più efficace dell’uso singolo. In altre parole Agent è superiore a Operator e Deep Research nonostante sia una sorta di somma dei due agenti.

L’interfaccia grafica dell’Agent è molto usabile, e consente anche di osservarne il comportamento, mettendo in pausa l’esecuzione quando si vuole per poter interagire col Web browser usato dal modello.

Non si può non pensare che gli 1-4 anni previsti da Harari per delegare all’AI la gestione finanziaria forse saranno pochi mesi e questo apre domande molto importanti.

guest

0 Commenti
Più recenti
Più votati
Inline Feedback
Vedi tutti i commenti

Articoli correlati