la nostra prova

Codex di OpenAI diventa un agente per il computer: cosa può fare davvero



Indirizzo copiato

OpenAI ha trasformato Codex da agente cloud per repository a applicazione desktop general purpose capace di lavorare su codice, documenti e attività automatizzate. Tra permessi, browser integrato, generazione di immagini e limiti d’uso, il servizio punta a diventare un assistente operativo quotidiano anche oltre lo sviluppo software

Pubblicato il 20 mag 2026

Antonio Cisternino

Università di Pisa



openai codex AI aperta
AI Questions Icon
Chiedi all'AI
Riassumi questo articolo
Approfondisci con altre fonti

Un anno fa (il 16 maggio 2025) OpenAI rilasciava in anteprima il Codex integrato nell’interfaccia di ChatGPT: un agente cloud capace di supportare i programmatori nello svolgimento di compiti su repository GitHub.

Era la prima versione agentica di OpenAI per la manipolazione di codice (che seguiva dopo solo un mese il rilascio del progetto open source CodexCLI) dopo il rilascio del modello vero e proprio del 2021 utilizzato da GitHub Copilot.

L’agente seguiva a due mesi di distanza del rilascio da parte di Anthropic di Claude Code, un agente analogo basato sui modelli del concorrente e divenuto rapidamente molto popolare. La natura orientata al cloud del primo rilascio di Codex ha probabilmente scoraggiato molti programmatori al suo uso, anche se la versione CLI consentiva di utilizzare i modelli di OpenAI anche sul disco del programmatore. Nel corso dell’anno OpenAI ha però rilasciato un’applicazione desktop per MacOS e Windows (e prossimamente Linux) capace di lavorare sul proprio computer.

Più recentemente OpenAI ha cominciato a far evolvere questa applicazione per divenire un agente general purpose che consenta lo svolgimento di compiti non limitati all’ambito della programmazione, ma per svolgere compiti arbitrari.

Cerchiamo di capire come utilizzare l’applicazione Codex per disporre di un agente sul proprio computer e quali siano i limiti e l’accessibilità di questa nuova tecnologia.

Usare Codex per sviluppare codice

L’interfaccia dell’applicazione Codex è significativamente differente da quella di ChatGPT: nel pannello di sinistra le chat non sono elencate secondo una linea temporale, sono invece organizzate secondo le cartelle del proprio sistema per cui si è chiesto di svolgere un compito all’agente.

Il pannello centrale è occupato dalla conversazione, ma gli elementi sono diversi da quelli a cui siamo abituati in una semplice Chat: al testo si alternano vari elementi tipici dello sviluppo come, ad esempio, le modifiche che l’agente ha apportato ai vari file.

L’agente è in grado di lavorare sia su cartelle di codice già esistenti oppure creare applicazioni da una cartella vuota. In ogni caso le competenze e i plugin consentono di integrare la conoscenza dell’agente con capacità specifiche, ad esempio sviluppando in .NET ho tra le mie competenze la skill ASP.NET Core.

Skill, plugin e permessi operativi

I plugin sono analoghi alle competenze ma sono relative a terze parti e richiedono tipicamente la registrazione presso servizi esterni di cui poi si invocheranno le API, come ad esempio nel caso di GitHub e Hugging face.

Le skill (o competenze) sono divenute una specifica che standardizza file di risorse che un agente inserisce nel contesto del modello per condizionarne i comportamenti. Possono anche fornire strumenti eseguibili e documentazione che consentano al modello di seguire prassi ed effettuare azioni durante l’esecuzione.

Codex ha un modello stringente di permessi per evitare che l’agente possa prendere iniziative dannose per proprio conto: ogni volta che tenterà di eseguire un comando di shell il sistema per default chiede l’approvazione che può essere puntuale o per la particolare istanza e le successive. Sebbene questo modo di procedere possa essere un po’ noioso è importante non disabilitarlo per non incorrere in dolorosi errori da parte dell’agente che potrebbe eseguire azioni indesiderate, a volte irreversibili.

Browser integrato, computer use e immagini

Un aspetto molto interessante dello sviluppo di applicazioni che usano il Web per il rendering della grafica è la possibilità di utilizzare il Web browser integrato nell’applicazione per visualizzare lo stato ed annotare la pagina Web come si fa con gli strumenti di sviluppo del browser per fornire indicazioni specifiche su aspetti dell’interfaccia che devono essere modificati.

Nella sua versione Mac Codex è anche capace di “cliccare” su finestre native del sistema per supportare sia lo sviluppo ma anche l’uso di applicazioni grafiche sul proprio desktop. Anche il computer use è soggetto alla sandbox per evitare che il modello compia azioni indesiderate cliccando su azioni che non sono richieste.

Infine una caratteristica di Codex è quella di saper utilizzare GPT-Images 2.0 per la generazione di immagini, questo apre a numerose possibilità di ottenere rappresentazioni grafiche del funzionamento del codice come nel seguente esempio del sistema Open source Eligere (https://github.com/Unipisa/Eligere) che impiega due applicazioni Web per assicurare l’anonimità del voto espresso.

Documentazione e regole di progetto con Codex di OpenAI

L’impatto che Codex può avere sulla documentazione del codice è quindi rilevante, sia nella creazione di documentazione e schemi (ad esempio diagrammi di sequenza o di stato) di funzionamento, ma anche nel tenerli aggiornati durante l’aggiornamento dell’applicazione stessa.

In effetti è addirittura possibile istruire l’agente usando un file AGENTS.md nella cartella del progetto che fornisca istruzioni specifiche, come ad esempio quella di rispettare requisiti forniti in fase di analisi e presenti nel progetto stesso, chiedendo esplicitamente conferma qualora un requisito dovesse essere modificato.

Un agente per utenti e non per sviluppatori

Seguendo le orme di Anthropic ma con un approccio decisamente diverso OpenAI ha deciso di aprire Codex all’uso del computer non solo per lo sviluppo di codice (Anthropic ha invece integrato il Cowork nell’interfaccia di Claude). Ecco quindi che possiamo chiedere all’agente di svolgere compiti più documentali, di scrivere bozze di email al posto nostro e svolgere molti altri compiti.

A titolo di esempio ho aperto la cartella dove tengo i file Word degli articoli che scrivo per Agenda Digitale. Come appare subito evidente dai suggerimenti l’agente si è accorto che il contenuto della cartella è di documenti e propone quindi prompt appropriati.

Mappare contenuti e leggere documenti con Codex

Ho pensato che fosse utile generare una mappa degli articoli che ho scritto negli ultimi due anni distinguendo tra quelli più descrittivi di annunci e novità e quelli più di riflessione sulle tecnologie. Dopo qualche prompt sono riuscito ad ottenere una rappresentazione in formato mermaid del mio lavoro, con l’agente che ha aperto i vari file ed ha analizzato il contenuto collocandolo nel tempo utilizzando le date di salvataggio dei file. In alcuni casi ha addirittura condensato articoli simili come, ad esempio, quello sui modelli Veo 3 e Sora 2, che hanno una matrice analoga.

Automazioni e compiti pianificati con Codex di OpenAI

È possibile anche automatizzare compiti utilizzando dei prompt che faranno partire dei compiti dell’agente ad orari specifici. È possibile ad esempio far fare una rassegna su un particolare argomento ogni mattina salvando in una cartella documenti ottenuti in rete, oppure analizzando i contenuti di una cartella per tenere aggiornate valutazioni sui documenti in essa contenuti.

I limiti di uso di Codex di OpenAI

Codex è disponibile per tutti i livelli di ChatGPT, incluso il livello gratuito. Ovviamente il numero di token che si possono utilizzare è contingentato e varia a secondo del livello della sottoscrizione (con un fattore di circa 20x tra il livello gratuito e quello Plus). L’applicazione consente di vedere il limite per ciascuna finestra di cinque ore e quello settimanale, limiti che sono facilmente raggiungibili se si fa un uso intenso dell’agente.

È possibile anche acquisire più capacità utilizzando API keys e pagando i token utilizzati passando ad un modello pay per use.

Perché Codex di OpenAI resta un buon punto di partenza

Ho trovato Codex un’applicazione molto ben fatta e che consente a tutti di utilizzare un Agente AI con poco sforzo. Da un punto di vista della user experience preferisco la scelta di OpenAI di utilizzare un’applicazione separata da ChatGPT per l’agente rispetto a quella di includere in Claude l’interfaccia dell’agente Cowork. Restano forti le differenze negli approcci: OpenAI privilegia il lavoro collaborativo e supporta anche l’esecuzione di compiti in cloud mentre Anthropic è più orientato all’esecuzione di compiti al terminale in stile Unix. Il supporto nativo di Windows in Codex, con l’uso di PowerShell, è decisamente apprezzabile ed efficace.

Uso quotidianamente Codex, ed ho cominciato anche ad inviare compiti mediante la app mobile. Si tratta di un approccio alternativo a quello di effettuare un’installazione OpenClaw che richiede decisamente più sforzo e competenze per accedere al mondo degli agenti AI.

È utile tenere presente che l’applicazione Codex può usare anche modelli locali e l’ultima versione di Ollama è capace di configurare in modo semplice l’app per utilizzare modelli open.

Se si è curiosi e si vuole sperimentare con gli Agenti Codex è decisamente un buon punto di partenza, essendo disponibile anche nella versione gratuita dell’account OpenAI.

guest

0 Commenti
Più recenti
Più votati
Inline Feedback
Vedi tutti i commenti

Articoli correlati

0
Lascia un commento, la tua opinione conta.x