In poco più di dieci giorni abbiamo assistito a una pletora di annunci provenienti dal mondo dell’AI che contribuiscono attraverso continui colpi di scena a continuare a rendere fluido il panorama dell’AI e allo stesso tempo ad acuire quel senso di incertezza nelle scelte fatte in assenza di un chiaro cavallo su cui puntare. Cerchiamo quindi di capire cosa è successo e come questo influenzerà le prossime settimane.
Per capire i movimenti in atto è necessario separare le evoluzioni dei modelli dalle funzioni più orientate all’interfaccia e alle funzioni e dai modelli di business.
Indice degli argomenti
La nuova ondata di AI nei modelli più osservati
Sul fronte modelli le news più rilevanti sono i rilasci dei modelli GPT 5.5 di OpenAI, il nuovo GPT Image 2.0 e i modelli Deepseek v4 e Kimi K2.6. Il nuovo modello di OpenAI porta avanti lo stato dell’arte di un modello AI, soprattutto negli ambiti del coding e dell’agentic AI, ma avanzando anche le capacità di ragionamento ingegneristico e scientifico. Nello scorrere l’articolo che lo annuncia è evidente come il numero di benchmark dei modelli AI stia esplodendo, ed ogni produttore tenda a pubblicare i riferimenti a quelli che ritiene rilevanti.

Dopo anni di confronti con i propri modelli OpenAI si confronta ormai anche con Gemini e Claude, segno di riconoscimento del lavoro delle altre grandi realtà statunitensi dell’AI.
Tra i benchmark nuovi troviamo CyberGym, un benchmark orientato ai problemi di cybersecurity. Si tratta di un tema caldo, come ha dimostrato il mancato rilascio da parte di Anthropic del modello Mythos, limitato a sole quaranta aziende, e particolarmente forte negli aspetti di Cybersecurity al punto di rappresentare un potenziale rischio per i sistemi IT globali. Va anche detto che Anthropic nuovamente è finita sotto i riflettori grazie ad un accesso non autorizzato al modello Mythos, un altro problema di sicurezza dopo il rilascio di fatto del codice di Claude code fatto per errore qualche settimana fa.

La corsa cinese e la nuova ondata di AI
Seguendo la traiettoria già sottolineata dall’AI Stanford Index, i modelli cinesi continuano ad avvicinarsi a quelli statunitensi, offrendo pricing più aggressivi a parità di token e soprattutto spingendo per modelli di rilascio open weight dei modelli (anche se in pochi dispongono delle risorse di calcolo realmente necessarie per la loro esecuzione). Sia Deepseek v4 e Kimi K2.6 hanno raggiunto in alcuni benchmark le prestazioni di Claude Opus 4.6, offrendo alternative ai modelli americani.
Agenti autonomi, automazione e punti di controllo
Anche nel caso di Deepseek v4 e Kimi K2.6 l’attenzione è al coding e all’esecuzione di agenti, tecnologia sempre più diffusa e che trova sempre più incarnazioni in progetti sia aperti che chiusi.
Non può non saltare all’occhio il rilascio di Workspace agents di OpenAI per l’Enterprise e l’education. Questi agenti consentono l’automazione di processi all’interno del workspace aziendale a patto che si dia accesso mediante connettori e strumenti ai vari strumenti utilizzati (e questo richiede sicuramente attenzione ed un confronto significativo con il DPO per analizzare i rischi).
È sicuramente attraente disporre di intelligenze artificiali capaci di automatizzare processi aziendali, e la possibilità di poter creare facilmente agenti utilizzando strumenti di alto livello come quelli forniti da OpenAI non può che accelerare l’adozione. È però necessario sottolineare che il passaggio da una modalità di interazione con l’AI orientata al dialogo ad un lavoro autonomo riduce i punti di controllo per verificare la correttezza dell’operato dell’AI, riducendo di fatto, almeno in parte, l’accountability dei sistemi stessi.
Dagli esempi fatti da OpenAI al lancio è evidente che le prime applicazioni siano quelle di reporting e prioritizzazione, ovvero attività che aiutano a processare autonomamente grandi quantità di dati e informazioni che poi vengono sintetizzate in report di varia natura. È importante però sottolineare che, sebbene non vi siano rischi legati ad azioni che l’AI intraprende, anche la selezione dei contenuti potrebbe avere impatto sul funzionamento aziendale: delegare l’AI, almeno in parte, alla selezione delle metriche e dei KPI sicuramente riduce lo sforzo lavorativo, ma allo stesso tempo seleziona per nostro conto quali siano i dati degli di attenzione, potenzialmente portando a valutazioni errate a causa di una visione distorta dalla lente dell’AI.

Vedremo come saranno utilizzati questo nuovo tipo di agenti e quale sarà l’impatto nella gestione dei processi aziendali.
Come la nuova ondata di AI cambia l’esperienza utente
Molti annunci si stanno concentrando sull’esperienza utente. Sicuramente i workspace agents non sono solo una tecnologia ad agenti ma sono anche la loro personificazione nell’interfaccia di ChatGPT di questo tipo di tecnologia. Lo stesso si può dire del modello GPT Image 2.0 che consente la creazione di grafica vera e propria, supportando la selezione di font e stili e non solo la capacità di generare immagini.
Diviene quindi sempre più facile creare infografiche e non solo immagini con i nuovi modelli, e questo non può non spingere all’evoluzione delle interfacce. Nel seguente esempio appare evidente come si abbia decisamente più controllo nella realizzazione di veri e propri poster.

Anche Codex cambia pelle: invece di introdurre il Coworker come ha fatto Anthropic OpenAI sembra puntare sul potenziamento della App Codex che comincia ad occuparsi non solo di codice: il Codex diviene quindi il tuo agente personale in esecuzione sul proprio computer, capace anche di generare immagini, analizzare documenti ed effettuare tutte quelle azioni che ormai ci aspettiamo un agente possa intraprendere.
Prezzi, abbonamenti e competizione nel mercato AI
È importante ricordare come il panorama dell’AI non sia indirizzato solo dalle innovazioni tecnologiche, anche i modelli di costo possono influenzare significativamente le scelte. Questa settimana LinkedIn era pieno di post di lamentele di utenti Anthropic che si sono visti tagliare di fatto la capacità in termini di token e di uso di Claude Code inclusa con l’abbonamento. Questo ha spinto molti a trovare modi di ridurre il consumo di token, ed altri ad annunciare l’abbandono della piattaforma in favore di altre.
In questo contesto si collocano sicuramente le offerte dei modelli cinesi che, grazie al miglioramento della qualità dei modelli, divengono molto competitivi sul pricing per token tentando gli utenti e spingendo la competizione. Non è chiaro per quanto l’approccio statunitense riuscirà a giustificare il pagamento di prezzi premium per capacità che non sono più così avanzate rispetto a chi insegue.
La nuova ondata di AI tra incertezza e scenari futuri
Come si poteva intuire il 2026 si conferma un anno di forte cambiamento ed instabilità nel mondo dell’AI. Continui colpi di scena ed annunci di nuovi rilasci contribuiscono a rendere il clima incerto, unitamente anche agli aspetti giuridico normativi. Lo stato del Maine ha approvato una moratoria di due anni per i datacenter di più di 100MW per capire l’impatto delle gigafactory, e lunedì 27/4 si avvia il contenzioso tra OpenAI e Elon Musk che potrebbe stravolgere l’intero panorama in poche settimane.
Non resta quindi che continuare ad osservare e provare per comprendere gli impatti reali che questi annunci produrranno nelle settimane e nei mesi futuri.











