A Shoreline Amphitheatre, davanti al pubblico degli sviluppatori, Sundar Pichai ha scelto una formula precisa per inquadrare l’evento del 19-20 maggio: “We are firmly in our agentic Gemini era“. Non è retorica da palco. È la cornice che tiene insieme una sessantina di annunci tecnici altrimenti dispersi, da Gemini 3.5 Flash agli occhiali Android XR, dalla nuova Search a un modello multimodale che simula gravità e cinetica. Il filo conduttore è uno solo: gli agenti smettono di essere demo da laboratorio e diventano interfaccia primaria dei prodotti consumer di Google.
L’azienda non parte da zero. L’app Gemini in dodici mesi è passata da 400 milioni a 900 milioni di utenti attivi mensili in 230 paesi, una traiettoria che colloca Mountain View in una condizione strana, quella di un challenger che dispone già di un’audience da incumbent. La domanda che gli analisti si pongono dopo Google I/O 2026 è se questa massa critica basterà a vincere la battaglia degli assistenti autonomi contro OpenAI e Anthropic, o se la partita si giocherà altrove, su un terreno che Google sta cercando di costruirsi da solo.

Indice degli argomenti
Perché Google ha aperto con Gemini 3.5 Flash e non con il Pro
La prima sorpresa è di sequenza più che di sostanza. Google ha aperto con Gemini 3.5 Flash, riservando a giugno il debutto del 3.5 Pro. Pichai ha presentato il modello come 4x più veloce dei concorrenti diretti, capace di superare Gemini 3.1 Pro su benchmark di coding e capacità agentiche come Terminal-Bench 2.1 (76.2%), GDPval-AA (1656 Elo) e MCP Atlas (83.6%). Nei punteggi pesa meno il numero assoluto e più la scelta di mettere in vetrina il modello cheap-and-fast prima del flagship. Significa che Google ritiene la battaglia competitiva del prossimo anno una partita di rapporto costo/latenza, prima ancora che di intelligenza pura.
Distribuzione del modello e messaggio ai builder
Il modello diventa di default in AI Mode su Search a livello globale, in Antigravity 2.0 (la piattaforma di sviluppo agentica desktop, rebrand di quanto presentato a novembre 2025), via API in Google AI Studio e nello sviluppo Android Studio. Il messaggio implicito ai builder è che la stessa intelligenza che alimenta l’esperienza consumer è disponibile via API, allo stesso prezzo a cui Google la consuma internamente. È una mossa di estrazione di valore inversa rispetto a quella praticata fino al 2024, quando i modelli più capaci restavano un differenziale chiuso nei prodotti proprietari.
Search, ventotto anni dopo
L’annuncio che genera il maggior numero di domande strategiche è la riscrittura della Search box. Elizabeth Reid, VP Search, ha definito quella di maggio “the biggest upgrade in over 25 years“. L’aggettivo trova un riscontro letterale: cambia l’oggetto su cui Google ha costruito vent’anni di abitudini di milioni di persone. La nuova barra di ricerca si espande dinamicamente, accetta input multimodali (testo, immagini, file, video, tab di Chrome) e ragiona attraverso tutti questi input combinati con Gemini 3.5 Flash.
Gli agenti entrano nella Search
AI Mode, lanciato sperimentalmente lo scorso anno, ha già superato un miliardo di utenti attivi mensili con query raddoppiate ogni trimestre. Su questa base Google introduce gli “agent in Search”, capacità che vanno dall’agentic booking (confronto prezzi, prenotazioni complete dentro la Search) alle interfacce generative che la pagina costruisce al volo in base alla richiesta, fino agli “information agents” che monitorano il web nel tempo e ritornano aggiornamenti. Le implicazioni per chi pubblica contenuti, gestisce SEO o vende ad sono profonde e ancora largamente irrisolte: Search Engine Journal ha registrato segnali contrastanti da parte di team Google diversi su come trattare il file llms.txt, sintomo di una fase di transizione non completamente coordinata neanche internamente.
Gemini Omni e la promessa del world-model
Demis Hassabis ha presentato Gemini Omni come “un nuovo livello di comprensione del mondo“, costruito combinando l’intelligenza di Gemini con i modelli generativi Veo e Nano Banana. Sul palco la demo ha mostrato editing video conversazionale (l’utente parla, il modello modifica scene, aggiunge personaggi, cambia azioni) e una simulazione physics-aware di gravità e cinetica. Il caveat onesto, riportato dalla stessa Google: quello che ha debuttato il 19 maggio è Gemini Omni Flash, una versione veloce ed embrionale. Gli aggiornamenti sostanziali del world-model arrivano “later this year”, il che significa che la retorica AGI andrà letta con la pazienza di chi distingue tra annuncio di intento e prodotto consegnato.
Rollout per creator e video
Omni Flash è già disponibile per gli utenti AI Plus, Pro e Ultra dell’app Gemini, dentro Flow (la piattaforma creativa di Google) e con rollout previsto su YouTube Shorts. Per i creator e per chi lavora con il video commerciale, il vantaggio si sposterà dalla produzione asset alla regia: cosa chiedere al modello, in che ordine, con quali constraint estetici. È un altro segmento in cui la barriera all’ingresso continua a comprimersi.
L’hardware XR resta in passerella, il software no
Le smart glasses Android XR arriveranno in autunno, costruite con Samsung, Qualcomm, Warby Parker e Gentle Monster, con un occhio rivolto a Xreal Project Aura come reference platform per gli OEM. La demo on-stage ha mostrato navigazione hands-free, traduzioni audio real-time nella voce del parlante, un agente che ordina “il solito” cold brew via DoorDash mentre il telefono resta in tasca. La parte hardware è stata trattata con sobrietà, quasi a non distogliere l’attenzione dal cuore software dell’evento. Wear OS è stato citato di sfuggita, e i Googlebook (i nuovi laptop che sostituiscono i Chromebook, mostrati la settimana prima all’Android Show) non hanno avuto spazio nella keynote principale.
L’impressione è quella di un Google che ha imparato la lezione del 2013-2017: l’hardware è strumento di distribuzione dell’intelligenza, non protagonista. Il vero protagonista vive nel cloud, e si chiama Spark.
Cosa fa davvero Gemini Spark e perché è diverso dai chatbot
Pichai ha descritto Gemini Spark come “your personal AI agent that helps you navigate your digital life, taking action on your behalf and under your direction”. La definizione asciutta nasconde un’architettura che cambia il modo in cui si pensa a un assistente AI. Spark gira su macchine virtuali dedicate dentro Google Cloud, costruito sul modello Gemini 3.5 e sull’agentic harness di Antigravity. Quando l’utente chiude il laptop, mette via il telefono, va a dormire, Spark continua a lavorare. Più che una promessa pubblicitaria, è la differenza architetturale che separa Spark dai chatbot conversazionali e anche da molte implementazioni agentiche viste finora.
Le tre famiglie di task
Il pacchetto di capacità annunciato e mostrato include tre famiglie di task. La prima è monitoraggio: Spark osserva la inbox Gmail per individuare nuovi abbonamenti nascosti negli estratti conto, tracciare aggiornamenti dalla scuola dei figli, segnalare comunicazioni che corrispondono a criteri impostati. La seconda è esecuzione multi-step: l’agente riceve un obiettivo, lo scompone, accede a Gmail, Docs, Calendar, esegue azioni intermedie e ritorna risultati. La terza è azione transazionale, con passaggi di conferma per invio email, acquisti e modifiche al calendario.
L’indirizzo Gmail dedicato
Una caratteristica concettualmente nuova è l’indirizzo Gmail dedicato che ogni Spark riceve. L’utente può inviargli compiti via email, come scriverebbe a un collaboratore umano, e Spark risponde con risultati o richieste di chiarimento. È il primo segnale chiaro di un design che tratta l’agente come un’entità con cui si comunica, non come un comando da impartire. Le integrazioni native con Workspace partono senza setup, e dalla seconda metà del 2026 arriveranno via Model Context Protocol connettori per Canva, OpenTable e Instacart, fra gli altri.
Il vantaggio strutturale di Google e i tre limiti che lo tengono in equilibrio
Qui sta il punto strategico che vale la pena fissare. Mentre Anthropic con Claude Cowork e OpenAI con ChatGPT Agent costruiscono assistenti che devono accedere a Gmail, Docs e Drive attraverso connettori di terze parti, Google parte da un terreno in cui possiede già l’email, il calendar, i documenti, i fogli, le foto, la storia di navigazione Chrome di centinaia di milioni di persone. Non deve negoziare l’accesso ai dati. Lo ha già. La friction zero che ne deriva è il vantaggio competitivo più solido nel mercato degli agenti consumer.
Ecosistema, sicurezza e governance
Ci sono però tre vincoli che bilanciano questa rendita di posizione. Il primo è la profondità dell’ecosistema MCP, dove Anthropic offre oggi oltre 2.300 server connessi contro la trentina di Spark. Per chi vive fuori dal perimetro Workspace (Outlook, Slack non-Google, CRM verticali, strumenti enterprise legacy), Spark vale molto meno. Il secondo è la superficie di attacco: un agente persistente che ha accesso a email, browsing e autorizzazioni di pagamento è un bersaglio ad altissimo valore. Google stessa, a maggio 2026, ha avvertito che siti malevoli stanno attivamente targeting gli AI agent attraverso prompt injection nascosti, e Spark integra meccanismi di “adversarial prompt detection” che però nessuno, in onestà, ha ancora risolto in modo definitivo. Il terzo è la governance enterprise, dove i CIO chiedono controlli di compliance, audit log granulari e tier di permessi che Spark, oggi, ha solo nelle slide degli annunci e non ancora nella product matrix dei piani Workspace.
Il pricing Gemini è il messaggio
C’è un dettaglio che vale più di tutti i benchmark messi insieme. Google ha tagliato il piano AI Ultra da 249,99 a 100 dollari al mese, contestualmente all’annuncio della beta Spark. Il bundle include 20 terabyte di cloud, YouTube Premium, accesso ai modelli più potenti e Gemini Spark in anteprima. Il movimento è speculare a quello che OpenAI e Anthropic praticano con i loro piani Pro e Max a 200 dollari mensili: Google si posiziona alla metà del prezzo dei competitor diretti, mentre offre un set di servizi che include due prodotti consumer (cloud storage e streaming video) che gli altri non hanno in casa.
Quel taglio del 60% sul prezzo è la dichiarazione strategica più chiara dell’evento. Significa che Google considera la diffusione capillare degli agenti più redditizia della rendita sui power user. È una scommessa lunga: l’agente come superficie di intermediazione di shopping e prenotazioni, ricerca informativa, generazione di contenuti, esecuzione operativa. Se Spark si afferma come tessuto connettivo della vita digitale di centinaia di milioni di persone, il valore non sta nel canone, sta in tutto quello che ci passa attraverso. La logica che vent’anni fa fece di Search la pagina più visitata del mondo si ripresenta su un piano diverso.
Gemini Spark: cosa portano a casa CTO e innovation manager
Per chi guida la trasformazione digitale di un’organizzazione, l’agenda concreta dei prossimi sei mesi cambia su tre piani. Il primo è di natura comparativa: la scelta di un assistente agentico aziendale smette di essere una decisione di prezzo o di benchmark, e diventa una decisione di lock-in dell’ecosistema. Chi è già full-Workspace troverà Spark naturalmente conveniente. Chi ha un parco strumenti misto dovrà valutare seriamente Claude Cowork e ChatGPT Agent, perché la portabilità MCP, oggi, è dalla loro parte.
Policy interna e controlli
Il secondo piano è di policy interna. Un agente che gira 24/7 nel cloud, accede a inbox aziendali e autorizza azioni va inquadrato nelle policy di security e di data governance prima del rollout, non dopo. Le imprese in settori regolati (finance, sanità, PA) devono attendere il livello enterprise di controlli Workspace, che a oggi Google non ha ancora dettagliato edition per edition. Per chi opera in queste verticali, sperimentare oggi Spark su account personali e su use case non-mission-critical è il compromesso ragionevole, in attesa di chiarezza contrattuale.
Scenario operativo
Il terzo piano è di scenario. Se Pichai ha ragione, e ci stiamo davvero spostando in un’era in cui il punto di contatto primario con la tecnologia è un agente che lavora per noi mentre dormiamo, allora il modo in cui le imprese organizzano i workflow, le deleghe operative e i meccanismi di controllo qualità andrà ripensato sopra la singola feature. Già oggi, in Pelle Digitale, ho descritto come la collaborazione uomo-macchina sposti la nozione stessa di competenza dal saper fare al saper indirizzare. Spark e i suoi competitor accelerano questo movimento di un ordine di grandezza.
Resta una domanda finale, e senza dubbio è quella che a valle di un evento di questa portata ci si pone leggendo i comunicati di un competitor o aprendo l’app di un assistente: chi presiede davvero le decisioni quando l’agente lavora autonomamente per dodici ore, quali tracce restano del suo ragionamento, e quanto siamo pronti a leggerle?










