intelligenza artificiale

Gemini 3.1 Flash-Lite: che differenza fa tra le alternative

Home Industry 4.0/Innovazione in azienda

Google presenta Gemini 3.1 Flash-Lite, modello progettato per ridurre latenza e costi su Gemini API, AI Studio e Vertex AI. Prezzi, caching e modalità batch puntano a ottimizzare l’inferenza su larga scala. Spiccano livelli di thinking, multimodalità in input e focus su tool calling e output strutturati

Pubblicato il 5 mar 2026

Aggiungi tra i preferiti su Google

Giovanni Masi

Computer Science Engineer

Nel 2026 la competizione fra modelli generativi si gioca sempre meno sul semplice aumento della dimensione e sempre più sulla capacità di sostenere carichi reali, continui e prevedibili. Nel mondo enterprise e nelle applicazioni consumer ad alto traffico, la domanda principale non è soltanto “quanto è bravo” un modello, ma quanto rapidamente riesce a restituire il primo frammento di risposta e quanto costa farlo milioni di volte al giorno.

@RIPRODUZIONE RISERVATA

Giovanni Masi

Computer Science Engineer

Ingegnere Informatico e dell’Automazione, con specializzazione in Cybersecurity e Intelligenza Artificiale. Coordina il gruppo di lavoro sull’Intelligenza Artificiale presso l’Ordine degli Ingegneri. Con oltre vent’anni di esperienza nel settore dell’Information Technology, ha maturato competenze avanzate nella progettazione e sviluppo di architetture software, nella gestione di infrastrutture IT complesse, nell’implementazione di strategie di cybersecurity e nella creazione di modelli di Intelligenza Artificiale. Svolge attività accademica come cultore della materia presso il Dipartimento di Ingegneria Informatica dell’Università eCampus. È autore e docente dei corsi “Intelligenza Artificiale per Ingegneri” e “Intelligenza Artificiale Generativa e Prompt Engineering” erogati presso l’Ordine degli Ingegneri, nell’ambito delle attività formative specialistiche rivolte ai professionisti del settore. Ha inoltre tenuto seminari sull’Intelligenza Artificiale presso la Pontificia Università Antonianum. Autore di numerosi articoli di settore, pubblicati su riviste scientifiche, nei quali approfondisce tematiche legate alla ricerca applicata nella Generative AI. Ha partecipato a importanti progetti di ricerca, tra cui “BioGene”, un progetto supportato da NASA GeneLab, finalizzato all’analisi e all’estrazione di dati genomici da esperimenti spaziali e “Classificazione del livello di ossidazione dell’olio”, uno studio innovativo condotto in collaborazione con l’Università Ben Gurion del Negev (Israele), volto all’analisi e alla classificazione dei processi di ossidazione negli oli.

Seguimi su