I recenti annunci di OpenAI e Google sulle nuove funzioni di GPT e Gemini hanno spostato l’attenzione dalla semplice elaborazione del testo e del completamento di un prompt testuale da parte di un modello LLM ad una visione decisamente più integrata di elaborazione che non si limiti a manipolare testo ma anche audio, immagini e video.
intelligenza artificiale
Usiamo l’IA multimodale: ecco alcuni usi pratici che sono una svolta
Con l’annuncio delle nuove funzioni di GPT e Gemini, OpenAI e Google spostano l’attenzione su modelli di intelligenza artificiale capaci di elaborare non solo testo, ma anche audio, immagini e video. Questi modelli multimodali promettono di rivoluzionare le interazioni quotidiane, sebbene restino interrogativi sull’effettiva utilità e impatto di queste tecnologie
Università di Pisa

Continua a leggere questo articolo
Argomenti
Canali
InnovAttori
-

L’IA nel turismo corre, ma non per tutti: la mappa italiana e globale
08 Mag 2026 -

AI agentica nel turismo: come cambia il mercato dei viaggi
09 Apr 2026 -

OpenBIM e interoperabilità: perché gli standard aperti sono decisivi in edilizia
03 Apr 2026 -

Competitività europea e sovranità, cosa manca davvero alle startup Ue
01 Apr 2026 -

Come l’AI porta il caffè sulle nostre tavole al tempo della guerra
13 Mar 2026











