I recenti annunci di OpenAI e Google sulle nuove funzioni di GPT e Gemini hanno spostato l’attenzione dalla semplice elaborazione del testo e del completamento di un prompt testuale da parte di un modello LLM ad una visione decisamente più integrata di elaborazione che non si limiti a manipolare testo ma anche audio, immagini e video.
intelligenza artificiale
Usiamo l’IA multimodale: ecco alcuni usi pratici che sono una svolta
Con l’annuncio delle nuove funzioni di GPT e Gemini, OpenAI e Google spostano l’attenzione su modelli di intelligenza artificiale capaci di elaborare non solo testo, ma anche audio, immagini e video. Questi modelli multimodali promettono di rivoluzionare le interazioni quotidiane, sebbene restino interrogativi sull’effettiva utilità e impatto di queste tecnologie
Università di Pisa

Continua a leggere questo articolo
Argomenti
Canali
InnovAttori
-

Come l’AI porta il caffè sulle nostre tavole al tempo della guerra
13 Mar 2026 -

Smart home, l’AI accelera la transizione green: ma occhio alla sicurezza
02 Mar 2026 -

Robotica avanzata: la strategia italiana per competere con Cina e Usa
24 Feb 2026 -

Industria metalmeccanica, se il consulente è la GenAI: il caso Co.Me.T
24 Feb 2026 -

L’AI cambia la fabbrica: ecco i trend più avanzati
23 Feb 2026











