I recenti annunci di OpenAI e Google sulle nuove funzioni di GPT e Gemini hanno spostato l’attenzione dalla semplice elaborazione del testo e del completamento di un prompt testuale da parte di un modello LLM ad una visione decisamente più integrata di elaborazione che non si limiti a manipolare testo ma anche audio, immagini e video.
intelligenza artificiale
Usiamo l’IA multimodale: ecco alcuni usi pratici che sono una svolta
Con l’annuncio delle nuove funzioni di GPT e Gemini, OpenAI e Google spostano l’attenzione su modelli di intelligenza artificiale capaci di elaborare non solo testo, ma anche audio, immagini e video. Questi modelli multimodali promettono di rivoluzionare le interazioni quotidiane, sebbene restino interrogativi sull’effettiva utilità e impatto di queste tecnologie
Università di Pisa

Continua a leggere questo articolo
Argomenti
Canali