Il clamore su ChatGPT ha polarizzato l’attenzione sui modelli di intelligenza artificiale relativi all’elaborazione del linguaggio naturale, ma le tecniche di deep learning utilizzate per addestrare i modelli sono state utilizzate per la realizzazione di numerosi servizi altrettanto sorprendenti e sicuramente utili e capaci di cambiare intere aree produttive.
Come avvenne all’inizio del Web solo alcuni di questi servizi sopravviveranno alla fase di startup, ma la ricchezza delle applicazioni mostra come le tecnologie AI siano pronte per entrare a far parte di praticamente qualsiasi strumento che useremo nel prossimo futuro.
Guardiamo gli strumenti già disponibili che hanno introdotto queste tecniche per rendere possibili funzioni che solo pochi anni fa sarebbero sembrate impossibili da realizzare.
Un mondo di chat
ChatGPT non è l’unico servizio di dialogo basato su modelli estesi di linguaggio naturale. Oltre a ChatGPT troviamo, ad esempio, Chatsonic un’applicazione Web simile a ChatGPT ma capace anche di integrare la generazione di immagini ed altri elementi. Un aspetto importante da considerare è che i modelli GPT-3 sono disponibili e quindi OpenAI, autore del modello, non è l’unica società a realizzare servizi basati su di esso; un esempio è JasperChat, un chatbot orientato al marketing. Per le conversazioni di gruppo troviamo Character AI, un servizio in cui le AI hanno più personalità partecipando ad una chat di gruppo. Alcuni chat bot utilizzano il modello di GPT ma introducendo meccanismi di aggiornamento delle conoscenze consentendo discussioni su informazioni più fresche come YouChat. Replika, sempre basato su GPT-3, è un servizio che si concentra sulla conversazione adattando il proprio comportamento a quello che ha imparato dalla conversazione. ChatGPT è divenuto noto anche per la capacità di generare storie, e il servizio Tome fa uso di GPT-3 per generare storie con tanto di illustrazioni basate sul generatore di immagini DALL-E.
La ricerca intelligente
Microsoft e Google hanno conquistato la scena con l’introduzione di ChatGPT in Bing e con l’annuncio del Google Bard. Servizi come YouChat cercano di rispondere a domande, ma non hanno come obiettivo quello di offrire i risultati di una ricerca che assicuri la necessaria accuratezza nelle risposte. Vi sono però motori di ricerca che fanno uso di AI come Perplexity e la cui interazione è analoga a quella esibita da Bing senza la parte della ricerca tradizionale.
La ricerca non è necessariamente quella di un motore di ricerca: il servizio UseChannel ricerca all’interno di dati, organizzandoli autonomamente in modo da aiutarne l’esplorazione.
Si può automatizzare la ricerca di informazioni su siti specifici programmando dei bot intelligenti utilizzando il servizio Browse.AI.
La generazione di immagini
StableDiffusion e DALL-E sono modelli AI generativi di immagini divenuti popolari perché capaci di generare immagini artistiche anche utilizzando stili di artisti famosi. È difficile però controllare questi modelli generici per ottenere effetti specifici o che includano elementi particolari, ecco che servizi di generazione immagini con date finalità: il servizio Flair, ad esempio, consente di realizzare immagini al fine di valorizzare un particolare contenuto come un prodotto da promuovere immerso in una scena generata da AI; il servizio PatternedAI genera con AI delle trame grafiche che si ripetano, una capacità apprezzabile per chi realizza tessuti e carte stampate. L’AI ci aiuta a generare anche delle foto per la promozione di capi di abbigliamento utilizzando il servizio Booth.AI.
La maggior parte di servizi di generazione immagini genera immagini raster, ovverosia matrici di pixel con dimensioni prefissate, esistono però servizi come, ad esempio, Illustroke capaci di generare immagini in formato vettoriale.
Il servizio Stockimg consente invece di generare immagini a partire dalla descrizione finalizzate per un uso di publishing.

Anche il servizio Clickable genera immagini pubblicitarie.
Elaborazione audio e video
Se la generazione e l’elaborazione di testo e immagini con AI sono spesso oggetto di discussione, l’AI generativa e l’analisi intelligente trova nell’elaborazione di audio e video un’applicazione naturale.
Il servizio Beatoven, ad esempio, genera tracce musicali a supporto di un video o di un podcast anche in accordo alle tonalità richieste.

La necessità di produrre contenuti sempre più professionali da parte di amatori ad un ritmo che richiederebbe uno studio può sicuramente beneficiare del servizio Cleanvoice capace di editare l’audio di un podcast per rimuovere rumori di sottofondo ed imperfezioni di dizione. Podcastle assicura invece la trascrizione di podcast, una funzione tra le molte orientate all’elaborazione di podcast.
Il doppiaggio di un video è un’altra attività complessa, e Papercup è un servizio che automatizza questo importante scenario utilizzando l’AI. Con questo servizio è possibile generare video in più lingue avvalendosi della traduzione automatica e della loro generazione vocale.
La sintetizzazione della voce umana che non suoni meccanica è un aspetto importante per la generazione di audio vocale, finalizzato alla realizzazione di audiolibri, audio guide, o altra applicazione. Il servizio ElevenLabs, ad esempio, fa uso dell’AI generativa per generare voce a partire dal testo in inglese.
Il servizio Glasp genera riassunti a partire da video YouTube grazie alla sua funzione di trascrizione e a ChatGPT.
Altre applicazioni
Ocoya è un servizio disegnato per accelerare la produzione e la temporizzazione della pubblicazione sui social media (c’è da chiedersi quando faremo anche i bot per leggere i social e così finalmente avremo i social fatti da AI per AI…). Anche il software smart-copy di Unbounce è disegnato per supportare i creatori di contenuti con le capacità generative delle AI. Nella stessa scia troviamo CopyMonkey, un servizio per generare descrizioni più ricche di prodotti pubblicati su Amazon.
Infine merita una menzione il servizio Rationale, un servizio orientato al supporto alle decisioni che genera un’analisi SWOT a partire da informazioni su un problema.
Conclusioni
L’intelligenza artificiale è una tecnica pervasiva che consente di elaborare informazioni per cui non si disponeva di algoritmi in passato. Tutto ad un tratto è divenuto possibile riassumere, generare immagini, musica, analizzare audio e video ed accelerare la generazione di contenuto digitale.
Rimane però da capire il reale impatto che queste tecnologie avranno sul nostro stile di vita, e chi sarà in grado di fruire di così tanti contenuti generati. C’è il rischio che le macchine producano contenuti più rapidamente di quanto la popolazione mondiale possa elaborarli, e comunque avranno un impatto sull’organizzazione sociale e sulla gestione del tempo.
In fondo queste tecniche ci consentono di essere musicisti, scrittori, attori, con poche parole, come gli elfi nel mondo di Eragon (e in tanti altri), e non posso che pensare al commento che nella saga fa l’elfa Rhunön: “quando con poche parole puoi ottenere tutto quello che serve diviene importante il viaggio e non la meta”.