scenari

Intelligenza artificiale sempre più efficiente: i nuovi parametri di riferimento che servono

Negli ultimi anni, l’intelligenza artificiale ha battuto gli esseri umani in molti campi. La missione attuale è quella di creare sistemi in grado di catturare abilità come ragionamento, creatività, intelligenza emotiva. Occorrono quindi nuovi parametri per rendere l’AI sempre più efficiente

30 Apr 2021
Luigi Mischitelli

Privacy & Data Protection Specialist at IRCCS Casa Sollievo della Sofferenza

Codex open ai gptr - - Explainable AI - IA no code - BLOOM

Sin dagli albori dell’intelligenza artificiale, circa sessant’anni fa, i ricercatori hanno misurato i progressi di tale tecnologia stabilendo dei parametri di riferimento, come la capacità di riconoscere immagini, costruire frasi di senso compiuto e prendere parte “come esseri umani” a giochi come gli scacchi. Questi parametri di riferimento si sono dimostrati un modo utile per determinare se l’intelligenza artificiale potesse essere in grado di fare più cose, guidando al contempo i ricercatori verso la creazione di strumenti tecnologici che siano ancora più utili.

Can Machines And Artificial Intelligence Be Creative? - with Oxford Professor Marcus du Satoy

Negli ultimi anni, i sistemi di intelligenza artificiale hanno superato molti test creati ad hoc dai ricercatori, battendo gli esseri umani in molti campi. Per gli scienziati, la missione attuale è quella di creare parametri di riferimento che possano “catturare” e – ad esempio – riflettere abilità “sfuggenti” come il ragionamento, la creatività e la capacità di imparare in maniera autonoma. Per non parlare di aree come l’intelligenza emotiva, che sono abbastanza difficili da misurare negli esseri umani. Ad esempio, un sistema di intelligenza artificiale può funzionare così bene da non permettere agli esseri umani di dire se un’immagine o un testo sono stati creati dall’uomo o da una macchina.

L’intelligenza artificiale, ad esempio, non avrebbe problemi nel rispondere alla domanda: “chi ha vinto l’Oscar per la migliore attrice l’anno scorso?”. Ma se le chiedessimo “perché” l’attrice ha vinto, l’intelligenza artificiale rimarrebbe “perplessa”. In pratica, mancherebbe il ragionamento, la contestualizzazione nonché la comprensione emotiva che sono necessari per rispondere adeguatamente ad una “semplice” domanda come quella.

Algorithmic Couture β - Synflux

Dal test di Turing alla disfatta di Kasparov

Tornando indietro nel tempo è possibile comprendere quanto l’intelligenza artificiale sia arrivata lontano, e quanta strada dovrà ancora fare guardando alle sfide che sono dinanzi a lei. Il primo punto di riferimento (o “benchmark”) ce lo diede il grande genio inglese Alan Turing. Nel 1950, propose di considerare la domanda: “Le macchine possono pensare?”. Per determinarlo, descrisse un esperimento – poi soprannominato il test di Turing – in cui un giudice umano ascolta una conversazione tra una persona e una macchina progettata per generare risposte simili a quelle umane. Se il giudice non riesce a identificare correttamente quale tra i due “conversanti” è l’uomo, la macchina supera quello che Turing chiamava “Imitation Game” (Gioco dell’Imitazione). Cercare di superare il Test di Turing era uno dei primi obiettivi dell’intelligenza artificiale dell’epoca. E così fu fino agli anni novanta, quando i ricercatori iniziarono a “spostare” i parametri di riferimento dall’uguagliare l’intelligenza umana a batterla su compiti specifici. Non si sarebbe più puntato all’eguaglianza tra le intelligenze, ma al superamento dell’intelligenza umana da parte della macchina. E uno dei primi progressi si raggiunse nel 1997, quando il programma IBM Deep Blue batté il campione russo di scacchi Garry Kasparov. Avvenimento che fu visto come un balzo in avanti nello sviluppo dell’intelligenza artificiale.

WHITEPAPER
La RPA in 9 step: da dove si comincia?
Intelligenza Artificiale
Realtà virtuale

La primavera dell’intelligenza artificiale

Ma il vero balzo in avanti, che prende il nome di “primavera dell’intelligenza artificiale”, si ebbe a partire dal 2012. Quello fu l’anno in cui l’ImageNet Challenge – un test per vedere se un algoritmo poteva rilevare e identificare correttamente ciò che veniva mostrato nelle foto contenute in un database di 14 milioni di immagini – segnò una svolta nel settore in esame. AlexNet, un tipo di algoritmo di Intelligenza artificiale (rete neurale), ottenne un tasso di errore del 15.3%. Dopo che la maggior parte dei concorrenti ebbe tassi di errore inferiori al 5% nel 2017, i ricercatori dichiararono che avrebbero lavorato su una nuova versione del programma. Negli ultimi anni invece (dal 2018), i sistemi in grado di comprendere il linguaggio naturale, così come quelli che possono decifrare accuratamente immagini e video digitali, hanno sfondato una successione di parametri di riferimento. Ad esempio, nel 2018 venne rilasciato un parametro di riferimento chiamato GLUE (General Language Understanding Evaluation), che richiedeva ai sistemi di intelligenza artificiale di superare test come riconoscere se le frasi si parafrasassero a vicenda, determinando se una recensione di un film fosse positiva, negativa o neutrale.

Molti di questi compiti furono battuti così rapidamente che i ricercatori elevarono tale parametro di riferimento al “rango” di “SuperGLUE” verso la fine del 2019. A gennaio 2021 invece, i ricercatori che lavoravano per creare sistemi in grado di battere il parametro di riferimento SuperGLUE avevano già superato quello che la maggior parte degli esseri umani è in grado di fare. Queste tempistiche sempre più veloci nel battere i parametri di riferimento hanno indotto i ricercatori a chiedere di strutturare tali parametri in un modo che possano tenere il passo con il ritmo dell’innovazione nel campo dell’intelligenza artificiale.

Tutti i limiti del (buon) regolamento UE su intelligenza artificiale

L’Alexa Prize di Amazon, che sfida gli studenti universitari a creare chatbot che possano parlare naturalmente di vari argomenti per venti minuti e ottenere un punteggio da una giuria umana di almeno 4 su 5, è uno dei diversi tentativi dell’azienda di Jeff Bezos di scalare un parametro di riferimento e farlo durare più a lungo, testando al contempo più abilità nel medesimo lasso di tempo. L’Alexa Prize si è tenuto tre volte (la quarta è in corso) senza che nessuna squadra abbia raggiunto il tempo o il punteggio necessari (entrambi) per vincere. A marzo 2021 l’azienda di Bellevue ha annunciato l’avvio di un nuovo test chiamato “TaskBot Challenge”, la prima sfida di Intelligenza artificiale “conversazionale” su voce e immagini. Il test punterà a vedere quanto può spingersi un’intelligenza artificiale con l’analisi di voce e immagini per far ottenere ai clienti le informazioni che vogliono, a partire da compiti “di cucina” e al miglioramento della vita domestica. Dopo la fine della conversazione, agli utenti verrà chiesto di giudicare l’utilità del TaskBot su una scala da 1 a 5, oltre a fornire un feedback volontario.

Creatività e test Lovelace

La creatività è un’altra area per la quale i ricercatori stanno lottando per sviluppare parametri di riferimento. E, infatti, non vi è alcun dubbio che l’intelligenza artificiale e la creatività siano inestricabilmente legate tra loro. Nel 2014 il “Lovelace 2.0 Test of Artificial Creativity and Intelligence” (una sorta di “Test di Turing alternativo”) esordì come modalità per misurare la creatività nell’intelligenza artificiale. Nel test si propose di avere un giudice umano che desse all’intelligenza artificiale un compito creativo, come creare una poesia o dipingere un quadro basato su una richiesta specifica. Se il giudice umano avesse trovato un’intelligenza artificiale in grado di eseguire la richiesta, così come qualsiasi altro parametro aggiunto in corso d’opera dal giudice, l’intelligenza artificiale avrebbe passato il test. Il giudice avrebbe potuto anche aggiungere requisiti più difficili, come passare da una poesia di cinque righe a qualcosa di più lungo, in turni successivi.

Come il test di Turing, Lovelace era più un esperimento di pensiero che un test vero e proprio. Quando uscì per la prima volta, non si pensava potesse esistere un’intelligenza artificiale in grado di superare anche un solo round. Ma nel giro di un paio d’anni, cominciarono ad uscire casi che documentavano sistemi in grado di creare un’immagine sulla base di un testo. All’inizio del 2021, DALL-E by OpenAI, poteva fare illustrazioni stravaganti sulla base di alcune frasi scelte dagli utenti (disegno di un ravanello che porta a spasso un cane). In pratica, DALL-E sovvertì le previsioni sull’impossibilità di passare il Test Lovelace formulate appena sei anni prima.

AI vs. AI. Two chatbots talking to each other

Precisione vs. distorsione

Man mano che i sistemi di intelligenza artificiale odierni diventano più efficienti e sofisticati serve spingere verso la necessità di modificare alcuni parametri di riferimento. Per esempio, i sistemi di riconoscimento facciale sono sorprendentemente efficaci; tuttavia, ad esempio, non possono sempre riconoscere con certezza le donne di colore, anche perché i sistemi di Intelligenza artificiale sono (spesso) addestrati su training data tarati su foto di uomini di etnia indoeuropea. Siamo in presenza del cosiddetto “bias” (o pregiudizio) dell’intelligenza artificiale. I ricercatori stanno cercando di creare dataset equilibrati per sopperire a quei parametri di riferimento che raramente considerano il razzismo o il sessismo (nonché la protezione dei dati) nel settaggio dell’intelligenza artificiale.[1]

  1. Why We Need New Benchmarks for AI. The Wall Street Journal

@RIPRODUZIONE RISERVATA

Speciale PNRR

Tutti
Incentivi
PA
Sostemibilità
Analisi
Formazione
Salute digitale
Sicurezza
Sostenibilità
Digital Economy
Formazione
Trasferimento tecnologico, il Mise mette sul piatto 7,5 milioni
Strategie
PSN e Strategia Cloud Italia: a che punto siamo e come supportare la PA in questo percorso
Dispersione idrica
Siccità: AI e analisi dei dati possono ridurre gli sprechi d’acqua. Ecco gli interventi necessari
PNRR
Cloud, firmato il contratto per l’avvio di lavori del Polo strategico
Formazione
Competenze digitali, stanziati 48 milioni per gli Istituti tecnologici superiori
Iniziative
Digitalizzazione delle reti idriche: oltre 600 milioni per 21 progetti
Competenze e competitività
PNRR, così i fondi UE possono rilanciare la ricerca e l’Università
Finanziamenti
PNRR, si sbloccano i fondi per l’agrisolare
Sanità post-pandemica
PNRR, Missione Salute: a che punto siamo e cosa resta da fare
Strategie
Sovranità e autonomia tecnologica nazionale: come avviare un processo virtuoso e sostenibile
La relazione
Pnrr e PA digitale, l’alert della Corte dei conti su execution e capacità di spesa
L'editoriale
Elezioni 2022, la sfida digitale ai margini del dibattito politico
Strategie
Digitale, il monito di I-Com: “Senza riforme Pnrr inefficace”
Transizione digitale
Pnrr: arrivano 321 milioni per cloud dei Comuni, spazio e mobilità innovativa
L'analisi I-COM
Il PNRR alla prova delle elezioni: come usare bene le risorse e centrare gli obiettivi digitali
Cineca
Quantum computing, una svolta per la ricerca: lo scenario europeo e i progetti in corso
L'indice europeo
Desi, l’Italia scala due posizioni grazie a fibra e 5G. Ma è (ancora) allarme competenze
L'approfondimento
PNRR 2, ecco tutte le misure per cittadini e imprese: portale sommerso, codice crisi d’impresa e sismabonus, cosa cambia
Servizi digitali
PNRR e trasformazione digitale: ecco gli investimenti e le riforme previste per la digitalizzazione della PA
Legal health
Lo spazio europeo dei dati sanitari: come circoleranno le informazioni sulla salute nell’Unione Europea
Servizi digitali
PNRR e PA digitale: non dimentichiamo la dematerializzazione
Digital Healthcare transformation
La trasformazione digitale degli ospedali
Governance digitale
PA digitale, è la volta buona? Così misure e risorse del PNRR possono fare la differenza
Servizi digitali
Comuni e digitale, come usare il PNRR senza sbagliare
La survey
Pnrr e digitale accoppiata vincente per il 70% delle pmi italiane
Missione salute
Fascicolo Sanitario Elettronico alla prova del PNRR: limiti, rischi e opportunità
Servizi pubblici
PNRR: come diventeranno i siti dei comuni italiani grazie alle nuove risorse
Skill gap
PNRR, la banda ultra larga crea 20.000 nuovi posti di lavoro
Il Piano
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUMPA2022
PNRR e trasformazione digitale: rivedi i Talk di FORUM PA 2022 in collaborazione con le aziende partner
I contratti
Avio, 340 milioni dal Pnrr per i nuovi propulsori a metano
Next Generation EU
PNRR, a che punto siamo e cosa possono aspettarsi le aziende private
Fondi
Operativo il nuovo portale del MISE con tutti i finanziamenti per le imprese
Servizi comunali
Il PNRR occasione unica per i Comuni digitali: strumenti e risorse per enti e cittadini
Healthcare data platform
PNRR dalla teoria alla pratica: tecnologie e soluzioni per l’innovazione in Sanità
Skill
Competenze digitali, partono le Reti di facilitazione
Gli obiettivi
Scuola 4.0, PNRR ultima chance: ecco come cambierà il sistema formativo
Sistema Paese
PNRR 2, è il turno della space economy
FORUM PA 2022
FORUM PA 2022: la maturità digitale dei comuni italiani rispetto al PNRR
Analisi
PNRR: dalla Ricerca all’impresa, una sfida da cogliere insieme
Innovazione
Pnrr, il Dipartimento per la Trasformazione digitale si riorganizza
FORUM PA 2022
PA verde e sostenibile: il ruolo di PNRR, PNIEC, energy management e green public procurement
Analisi
PNRR, Comuni e digitalizzazione: tutto su fondi e opportunità, in meno di 3 minuti. Guarda il video!
Rapporti
Competenze digitali e servizi automatizzati pilastri del piano Inps
Analisi
Attuazione del PNRR: il dialogo necessario tra istituzioni e società civile. Rivedi lo Scenario di FORUM PA 2022
Progetti
Pnrr, fondi per il Politecnico di Torino. Fra i progetti anche IS4Aerospace
Analisi
PNRR, Colao fa il punto sulla transizione digitale dell’Italia: «In linea con tutte le scadenze»
La Svolta
Ict, Istat “riclassifica” i professionisti. Via anche al catalogo dati sul Pnrr
Analisi
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUM PA 2022
Ecosistema territoriale sostenibile: l’Emilia Romagna tra FESR e PNRR
Il Piano
Innovazione, il Mise “centra” gli obiettivi Pnrr: attivati 17,5 miliardi
Analisi
PNRR: raggiunti gli obiettivi per il primo semestre 2022. Il punto e qualche riflessione
Analisi
PNRR: dal dialogo tra PA e società civile passa il corretto monitoraggio dei risultati, tra collaborazione e identità dei luoghi
Webinar
Comuni e PNRR: un focus sui bandi attivi o in pubblicazione
Analisi
Formazione 4.0: cos’è e come funziona il credito d’imposta
PA e Sicurezza
PA e sicurezza informatica: il ruolo dei territori di fronte alle sfide della digitalizzazione
PA e sicurezza
PNRR e servizi pubblici digitali: sfide e opportunità per Comuni e Città metropolitane
Water management
Water management in Italia: verso una transizione “smart” e “circular” 
LE RISORSE
Transizione digitale, Simest apre i fondi Pnrr alle medie imprese
Prospettive
Turismo, cultura e digital: come spendere bene le risorse del PNRR
Analisi
Smart City: quale contributo alla transizione ecologica
Decarbonizzazione
Idrogeno verde, 450 milioni € di investimenti PNRR, Cingolani firma
Unioncamere
PNRR, imprese in ritardo: ecco come le Camere di commercio possono aiutare
I fondi
Industria 4.0: solo un’impresa su tre pronta a salire sul treno Pnrr
Formazione
Trasferimento tecnologico, il Mise mette sul piatto 7,5 milioni
Strategie
PSN e Strategia Cloud Italia: a che punto siamo e come supportare la PA in questo percorso
Dispersione idrica
Siccità: AI e analisi dei dati possono ridurre gli sprechi d’acqua. Ecco gli interventi necessari
PNRR
Cloud, firmato il contratto per l’avvio di lavori del Polo strategico
Formazione
Competenze digitali, stanziati 48 milioni per gli Istituti tecnologici superiori
Iniziative
Digitalizzazione delle reti idriche: oltre 600 milioni per 21 progetti
Competenze e competitività
PNRR, così i fondi UE possono rilanciare la ricerca e l’Università
Finanziamenti
PNRR, si sbloccano i fondi per l’agrisolare
Sanità post-pandemica
PNRR, Missione Salute: a che punto siamo e cosa resta da fare
Strategie
Sovranità e autonomia tecnologica nazionale: come avviare un processo virtuoso e sostenibile
La relazione
Pnrr e PA digitale, l’alert della Corte dei conti su execution e capacità di spesa
L'editoriale
Elezioni 2022, la sfida digitale ai margini del dibattito politico
Strategie
Digitale, il monito di I-Com: “Senza riforme Pnrr inefficace”
Transizione digitale
Pnrr: arrivano 321 milioni per cloud dei Comuni, spazio e mobilità innovativa
L'analisi I-COM
Il PNRR alla prova delle elezioni: come usare bene le risorse e centrare gli obiettivi digitali
Cineca
Quantum computing, una svolta per la ricerca: lo scenario europeo e i progetti in corso
L'indice europeo
Desi, l’Italia scala due posizioni grazie a fibra e 5G. Ma è (ancora) allarme competenze
L'approfondimento
PNRR 2, ecco tutte le misure per cittadini e imprese: portale sommerso, codice crisi d’impresa e sismabonus, cosa cambia
Servizi digitali
PNRR e trasformazione digitale: ecco gli investimenti e le riforme previste per la digitalizzazione della PA
Legal health
Lo spazio europeo dei dati sanitari: come circoleranno le informazioni sulla salute nell’Unione Europea
Servizi digitali
PNRR e PA digitale: non dimentichiamo la dematerializzazione
Digital Healthcare transformation
La trasformazione digitale degli ospedali
Governance digitale
PA digitale, è la volta buona? Così misure e risorse del PNRR possono fare la differenza
Servizi digitali
Comuni e digitale, come usare il PNRR senza sbagliare
La survey
Pnrr e digitale accoppiata vincente per il 70% delle pmi italiane
Missione salute
Fascicolo Sanitario Elettronico alla prova del PNRR: limiti, rischi e opportunità
Servizi pubblici
PNRR: come diventeranno i siti dei comuni italiani grazie alle nuove risorse
Skill gap
PNRR, la banda ultra larga crea 20.000 nuovi posti di lavoro
Il Piano
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUMPA2022
PNRR e trasformazione digitale: rivedi i Talk di FORUM PA 2022 in collaborazione con le aziende partner
I contratti
Avio, 340 milioni dal Pnrr per i nuovi propulsori a metano
Next Generation EU
PNRR, a che punto siamo e cosa possono aspettarsi le aziende private
Fondi
Operativo il nuovo portale del MISE con tutti i finanziamenti per le imprese
Servizi comunali
Il PNRR occasione unica per i Comuni digitali: strumenti e risorse per enti e cittadini
Healthcare data platform
PNRR dalla teoria alla pratica: tecnologie e soluzioni per l’innovazione in Sanità
Skill
Competenze digitali, partono le Reti di facilitazione
Gli obiettivi
Scuola 4.0, PNRR ultima chance: ecco come cambierà il sistema formativo
Sistema Paese
PNRR 2, è il turno della space economy
FORUM PA 2022
FORUM PA 2022: la maturità digitale dei comuni italiani rispetto al PNRR
Analisi
PNRR: dalla Ricerca all’impresa, una sfida da cogliere insieme
Innovazione
Pnrr, il Dipartimento per la Trasformazione digitale si riorganizza
FORUM PA 2022
PA verde e sostenibile: il ruolo di PNRR, PNIEC, energy management e green public procurement
Analisi
PNRR, Comuni e digitalizzazione: tutto su fondi e opportunità, in meno di 3 minuti. Guarda il video!
Rapporti
Competenze digitali e servizi automatizzati pilastri del piano Inps
Analisi
Attuazione del PNRR: il dialogo necessario tra istituzioni e società civile. Rivedi lo Scenario di FORUM PA 2022
Progetti
Pnrr, fondi per il Politecnico di Torino. Fra i progetti anche IS4Aerospace
Analisi
PNRR, Colao fa il punto sulla transizione digitale dell’Italia: «In linea con tutte le scadenze»
La Svolta
Ict, Istat “riclassifica” i professionisti. Via anche al catalogo dati sul Pnrr
Analisi
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUM PA 2022
Ecosistema territoriale sostenibile: l’Emilia Romagna tra FESR e PNRR
Il Piano
Innovazione, il Mise “centra” gli obiettivi Pnrr: attivati 17,5 miliardi
Analisi
PNRR: raggiunti gli obiettivi per il primo semestre 2022. Il punto e qualche riflessione
Analisi
PNRR: dal dialogo tra PA e società civile passa il corretto monitoraggio dei risultati, tra collaborazione e identità dei luoghi
Webinar
Comuni e PNRR: un focus sui bandi attivi o in pubblicazione
Analisi
Formazione 4.0: cos’è e come funziona il credito d’imposta
PA e Sicurezza
PA e sicurezza informatica: il ruolo dei territori di fronte alle sfide della digitalizzazione
PA e sicurezza
PNRR e servizi pubblici digitali: sfide e opportunità per Comuni e Città metropolitane
Water management
Water management in Italia: verso una transizione “smart” e “circular” 
LE RISORSE
Transizione digitale, Simest apre i fondi Pnrr alle medie imprese
Prospettive
Turismo, cultura e digital: come spendere bene le risorse del PNRR
Analisi
Smart City: quale contributo alla transizione ecologica
Decarbonizzazione
Idrogeno verde, 450 milioni € di investimenti PNRR, Cingolani firma
Unioncamere
PNRR, imprese in ritardo: ecco come le Camere di commercio possono aiutare
I fondi
Industria 4.0: solo un’impresa su tre pronta a salire sul treno Pnrr

Articoli correlati