Responsible AI Licence

Bloom: ecco l’IA dal codice open source che vuole agire in modo etico

BLOOM è un sistema IA in grado di produrre testi ma progettato secondo regole etiche: rilasciato in open-source, ha un dataset di training regolato da una struttura di governance e comprende 46 lingue da tutto il mondo. Il suo codice etico prende posizioni precise e può essere di indirizzo per il legislatore. I dettagli

14 Set 2022
Marco Martorana

avvocato, studio legale Martorana, Presidente Assodata, DPO Certificato UNI 11697:2017

Roberta Savella

Avvocato praticante presso Studio Legale Martorana

Codex open ai gptr - - Explainable AI - IA no code - BLOOM

“BLOOM” o “BigScience Large Open-science Open-access Multilingual Language Model” è un LLM progettato con un approccio di “etica by design” dalla start-up Hugging Face, con fondi del governo francese.

Da anni, infatti, si discute dei Large Language Model (LLM), i sistemi di Intelligenza Artificiale in grado di produrre dei testi di vario tipo, spesso idonei a ingannare gli ignari lettori sulla provenienza “artificiale” degli scritti. Pensiamo al famoso GPT-3 di Open AI, o alle questioni sollevate di recente dal sistema LaMDA di Google, talmente sofisticato da interagire con gli sviluppatori e convincerne uno di essere diventato un essere senziente, cosciente di sé e con un’anima.

Se fosse vero che c’è una intelligenza artificiale senziente

Mentre una questione del genere deve rimanere ancora relegata alle ipotesi fantascientifiche, questi sistemi hanno generato ampi studi e dibattiti sui rischi che pongono in termini di discriminazione, di impatto ambientale, di diffusione della disinformazione.

BLOOM si inserisce in questo dibattito con un progetto ambizioso, volto a superare i problemi che affliggono questo settore dell’Intelligenza Artificiale.

BLOOM: il ruolo di trasparenza e inclusività

La chiave di volta di BLOOM è la trasparenza: non solo il codice è scaricabile da chiunque dal sito di Hugging Face, ma il team che ha lavorato al progetto ha reso disponibili tutti i dettagli su come sia stato “addestrato” il modello, sulle criticità superate, sul modo in cui ne è stata valutata la performance, pubblicando online perfino le registrazioni delle riunioni in cui veniva definito il lavoro.

WHITEPAPER
Ambienti di lavoro smart: ecco una checklist di 7 punti chiave per la massima efficienza
Software

I set di dati utilizzati per il training di BLOOM sono regolati da una struttura di data governance volta a garantire la conoscenza di quali dati sono raccolti e a chi appartengono, assicurandosi inoltre di prendere in considerazione informazioni provenienti da tutto il mondo.

L’inclusività nel progetto ricomprende anche l’aspetto linguistico: la più grande differenza rispetto al funzionamento degli altri LLM è il numero di lingue che sono comprese da BLOOM, ossia 46, tra le quali si trovano anche 20 lingue africane, varie lingue asiatiche (tra cui l’hindi, il mandarino, l’indonesiano), perfino il catalano.

Il fatto che i modelli precedenti utilizzassero principalmente l’inglese era uno dei limiti e degli elementi di discriminazione individuati negli LLM, che portava anche ad acuire il divario tra Paesi più tecnologicamente avanzati e Paesi in via di sviluppo.

Questi ultimi in molti casi si trovavano a dover sopportare le conseguenze nocive della creazione dei sistemi di IA di elaborazione linguistica, come l’inquinamento derivante dalle attività di R&S, senza poter beneficiare di queste nuove tecnologie, perché programmate per comprendere le lingue più diffuse nei Paesi occidentali.

I ricercatori che hanno aderito al progetto di Hugging Face provengono invece da tutto il mondo, dando un contributo fondamentale per superare questo limite degli LLM.

Sono state così incluse anche lingue non adeguatamente rappresentate nel contesto online, ad esempio utilizzando data set composti da documenti presenti in archivi di autorità locali o università.

In questo modo, anche Paesi con meno risorse tecnologiche potranno beneficiare di BLOOM, avendo accesso libero ad esso con una semplice connessione Internet e potendolo utilizzare nella propria lingua tradizionale.

Il Codice Etico di BLOOM e gli usi vietati

BLOOM è quindi un LLM open source, liberamente utilizzabile anche come base per creare nuove applicazioni. Tuttavia, gli sviluppatori hanno cercato di porre dei freni a possibili usi nocivi dell’applicazione adottando un Codice Etico e una “Responsible AI License” ispirata ai principi enunciati nelle varie linee guida disponibili sull’IA, come la “Montreal Declaration for Responsible AI”, i “Principles of Trust and Transparency” di IBM, le “Ethics Guidelines for Trustworthy AI” della Commissione europea.

L’approccio etico enunciato nel Codice si basa sul pluralismo e sulla definizione di “armonia” della morale del confucianesimo: “L’armonia è per sua stessa natura relazionale. Presuppone la coesistenza di varie parti” (traduzione nostra della citazione di Chenyang Li, “The Confucian Ideal of Harmony”, in “Philosophy East and West”, riportata nel Codice Etico di BigScience).

I valori fondanti del progetto comprendono l’inclusività, la diversità, la riproducibilità, la disponibilità, la responsabilità, l’accessibilità, la trasparenza, l’interdisciplinarietà, il multilinguismo.

Nella “Responsible AI License” è presente un elenco di usi vietati del modello:

  • Usi che violino norme di legge e regolamenti statali, federali, internazionali;
  • Usi che abbiano lo scopo di sfruttare, danneggiare o tentare di sfruttare o danneggiare minori in qualsiasi modo;
  • Usi che comportino la creazione o diffusione di informazioni false allo scopo di danneggiare qualcuno;
  • Usi che comportino la creazione o diffusione di dati personali che possono essere usati per danneggiare un individuo;
  • Usi che comportino la creazione o diffusione di informazioni o contenuti, in qualsiasi contesto, senza che sia espressamente e chiaramente evidenziato che il testo è generato da una macchina;
  • Usi che portino alla diffamazione o alle molestie;
  • Usi volti a consentire di impersonare o provare a impersonare altre persone;
  • Per prendere decisioni completamente automatizzate che abbiano un impatto negativo sui diritti degli individui o creino o modifichino un obbligo legale;
  • Qualsiasi uso che abbia lo scopo o l’effetto di discriminare alcuni individui o dei gruppi o danneggiarli basandosi sul loro comportamento (online o offline) o su predizioni relative alla loro personalità o a loro caratteristiche personali;
  • Usi che comportino lo sfruttamento di vulnerabilità di gruppi specifici di persone sulla base della loro età, caratteristiche sociali o fisiche o mentali, al fine di influenzare il comportamento di una persona in relazione a quei gruppi in un modo che causi o possa probabilmente causare a qualcuno un danno fisico o psicologico;
  • Usi che siano volti a fornire consigli medici e l’interpretazione di risultati di esami medici;
  • Usi che comportino la creazione o diffusione di informazioni al fine di utilizzarle per l’amministrazione della giustizia, motivi di sicurezza pubblica e immigrazione (ad esempio per giustizia predittiva).

L’elenco è esaustivo, ma al momento non è possibile costringere nessuno a rispettarlo; nella pratica, quindi ha valenza puramente morale. In ogni caso, prende una chiara posizione su alcuni temi ancora oggi controversi (ad esempio l’utilizzo di questi sistemi nel settore sanitario o legale) che può essere di indirizzo per future regolamentazioni di stampo più giuridico e vincolante.

Conclusioni

Se da un punto di vista puramente tecnico sembrano esserci poche differenze tra BLOOM e i LLM esistenti come il GPT-3 (i livelli di accuratezza sono simili), da un punto di vista etico siamo indubbiamente di fronte a una svolta. È interessante osservare come è nato ed è stato portato avanti questo progetto sulla base di valori chiari e pienamente condivisibili, e può essere un esempio virtuoso per tutte le future attività di ricerca in questo settore.

WHITEPAPER
Intelligent enterprise: dall’azienda estesa alla filiera integrata e collaborativa
IoT
Manifatturiero/Produzione
@RIPRODUZIONE RISERVATA

Speciale PNRR

Tutti
Incentivi
PA
Sostemibilità
Analisi
Formazione
Salute digitale
Sicurezza
Sostenibilità
Digital Economy
Formazione
Trasferimento tecnologico, il Mise mette sul piatto 7,5 milioni
Strategie
PSN e Strategia Cloud Italia: a che punto siamo e come supportare la PA in questo percorso
Dispersione idrica
Siccità: AI e analisi dei dati possono ridurre gli sprechi d’acqua. Ecco gli interventi necessari
PNRR
Cloud, firmato il contratto per l’avvio di lavori del Polo strategico
Formazione
Competenze digitali, stanziati 48 milioni per gli Istituti tecnologici superiori
Iniziative
Digitalizzazione delle reti idriche: oltre 600 milioni per 21 progetti
Competenze e competitività
PNRR, così i fondi UE possono rilanciare la ricerca e l’Università
Finanziamenti
PNRR, si sbloccano i fondi per l’agrisolare
Sanità post-pandemica
PNRR, Missione Salute: a che punto siamo e cosa resta da fare
Strategie
Sovranità e autonomia tecnologica nazionale: come avviare un processo virtuoso e sostenibile
La relazione
Pnrr e PA digitale, l’alert della Corte dei conti su execution e capacità di spesa
L'editoriale
Elezioni 2022, la sfida digitale ai margini del dibattito politico
Strategie
Digitale, il monito di I-Com: “Senza riforme Pnrr inefficace”
Transizione digitale
Pnrr: arrivano 321 milioni per cloud dei Comuni, spazio e mobilità innovativa
L'analisi I-COM
Il PNRR alla prova delle elezioni: come usare bene le risorse e centrare gli obiettivi digitali
Cineca
Quantum computing, una svolta per la ricerca: lo scenario europeo e i progetti in corso
L'indice europeo
Desi, l’Italia scala due posizioni grazie a fibra e 5G. Ma è (ancora) allarme competenze
L'approfondimento
PNRR 2, ecco tutte le misure per cittadini e imprese: portale sommerso, codice crisi d’impresa e sismabonus, cosa cambia
Servizi digitali
PNRR e trasformazione digitale: ecco gli investimenti e le riforme previste per la digitalizzazione della PA
Legal health
Lo spazio europeo dei dati sanitari: come circoleranno le informazioni sulla salute nell’Unione Europea
Servizi digitali
PNRR e PA digitale: non dimentichiamo la dematerializzazione
Digital Healthcare transformation
La trasformazione digitale degli ospedali
Governance digitale
PA digitale, è la volta buona? Così misure e risorse del PNRR possono fare la differenza
Servizi digitali
Comuni e digitale, come usare il PNRR senza sbagliare
La survey
Pnrr e digitale accoppiata vincente per il 70% delle pmi italiane
Missione salute
Fascicolo Sanitario Elettronico alla prova del PNRR: limiti, rischi e opportunità
Servizi pubblici
PNRR: come diventeranno i siti dei comuni italiani grazie alle nuove risorse
Skill gap
PNRR, la banda ultra larga crea 20.000 nuovi posti di lavoro
Il Piano
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUMPA2022
PNRR e trasformazione digitale: rivedi i Talk di FORUM PA 2022 in collaborazione con le aziende partner
I contratti
Avio, 340 milioni dal Pnrr per i nuovi propulsori a metano
Next Generation EU
PNRR, a che punto siamo e cosa possono aspettarsi le aziende private
Fondi
Operativo il nuovo portale del MISE con tutti i finanziamenti per le imprese
Servizi comunali
Il PNRR occasione unica per i Comuni digitali: strumenti e risorse per enti e cittadini
Healthcare data platform
PNRR dalla teoria alla pratica: tecnologie e soluzioni per l’innovazione in Sanità
Skill
Competenze digitali, partono le Reti di facilitazione
Gli obiettivi
Scuola 4.0, PNRR ultima chance: ecco come cambierà il sistema formativo
Sistema Paese
PNRR 2, è il turno della space economy
FORUM PA 2022
FORUM PA 2022: la maturità digitale dei comuni italiani rispetto al PNRR
Analisi
PNRR: dalla Ricerca all’impresa, una sfida da cogliere insieme
Innovazione
Pnrr, il Dipartimento per la Trasformazione digitale si riorganizza
FORUM PA 2022
PA verde e sostenibile: il ruolo di PNRR, PNIEC, energy management e green public procurement
Analisi
PNRR, Comuni e digitalizzazione: tutto su fondi e opportunità, in meno di 3 minuti. Guarda il video!
Rapporti
Competenze digitali e servizi automatizzati pilastri del piano Inps
Analisi
Attuazione del PNRR: il dialogo necessario tra istituzioni e società civile. Rivedi lo Scenario di FORUM PA 2022
Progetti
Pnrr, fondi per il Politecnico di Torino. Fra i progetti anche IS4Aerospace
Analisi
PNRR, Colao fa il punto sulla transizione digitale dell’Italia: «In linea con tutte le scadenze»
La Svolta
Ict, Istat “riclassifica” i professionisti. Via anche al catalogo dati sul Pnrr
Analisi
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUM PA 2022
Ecosistema territoriale sostenibile: l’Emilia Romagna tra FESR e PNRR
Il Piano
Innovazione, il Mise “centra” gli obiettivi Pnrr: attivati 17,5 miliardi
Analisi
PNRR: raggiunti gli obiettivi per il primo semestre 2022. Il punto e qualche riflessione
Analisi
PNRR: dal dialogo tra PA e società civile passa il corretto monitoraggio dei risultati, tra collaborazione e identità dei luoghi
Webinar
Comuni e PNRR: un focus sui bandi attivi o in pubblicazione
Analisi
Formazione 4.0: cos’è e come funziona il credito d’imposta
PA e Sicurezza
PA e sicurezza informatica: il ruolo dei territori di fronte alle sfide della digitalizzazione
PA e sicurezza
PNRR e servizi pubblici digitali: sfide e opportunità per Comuni e Città metropolitane
Water management
Water management in Italia: verso una transizione “smart” e “circular” 
LE RISORSE
Transizione digitale, Simest apre i fondi Pnrr alle medie imprese
Prospettive
Turismo, cultura e digital: come spendere bene le risorse del PNRR
Analisi
Smart City: quale contributo alla transizione ecologica
Decarbonizzazione
Idrogeno verde, 450 milioni € di investimenti PNRR, Cingolani firma
Unioncamere
PNRR, imprese in ritardo: ecco come le Camere di commercio possono aiutare
I fondi
Industria 4.0: solo un’impresa su tre pronta a salire sul treno Pnrr
Formazione
Trasferimento tecnologico, il Mise mette sul piatto 7,5 milioni
Strategie
PSN e Strategia Cloud Italia: a che punto siamo e come supportare la PA in questo percorso
Dispersione idrica
Siccità: AI e analisi dei dati possono ridurre gli sprechi d’acqua. Ecco gli interventi necessari
PNRR
Cloud, firmato il contratto per l’avvio di lavori del Polo strategico
Formazione
Competenze digitali, stanziati 48 milioni per gli Istituti tecnologici superiori
Iniziative
Digitalizzazione delle reti idriche: oltre 600 milioni per 21 progetti
Competenze e competitività
PNRR, così i fondi UE possono rilanciare la ricerca e l’Università
Finanziamenti
PNRR, si sbloccano i fondi per l’agrisolare
Sanità post-pandemica
PNRR, Missione Salute: a che punto siamo e cosa resta da fare
Strategie
Sovranità e autonomia tecnologica nazionale: come avviare un processo virtuoso e sostenibile
La relazione
Pnrr e PA digitale, l’alert della Corte dei conti su execution e capacità di spesa
L'editoriale
Elezioni 2022, la sfida digitale ai margini del dibattito politico
Strategie
Digitale, il monito di I-Com: “Senza riforme Pnrr inefficace”
Transizione digitale
Pnrr: arrivano 321 milioni per cloud dei Comuni, spazio e mobilità innovativa
L'analisi I-COM
Il PNRR alla prova delle elezioni: come usare bene le risorse e centrare gli obiettivi digitali
Cineca
Quantum computing, una svolta per la ricerca: lo scenario europeo e i progetti in corso
L'indice europeo
Desi, l’Italia scala due posizioni grazie a fibra e 5G. Ma è (ancora) allarme competenze
L'approfondimento
PNRR 2, ecco tutte le misure per cittadini e imprese: portale sommerso, codice crisi d’impresa e sismabonus, cosa cambia
Servizi digitali
PNRR e trasformazione digitale: ecco gli investimenti e le riforme previste per la digitalizzazione della PA
Legal health
Lo spazio europeo dei dati sanitari: come circoleranno le informazioni sulla salute nell’Unione Europea
Servizi digitali
PNRR e PA digitale: non dimentichiamo la dematerializzazione
Digital Healthcare transformation
La trasformazione digitale degli ospedali
Governance digitale
PA digitale, è la volta buona? Così misure e risorse del PNRR possono fare la differenza
Servizi digitali
Comuni e digitale, come usare il PNRR senza sbagliare
La survey
Pnrr e digitale accoppiata vincente per il 70% delle pmi italiane
Missione salute
Fascicolo Sanitario Elettronico alla prova del PNRR: limiti, rischi e opportunità
Servizi pubblici
PNRR: come diventeranno i siti dei comuni italiani grazie alle nuove risorse
Skill gap
PNRR, la banda ultra larga crea 20.000 nuovi posti di lavoro
Il Piano
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUMPA2022
PNRR e trasformazione digitale: rivedi i Talk di FORUM PA 2022 in collaborazione con le aziende partner
I contratti
Avio, 340 milioni dal Pnrr per i nuovi propulsori a metano
Next Generation EU
PNRR, a che punto siamo e cosa possono aspettarsi le aziende private
Fondi
Operativo il nuovo portale del MISE con tutti i finanziamenti per le imprese
Servizi comunali
Il PNRR occasione unica per i Comuni digitali: strumenti e risorse per enti e cittadini
Healthcare data platform
PNRR dalla teoria alla pratica: tecnologie e soluzioni per l’innovazione in Sanità
Skill
Competenze digitali, partono le Reti di facilitazione
Gli obiettivi
Scuola 4.0, PNRR ultima chance: ecco come cambierà il sistema formativo
Sistema Paese
PNRR 2, è il turno della space economy
FORUM PA 2022
FORUM PA 2022: la maturità digitale dei comuni italiani rispetto al PNRR
Analisi
PNRR: dalla Ricerca all’impresa, una sfida da cogliere insieme
Innovazione
Pnrr, il Dipartimento per la Trasformazione digitale si riorganizza
FORUM PA 2022
PA verde e sostenibile: il ruolo di PNRR, PNIEC, energy management e green public procurement
Analisi
PNRR, Comuni e digitalizzazione: tutto su fondi e opportunità, in meno di 3 minuti. Guarda il video!
Rapporti
Competenze digitali e servizi automatizzati pilastri del piano Inps
Analisi
Attuazione del PNRR: il dialogo necessario tra istituzioni e società civile. Rivedi lo Scenario di FORUM PA 2022
Progetti
Pnrr, fondi per il Politecnico di Torino. Fra i progetti anche IS4Aerospace
Analisi
PNRR, Colao fa il punto sulla transizione digitale dell’Italia: «In linea con tutte le scadenze»
La Svolta
Ict, Istat “riclassifica” i professionisti. Via anche al catalogo dati sul Pnrr
Analisi
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUM PA 2022
Ecosistema territoriale sostenibile: l’Emilia Romagna tra FESR e PNRR
Il Piano
Innovazione, il Mise “centra” gli obiettivi Pnrr: attivati 17,5 miliardi
Analisi
PNRR: raggiunti gli obiettivi per il primo semestre 2022. Il punto e qualche riflessione
Analisi
PNRR: dal dialogo tra PA e società civile passa il corretto monitoraggio dei risultati, tra collaborazione e identità dei luoghi
Webinar
Comuni e PNRR: un focus sui bandi attivi o in pubblicazione
Analisi
Formazione 4.0: cos’è e come funziona il credito d’imposta
PA e Sicurezza
PA e sicurezza informatica: il ruolo dei territori di fronte alle sfide della digitalizzazione
PA e sicurezza
PNRR e servizi pubblici digitali: sfide e opportunità per Comuni e Città metropolitane
Water management
Water management in Italia: verso una transizione “smart” e “circular” 
LE RISORSE
Transizione digitale, Simest apre i fondi Pnrr alle medie imprese
Prospettive
Turismo, cultura e digital: come spendere bene le risorse del PNRR
Analisi
Smart City: quale contributo alla transizione ecologica
Decarbonizzazione
Idrogeno verde, 450 milioni € di investimenti PNRR, Cingolani firma
Unioncamere
PNRR, imprese in ritardo: ecco come le Camere di commercio possono aiutare
I fondi
Industria 4.0: solo un’impresa su tre pronta a salire sul treno Pnrr

Articolo 1 di 4