Nell’ambito del Regolamento (UE) 2024/1689 o Ai Act, il legislatore europeo si è soffermato in più punti sulla tematica dei sistemi e modelli di IA rilasciati con licenze libere e open source, riconoscendo a questa pratica la capacità di contribuire attivamente alla ricerca e all’innovazione nel mercato, nonché come potenziali notevoli opportunità per la crescita per l’economia dell’Unione.
Tuttavia, il quadro interpretativo dietro i concetti di sistemi e modelli di IA liberi e open source è ancora lontano dall’essere chiaro e uniforme.
Per questo motivo è necessario interrogarsi sulle interpretazioni attualmente presenti su questi temi, anche al fine di poter correttamente sviluppare delle strategie industriali e progresso tecnologico volte a sfruttare le “agevolazioni” fornite dall’AI ACT per queste tipologie di prodotti.
Indice degli argomenti
Modelli open source e semplificazioni previste dal regolamento europeo
All’interno del Regolamento (UE) 2024/1689 (AI ACT), sono previsti degli “scenari agevolati” in termini di requisiti a cui conformarsi per sistemi e modelli di IA rilasciati con licenza libera e open source. In particolare, all’art. 2 par. 12 AI ACT è stabilito che le disposizioni del presente Regolamento non riguardano i sistemi di IA rilasciati con licenza libera e open source, salvo che questi non siano immessi sul mercato o messi in servizio come sistemi proibiti, sistemi di IA ad alto rischio o come sistemi di IA destinati a interagire direttamente con le persone fisiche (quindi rientranti nell’ambito dell’art. 50 del Regolamento).
Da un punto di vista fattuale, dunque, è ragionevole ipotizzare che i sistemi di IA rilasciati con licenza libera e open source che potranno effettivamente godere dell’esenzione di applicabilità del regolamento saranno relativamente poco numerosi.
Per quanto concerne i modelli di IA per finalità generale, troviamo anche in questo caso un possibile scenario semplificato di conformità. L’art. 53 par. 2 AI ACT stabilisce infatti che una serie di obblighi di conformità per i fornitori di modelli di IA per finalità generali definiti nell’art. 53 par. 1 lett. a) e b) (redazione e manutenzione di documentazione tecnica del modello, documentazione relativa alle modalità di integrazione del modello, etc.) non si applicano ai fornitori di modelli di IA rilasciati con licenza libera e open source a condizione che, tuttavia, i fornitori di tali modelli consentano l’accesso, l’uso, la modifica e la distribuzione del modello e che siano resi pubblici i parametri, compresi i pesi, le informazioni sull’architettura del modello e le informazioni sull’uso del modello.
Inoltre, ai sensi dell’art. 54 par. 6, per i fornitori di tale tipologia di modelli di IA per finalità generali vi è anche l’esenzione alla nomina di un rappresentante autorizzato stabilito nell’Unione nel caso essi fossero stabilità in Paesi terzi. Tali eccezioni di cui all’art 53 par. 2 e all’art. 54 par. 6 non si applicano, tuttavia, ai modelli di IA per finalità generali con rischi sistemici.
A differenza dei sistemi di IA, nel caso dei modelli è più ragionevole ipotizzare, invece, un possibile maggior impatto in termini di numero di fornitori sgravati dai requisiti di conformità, favorendo tra l’altro la diffusione di modelli di IA per finalità generali rilasciati con licenza e open source.
Modelli di ia open source: definizioni, livelli di apertura e criticità
Chiarito il quadro normativo, un primo tema su cui riflettere è come bisogna intendere il concetto di IA libera e open source. Per quanto concerne i modelli di IA, la lettura combinata dell’art. 53 par. 2 AI ACT e dei considerando 102 e 104 ci fornisce una prospettiva per cui un utente possa essere in grado, in piena autonomia, di comprendere la logica di funzionamento del modello di IA e tutti gli aspetti architetturali che vi sono alla base. Sostanzialmente, il modello di IA diventa una struttura vetrata in modo tale che l’utente possa analizzare autonomamente ogni suo aspetto interno.
Questa interpretazione del concetto di modello di IA rilasciato con licenza libera e open source sarà potenzialmente rafforzata con la pubblicazione del General-Purpose AI Code of Practice della Commissione Europea. Nella terza bozza rilasciata a marzo dal Commissione vi è, infatti, la notazione di “fully open(-source)” relativa ai modelli di IA definita come: «open source models for which weights, full code, training data, and other documentation (e.g. about the model’s training process) are made publicly available, without restrictions on modification, use and sharing». Tale notazione è stata richiamata dal 2025 International AI Safety report. Il report, a cui hanno collaborato 96 esperti in materia di IA proveniente da 30 Paesi, è stato presentato in occasione dell’AI Action Summit svoltosi a febbraio 2025 a Parigi e ha avuto come scopo quello di sintetizzare lo stato della comprensione scientifica dell’IA general-purpose con particolare attenzione alla comprensione e alla gestione dei suoi rischi. All’interno del report è stato analizzando il concetto di open AI sotto varie sfaccettature. In prima analisi è stata concepita la differenza tra:
- Open-weight model: un modello di IA i cui pesi[1] sono pubblicamente disponibili per il download. I modelli open-weight possono essere, ma non necessariamente, open source.
- Open source model: un modello di IA che viene rilasciato per il download pubblico con una licenza open source. La licenza open source garantisce la libertà di utilizzare, studiare, modificare e condividere il modello per qualsiasi scopo.
Nel report, tuttavia, viene specificato come sia rimasto un certo disaccordo su quali componenti del modello (pesi, codice, dati di addestramento) e sulla documentazione debbano essere pubblicamente accessibili affinché il modello si qualifichi come open source. Inoltre, nel report viene rappresentato uno spettro di modalità di rilascio dei modelli, sulla base delle attuali pratiche poste dai fornitori di modelli di IA.
Livello di accessibilità | Descrizione | Esempio | Confronto con tipologie di software tradizionali |
Fully closed | L’utente non può interagire in alcun modo con il modello | Flamingo (Google) | Algoritmi proprietari integrati in software chiusi |
Hosted Access | L’utente può interagire con il modello solamente tramite una specifica applicazione/interfaccia | Midjourney (Midjourney) | Software SaaS (ad es. Google Docs) |
API Access to Model | Gli utenti possono inviare richieste al modello in modo programmatico, consentendone l’uso in applicazioni esterne | Claude 3.5 Sonnet (Anthropic) | Cloud-based API (ad es., website builder come Squarespace) |
API Access to Fine-Tuning | Gli utenti possono effettuare del fine-tuning sul modello per adattarlo alle proprie specifiche esigenze | GPT-4o (OpenAI) | Software enterprise con API personalizzabili (ad es., Salesforce Development Platform) |
Open-weight | Gli utenti possono liberamente accedere ai parametri del modello, il quale può essere scaricato ed eseguito localmente | Llama 3 (Meta), Mixtral (Mistral) | Software desktop proprietario (ad es. Microsoft Word) |
Partially open model | Gli utenti possono scaricare ed eseguire localmente il modello. Inoltre, gli utenti possono accedere ai parametri, alla logica inferenziale del modello e alla logica di addestramento, con anche accesso ai dati di training. Tuttavia, l’utilizzo generale è parzialmente limitato. | BLOOM (BigScience) | Source-available software (ad es., Unreal Engine) |
Fully open | Gli utenti hanno piena libertà di scaricare, utilizzare e modificare il modello, il codice completo e i dati | GPT-NeoX (EleutherAI) | Open source software (ad es., Mozilla Firefox and Linux) |
Tabella basasta sulla Tabella 2.5 del 2025 International AI safety report
Tale elenco testimonia come non ci sia ancora una chiara tendenza del mercato per quanto concerne la gestione delle modalità di rilascio, in termini di licenze d’uso, dei modelli di IA.
Si ritiene ragionevolmente condivisibile, tuttavia, come delle ipotesi di rilascio intermedie, come solamente il rilascio dei pesi, o come solamente il rilascio del dataset di training, siano non particolarmente funzionali, in quanto un modello di IA maturo e utilizzabile è il risultato di un lavoro in cui molteplici parti concorrono.
Capire il perché vi siano determinati pesi senza avere accesso al dataset di training, oppure determinare come da un certo dataset di training si sia arrivati a un determinato output, sarebbero delle attività particolarmente complesse o potenzialmente fallaci rispetto alla completezza dell’analisi realizzabile in termini astratti. È quindi apprezzabile che sia nell’AI ACT sia perseguita l’interpretazione di modello di IA libero e open source solamente nell’ottica di un fully open, ossia di un modello di IA per cui che i pesi, il codice completo, i dati di addestramento e altra documentazione (ad es. sul processo di addestramento del modello) siano resi disponibili al pubblico, senza restrizioni di modifica, uso e condivisione.
Verso una definizione condivisa di sistemi di IA open source
Se per quanto riguarda i modelli di IA vi è già un buon quantitativo di informazioni per potersi orientare sulle strade da perseguire, lo stesso non si può dire tuttavia per quanto riguarda i sistemi di IA.
Partendo dall’AI ACT, infatti, se grazie all’art. 53 par. 2 e ai considerando 102 e 104 del Regolamento si ricevono delle indicazioni dirette su come intendere un modello di IA libero e open source, la medesima norma, invece, fallisce nell’essere altrettanto incisiva nel chiarire il medesimo concetto rapportato però ai sistemi di IA.
Seppur, infatti, è possibile trovare dei principi interpretativi nei considerando 102 e 103, non è comunque presente all’interno dell’articolato del Regolamento una definizione chiara di sistema di IA. D’altronde, una tematica di questo tipo non è banale, in quanto gli aspetti tecnologici in gioco con i sistemi di IA non permettono un’applicazione immediata della concezione tradizionale che si ha di software libero e open source.
Già nel 2023, ad esempio, la Open Source Initiave (OSI) si interrogò sulla necessità di realizzare una definizione ad hoc di “Open Source AI” per fronteggiare questo nuovo paradigma tecnologico. Attualmente l’OSI ha pubblicato la versione 1.0 della definizione di Open Source AI, secondo la quale:
An Open Source AI is an AI system made available under terms and in a way that grant the freedoms to: Use the system for any purpose and without having to ask for permission. Study how the system works and inspect its components. Modify the system for any purpose, including to change its output. Share the system for others to use with or without modifications, for any purpose. These freedoms apply both to a fully functional system and to discrete elements of a system. A precondition to exercising these freedoms is to have access to the preferred form to make modifications to the system. |
È possibile notare come le libertà indicate dall’OSI derivino dalle quattro libertà essenziali della definizione di Free Software. Rispetto alla versione originale, tuttavia, viene meno il concetto di codice sorgente, elemento legato al concetto di programma informatico tradizionale, per far spazio al concetto di “componenti”. In questo modo, l’OSI ha voluto enfatizzare la dinamica che si instaura con le tecnologie di IA per cui i confini tra dati, opzioni di configurazione, documentazione e i nuovi artefatti, come i pesi e i pregiudizi, non sono chiaramente marcati. Nel proseguo della definizione fornita dall’OSI, infatti, viene anche meglio chiarito il concetto di “preferred form to make modifications to the system”. Al fine di poter operare efficacemente delle modifiche su un sistema di IA, infatti, l’OSI afferma come sia necessario fornire:
- informazioni sufficientemente dettagliate sui dati utilizzati per addestrare il sistema, in modo che una persona esperta possa costruire un sistema sostanzialmente equivalente.
- il codice sorgente completo utilizzato per addestrare ed eseguire il sistema. Il codice deve rappresentare la specifica completa di come sono stati elaborati e filtrati i dati e di come è stato effettuato l’addestramento.
- i parametri del modello, come i pesi o altre impostazioni di configurazione.
Da questi termini, è possibile notare come ci si è riavvicinati alla concezione di modello di IA libero e open source stabilita nell’AI ACT. Per questo motivo, tuttavia, è ragionevole a questo punto porsi una domanda, per la quale tuttavia non vi è ancora una risposta netta nel quadro normativo: è possibile concepire l’esistenza di sistemi di IA liberi e open source basati su modelli chiusi? Oppure, volendo porre la domanda in altri termini: l’adozione di un modello di IA fully open è una condizione preliminare e necessaria per far sì che un sistema di IA possa essere considerato libero e open source?
Riflessioni conclusive sull’evoluzione normativa dell’IA open source
La disponibilità di prodotti di IA fully open offre all’industria e alla ricerca scientifica nuovi margini di innovazione collaborativa. L’AI ACT riconosce questa realtà e contempla degli scenari di conformità semplificati. Tuttavia, bisogna porre particolare attenzione alle modalità con cui viene implementata questa “apertura” dei prodotti di IA. Sono già presenti casi, infatti, in cui prodotti di IA indicati come open riservassero, tuttavia, delle restrizioni d’uso mirate che vanno in contrasto con l’approccio libero e open source avanzato dall’OSI, ad esempio. Dopo la nascita di termini come il green-washing, quindi, bisognerà prepararsi a familiarizzare con termini quali l’open washing?
Infine, bisognerà attenzionare anche la potenziale nascita di licenze di utilizzo di modelli di IA, in particolare, che contemplino, come per le licenze della famiglia GPL per i software tradizionali, dotate di clausole di viralità al fine di permettere una maggior diffusione del paradigma dell’Open AI.
Note
[1] Parametri di un modello di IA che rappresentano la forza della connessione tra i nodi di una rete neurale. I pesi svolgono un ruolo importante nel determinare l’output di un modello in risposta a un dato input e vengono aggiornati iterativamente durante l’addestramento del modello per migliorarne le prestazioni.