intelligenza artificiale

RAG, cos’è e come funziona: guida a strumenti e strategie per il business



Indirizzo copiato

Implementare un RAG efficace è una sfida complessa. Analizziamo l’architettura e le tecniche chiave, dalla gestione della privacy alla riduzione dei costi, per garantire il successo di un progetto aziendale basato su questa potente tecnologia

Pubblicato il 12 mar 2025

Paolino Madotto

manager esperto di innovazione, blogger e autore del podcast Radio Innovazione



distillazione intelligenza artificiale

L’intelligenza artificiale generativa ha aperto scenari incredibili, ma spesso ci scontriamo con limiti noti: le cosiddette “allucinazioni” e la difficoltà di mantenere le informazioni aggiornate nel tempo.

Quante volte un chatbot ci ha fornito risposte fantasiose o basate su dati obsoleti? La promessa di un’AI veramente utile per il business passa necessariamente per la soluzione di questi problemi.

Ed è qui che entra in gioco il Retrieval-Augmented Generation (RAG). Sentiamo sempre più spesso parlare di RAG come la “bacchetta magica” per superare questi ostacoli. Alcuni fornitori la dipingono addirittura come una tecnologia semplice, quasi “plug-and-play”. Ma è davvero così facile?

E soprattutto, come possiamo sfruttare al massimo il suo potenziale per le nostre aziende?

Proviamo allora a fare chiarezza, offrendo una prospettiva realistica e approfondita su questa tecnologia tanto discussa quanto spesso fraintesa.

What is Retrieval-Augmented Generation (RAG)?

La vera natura del Rag- retrieval-augmented generation e le sue promesse

Immaginate un modello linguistico di grandi dimensioni (LLM), il “motore” dell’AI generativa, come un cervello brillante ma “isolato” dal mondo esterno dopo la fase di training.

Il RAG è come aggiungere uno strato di conoscenza dinamico a questo cervello. Invece di basarsi solo sulle informazioni statiche apprese durante l’addestramento, il RAG permette al modello di consultare fonti di informazione esterne e aggiornate in tempo reale prima di generare una risposta.

Come funziona il RAG: un’analisi tecnica dettagliata

In termini più tecnici, il RAG funziona attraverso una pipeline complessa di elaborazione dei documenti. Quando poniamo una domanda, il sistema non si limita a “pescare” nella sua memoria interna, ma attiva un processo che possiamo semplificare in questo modo:

  • Estrazione dei dati: il primo passo è “digerire” la conoscenza. Qualsiasi tipo di documento (testi, tabelle, immagini) viene estratto e trasformato in un formato comprensibile per il sistema. Questa fase, spesso sottovalutata, è cruciale. Non è banale estrarre informazioni utili da una miriade di formati diversi, dai PDF strutturati a documenti di testo meno organizzati, passando per tabelle e persino immagini. Un’estrazione efficace è la base per il successo del RAG.
  • Chunking e indicizzazione: una volta estratti, i documenti vengono divisi in “pezzi” più piccoli, chiamati “chunk”. La dimensione di questi chunk, il modo in cui vengono creati (per caratteri, paragrafi, sovrapposizioni…) è un’arte che impatta direttamente sulla qualità delle risposte. Questi chunk, insieme a metadati utili per la ricerca, vengono poi indicizzati in un database semantico.
  • Database semantico e embedding: ed eccoci al cuore del sistema: il database semantico. Non è un database tradizionale, ma un ambiente in cui le informazioni vengono pre-elaborate attraverso il processo di “embedding”. In parole semplici, l’embedding trasforma il testo (ma anche immagini o audio) in sequenze numeriche che ne rappresentano il significato. La magia è che testi con significato simile avranno sequenze numeriche simili. Questo permette al RAG di cercare per significato, non solo per parole chiave, trovando informazioni rilevanti anche se espresse in modo diverso rispetto alla domanda.
  • Ricerca, elaborazione e risposta: quando l’utente pone una domanda, il RAG utilizza tecniche di ricerca avanzate nel database semantico per trovare i chunk più rilevanti. Questi chunk vengono poi rielaborati e forniti al modello LLM come “contesto aggiuntivo”. Infine, l’LLM genera la risposta, arricchita dalla conoscenza esterna e aggiornata recuperata dal RAG.

Sfide e criticità nella realizzazione di un RAG efficace

Un RAG non è un Agente. Un agente è un software che può essere eseguito a seguito di una indicazione di da parte di un LLM, un RAG è uno strato software che potenzia l’LLM dal punto di vista della sua capacità di conoscenza.

A questo punto, spero sia chiaro che parlare di “facilità” quando si tratta di RAG è riduttivo, se non fuorviante. Dietro la promessa di un’AI sempre aggiornata e meno incline all’allucinazione si nasconde una catena di processi complessi che richiedono competenza e know-how.

RAG vs agenti: la complessità nascosta di una tecnologia potente

La verità è che implementare un RAG efficace è tutt’altro che banale. Le scelte architetturali, le tecniche di estrazione, chunking, embedding, la selezione del database semantico più adatto al caso d’uso specifico, la strategia di ricerca e rielaborazione delle informazioni… sono tutti fattori critici che determinano il successo o il fallimento di un progetto RAG.

Ma la complessità del RAG non si ferma alle sole sfide tecniche. Un aspetto cruciale, spesso sottovalutato, è la sicurezza e la privacy dei dati aziendali. Come abbiamo visto, il RAG, per sua natura, si alimenta di documenti e informazioni interne all’azienda. Questo solleva questioni importanti, soprattutto quando si considerano soluzioni basate su LLM proprietari in cloud.

Affidare conoscenza aziendale sensibile a provider esterni come Microsoft o Google, anche con contratti che promettono sicurezza, comporta sempre un rischio. Questi giganti tecnologici, infatti, conservano le chat e i dati forniti dagli utenti per migliorare i propri modelli, e in caso di problemi o data breach, intraprendere azioni legali si rivelerebbe un percorso arduo e incerto.

Efficienza economica e vantaggi tangibili di un rag performante

Un ulteriore elemento da non trascurare è l’efficienza economica. Un RAG performante consuma un elevato numero di token, poiché interagisce con l’LLM in diverse fasi del processo. Utilizzare LLM proprietari in cloud, con un modello di pagamento a consumo, può rapidamente far lievitare i costi, anche con un numero limitato di utenti. Una architettura “Private AI” ben fatta è progettata per abbattere drasticamente questi costi. Sfruttando modelli interni e ottimizzazioni avanzate, offrendo una soluzione RAG dalle performance elevate ma con un modello di costo “fiat”, prevedibile e scalabile, eliminando le sorprese legate al consumo di token.

Differenze tra prototipi RAG e soluzioni enterprise

Infine, è fondamentale distinguere tra prototipi RAG e soluzioni pronte per la produzione aziendale. Oggi, online, si trovano moltissimi articoli e framework che spiegano come “fare un RAG” e promettono soluzioni pre-confezionate.

Realizzare un prototipo RAG funzionale è relativamente semplice, ma costruire un sistema robusto, scalabile, sicuro e realmente efficace per un utilizzo aziendale intensivo è una sfida ben più complessa. Un RAG di livello enterprise deve essere in grado di servire un elevato numero di utenti contemporaneamente, gestire interrogazioni sofisticate che tengano conto del feedback degli utenti, della profondità storica della documentazione e di molti altri fattori critici. Queste sono le sfide che è necessario affrontare e risolvere quotidianamente, offrendo agli utenti soluzioni RAG affidabili, performanti e veramente pronte per la produzione.

I vantaggi del RAG per le aziende

Nonostante la complessità tecnica, il RAG porta con sé vantaggi tangibili per le aziende:

  • Informazioni sempre aggiornate: dimenticate i modelli “bloccati” a una data specifica. Il RAG permette di accedere a informazioni in tempo reale, garantendo risposte pertinenti e affidabili nel tempo.
  • Riduzione drastica delle allucinazioni: fornendo un contesto informativo esterno, il RAG “ancora” le risposte dell’LLM alla realtà, minimizzando il rischio di risposte inventate o fantasiose.
  • Personalizzazione e contestualizzazione: il RAG può essere “alimentato” con la conoscenza specifica di un’azienda, un settore, un prodotto, offrendo risposte altamente personalizzate e contestualizzate.
  • Trasparenza e spiegabilità: in molti casi, il RAG può fornire indicazioni sulle fonti informative utilizzate per generare la risposta, aumentando la trasparenza e la fiducia nel sistema.

Il valore economico concreto di un RAG di livello enterprise

Ma qual è il valore economico concreto di un RAG di livello enterprise? Uno studio McKinsey ci fornisce dati illuminanti: i dipendenti impiegano in media il 20% del loro tempo a cercare informazioni, spulciando documenti, interpellando colleghi o navigando in internet. Ebbene, secondo McKinsey, uno strumento efficace che recuperi questo 20% di tempo aumenterebbe la produttività del 35%. Tradotto in cifre, con una RAL media di un impiegato amministrativo, parliamo di circa 5.300€ annui di tempo sprecato in ricerca e di un potenziale recupero di produttività di circa 9.300€. Per un dirigente, queste cifre salgono rispettivamente a circa 18.000€ e 32.000€. Questi semplici calcoli evidenziano immediatamente il potenziale ritorno sull’investimento (ROI) di un RAG enterprise. Con il risparmio generato anche solo da pochi dipendenti, un’azienda può ripagare l’investimento in un sistema RAG e iniziare a beneficiare dei risparmi su larga scala.

Strategia di gestione della conoscenza aziendale con il RAG

Oltre al mero risparmio di tempo e denaro, il valore di un RAG si estende alla gestione strategica della conoscenza aziendale. In un mondo in cui lo spazio disco e il volume di dati non strutturati crescono esponenzialmente ogni anno, un RAG si rivela uno strumento indispensabile. Consente di gestire efficacemente questo patrimonio informativo, evitando di riscrivere informazioni già esistenti, facilitando la collaborazione nella creazione di nuovi documenti e garantendo che ogni dipendente possa ottenere l’informazione giusta, al momento opportuno, in base alle proprie esigenze.

In definitiva, il RAG è l’applicazione che manca nel portafoglio applicativo delle aziende moderne, quelle aziende che riconoscono nella conoscenza il loro vero “petrolio” e che desiderano proteggerlo e valorizzarlo. E per queste aziende, la soluzione “Private AI”, supportata dalla nostra piattaforma “Ambrogio” (il primo RAG italiano sul mercato da gennaio 2024), rappresenta la risposta ideale. Un RAG di livello enterprise, come “Ambrogio”, deve connettersi in modo nativo con le applicazioni aziendali esistenti, estrarre conoscenza in modo intelligente, sincronizzarsi periodicamente con i dati e mettere a disposizione degli utenti la conoscenza in modo continuo e proattivo. “Ambrogio” è progettato per fare proprio questo, trasformando la sfida della gestione della conoscenza in un vantaggio competitivo concreto.

Il futuro del RAG: innovazioni e applicazioni aziendali

Il Retrieval-Augmented Generation non è una soluzione “magica” e certamente non è “facile” come alcuni vogliono far credere. Ma è senza dubbio una tecnologia fondamentale per sbloccare il vero potenziale dell’intelligenza artificiale generativa nel contesto aziendale. In futuro sarà arricchito da agenti, sistemi sempre più sofisticati per gestire la conoscenza aziendale, LLM con post-training verticalizzato, ecc. ma già oggi è una soluzione a portata di mano, concreta che genera subito ritorni economici e semplifica il modo di lavorare in azienda. Il RAG si candida ad essere l’assistente al servizio del lavoratore nella vita quotidiana.

Su questi temi Lunedì 17 alle 11 come Intelligentiae abbiamo organizzato un webinar sul RAG nel quale presenteremo molte delle cose di cui abbiamo accennato.

EU Stories - La coesione innova l'Italia

Tutti
Video & Podcast
Analisi
Social
Iniziative
Podcast
Centro Servizi Territoriali: uno strumento per accompagnare gli enti nell’attuazione della politica di coesione. Il podcast “CapCoe. La coesione riparte dalle persone”
Podcast
EU Stories, il podcast | Politiche di coesione e comunicazione: una sinergia per il futuro
Opinioni
La comunicazione dei fondi europei da obbligo ad opportunità
eBook
L'analisi della S3 in Italia
Norme UE
European Accessibility Act: passi avanti verso un’Europa inclusiva
Agevolazioni
A febbraio l’apertura dello sportello Mini Contratti di Sviluppo
Quadri regolamentari
Nuovi Orientamenti sull’uso delle opzioni semplificate di costo
Coesione
Nuovo Bauhaus Europeo (NEB): i premi che celebrano innovazione e creatività
Dossier
Pubblicato il long form PO FESR 14-20 della Regione Sicilia
Iniziative
400 milioni per sostenere lo sviluppo delle tecnologie critiche nel Mezzogiorno
Formazione
“Gian Maria Volonté”: dalle aule al mondo del lavoro, focus sui tirocini della Scuola d’Arte Cinematografica
TRANSIZIONE ENERGETICA
Il ruolo del finanziamento BEI per lo sviluppo del fotovoltaico in Sicilia
Formazione
“Gian Maria Volonté”: dalla nascita ai progetti futuri, focus sulla Scuola d’Arte Cinematografica. Intervista al coordinatore Antonio Medici
MedTech
Dalla specializzazione intelligente di BionIT Labs una innovazione bionica per la disabilità
Finanza sostenibile
BEI e E-Distribuzione: investimenti per la sostenibilità energetica
Professioni
Servono competenze adeguate per gestire al meglio i fondi europei
Master
Come formare nuove professionalità per governare e gestire al meglio i fondi europei?
Programmazione UE
Assunzioni per le politiche di coesione: prossimi passi e aspettative dal concorso nazionale. Il podcast “CapCoe. La coesione riparte dalle persone”
innovazione sociale
Rigenerazione urbana: il quartiere diventa un hub dell’innovazione. La best practice di San Giovanni a Teduccio
Programmazione europ
Fondi Europei: la spinta dietro ai Tecnopoli dell’Emilia-Romagna. L’esempio del Tecnopolo di Modena
Interventi
Riccardo Monaco e le politiche di coesione per il Sud
Iniziative
Implementare correttamente i costi standard, l'esperienza AdG
Finanziamenti
Decarbonizzazione, 4,8 miliardi di euro per progetti cleantech
Formazione
Le politiche di Coesione UE, un corso gratuito online per professionisti e giornalisti
Interviste
L’ecosistema della ricerca e dell’innovazione dell’Emilia-Romagna
Interviste
La ricerca e l'innovazione in Campania: l'ecosistema digitale
Iniziative
Settimana europea delle regioni e città: un passo avanti verso la coesione
Iniziative
Al via il progetto COINS
Eventi
Un nuovo sguardo sulla politica di coesione dell'UE
Iniziative
EuroPCom 2024: innovazione e strategia nella comunicazione pubblica europea
Iniziative
Parte la campagna di comunicazione COINS
Interviste
Marco De Giorgi (PCM): “Come comunicare le politiche di coesione”
Analisi
La politica di coesione europea: motore della transizione digitale in Italia
Politiche UE
Il dibattito sul futuro della Politica di Coesione
Mobilità Sostenibile
L’impatto dei fondi di coesione sul territorio: un’esperienza di monitoraggio civico
Iniziative
Digital transformation, l’Emilia-Romagna rilancia sulle comunità tematiche
Politiche ue
Fondi Coesione 2021-27: la “capacitazione amministrativa” aiuta a spenderli bene
Finanziamenti
Da BEI e Banca Sella 200 milioni di euro per sostenere l’innovazione di PMI e Mid-cap italiane
Analisi
Politiche di coesione Ue, il bilancio: cosa ci dice la relazione 2024
Politiche UE
Innovazione locale con i fondi di coesione: progetti di successo in Italia
Podcast
Centro Servizi Territoriali: uno strumento per accompagnare gli enti nell’attuazione della politica di coesione. Il podcast “CapCoe. La coesione riparte dalle persone”
Podcast
EU Stories, il podcast | Politiche di coesione e comunicazione: una sinergia per il futuro
Opinioni
La comunicazione dei fondi europei da obbligo ad opportunità
eBook
L'analisi della S3 in Italia
Norme UE
European Accessibility Act: passi avanti verso un’Europa inclusiva
Agevolazioni
A febbraio l’apertura dello sportello Mini Contratti di Sviluppo
Quadri regolamentari
Nuovi Orientamenti sull’uso delle opzioni semplificate di costo
Coesione
Nuovo Bauhaus Europeo (NEB): i premi che celebrano innovazione e creatività
Dossier
Pubblicato il long form PO FESR 14-20 della Regione Sicilia
Iniziative
400 milioni per sostenere lo sviluppo delle tecnologie critiche nel Mezzogiorno
Formazione
“Gian Maria Volonté”: dalle aule al mondo del lavoro, focus sui tirocini della Scuola d’Arte Cinematografica
TRANSIZIONE ENERGETICA
Il ruolo del finanziamento BEI per lo sviluppo del fotovoltaico in Sicilia
Formazione
“Gian Maria Volonté”: dalla nascita ai progetti futuri, focus sulla Scuola d’Arte Cinematografica. Intervista al coordinatore Antonio Medici
MedTech
Dalla specializzazione intelligente di BionIT Labs una innovazione bionica per la disabilità
Finanza sostenibile
BEI e E-Distribuzione: investimenti per la sostenibilità energetica
Professioni
Servono competenze adeguate per gestire al meglio i fondi europei
Master
Come formare nuove professionalità per governare e gestire al meglio i fondi europei?
Programmazione UE
Assunzioni per le politiche di coesione: prossimi passi e aspettative dal concorso nazionale. Il podcast “CapCoe. La coesione riparte dalle persone”
innovazione sociale
Rigenerazione urbana: il quartiere diventa un hub dell’innovazione. La best practice di San Giovanni a Teduccio
Programmazione europ
Fondi Europei: la spinta dietro ai Tecnopoli dell’Emilia-Romagna. L’esempio del Tecnopolo di Modena
Interventi
Riccardo Monaco e le politiche di coesione per il Sud
Iniziative
Implementare correttamente i costi standard, l'esperienza AdG
Finanziamenti
Decarbonizzazione, 4,8 miliardi di euro per progetti cleantech
Formazione
Le politiche di Coesione UE, un corso gratuito online per professionisti e giornalisti
Interviste
L’ecosistema della ricerca e dell’innovazione dell’Emilia-Romagna
Interviste
La ricerca e l'innovazione in Campania: l'ecosistema digitale
Iniziative
Settimana europea delle regioni e città: un passo avanti verso la coesione
Iniziative
Al via il progetto COINS
Eventi
Un nuovo sguardo sulla politica di coesione dell'UE
Iniziative
EuroPCom 2024: innovazione e strategia nella comunicazione pubblica europea
Iniziative
Parte la campagna di comunicazione COINS
Interviste
Marco De Giorgi (PCM): “Come comunicare le politiche di coesione”
Analisi
La politica di coesione europea: motore della transizione digitale in Italia
Politiche UE
Il dibattito sul futuro della Politica di Coesione
Mobilità Sostenibile
L’impatto dei fondi di coesione sul territorio: un’esperienza di monitoraggio civico
Iniziative
Digital transformation, l’Emilia-Romagna rilancia sulle comunità tematiche
Politiche ue
Fondi Coesione 2021-27: la “capacitazione amministrativa” aiuta a spenderli bene
Finanziamenti
Da BEI e Banca Sella 200 milioni di euro per sostenere l’innovazione di PMI e Mid-cap italiane
Analisi
Politiche di coesione Ue, il bilancio: cosa ci dice la relazione 2024
Politiche UE
Innovazione locale con i fondi di coesione: progetti di successo in Italia

Articoli correlati

Articolo 1 di 4