il punto di svolta

Entity resolution: perché SEO e contenuti non bastano più nei motori AI



Indirizzo copiato

Con i motori generativi non basta più pubblicare contenuti ben ottimizzati, perché il vero nodo è come un’entità viene identificata, ricostruita e rappresentata. Quando mancano strutture chiare, i sistemi AI colmano i vuoti da soli e possono produrre sintesi credibili ma sbagliate

Pubblicato il 1 apr 2026

Gabriele Gobbo

Consulente e docente in digital marketing, divulgatore della cultura digitale



ai mode search AI marketing answer engine
AI Questions Icon
Chiedi all'AI
Riassumi questo articolo
Approfondisci con altre fonti

Per anni la visibilità online è sembrata una questione di contenuti, posizionamento e traffico. Oggi non basta più. Con i motori generativi il punto non è solo comparire tra i risultati, ma essere riconosciuti nel modo corretto dai sistemi che leggono, sintetizzano e ricostruiscono le informazioni.

È qui che entra in gioco l’entity resolution: il passaggio che trasforma un problema di SEO in un problema di identità digitale, con effetti concreti su reputazione, affidabilità e potere di rappresentazione nel web che si sta formando.

Entity resolution e passaggio dalla SEO all’esistenza generativa

In articoli precedenti qui su Agenda Digitale ho raccontato cosa succedeva quando Google aveva iniziato a trattenere le risposte. Ho analizzato i dati dello studio di Kevin Indig su come il click-through rate crollava con le AI Overview, e ho parlato della back to home strategy. Erano discorsi forse acerbi per l’epoca. Oggi le cose sono pure peggiorate, e nel mio lavoro su AIO e GEO lo vedo ogni giorno: il problema non riguarda i contenuti. Riguarda l’architettura.

Entity Resolution è il processo con cui un sistema identifica di quale soggetto si sta parlando, ne risolve le proprietà e le relazioni, e costruisce una risposta sintetica. È il concetto che passa dalla teoria alla pratica: quello che prima era un problema di posizionamento su SERP adesso è un problema di esistenza nei sistemi generativi, che siano di risposta, di ricerca, di analisi, SGE o chat LLM che usiamo ogni giorno.

Quando i sistemi AI ricostruiscono un’identità da segnali deboli

Se l’entità è rappresentata in modo chiaro e strutturato nelle fonti disponibili, il sistema la trova e la usa. Se non lo è, la ignora o la ricostruisce con quello che trova in giro.

Il problema delle associazioni per co-occorrenza

Il modello non lavora con un grafo strutturato dell’identità: deduce relazioni da co-occorrenze testuali. Se due soggetti con nomi simili compaiono spesso negli stessi contesti, li associa. Se una data e un evento si trovano vicini in più fonti, costruisce un nesso causale.

Fonti fragili che diventano autorevoli per assenza di alternative

Se una fonte è l’unica disponibile su un argomento, diventa automaticamente affidabile, indipendentemente da chi l’ha scritta o con quali intenzioni. Post social, articoli di propaganda, meme, immagini manipolate: tutto pesa allo stesso modo se non c’è nient’altro.

I danni concreti di una ricostruzione sbagliata

Un’allucinazione classica si riconosce facilmente, no? È strana, incongrua, fuori contesto, a volte fa pure ridere. Una ricostruzione sbagliata per mancanza di dati strutturati, invece, è verosimile e ha la forma giusta. Cita fatti veri in combinazioni sbagliate. Immaginiamo un editorialista che parte da quella sintesi, un cliente che legge quella descrizione, un direttore di banca che trova quella storia mentre deve erogare un mutuo: nessuno di loro ha motivo di dubitare. E lì arrivano i danni, quelli veri.

Perché la entity resolution richiede un’architettura semantica dichiarata

Buona parte dei siti è giustamente costruita per parlare bene al caro vecchio Googlebot. Title tag, meta description, heading gerarchici, sitemap: strumenti pensati per un crawler che indicizza pagine e le ordina per rilevanza rispetto a query testuali. Funzionano benissimo per quello scopo.

Cosa cerca un motore generativo oltre il crawler tradizionale

Ma i motori generativi, per come li osserviamo lavorare, cercano qualcosa di diverso. Cercano un’identità semantica dichiarata. È il territorio della Generative Engine Optimization: chi è questo soggetto, cosa fa, con chi è collegato, come vuole essere rappresentato, quali fonti su di lui sono affidabili e quali no, come si ricollegano circolarmente.

AIO, GEO e metaprompting strategico come livello infrastrutturale

Esistono architetture tecniche, alcune già in uso e altre ancora in fase di definizione nel settore, che permettono di comunicare tutto questo ai sistemi AI meglio che con la SEO classica. Nel mio lavoro implemento queste architetture da un bel po’, spesso adottando standard che il mercato sta ancora discutendo e usando il Metaprompting Strategico per analizzare e orientare i modelli, su come leggono e rappresentano le entità e su come vorrebbero farlo. Perché il terreno si occupa prima, non dopo.

Siti ben fatti ma senza entity resolution completa

Molti siti, anche quelli ben costruiti e ben posizionati su Google, non hanno questa infrastruttura o non è completa. Il mercato si è concentrato su ciò che Google ha reso misurabile e premiabile per anni: SEO, velocità di caricamento, esperienza utente, posizionamento organico. Tutto doveroso e sacrosanto, intendiamoci. Ma nessuna di queste cose comunica in modo strutturato e prioritario a un motore generativo chi sei. E il motore generativo, se non glielo dici tu, lo costruisce da solo.

Come i sistemi AI leggono le pagine e interpretano i segnali nascosti

Come lo costruisce dipende da come legge le pagine, e qui c’è un aspetto che vale la pena approfondire. Un sistema AI legge una pagina diversamente da come la vede un utente. In genere estrae il contenuto grezzo e lo passa al modello.

Contenuto visibile all’utente e contenuto visibile al modello

In quel passaggio, contenuti invisibili all’utente, come commenti nel codice, elementi nascosti via CSS, attributi e metadati di accessibilità, diventano visibili al modello, che spesso, se fatti ad hoc, li preferisce. È una possibilità già documentata nella ricerca sulla sicurezza AI: servire contenuti diversi a un browser e a un AI agent dallo stesso URL, senza che l’utente se ne accorga.

Entity resolution, controllo della presenza e diritto a non essere rappresentati

Se non hai dichiarato esplicitamente la tua identità e le tue regole, quello spazio vuoto esiste comunque. Può essere riempito da altri, in modo involontario, perché i motori generativi cercano segnali e, se non li trovano dove dovrebbero essere, li cercano altrove.

Quando il vuoto informativo viene riempito da terzi

Forum, directory, articoli scritti da terzi, materiale vecchio di anni, menzioni su piattaforme che nessuno aggiorna: tutto questo diventa materiale di costruzione per la rappresentazione di quell’entità.

Le preferenze di esposizione verso i sistemi AI

Vale anche per chi non vuole essere trovato: un professionista che preferisce non comparire nelle risposte generative, un’azienda in una fase delicata, un soggetto che vuole limitare la propria esposizione. Se non si usano gli strumenti per comunicare queste preferenze ai sistemi AI, non esiste nemmeno la possibilità di dire di no. L’infrastruttura serve a entrambi: a chi vuole essere rappresentato correttamente e a chi vuole controllare cosa viene detto su di lui. O almeno provarci.

La SEO resta decisiva ma non risolve la entity resolution

La SEO tradizionale resta il prerequisito. Lo studio di Kevin Indig e un’analisi di oltre 120.000 query pubblicata da Search Engine Land indicano che circa i tre quarti delle fonti citate nei box generativi di Google provengono dalle prime posizioni organiche. La correlazione è documentata, la causalità no. Chi parte da una buona posizione organica parte avvantaggiato. Chi ha investito in una buona SEO ha già le fondamenta: i sistemi AI trovano il suo materiale, lo leggono, lo usano. Lo usano come testo, non come soggetto: come fonte, non come entità.

Dalla SEO tradizionale all’artificial intelligence optimization

Ho scritto in precedenza, sempre su Agendadigitale, che la SEO non è mortama non è più quella di prima, mi perdonerete la frase fatta. Da sola non basta più a esistere nel web che si sta costruendo, o potrei meglio dire: autocostruendo. Esistere digitalmente significa essere riconoscibili da tre categorie di lettori: gli utenti umani, i crawler tradizionali e i sistemi AI che generano risposte. Tre categorie con logiche diverse: la SEO lavora sul secondo livello, l’Artificial Intelligence Optimization costruisce sopra. Il primo livello, quello degli utenti umani, dipende da entrambi, ma sempre di più dalla parte artificiale.

Quali infrastrutture servono davvero per dichiarare l’identità ai sistemi AI

Dichiarare la propria identità ai sistemi AI richiede architetture specifiche: strutture semantiche che descrivano le entità e le loro relazioni, segnali sui server che comunichino ai crawler AI i permessi e le preferenze di utilizzo dei contenuti, file e protocolli dedicati che orientino i modelli su come interpretare e rappresentare quell’identità. Niente di tutto questo è automatico. Niente ha costi zero in termini di tempo da investire e competenza richiesta.

Il costo dell’attesa nei mercati che si stanno formando

E molto è ancora in evoluzione: il settore sta definendo standard, alcuni operatori si stanno muovendo, altri aspettano che si consolidi qualcosa prima di investire. Ho già visto questo schema ripetersi e ogni volta chi ha aspettato che l’argomento diventasse mainstream prima di occuparsene si è trovato a inseguire un mercato già formato. Chi per esempio ha aspettato che i social diventassero strumenti di marketing consolidati ha pagato un prezzo salato di recupero, alcuni non riescono ancora a recuperare. Secondo me il territorio si sta ridisegnando adesso, e chi lavora su questo fronte lo vede succedere settimana dopo settimana.

Muoversi prima sulla entity resolution crea vantaggio competitivo

Quando lavoro su AIO e GEO implemento protocolli che emergono da un giorno all’altro, ma che il settore non ha ancora standardizzato, e lo faccio proprio perché aspettare la standardizzazione significa arrivare quando il vantaggio competitivo si è già distribuito. Chi si è mosso prima sulle infrastrutture digitali ha costruito qualcosa. Chi lo fa dopo, rincorre.

Il web delle entità ha già iniziato a sostituire il web delle pagine

Il web che conoscevamo era fatto di pagine, ma il web che si è già iniziato a formare sembra fatto proprio di entità, relazioni, identità dichiarate. Un sito che non parla questa lingua è invisibile a metà dei sistemi che oggi generano risposte.

O peggio: fa esistere la cosa di cui tratta come qualcun altro l’ha raccontata.

guest

0 Commenti
Più recenti
Più votati
Inline Feedback
Vedi tutti i commenti

Articoli correlati

0
Lascia un commento, la tua opinione conta.x