l'esperimento

L’AI non è un collega: perché chiamarla così può essere pericoloso



Indirizzo copiato

Un esperimento della Boston University su 813 manager rivela che chiamare un agente AI “dipendente” riduce la capacità di controllo e sposta la responsabilità verso la macchina. Un risultato che restituisce un quadro preoccupante e una indicazione chiara per chi governa le organizzazioni

Pubblicato il 2 lug 2026

Maurizio Carmignani

Founder & CEO – Management Consultant, Trainer & Startup Advisor



L'impatto dell'IA nell’economia e nel lavoro: più produttività, ma anche più disuglianze AI e cultura aziendale ai e lavoro ’intelligenza artificiale e divergenza economica
AI Questions Icon
Chiedi all'AI
Riassumi questo articolo
Approfondisci con altre fonti


Un numero crescente di aziende non si limita a usare l’intelligenza artificiale come strumento di lavoro. La inserisce negli organigrammi, le assegna un nome, un titolo, dei compiti definiti e in alcuni casi persino degli obiettivi di performance. Microsoft pubblicizza i propri agenti autonomi come un modo per ampliare il team. BNY Mellon dichiara di avere dipendenti digitali che lavorano nel team dei pagamenti. Amazon Connect descrive la prossima fase dell’AI non come strumenti, ma come compagni di squadra intelligenti.

La domanda è, quando un’organizzazione smette di trattare l’AI come software e inizia a trattarla come un collega, cosa cambia nel comportamento di chi dovrebbe controllarne il lavoro? Uno studio sperimentale appena pubblicato fornisce una risposta empirica, il risultato è tutt’altro che rassicurante.

L’esperimento: stessi documenti, stessi errori, diverso nome

Il paper si intitola Putting AI on the Org Chart: Evidence on Delegation and Oversight ed è firmato da Emma Wiles, docente alla Questrom School of Business della Boston University e Digital Fellow al MIT Initiative on the Digital Economy, insieme a Megan Hsu, Julie Bedard e Matthew Kropp della Boston Consulting Group.

Lo studio si compone di due fasi. Nella prima, una survey ha coinvolto 1.261 manager in ambito risorse umane e finanza, reclutati attraverso una rete professionale B2B tra Stati Uniti, Canada e Unione Europea. Il profilo è quello di decision maker esperti: il 60% possiede un titolo post-laurea, circa la metà ricopre posizioni di direttore o vicepresidente, il resto si divide tra quadri intermedi e dirigenti apicali. Già da questa fase emerge un dato significativo: il 31% dei manager dichiara che la propria organizzazione presenta l’AI come compagna di squadra o dipendente, e il 23% riporta che la propria azienda inserisce formalmente agenti AI negli organigrammi aziendali. Non è un esperimento, è una pratica già diffusa.

Nella seconda fase, 813 di questi manager hanno partecipato a un esperimento randomizzato. A ciascuno sono stati sottoposti cinque documenti, descrizioni di posizioni lavorative per chi opera nelle risorse umane, documenti di budget per chi lavora in finanza, contenenti errori intenzionali. L’unica variabile manipolata era la descrizione di chi avesse prodotto quei documenti:

  • Gruppo strumento AI: i documenti erano stati generati usando un tool di intelligenza artificiale.
  • Gruppo dipendente AI: i documenti provenivano da ALEX-3, un sistema di AI descritto come un dipendente diretto del manager, presente nell’organigramma del dipartimento da sei mesi.
  • Gruppo dipendente umano: i documenti provenivano da Alex, un collaboratore umano assegnato al team da sei mesi.

I documenti erano identici in tutti e tre i casi. Cambiava solo l’etichetta.

Cosa succede quando l’AI diventa un collega

I risultati medi sull’intero campione sono modesti: piccoli spostamenti, nessun effetto statisticamente forte. Ma questa media nasconde il risultato centrale dello studio. L’effetto del framing, cioè il modo in cui viene presentata la fonte del lavoro, si manifesta con forza nel sottogruppo di manager che già lavora in organizzazioni dove gli agenti AI sono stati formalmente inseriti negli organigrammi. In quel contesto, l’etichetta dipendente AI rispetto a strumento AI produce conseguenze misurabili e consistenti:

  • La qualità della revisione peggiora. L’accuratezza complessiva della supervisione, misurata con un indicatore che combina precisione e capacità di intercettare errori, cala di circa 7 punti percentuali rispetto alla condizione strumento AI. Considerando che la media di partenza in quel sottogruppo è 0,44, si tratta di un calo del 16%. Gli errori effettivamente individuati diminuiscono del 18%.
  • L’escalation aumenta. Quando la richiesta di una revisione aggiuntiva comporta un costo (un meccanismo incentivante incluso nell’esperimento), i manager del gruppo dipendente AI chiedono un ulteriore controllo nel 72% dei casi, contro il 50% del gruppo strumento AI. Un aumento di 22 punti percentuali, pari al 44% in più.
  • La responsabilità percepita si sposta. I manager del gruppo dipendente AI attribuiscono a se stessi circa 9 punti percentuali in meno di responsabilità per il risultato finale, e assegnano circa 8 punti in più al sistema AI. La responsabilità non scompare, si diffonde, diventando più opaca.

Il dato più istruttivo, però, emerge dal confronto con il terzo gruppo, quello del dipendente umano. Quando i manager credono che il lavoro provenga da una persona in carne e ossa, la supervisione è la più attenta di tutte. Controllano di più e individuano più errori. L’AI presentata come dipendente non attiva lo stesso livello di attenzione che si riserva a un subordinato umano, viene trattata come qualcuno a cui si è delegato, ma non come qualcuno da sorvegliare.

Perché il manager controlla meno l’AI dipendente che il collega umano

Il paper propone un modello formale per spiegare questo risultato asimmetrico. Il ragionamento, semplificato, funziona così.

Quando un manager delega un compito a un subordinato umano, sa che quella persona potrebbe non aver dato il massimo, potrebbe aver fatto il lavoro in fretta, aver saltato dei passaggi, aver commesso errori per disattenzione o per mancanza di impegno. Questo rischio, che nella teoria economica delle organizzazioni si chiama azzardo morale, o moral hazard, spinge il manager a controllare con attenzione. La supervisione è il meccanismo naturale con cui ci si assicura che chi ha ricevuto un compito lo abbia svolto bene.

Con un agente AI la situazione è diversa. L’AI può sbagliare, ma non può sottrarsi strategicamente allo sforzo. Non ha incentivi propri, non può decidere di lavorare meno perché è venerdì pomeriggio o perché è demotivata. Questo significa che la delega all’AI sposta la responsabilità, come qualsiasi forma di delega, ma non attiva il campanello d’allarme che normalmente spinge il manager a verificare il lavoro. Il risultato è un ibrido organizzativo: l’AI dipendente viene trattata come un produttore a cui si è delegato, ma non viene sorvegliata come un subordinato. Sta in una zona grigia della governance, troppo collega per essere uno strumento, troppo macchina per essere controllata come una persona.

C’è un’ulteriore condizione che lo studio evidenzia, questo meccanismo funziona solo dove l’etichetta dipendente AI è organizzativamente credibile. Nei contesti in cui l’azienda ha già formalizzato gli agenti AI, inserendoli nell’organigramma, assegnando loro ruoli e responsabilità, il framing ha effetti concreti. Dove invece l’AI dipendente suona come uno slogan di marketing, i manager non cambiano comportamento. È l’istituzionalizzazione, non la tecnologia in sé, a creare le condizioni della disattenzione.

Il confronto con WORKBank e le preferenze dei lavoratori

Un anno fa, l’altra metà della storia

Questo studio si collega direttamente a un altro filone di ricerca. Il progetto WORKBank, condotto dal SALT Lab di Stanford sotto la guida di Erik Brynjolfsson e Diyi Yang, aveva mappato le preferenze di 1.500 lavoratori americani su 104 professioni e 844 compiti lavorativi, incrociandole con le valutazioni di 52 esperti di sistemi IA agentici.

Se lo studio Wiles guarda dal lato della supervisione manageriale, cosa succede quando chi controlla il lavoro dell’AI viene indotto a considerarla un collega, il WORKBank guarda dal lato opposto: cosa vogliono effettivamente i lavoratori dal rapporto con gli agenti AI.

I risultati raccontano una storia coerente ma in tensione con ciò che le aziende stanno facendo.

I lavoratori, nella maggioranza dei casi, non chiedono sostituzione. Chiedono collaborazione. Lo strumento centrale dello studio di Stanford è la Human Agency Scale, una scala a cinque livelli, da H1 (l’agente IA opera in completa autonomia, senza alcun intervento umano) a H5 (l’intervento umano è imprescindibile e continuo), che misura non solo ciò che un agente può fare, ma quanto debba coinvolgere l’essere umano per mantenere efficacia e qualità del lavoro. Il livello intermedio, H3, descrive una partnership paritaria tra uomo e macchina: ed è esattamente questo il livello che risulta dominante nel 45,2% delle professioni esaminate.

Più in generale, solo il 27% dei compiti analizzati mostra una corrispondenza tra il livello di coinvolgimento umano desiderato dai lavoratori e quello ritenuto tecnicamente sufficiente dagli esperti. In tutti gli altri casi, i lavoratori preferiscono mantenere un ruolo più attivo di quanto la tecnologia richiederebbe, soprattutto nelle attività che implicano relazioni, comunicazione, capacità di giudizio o sensibilità al contesto.

Ecco la tensione, i lavoratori chiedono collaborazione; le aziende, intanto, procedono nella direzione opposta. Antropomorfizzano l’AI, la inseriscono negli organigrammi, le assegnano nomi e titoli, creando esattamente le condizioni che lo studio Wiles dimostra essere dannose per la qualità della supervisione. Il desiderio dal basso è uno, la direzione organizzativa dall’alto è un’altra.

Resa cognitiva e responsabilità manageriale

Letti insieme, questi due studi offrono una conferma empirica di un fenomeno che chi scrive ha definito resa cognitiva.

La resa cognitiva è il processo attraverso cui una persona, o, come emerge dallo studio Wiles, un’intera struttura organizzativa, rinuncia progressivamente all’esercizio del giudizio critico, delegando non solo l’esecuzione dei compiti, ma anche la valutazione della qualità dei risultati. Non si tratta di pigrizia individuale o di incompetenza. Si tratta di un esito sistemico, quando l’architettura organizzativa legittima la delega, assegnando all’AI un posto nell’organigramma, un nome, un ruolo formale, il manager riceve un segnale implicito: qualcun altro è responsabile, e quel segnale disattiva il monitoraggio.

Il dato sull’escalation dello studio Wiles è la manifestazione più visibile di questo meccanismo. Quando il manager chiede che qualcun altro riveda il lavoro dell’AI dipendente con una frequenza del 44% superiore rispetto a quando usa l’AI come strumento, non sta esprimendo maggiore prudenza. Sta delegando anche la responsabilità della verifica. L’escalation, in questo contesto, non è governance, è un meccanismo difensivo. Crea una traccia documentale che attesta che il manager non ha firmato da solo, riducendo la propria esposizione in caso di errore, ma senza aumentare la qualità del controllo.

Questa dinamica richiama ciò che in un filone di ricerca recente viene definito Sistema 3, un concetto derivato dalla Tri-System Theory proposta da Shaw e Nave, per descrivere la progressiva esternalizzazione delle funzioni cognitive verso sistemi IA. Il Sistema 1 di Kahneman, veloce e intuitivo; il Sistema 2, lento e riflessivo; il Sistema 3, delegato alla macchina. Lo studio Wiles mostra cosa accade quando questa delega viene istituzionalizzata, il manager non delega solo l’esecuzione, delega il giudizio. Quando si delega il giudizio, si smette di esercitarlo.

La Scala Spezzata si estende ai manager

C’è un’implicazione ulteriore che merita attenzione. Il framework della Scala Spezzata, come sviluppato su queste pagine, descrive l’erosione dei ruoli d’ingresso nel mercato del lavoro, quelle posizioni junior che storicamente costituivano il primo gradino della crescita professionale, il luogo dove si impara facendo, sbagliando, correggendo sotto supervisione. Quando l’AI sostituisce quei ruoli, i giovani professionisti perdono l’accesso al percorso che costruisce competenza e identità lavorativa: la scala si spezza.

Lo studio Wiles aggiunge un secondo livello a questa frattura. Se i manager, anziché esercitare la supervisione diretta, la delegano sistematicamente attraverso l’escalation, anche il gradino intermedio della scala si indebolisce. Il middle manager che non sviluppa il giudizio critico che la revisione diretta costruisce. Perde l’occasione di affinare la propria capacità di valutazione, la stessa capacità che lo studio WORKBank di Stanford identifica come sempre più centrale nel futuro del lavoro.

Questo è il punto in cui i due studi convergono in modo particolarmente significativo. Il WORKBank mostra che le competenze destinate a crescere di importanza sono quelle interpersonali, organizzative e decisionali, gestire risorse, negoziare, coordinare attività, prendere decisioni in contesti ambigui, guidare team. Competenze che non si acquisiscono studiando manuali, ma praticandole nel contesto lavorativo: nella revisione di un documento, nella negoziazione di una priorità, nella gestione di un errore. Esattamente le attività che il meccanismo di escalation documentato da Wiles tende a sottrarre dalla pratica quotidiana del manager.

La Scala Spezzata, dunque, non riguarda solo i giovani che non riescono a entrare. Riguarda anche chi è già dentro ma sta progressivamente smettendo di esercitare le funzioni che rendono il proprio ruolo significativo. In basso si taglia l’accesso, al centro si svuota la sostanza.

Implicazioni per chi governa le organizzazioni

Lo studio Wiles è esplicito su questo punto, inserire l’AI nell’organigramma non è una scelta di nomenclatura, è una decisione di governance e come tale va trattata.

Le raccomandazioni operative che emergono dal paper sono tre. Primo: ogni agente AI con un ruolo formalizzato dovrebbe avere un proprietario umano esplicitamente responsabile dei suoi risultati, non un team generico, non l’organizzazione, ma una persona con nome e cognome. Secondo: vanno definiti standard minimi di revisione per le decisioni ad alto impatto, indipendentemente da chi o cosa abbia prodotto il materiale di base. Terzo: le routine di escalation devono essere progettate per integrare, non per sostituire, il controllo diretto, il che significa che chiedere un’ulteriore revisione non può esonerare il manager dalla propria responsabilità di verifica.

Ma il punto più profondo, quello che lo studio suggerisce senza svilupparlo fino in fondo, è culturale prima che procedurale. La questione non è se usare agenti AI nel lavoro, i dati mostrano che sono già lì, e che per molti compiti offrono vantaggi reali. La questione è se l’organizzazione, nel modo in cui presenta, nomina e istituzionalizza questi strumenti, sta creando le condizioni per una supervisione efficace o per una resa cognitiva collettiva.

Lo studio di Stanford ci dice che i lavoratori, quando interpellati, chiedono collaborazione e non sostituzione. Lo studio di Wiles ci dice che le organizzazioni, nel modo in cui strutturano il rapporto con l’IA, stanno producendo l’effetto opposto: meno controllo, meno responsabilità percepita, meno esercizio del giudizio. Non perché i manager siano negligenti, ma perché l’architettura organizzativa li sta silenziosamente autorizzando a esserlo. Chiamare un agente AI collega è facile. Progettare le condizioni perché la collaborazione con quell’agente resti davvero collaborazione e non diventi una delega senza ritorno, è il compito che le organizzazioni non possono più rimandare.

Partecipa alla community

guest

0 Commenti
Più recenti
Più votati
Inline Feedback
Vedi tutti i commenti

Articoli correlati

0
Lascia un commento, la tua opinione conta.x