elogio della lentezza

L’IA ci rende impazienti: ecco come la latenza cambia il cervello

La riduzione della latenza nell’IA e il crollo dei tempi di attenzione stanno ridefinendo attesa e pensiero. Mentre pretendiamo risposte istantanee, i modelli più avanzati migliorano quando rallentano. Tra offloading cognitivo e cultura del real-time, la lentezza diventa una scelta critica

Pubblicato il 13 mar 2026

Walter Tripi

Innovation Manager

L’innovazione digitale nel Life Science: le priorità di investimento; metadominio Scienze della vita in Italia intelligenza artificiale e lavoro; Ecosistema salute, quando l’innovazione incontra l’investimento divario di genere nelle stem — transumanesimo

Chiedi allʼAI Nextwork360

Riassumi questo articolo

Approfondisci con altre fonti

La corsa ai millisecondi sta cambiando il nostro rapporto con il tempo. Cosa succede alla riflessione quando la risposta arriva prima che abbiamo finito di pensare? E perché talvolta sembra che i modelli di intelligenza artificiale più avanzati funzionino meglio proprio quando rallentano, mentre noi disimpariamo la lentezza?

Attenzione liquida: perché lo scrolling cambia il nostro cervello

Indice degli argomenti

Il paradigma dei 47 secondi

C’è un numero che racconta la nostra epoca meglio di molti saggi: 47 secondi. È il tempo medio che trascorriamo su uno schermo prima di spostare l’attenzione altrove, verso una nuova attività. Lo ha misurato Gloria Mark, psicologa e professoressa all’Università della California, dopo quasi vent’anni di ricerche sul campo. Nel 2004, quando iniziò a studiare come le persone interagiscono con la tecnologia, quel numero era di due minuti e mezzo. Nel 2012 era sceso a 75 secondi. Oggi siamo a meno di un minuto. E la metà delle osservazioni registra tempi inferiori ai 40 secondi.

Il dato, di per sé, potrebbe sembrare una curiosità statistica. Ma se lo si mette accanto a un altro fenomeno — la corsa forsennata della aziende tecnologiche per ridurre la latenza dei sistemi di intelligenza artificiale — emergono una serie di interrogativi più articolati e un quadro più profondo: una trasformazione del nostro rapporto con il tempo, con l’attesa, e in definitiva con il pensiero stesso.

Millisecondi e latenza come nuova moneta

Nel mondo dell’e-commerce, un ritardo di un secondo nel caricamento di una pagina può far crollare le conversioni di percentuali rilevanti: se il tempo di attesa supera i tre secondi, addirittura più di metà utenti abbandona il sito. Amazon ha calcolato che ogni 100 millisecondi di latenza le costa l’1% delle vendite. Google ha scoperto che mezzo secondo in più nella generazione dei risultati di ricerca riduce il traffico del 20%.

Questi numeri, noti da anni nel settore, hanno assunto un significato nuovo con l’arrivo dell’intelligenza artificiale conversazionale. Un chatbot che risponde in 800 millisecondi viene percepito come fluido, naturale, quasi umano, mentre già vedere un’animazione di attesa per un paio di secondi genera immediatamente frustrazione e senso di inadeguatezza del sistema. Sembra incredibile, ma a tutti è successo almeno una volta: trovarsi spazientiti di fronte a un ritardo microscopico di uno strumento tecnologico che solo pochi anni fa sarebbe apparso come il ritrovato più recente di magie nere e spiritismi.

Le aziende che sviluppano assistenti vocali hanno stabilito che la soglia di tolleranza per una risposta si aggira tra i 300 e i 500 millisecondi: è il tempo che intercorre, in una conversazione tra persone, tra la fine di una frase e l’inizio della successiva.

La conseguenza è facilmente immaginabile: tra i produttori di soluzioni tecnologiche e in particolare tra le case madri di tool IA, c’è una corsa senza precedenti. Si ottimizzano modelli, si comprimono reti neurali, si spostano i calcoli ai margini della rete per guadagnare frazioni di secondo, si sacrificano all’algoritmo pezzetti di adeguatezza.

Il “Time to First Token” — il tempo che passa prima che l’IA generi la prima parola della risposta — è diventato una metrica ossessivamente monitorata. Non perché influenzi di per sé la qualità della risposta, ma perché determina la percezione di competenza e affidabilità del sistema.

Il paradosso del pensiero lento e l’IA

Ed ecco il paradosso. Mentre noi pretendiamo risposte istantanee, i modelli di intelligenza artificiale più avanzati funzionano meglio quando si prendono tempo per “pensare“.

I cosiddetti reasoning models hanno già abbondantemente rappresentato una prima svolta concettuale: non si limitano a generare testo in modo autoregressivo, parola dopo parola, ma prima di rispondere attraversano una fase di ragionamento interno, scomponendo il problema in passaggi intermedi, valutando alternative, correggendo errori. Una catena di pensiero esplicita che migliora drasticamente le prestazioni su compiti complessi come matematica, logica e programmazione.

Sui test di matematica avanzata come l’AIME (American Invitational Mathematics Examination), i modelli tradizionali risolvono meno del 30% dei problemi rispetto ai reasoning models che arrivano al 70-80%. Su problemi di coding reali, le performance migliorano in modo proporzionale al tempo dedicato al ragionamento interno.

OpenAI lo ha sintetizzato più o meno così: più tempo il modello passa a “pensare“, meglio performa. C’è qualcosa di ironico, e forse di istruttivo, in questa dinamica. Abbiamo costruito macchine che imparano a rallentare per essere più intelligenti, mentre noi facciamo esattamente il contrario.

E d’altronde, noi per primi abbiamo dato libero accesso all’idea per cui la risposta immediata sia non solo preferibile, ma talvolta strettamente necessaria alle nostre emozioni ed aspettative.

L’impazienza digitale come norma cognitiva

La ricerca di Gloria Mark non si limita a misurare quanto velocemente spostiamo l’attenzione, ma ha indagato anche le conseguenze. Una delle più significative riguarda il costo del recupero, e andiamo su una statistica che avrete letto molte volte in qualche corso di Time Management o tutorial su gestione di progetti: dopo un’interruzione, servono in media 25 minuti per tornare pienamente concentrati su un compito. E quasi la metà delle interruzioni — il 49% — ce le procuriamo da soli. Non sono le notifiche a distrarci: siamo noi a cercare la distrazione.

Questo dato si intreccia con un fenomeno che i ricercatori chiamano cognitive offloading: la tendenza a delegare sempre più compiti cognitivi a strumenti esterni. Non memorizziamo più numeri di telefono perché li abbiamo in rubrica. Non calcoliamo perché c’è la calcolatrice. Non riflettiamo a lungo su una questione perché possiamo chiedere all’IA.

Uno studio pubblicato nel 2025 sulla rivista Societies ha esplorato la correlazione tra uso frequente di strumenti di intelligenza artificiale e capacità di pensiero critico. I risultati suggeriscono che chi si affida sistematicamente all’IA per ottenere risposte tende a sviluppare minori capacità di ragionamento indipendente. Non perché l’IA danneggi direttamente il cervello, ma perché viene meno l’esercizio. Come un muscolo che si atrofizza per mancanza di uso, le reti neurali biologiche deputate al ragionamento profondo perdono efficienza se non vengono stimolate.

Una meta-analisi che ha aggregato oltre 60 studi ha rilevato un calo medio del 10-15% nelle capacità di ragionamento deduttivo, inferenza e valutazione degli argomenti nella popolazione generale negli ultimi trent’anni. Gli autori attribuiscono questo declino alla crescente delega di compiti cognitivi alla tecnologia.

C’è un aspetto culturale, d’altronde, che merita attenzione. L’impazienza digitale non è solo un tratto comportamentale: sta diventando un valore implicito secondo il quale ciò che è lento viene percepito come inefficiente, inadeguato, obsoleto. Ciò che richiede tempo viene svalutato.

Questo ha implicazioni per tutto ciò che, per sua natura, non può essere accelerato né ha senso di esserlo: la lettura critica di un libro, volta a individuarne nuovi spunti, sfumature, studi. Ma anche l’elaborazione di un lutto, la costruzione di una relazione, l’apprendimento di una competenza complessa. Il pensiero filosofico. La ricerca scientifica. Sono tutte attività che richiedono quella che la neuroscienziata Maryanne Wolf chiama “pazienza cognitiva“: la capacità di sostare nel processo, di tollerare l’incertezza, di lasciar sedimentare.

Ma se l’aspettativa sociale — e ormai neurologica — è quella della risposta istantanea, la pazienza diventa una forma di resistenza controcorrente. Chi si prende tempo per pensare rischia di apparire lento, non riflessivo.

Quando la macchina insegna all’uomo a rallentare

C’è però un rovesciamento possibile di questa narrazione. I reasoning models, con la loro architettura progettata per rallentare, offrono un modello alternativo. Non sono più veloci dei loro predecessori; in molti casi sono più lenti. Ma sono più accurati, più affidabili, più capaci di gestire la complessità.

In un certo senso, queste macchine ci stanno mostrando qualcosa che avevamo dimenticato: che la qualità del pensiero dipende dal tempo che gli si dedica. Che scomporre un problema in passaggi intermedi non è una perdita di efficienza, ma un guadagno di comprensione. Che tornare sui propri passi, correggere un errore, provare un approccio diverso — tutte operazioni che richiedono tempo — sono esattamente ciò che distingue il ragionamento dalla mera reazione.

Il prompt design è, in questo senso, un alleato molto prezioso: permette di allenarsi a non dare niente per scontato, a interrogarsi su perimetri e parametri delle richieste che facciamo, di sviluppare le ragioni per cui le facciamo e con quali obiettivi, verso quali destinatari e con quale background relazionale.

Il fatto che siano le macchine a ricordarcelo è forse la parte più interessante della storia. Abbiamo costruito sistemi che, per funzionare bene, devono fare esattamente ciò che noi abbiamo smesso di fare: fermarsi a pensare.

La responsabilità della lentezza nella lentezza digitale

Non si tratta, ovviamente, di ingaggiare una battaglia contro il mulino a vento della velocità. Al netto di quanto questo risulterebbe drammaticamente controcorrente, il punto è poi che la riduzione della latenza può effettivamente vantaggi reali: esperienze utente più fluide, processi più efficienti, accesso più rapido alle informazioni. Il problema nasce, ancora una volta, quando la velocità diventa l’unico criterio, e tutto ciò che non si piega a quel criterio viene marginalizzato e non adeguatamente analizzato.

La sfida, allora, non è scegliere tra velocità e lentezza, ma riconoscere criticamente l’esigenza e il contesto di ognuna, applicandone la forza e la debolezza.

Non occorre demonizzare l’impazienza, che è di per sé foriera di grandi balzi in avanti ideali e concreti della storia: si tratta – non una sorpresa – di riprendersi il gusto della scultura. Anche quando questa scultura sia composta di pensiero e competenze.

Una domanda sul tempo e sulla qualità della domanda

Alla fine, la questione è culturale, e forse addirittura esistenziale: che tipo di pensiero vogliamo coltivare? Che tipo di attenzione siamo disposti a dedicare? Che valore attribuiamo al tempo necessario per comprendere, non solo per reagire?

I 47 secondi di Gloria Mark non sono una condanna. Sono un punto di partenza per una riflessione — lenta, se possibile — su cosa stiamo diventando. E su cosa potremmo scegliere di restare.

Perché alla fine, forse, la vera intelligenza — artificiale o umana che sia — non si misura nella velocità della risposta. Si misura nella qualità della domanda. E le domande buone, quelle che cambiano davvero qualcosa, hanno bisogno di tempo per emergere.

@RIPRODUZIONE RISERVATA