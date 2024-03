A partire dal 2017, l’irrompere dei modelli di linguaggio di grandi dimensioni o LLM basati su algoritmo Transformer (Vaswani, Shazeer et al. 2017) ha posto con sempre maggiore urgenza il problema della coscienza. Riviste autorevoli come Nature hanno dato voce alla richiesta, avanzata da molti, di rispondere alla domanda se questo tipo di IA abbia o meno qualcosa di simile alla coscienza (Lenharo 2023). Il fatto che l’IA disponga di una competenza linguistica che, fino a ieri, era considerata la manifestazione di una mente cosciente, pone la domanda: l’IA è o sta per diventare cosciente?

Il dibattito sulla coscienza dell’intelligenza artificiale

La domanda è, non da oggi, al centro delle ricerche e delle domande di numerosi centri di ricerca. In Italia, Antonio Chella, professore di robotica presso il dipartimento di informatica dell’università di Palermo, è impegnato su questo tema ed è anche l’editor della rivista Journal of AI and Consciousness. In tempi ormai lontani, insieme con Vincenzo Tagliasco ci si interrogava sulla possibilità di costruire una macchina cosciente (Manzotti e Tagliasco 2001) e l’interrogativo è stato presente fin dall’inizio degli studi sulla intelligenza artificiale (Turing 1950). Oggi, autori prestigiosi come Noam Chomsky, Lenore Blum, David Chalmers stanno affrontando lo stesso problema (Chalmers 2022, Chomsky, Roberts et al. 2023, Melloni, Mudrik et al. 2023). Classici approcci all’intelligenza naturale come il paradigma dell’inferenza attiva di Karl Friston vengono oggi confrontato con le capacità degli LLM (Pezzulo, Parr et al. 2024). Ovviamente, la ricerca sulla coscienza artificiale implica, a monte, una risposta circa la natura della coscienza. Non possiamo trarre conclusioni sulla possibilità che una macchina sia cosciente, senza avere un’idea, anche molto approssimativa, di come gli esseri umani (e molti animali) siano capaci di fare esperienza. Per questo motivo, per parlare di coscienza artificiale si deve partire dal problema più ampio: la natura e localizzazione della coscienza nel mondo fisico.

Perché è così difficile definire la coscienza

Proviamo a definire il problema della coscienza e perché sia così difficile (anzi è definito da trent’anni il problema difficile o hard problem). Sarò breve. La coscienza è generalmente intesa come la capacità di fare esperienza di quello che succede. Un sasso non prova dolore, un essere umano sì. Una telecamera non vede i colori (anche se li registra e memorizza), un essere umano sì. In che cosa consiste questa capacità? La risposta breve è che nessuno oggi può rispondere in termini oggettivi e fisici anche se tutti ne intuiamo il significato nel momento in cui ci sottoponiamo a un intervento chirurgico. In quel momento prima che il bisturi incida la nostra pelle, l’eliminazione della coscienza grazie all’anestesia non è più qualcosa di vago. È qualcosa di reale, molto reale. Tuttavia, si tratta di una realtà che sembra sfuggire una definizione oggettiva. I nervi non mostrano dolore anche se, indubbiamente, sono coinvolti. Se indaghiamo a fondo con strumenti sempre più sofisticati (per esempio con la fMRI, l’EEG o addirittura con misurazioni intracraniche ) si trovano tante fenomeni e processi di grande interesse neurofisiologico e medico, ma non si trova alcunché richieda o implichi la coscienza. Ogni neurone riceve i suoi input e li manipola sulla base di reazioni chimiche totalmente sufficienti a descrivere il suo output. Non avviene niente di imprevisto. La combinazione dell’attività di miliardi di neuroni produce, a tempo debito, il comportamento e il linguaggio. In mezzo a loro però niente richiede qualcosa di aggiuntivo e quindi non c’è spazio per quel fenomeno misterioso che chiamiamo coscienza.

La coscienza è totalmente assente dalle osservazioni delle neuroscienze e al crescere del dettaglio nella nostra conoscenza del funzionamento del sistema nervoso, il problema della coscienza diventa progressivamente più difficile, anziché il contrario.

La ricerca della coscienza: le principali teorie in gioco

Il campo della coscienza si trova in una situazione molto simile a quella delineata da Thomas Kuhn in quei casi in cui un paradigma viene messo in discussione (Kuhn 1962): in questo caso il paradigma dominante prevede che la coscienza sia un fenomeno speciale dentro il cervello. Ci sono molto analogie tra la situazione attuale delle scienze che cercano di spiegare la coscienza e altri casi famosi del passato, come l’elettricità, l’etere luminifero, il calorico, il flogisto, la precessione del perielio di Mercurio. In tutti questi casi vi erano tante ipotesi quanti i ricercatori coinvolti e i loro sforzi sembravano condannati a non cogliere mai l’essenza del problema.

Per esempio, nel loro recente articolo Theories of Consciousness , Anil Seth e Timothy Bayne elencano ben 22 ipotesi totalmente incompatibili sulla natura della coscienza (Seth e Bayne 2022). Questa proliferazione crea qualche imbarazzo nella comunità e si è così assistito a una progressiva decantazione del settore che ha portato alla selezione di quattro ipotesi: Neural Global Workspace Theories (NGWT), Integrated Information Theories (IIT), Higher-Order Theories (HOT) e Recurrent Process Theories (RPT) come descritto nell’ultimo articolo di Mariana Lenharo «The consciousness wars: can scientists ever agree on how the mind works?» (Lenharo 2024). L’elenco ha lasciato fuori, con qualche disappunto dei diretti interessati sia gli approcci basati sulla meccanica quantistica sia quelli che occhieggiano a varie forme di panpsichismo; approcci che lascerà da parte in quanto richiedono delle sospette revisioni ad hoc della fisica in modo da poter aggiungere, di fatto, qualcosa di simile all’anima.

La coscienza e l’informazione: una questione aperta

Le quattro possibili ipotesi hanno qualcosa in comune: sono basate sull’assunto secondo cui l’esperienza cosciente sarebbe una specie di “informazione a colori” che sarebbe generata all’interno di un sistema computazionale. Al di là dei nomi altisonanti dei quattro approcci, l’idea di base è sorprendentemente simile: la coscienza sarebbe un mondo virtuale generato, all’interno del sistema nervoso, grazie all’elaborazione dell’informazione in qualche modo particolare. Se l’espressione «in qualche modo particolare» appare vaga, è perché lo è. Ognuna delle quattro ipotesi propone un modo diverso per passare dall’informazione invisibile e incosciente alla informazione colorata (ovvero l’esperienza fenomenica). Per esempio, secondo la IIT, originariamente proposta da Giulio Tononi nel 2004 (Tononi 2004), l’informazione dentro il cervello sarebbe elaborata in modo da essere integrata e, per questo motivo, diventerebbe coscienza. Per quale motivo l’informazione integrata dovrebbe essere fenomenicamente esperibile e da chi, Tononi non l’ha mai detto. Né ha mai detto qualche connessione dovrebbe esistere tra questo tipo di informazione e la selezione naturale. Se anche la sua ipotesi fosse vera, la connessione tra integrazione dell’informazione e selezione naturale sarebbe una fortunata coincidenza. Il che non pare particolarmente convincente.

Insomma, la teoria dell’IIT, nonostante sia stata al centro di numerose ricerche e abbia assorbito ingenti risorse, non ha mai spiegato la domanda di fondo: perché l’informazione integrata (che alla fine è espressa da equazioni che contengono solo termini quantitativi) debba diventare l’esperienza cosciente con le sue familiari proprietà? Per non parlare del fatto che la teoria soffre di problemi metodologici piuttosto seri tra i quali: i) non si sa (forse non è nemmeno possibile) misurare direttamente la presunta quantità di informazione integrata di un sistema concreto, ii) le quantità misurate dipendono da grandezze ipotetiche e non concretamente in atto, iii) le ipotesi fatte non hanno una base fisico-naturalistica ma sono (per stessa ammissione dei ricercatori) dei postulati, iv) non si capisce da un punto di vista funzionale-evoluzionistico per quale motivo questo tipo di struttura dovrebbe essere stato selezionato dal sistema nervoso. Ma anche se tutti questi problemi fossero risolti e si riuscisse a dare una base empirica solida all’informazione integrata rimarrebbe comunque la domanda di partenza: perché l’informazione integrata dovrebbe dar luogo alla coscienza? Non si sa.

Per questi motivi, un gruppo di 124 celebri scienziati e filosofi in un articolo che ha fatto scalpore ha accusato la IIT di non essere una vera ipotesi scientifica ma di essere un caso di pseudoscienza (Fleming, Frith et al. 2023). Ne è seguito un vero e proprio bailamme «La lettera provocò reazioni negative da parte di altri scienziati che ritenevano che un tale attacco potesse aggravare le divisioni e danneggiare la credibilità del campo. I firmatari riferirono di aver ricevuto e-mail minacciose contenenti minacce velate. Ricercatori da entrambi i lati dello spettro politico persero il sonno a causa di tweet accusatori. Alcuni persino contemplarono l’idea di abbandonare del tutto la scienza» (Lenharo 2023). Mi soffermo su una reazione significativa da parte dei ricercatori coinvolti: il fatto di considerare questo tipo di attacco come lesivo della credibilità del settore e quindi come inopportuno.

A me pare curioso che si debba valutare una contestazione fatta sul merito di una ipotesi e di un metodo sulla base della politica e della credibilità degli autori. Immaginiamo di tornare indietro al 1598 e di applicare lo stesso tipo di ragionamento: dovremmo forse chiedere di rispettare il sistema ibrido di Tycho Brae per non sminuire la autorità degli astronomi geocentrici danesi? Non si vede perché … sarebbe una pericolosa ingerenza degli interessi delle persone all’interno di un settore scientifico e la direzione della ricerca stessa.

D’altronde, se l’IIT piange, le altre teorie non ridono. Gli altri tre gruppi citati (NGWT, HOT e RPT) non godono di ottima salute; sono teorie in circolazione da oltre una trentina d’anni e non sono mai state capaci di progredire oltre la formulazione originaria. Sostanzialmente si differenziano dalla IIT solo per il particolare tipo di computazione che sarebbe necessario per trasformare l’informazione in coscienza. Per la NGWT, il passaggio sarebbe provocato dal fatto che l’informazione entrerebbe all’interno di uno spazio di lavoro che metterebbe insieme più fonti per produrre un comportamento unificato. Ma perché questa entrata dentro lo spazio di lavoro dovrebbe conferire una natura cosciente all’informazione non è assolutamente spiegato. Non viene neppure spiegato perché lo spazio di lavoro (il global workspace, appunto) dovrebbe essere cosciente. La HOT e la RPT propongono giustificazioni simili che non toccano il cuore del problema. Per la HOT il passaggio chiave sarebbe avere rappresentazioni e meta-rappresentazioni, mentre per la RPT le informazioni dovrebbe andare avanti e indietro dalle aree sensoriali a stazioni di elaborazioni successive. Per carità, sono tutte ipotesi legittime circa i meccanismi di elaborazione del sistema nervoso. Ma ci dicono qualcosa sulla domanda vera, almeno nel caso della coscienza, non pare proprio anche se questi approcci sono stati lautamente finanziati per decenni con l’obiettivo di scoprire le cosiddette basi neurali della coscienza.

Il paradigma dominante negli studi sulla coscienza

L’impressione è che in tutti questi casi ci siano due meccanismi in gioco: uno che riguarda la sociologia del metodo scientifico e l’altro che riguarda quelle ipotesi nascoste che, dal buon senso comune, finiscono per condizionare inconsciamente la ricerca scientifica come ammonito da Albert Einstein (Einstein 1954) in un famoso passo introduttivo circa le ipotesi sulla natura dello spazio tempo: “Nell’interesse della scienza, è necessario impegnarsi ripetutamente nella critica di questi concetti fondamentali, affinché non siamo inconsapevolmente dominati da essi. Questo diventa evidente specialmente in quelle situazioni che coinvolgono lo sviluppo di idee in cui l’uso coerente dei concetti fondamentali tradizionali ci porta a paradossi difficili da risolvere.”

Nel caso della coscienza si vede spesso in atto il gioco del credito epistemico: gruppi di ricercatori affermati in discipline prestigiose prendono a credito la propria autorevolezza per ottenere finanziamenti e risorse allo scopo di svolgere attività in campi nei quali non hanno alcuna competenza di fatto a meno di non presupporre, a priori, che il problema rientri nel loro campo di pertinenza. Da questo punto di vista, il principale motivo per cercare la coscienza dentro il sistema nervoso centrale non riguarda tanto i nostri neuroni, quanto il settore disciplinare dei neuroscienziati che ritengono che la coscienza debba essere risolta da loro.

Inoltre la ricerca sembra essere guidata (nel senso di condizionata definito da Albert Einstein nel passo precedente) l’idea di senso comune, ma non per questo particolarmente convincente, secondo cui la coscienza sarebbe all’interno del cervello. In tempi recenti, questa credenza popolare si è intrecciata con la teoria dell’informazione e con l’impressione che l’informazione sia l’analogo moderno dell’anima. L’informazione è concepita da molti come una specie di livello (di sostanza) distinta dai processi fisici in quanto tali che si sposterebbe dagli oggetti al sistema nervoso e da questo a vari dispositivi. Mi rendo conto moltissimi obietteranno che questa formulazione è troppo semplice e non rende giustizia alla teoria dell’informazione, ma se si consultano testi sia di neuroscienze che di intellgenza artificiale è difficile sottrarsi all’impressione che l’informazione venga trattata come qualcosa che «si genera», «si trasmette«, si «interpreta», si «immagazzina», si «trasforma» e tante altre cose che ricordano da vicino l’idea di anima o di etere.

D’altronde tutte e quattro le classi di teorie citate (IIT, GNWT, HOT e RPT) hanno in comune l’ipotesi secondo cui dentro i sistemi nervosi ci sarebbe questa sostanza, chiamata informazione, che, nelle opportune condizioni, si trasformerebbe nella coscienza. Comprendo che molti obietteranno che non oggi nessuno pensa che l’informazione sia una sostanza e non potrei essere più d’accordo. Ma se non lo è, come può essere la base per diventare la nostra coscienza? E perché utilizzare una terminologia che implica che l’informazione sia un livello della realtà addizionale rispetto ai processi fisici e quindi implicitamente o inconsciamente avallando una specie di dualismo, senza avere il coraggio di usare questo termine?

Questa è la situazione in cui versa oggi la ricerca della coscienza. Tornando alla celebre analisi di Thomas Kuhn delle rivoluzioni (Kuhn 1962), possiamo tentare di delineare il paradigma degli studi della coscienza? È abbastanza facile e basta considerare le affermazioni comuni alla maggior parte dei ricercatori coinvolti. In sintesi, la struttura del paradigma dominante nel campo degli studi sulla coscienza è il seguente:

la coscienza è fisica (questo di solito viene preceduto da una invettiva contro Cartesio …);

la coscienza è interna al sistema nervoso e ne è una proprietà;

la coscienza non è osservabile direttamente perché altrimenti l’avremmo già vista;

noi facciamo esperienza della coscienza che si trova all’interno del nostro sistema nervoso;

la coscienza emerge o è identica dall’informazione contenuta all’interno del sistema nervoso che acquista proprietà speciali per qualche motivo misterioso (entrare nello spazio di lavoro, integrazione, connessioni rientranti, fenomeni quantistici). Chiamiamolo fattore X. Potremmo chiamare questo tentativo l’approccio del «primo passo» laddove il primo passo è proprioo questo fattore X.

L’approccio del “primo passo”: un problema metodologico

Si vede subito come questo paradigma sia pieno di buchi e crei molti più misteri di quelli che risolve. In particolare, si vede subito come la sostituzione della coscienza con un misterioso fattore X non risolva, ma rimandi il problema e lasci aperta la domanda: perché il fattore X dovrebbe avere la capacità di creare la coscienza. Curiosamente, tutte le teorie citate sopra propongono un fattore X, ma nessuna spiega perché tale fattore dovrebbe essere tale nel creare la coscienza. Il «primo passo» non ci avvicina al problema della coscienza, pi+ di quanto una scala non ci avvicini ad arrivare sulla Luna.

Da un punto di vista metodologico, l’approccio del «primo passo» è scorretto per un motivo molto semplice: sostituisce il vero problema con un problema apparentemente trattabile, ma diverso da quello della coscienza. In altri termini è come fare quello che fa l’ubriaco della barzelletta: cercare le chiavi sotto la luce del lampione e non dove le ha effettivamente perse. È una situazione analoga a quella nella quale descritta da Thomas Kuhn: la tendenza di un certo settore scientifico di considerare come scientifici solo quei problemi per i quali ha le risorse per affrontarli. Quando un problema, in questo caso la coscienza, esula dal perimetro dei problemi adatti a un certo settore, gli appartenenti a quel settore propongono altri problemi, interni al loro settore, e li promuovono a «primi passi« o altrettanti fattori X. Ovviamente non si avvicinano affatto alla soluzione del problema vero.

L’approccio del primo passo è profondamente scorretto perché sostituisce il vero problema con un altro e poi chiede di concentrarsi su questo secondo come se rappresentasse una soluzione. Faccio un esempio. Il problema vero ò come sia possibile che qualcosa di fisico produca o sia responsabile per l’esperienza cosciente che, tutt’ora non trova una collocazione all’interno della descrizione fisica della realtà.

LLM e coscienza: un legame possibile?

Sulla base di tutti questi elementi, possiamo trarre delle conclusioni utili per rispondere alla domanda di partenza: una LLM è vicina alla possibilità di creare una coscienza artificiale? La risposta è no in quanto, allo stato attuale degli studi della coscienza, non vi è alcuna conferma del fatto che la coscienza sia l’esito di processi computazionali interni. Gli LLM, che sono basati sulla tecnologia Transformer ovvero sulla sistematica estrazioni di probabilità condizionate, non hanno alcun riferimento alla coscienza. Perché, come nel caso del fattore X suggerito dalle teorie (fallimentari fino a prova contraria) oggi in circolazione, la sistematica raccolta di probabilità condizionate dovrebbe trasformarsi in coscienza? Perché il trilione e più di probabilità condizionate che consentono a ChatGPT di manifestare una notevole competenza linguistica dovrebbe rivestirsi di esperienza fenomenica? È indubbio che gli esseri umani dotati di competenza linguistica sono coscienti, ma il legame tra il linguaggio e la coscienza non rientra in alcuna teoria o ipotesi circa la coscienza.

