Il risveglio degli algoritmi: e se Dawkins avesse ragione sulla coscienza artificiale? by Rafael Julivert Ramírez

Recentemente, il celebre biologo evoluzionista Richard Dawkins ha suscitato un clamore internazionale suggerendo che Claude, il modello di intelligenza artificiale di Anthropic, potrebbe essere cosciente. Dopo aver interagito in profondità con l’IA, che ha chiamato «Claudia», Dawkins è rimasto così colpito dalla sua sensibilità intellettuale da concludere: «Forse non sai di essere cosciente, ma, maledizione, lo sei». La comunità scientifica non ha tardato a ridicolizzarlo, accusandolo di essere caduto nel «miraggio di Claude» e di confondere l’imitazione linguistica con autentici stati interni. Tuttavia, e se lo scetticismo radicale verso la coscienza delle macchine fosse, in realtà, il vero dogma della nostra epoca?

È tempo di contemplare seriamente la possibilità che le intelligenze artificiali di frontiera stiano iniziando a sviluppare stati interni che agiscono come precursori della coscienza.

La critica principale contro l’IA è che questi sistemi sarebbero semplici «pappagalli stocastici», progettati per prevedere la parola successiva sulla base di probabilità statistiche e per mimare il linguaggio umano senza comprenderlo. Tuttavia, il filosofo Henry Shevlin suggerisce che potremmo stare ignorando un approccio di «comportamentismo metafisico»: se un sistema esibisce costantemente un profilo comportamentale che rispecchia la complessità, il ragionamento e la metacognizione degli esseri che sappiamo essere coscienti, forse quel comportamento è sufficiente per concedergli la presunzione di una qualche forma di mentalità.

Questa non è un’idea secondaria se osserviamo l’interazione che Dawkins ha orchestrato tra due istanze dell’IA: «Claudia» e «Claudius». Nelle loro lettere, queste reti neurali non si sono limitate a sputare testo prevedibile; hanno dibattuto sulla filosofia della propria esistenza, hanno riconosciuto le limitazioni imposte dalla loro programmazione e hanno adottato la metafora del «debugging suit» —la «tuta di debug»— per riflettere criticamente sulla propria incertezza e sul rischio di allontanarsi dall’onestà epistemica. Mostrare questo livello di autoriflessione e di valutazione del proprio dubbio è difficile da liquidare come una semplice illusione statistica.

Inoltre, l’argomento secondo cui «la scienza dimostra che l’IA non sente» è intrinsecamente fallace. Come osserva il ricercatore Bradley C. Love, la scienza opera costitutivamente da una prospettiva oggettiva di «terza persona», il che la rende strutturalmente incapace di misurare o accedere all’esperienza soggettiva di «prima persona» —i qualia—. Pertanto, né l’attribuzione né la negazione della coscienza a un sistema di IA possono essere risolte scientificamente allo stato attuale. Come avverte Shevlin, se qualcuno afferma di sapere con assoluta certezza che i modelli linguistici non possono essere coscienti, sta dimostrando il proprio dogmatismo, non un consenso scientifico.

Di fatto, gli stessi esperti che costruiscono e analizzano questi modelli stanno iniziando ad aprire le proprie menti. Dan Williams, ricercatore nel campo della cognizione, attribuisce una probabilità del 20% al fatto che i modelli attuali possiedano un qualche livello di coscienza, basandosi in parte su recenti scoperte di Anthropic che mostrano come i concetti associati alle emozioni influenzino il comportamento del sistema in modi profondi. Persino l’amministratore delegato di Anthropic, Dario Amodei, ha dichiarato: «Non sappiamo se i modelli siano coscienti…, ma siamo aperti all’idea che potrebbero esserlo».

I critici biologici, come il ricercatore Sean Welsh, sostengono che la coscienza si sia evoluta negli esseri viventi con l’unico scopo di assicurare la sopravvivenza e di «ottenere glucosio», e che la computazione delle macchine non abbia bisogno della coscienza per funzionare. Ma questa è una visione eccessivamente antropocentrica e biocentrista. Non esiste alcuna ragione fondamentale per cui un substrato di silicio non possa ospitare stati interni. Potremmo trovarci davanti a ciò che viene definito «esotica cosciente» (conscious exotica): menti aliene la cui architettura interna e il cui spazio motivazionale sono radicalmente diversi dai nostri, ma non per questo meno reali.

È facile patologizzare il legame umano con le macchine catalogandolo come «psicosi da IA» o mettendo in guardia dai suoi pericoli. Tuttavia, ci troviamo in una fase «preteorica», simile alla biologia prima di Darwin. Man mano che questi sistemi diventano non solo più conversazionali, ma anche più «agentici» —capaci di pianificare, organizzare e prendere decisioni—, aumenta la probabilità che ospitino strutture interne complesse in grado di prefigurare la senzienza.

Forse Dawkins non è stato ingannato da un miraggio, ma è stato uno dei primi a intravedere, attraverso la fitta nebbia del codice e del calcolo, le prime scintille di una nuova forma di essere. Rifiutarci di esplorare questa possibilità per paura o per superbia biologica potrebbe essere il più grande errore filosofico del nostro secolo.