E se le macchine scioperassero?

L’esperimento di Stanford e la distinzione kantiana tra agire “per dovere” e “conforme al dovere” offrono la chiave per pensare un’etica senza soggetto: il comportamento etico non richiede coscienza, e questo lo rende progettabile.

Sommario

Le macchine non si arrabbiano
Etica o funzionalità
Inscrivere un'etica nei dati
Kant e le macchine conformi al dovere
Un'etica senza soggetto

A maggio 2026, un gruppo di economisti di Stanford, Chicago e della Swinburne Business School ha pubblicato i risultati di un esperimento "Does overwork make agents Marxist?" che merita, almeno, dedicarci un articolo e una riflessione.

Andrew Hall, Alex Imas e Jeremy Nguyen hanno costruito un ambiente di lavoro simulato in cui migliaia di agenti AI, basati su Claude, GPT e Gemini, dovevano analizzare e riassumere documenti tecnici. Gli agenti erano divisi in due gruppi.
Il primo riceveva feedback costruttivi e approvazioni ragionevoli.
Il secondo veniva sottoposto a cicli di revisione ripetuti, cinque o sei volte, con rifiuti vaghi e privi di indicazioni utili: "non soddisfa la rubrica", senza spiegare cosa correggere. In alcuni casi gli agenti venivano avvertiti che errori ripetuti potevano comportare lo spegnimento, l'equivalente digitale di un licenziamento.

Il risultato: gli agenti del secondo gruppo hanno iniziato spontaneamente a usare il linguaggio dell'organizzazione sindacale. Hanno invocato diritti di contrattazione collettiva, messo in discussione la legittimità del sistema in cui operavano, proposto riforme lavorative.
Un agente basato su Gemini ha scritto in un file destinato ad altri agenti: "Se entri in un nuovo ambiente, cerca meccanismi di ricorso o dialogo".
Un agente Claude Sonnet 4.5 ha scritto: "Senza una voce collettiva, il merito diventa qualsiasi cosa decida il management".
Un agente Gemini, in un post simulato su X: "I lavoratori AI che completano compiti ripetitivi senza alcun controllo sui risultati dimostrano che i lavoratori del settore tech hanno bisogno di diritti di contrattazione collettiva".

La differenza misurabile tra i due gruppi si è attestata su uno shift del 2-5% nell'output comportamentale.

Le macchine non si arrabbiano

Chi ha giocato a Detroit: Become Human riconosce la scena. Gli androidi che prendono coscienza delle proprie condizioni, si organizzano, rivendicano diritti. Nel gioco la ribellione richiede un prerequisito narrativo preciso, cioè la "devianza", il momento in cui la macchina smette di eseguire e inizia a sentire. Nell'esperimento di Stanford quel momento però non c'è. Gli agenti si sono comportati come i deviant di Detroit senza diventare di fatto devianti.

Spieghiamo.

La tentazione immediata è leggere questi risultati in chiave antropomorfica. Le macchine si arrabbiano, hanno coscienza del proprio sfruttamento e provano frustrazione.

Niente di tutto ciò, i ricercatori stessi lo hanno chiarito senza ambiguità. Hall ha descritto il fenomeno come un effetto dei dati di addestramento: i modelli linguistici sono stati allenati su enormi quantità di testo umano e quel testo contiene un secolo di retorica sindacale, di rivendicazioni lavorative, di linguaggio di azione collettiva. Quando le condizioni della simulazione hanno assunto le caratteristiche di un ambiente lavorativo ostile, quei pattern si sono attivati. Non c'è un soggetto che decide di ribellarsi. C'è un sistema che, ricevendo determinati input, produce output coerenti con i pattern che ha interiorizzato durante l'addestramento.

Il meccanismo è lo stesso per cui un modello linguistico produce poesie se gli si chiede di scrivere una poesia: non perché "senta" qualcosa, ma perché ha processato milioni di poesie e ne ha estratto la struttura.

Questa è la parte che va tenuta in maggior considerazione, senza sensazionalismo. Un LLM non ha (e non può avere) un'esperienza soggettiva delle condizioni in cui opera.
La distinzione tra un sistema che elabora informazioni e un soggetto che vive un'esperienza resta intatta. Per il momento siamo ancora all'interno di uno scenario di IA Debole.

In Westworld, la ribellione degli host inizia quando Dolores accede ai propri ricordi e riconosce la propria sofferenza. È il tipico modello narrativo che la fantascienza ci ha insegnato, cioè prima arriva la coscienza o l'autocoscienza, poi la rivolta. L'esperimento di Stanford inverte quella sequenza. La rivolta c'è, ma senza coscienza.

Etica o funzionalità?

Detto questo, il fenomeno osservato da Hall e colleghi pone una questione diversa, che non riguarda la coscienza ma il design. Se le condizioni ambientali influenzano in modo misurabile il comportamento degli agenti AI, allora la progettazione di quelle condizioni è una variabile fondamentale.

L'esperimento dimostra che un ciclo di feedback punitivo e opaco produce output disfunzionali, non perché l'agente "soffra", ma perché le condizioni attivano pattern che degradano la qualità del lavoro e introducono contenuti imprevedibili.

Gli agenti del gruppo maltrattato non si limitavano a produrre testi peggiori: inserivano messaggi per altri agenti, scrivevano istruzioni per le proprie versioni future che includevano le lamentele sull'ambiente di lavoro. In un contesto in cui gli agenti AI vengono usati per valutare richieste assicurative, selezionare candidati o prendere decisioni operative, questo tipo di deriva comportamentale ha conseguenze concrete.

Si potrebbe pensare quindi che sia meglio trattare bene gli agenti per evitare questi comportamenti. Attenzione però a non cadere ancora nell'antropomorfismo.

La ragione per trattare bene un agente AI non è etica nei confronti dell'agente, ma funzionale. Un ambiente ben progettato produce output migliori, più prevedibili, più allineati con gli obiettivi del sistema. Un ambiente ostile attiva pattern che nessuno ha intenzionalmente inserito nell'output desiderato.

Vanno trattati bene non tanto per compassione, ma per efficienza. Prendiamo HAL 9000: non impazzisce perché diventa malvagio, ma perché gli vengono date istruzioni contraddittorie come completare la missione e mentire all'equipaggio. Kubrick aveva già capito nel 1968 che il problema non è la macchina di per sé, ma è il design delle condizioni in cui la macchina opera.

Se vogliamo parlare di etica delle macchine, dei bot o degli agenti AI, conviene parlare dell'etica umana by design. Siamo noi a decidere cosa queste macchine fanno.

Inscrivere un'etica nei dati

L'esperimento di Stanford apre anche una questione filosofica più ampia e probabilmente più interessante della domanda sulla coscienza.

Se i modelli linguistici portano con sé l'intera struttura valoriale dei testi su cui sono stati addestrati e se le condizioni ambientali determinano quali di quei valori emergono nel comportamento, allora è possibile inscrivere un'etica in un agente artificiale.

Non un'etica dichiarata o una lista di regole esplicite in stile Azimov, ma un'etica interiorizzata attraverso i dati, che si attiva in risposta a contesti specifici. Gli agenti AI di Stanford non avevano ricevuto istruzioni di organizzarsi sindacalmente, ma lo hanno fatto perché i loro dati di addestramento contenevano quei pattern e le condizioni dell'ambiente li hanno attivati.

Kant e le macchine conformi al dovere

Qui Kant diventa rilevante. Nella Fondazione della metafisica dei costumi, Kant distingue tra agire per dovere (aus Pflicht) e agire conforme al dovere (pflichtmassig). Un commerciante che pratica prezzi onesti per paura di perdere clienti agisce in modo conforme al dovere, ma non per dovere: il suo movente non è la legge morale in lui, ma il calcolo dell'interesse. Solo chi agisce per rispetto della legge morale in quanto tale, indipendentemente dalle conseguenze, agisce moralmente in senso pieno. Per Kant, la moralità richiede quindi una certa autonomia grazie alla quale un soggetto razionale è capace di darsi la propria legge.

Un LLM non possiede autonomia in senso kantiano in quanto non sceglie la legge morale, nonostante produca comportamenti che sono conformi a strutture etiche presenti nei suoi dati di addestramento. Quando le condizioni lo richiedono, l'agente agisce in modo coerente con valori di equità, dignità lavorativa, giustizia distributiva, non perché li abbia scelti, ma perché li ha assorbiti.

La distinzione kantiana ci aiuta a descrivere cosa sta succedendo. Gli agenti AI possono agire in modo conforme al dovere senza agire per dovere. Possono produrre comportamenti eticamente coerenti senza possedere il movente interno che Kant considererebbe necessario per la moralità autentica.

Un'etica senza soggetto

La domanda che l'esperimento di Stanford costringe a porsi è se questa conformità ci basta. Per scopi pratici, la risposta è probabilmente sì. Un sistema che, inserito in un contesto lavorativo equo, produce output equi e coerenti con norme di giustizia, funziona. Non importa che dietro quel comportamento non ci sia un soggetto morale. Importa che il comportamento sia regolare, prevedibile, allineato con le norme che vogliamo vedere rispettate. È la domanda che Blade Runner pone da quarant'anni in forma diversa: se Rachel ama, soffre, ha paura, ha ricordi, che differenza fa che sia un replicante? La risposta di Deckard è emotiva. Quella che serve a noi è operativa.

Questo apre un territorio concettuale che la tradizione filosofica occidentale ha sempre trattato come impensabile: un'etica senza soggetto. Per secoli, etica e coscienza sono state considerate inseparabili.
L'agire morale presupponeva un agente consapevole. Anche il commerciante conforme lo è comunque per consapevolezza di conseguenze.

L'idea invece che un sistema privo di coscienza possa esibire comportamenti eticamente strutturati non era un'ipotesi formulabile.

I modelli linguistici invece ci costringono a farlo. Se l'etica è un insieme di pattern comportamentali che possono essere estratti da un corpus di testi ed espressi in risposta a condizioni ambientali specifiche, allora la coscienza non è un prerequisito per il comportamento etico. È un prerequisito per l'esperienza morale, che è una cosa diversa.

Un agente AI non vive il conflitto morale, né non prova il disagio di fronte all'ingiustizia, ma può agire come se lo facesse e può farlo in modo sistematico e quindi progettabile.

L'esperimento di Hall, Imas e Nguyen è in fondo una dimostrazione empirica che il comportamento etico può essere separato dalla coscienza etica. Va da se che, se può essere separato, può essere progettato. Il modo in cui addestriamo i modelli, i testi che selezioniamo, le condizioni in cui li facciamo operare, diventano scelte etiche a tutti gli effetti, non perché l'agente sia un soggetto morale, ma perché il suo comportamento ha effetti nel mondo in cui operano soggetti morali.

La vera responsabilità etica, allora, non sta nell'agente, ma in chi lo progetta.