I giovani di una piccola città che addestrano grandi modelli di IA
Autore | Sleepy.md
A Datong, nello Shanxi, una città che un tempo viveva di carbone e che ora si è scrollata di dosso la polvere di carbone, un piccone affilato ha preso il posto delle miniere di carbone, dirigendosi verso un’altra miniera invisibile.
All'interno dell'edificio degli uffici del Jinmao International Center, nel distretto di Pingcheng, non ci sono più pozzi minerari né camion per il trasporto del carbone. Ci sono invece migliaia di postazioni di lavoro disposte a ridosso l'una dell'altra. Il Centro di servizi intelligenti per i big data "Cloud Sonic Valley" di Shanghai Runxun occupa diversi piani, dove migliaia di giovani dipendenti, con le cuffie in testa, fissano gli schermi, cliccano, trascinano e selezionano.
Secondo i dati ufficiali, a novembre 2025 la città di Datong aveva messo in funzione 745.000 server, attirato 69 imprese specializzate nell'etichettatura dei dati, creato oltre 30.000 posti di lavoro e raggiunto un valore della produzione pari a 750 milioni di yuan. In questa miniera digitale, il 94% dei lavoratori è costituito da persone del posto.
Non si tratta solo di Datong. Nel primo gruppo di centri di etichettatura dei dati individuati dall'Ufficio Nazionale di Statistica figurano contee della regione occidentale quali la contea di Yonghe nello Shanxi, Bijie nel Guizhou e Mengzi nello Yunnan. Nel centro di etichettatura dati della contea di Yonghe, l'80% dei dipendenti è costituito da donne. La maggior parte di loro sono mamme casalinghe che vivono in campagna o giovani delle zone rurali che non riescono a trovare un lavoro adeguato.
Cento anni fa, le fabbriche tessili di Manchester, nel Regno Unito, erano affollate di contadini senza terra. Oggi, davanti agli schermi dei computer di queste remote cittadine di provincia, ci sono giovani che non riescono a trovare un posto nell'economia reale.
Sono impegnati in un lavoro a cottimo, al tempo stesso futuristico ed estremamente primitivo, che consiste nel produrre i dati necessari per i giganti dell’intelligenza artificiale di Pechino, Shenzhen e della Silicon Valley.
Nessuno ci vede alcun problema.
Una nuova catena di montaggio sull'altopiano del Loess
L'essenza dell'etichettatura dei dati consiste nell'insegnare alle macchine come funziona il mondo.
La guida autonoma deve essere in grado di riconoscere i semafori e i pedoni, mentre i modelli di grandi dimensioni devono distinguere tra gatti e cani. Le macchine di per sé non hanno il buon senso e hanno bisogno che un essere umano disegni un riquadro sull'immagine per indicare loro "questo è un pedone" prima di poter imparare a riconoscerlo dopo aver analizzato milioni di immagini.
Questo lavoro non richiede un titolo di studio elevato, ma solo pazienza e un dito capace di cliccare senza sosta.
Durante il periodo d'oro del 2017, una semplice scatola in 2D poteva costare più di un centesimo, e alcune aziende arrivavano addirittura a offrire un prezzo elevato pari a mezzo yuan. Un addetto all'etichettatura veloce potrebbe guadagnare dai cinquecento ai seicento yuan lavorando dieci ore al giorno. Nel capoluogo di provincia, questo è sicuramente considerato un lavoro ben retribuito e dignitoso.
Ma con l'evoluzione dei modelli di grandi dimensioni, è emersa la dura realtà di questo processo.
Entro il 2023, il prezzo unitario dell'annotazione di immagini semplici era sceso a 3-4 centesimi, con un calo di oltre il 90%. Anche nel caso di immagini di nuvole di punti 3D più complesse, in cui i punti sono così fitti che occorre ingrandire notevolmente l'immagine per distinguere i contorni, gli annotatori devono tracciare meticolosamente nello spazio un riquadro tridimensionale che comprenda lunghezza, larghezza, altezza e angolo di orientamento, in modo da avvolgere perfettamente un veicolo o un pedone. Tuttavia, il prezzo di una scatola 3D così complessa è di soli 5 centesimi.

La conseguenza diretta di questo crollo dei prezzi è un drastico aumento dell'intensità di manodopera. Per mantenere uno stipendio mensile compreso tra i duemila e i tremila dollari, gli annotatori devono migliorare la propria velocità in modo costante e instancabile.
Non si tratta affatto di un lavoro d'ufficio facile. In molti centri di annotazione, la gestione è talmente rigida da risultare opprimente; ai dipendenti non è consentito rispondere al telefono durante l'orario di lavoro e i cellulari devono essere riposti in armadietti chiusi a chiave. Il sistema registra meticolosamente ogni movimento del mouse e ogni momento di inattività di ogni dipendente e, se si verifica una pausa superiore ai tre minuti, un avviso dal server centrale si abbatte come una frustata.
Ancora più frustrante è il tasso di tolleranza. Il punteggio minimo richiesto nel settore è solitamente superiore al 95%, con alcune aziende che arrivano addirittura a richiedere il 98%-99%. Ciò significa che se disegni 100 riquadri e commetti 2 errori, l'intera immagine verrà rispedita indietro per essere rifatta.
Le immagini dinamiche sono costituite da fotogrammi in cui i veicoli che cambiano corsia risultano oscurati, costringendo gli annotatori a ricorrere alla propria immaginazione per identificarli; nelle immagini di nuvole di punti 3D, qualsiasi oggetto con più di 10 punti deve essere racchiuso in un riquadro. In un progetto complesso relativo ai parcheggi, se le linee sono troppo lunghe o manca qualcosa, il controllo qualità rileverà sempre degli errori. È normale che un'immagine venga rielaborata quattro o cinque volte. Alla fine, dopo averci dedicato un'ora di lavoro, guadagni solo pochi centesimi.
Una collaboratrice della provincia di Hunan ha pubblicato sui social media il proprio resoconto giornaliero, dal quale risulta che, dopo una giornata di lavoro, ha disegnato oltre 700 caselle al prezzo di 4 centesimi l'una, guadagnando in totale 30,2 yuan.
Si tratta di un panorama estremamente frammentato.
Da un lato ci sono i giganti della tecnologia che, durante le conferenze, discutono di come l’intelligenza artificiale generale (AGI) libererà l’umanità; dall’altro, nelle cittadine dell’altopiano del Loess e nelle montagne del sud-ovest, i giovani fissano gli schermi per otto-dieci ore al giorno, disegnando meccanicamente quadrati, a migliaia, a decine di migliaia, e persino sognando di notte, mentre le loro dita tracciano linee di demarcazione nell’aria.
Qualcuno una volta ha detto che la facciata dell'intelligenza artificiale è come un'auto di lusso che romba, ma quando si apre la portiera, all'interno si vedono un centinaio di persone in sella a delle biciclette che stringono i denti e pedalano con tutte le loro forze.
Nessuno pensa che ci sia qualcosa di sbagliato in questo.
L'artigiano a cottimo insegna alle macchine «come amare»
Dopo aver superato l'ostacolo del riconoscimento delle immagini, i modelli di grandi dimensioni hanno subito un'evoluzione più profonda, dovendo imparare a pensare, a conversare e persino a mostrare "empatia" come gli esseri umani.
Ciò ha dato origine alla fase più critica e costosa dell'addestramento dei modelli su larga scala: l'RLHF (Apprendimento per rinforzo basato sul feedback umano).
In parole povere, si tratta di far valutare a persone reali le risposte generate dall'intelligenza artificiale, indicando quali sono migliori, più in linea con i valori umani e le preferenze emotive.
Il motivo per cui ChatGPT sembra "simile a un essere umano" è che dietro c'è un numero infinito di annotatori RLHF che lo istruiscono.
Sulle piattaforme di crowdsourcing, tali attività di annotazione hanno spesso un prezzo ben definito: un costo unitario compreso tra 3 e 7 RMB. Gli annotatori devono assegnare punteggi emotivi estremamente soggettivi alle risposte fornite dall'IA per valutare se la risposta sia "cordiale", "empatica" o "attenta alle emozioni dell'utente".
A una persona che guadagna appena un paio di migliaia di RMB al mese, alle prese con le difficoltà della vita quotidiana e a malapena in grado di gestire le proprie emozioni, il sistema richiede ora di fungere da guida emotiva dell’IA e da arbitro dei valori.

Devono ridurre con la forza il calore umano, l'empatia e altre emozioni umane estremamente complesse e sottili a freddi punteggi compresi tra 1 e 5. Se i loro punteggi non corrispondono alle risposte corrette predefinite dal sistema, la loro precisione sarà considerata insufficiente, con conseguente decurtazione dei loro già esigui salari a cottimo.
È una vera e propria fatica mentale. Le emozioni, i valori morali e la compassione umani, così complessi e ricchi di sfumature, vengono costretti a passare attraverso l'imbuto dell'algoritmo. Nel gelido regno della quantificazione e delle scale di standardizzazione, vengono private del loro ultimo briciolo di calore. Mentre ti meravigli davanti al colosso digitale sullo schermo che ha imparato a scrivere poesie, comporre musica, mostrare affetto e persino a rivestirsi di una malinconica sensibilità, fuori dallo schermo quel gruppo di esseri umani un tempo vivaci è regredito, attraverso giudizi meccanici quotidiani, a macchine di punteggio prive di emozioni.
Questo è l'aspetto più riservato dell'intera filiera industriale, che non compare mai nelle notizie sui finanziamenti né nei white paper tecnologici.
Nessuno pensa che ci sia qualcosa di sbagliato in questo.
985 Titolari di laurea magistrale vs. I giovani delle piccole città
Il lavoro di base alle catene di montaggio sta venendo schiacciato dai passi dell'intelligenza artificiale, causando l'espansione verso l'alto di questo nastro trasportatore cibernetico, che sta iniziando a travolgere anche il lavoro intellettuale di livello superiore.
Le preferenze dei modelli di grandi dimensioni sono cambiate. Non più soddisfatti di limitarsi a masticare banali ovvietà, ora esigono di divorare le competenze umane e la logica avanzata.
Su diverse importanti piattaforme di ricerca di lavoro, ha iniziato a comparire con una certa frequenza un nuovo tipo di lavoro part-time, come ad esempio "Annotazione di ragionamento logico su modelli di grandi dimensioni" e "Formatore di IA nel campo delle discipline umanistiche". Questo lavoro part-time ha requisiti di accesso estremamente elevati, richiedendo spesso «un master o un titolo superiore conseguito presso università del Progetto 985 o del Progetto 211» e riguardando settori professionali quali diritto, medicina, filosofia e letteratura.

Molti laureati provenienti da prestigiose università sono attratti dai gruppi di outsourcing di questi colossi tecnologici e decidono di entrarvi a far parte. Tuttavia, si rendono presto conto che non si tratta di un semplice esercizio mentale, bensì di una forma di tortura mentale.
Prima di assumere formalmente l'incarico, devono leggere attentamente decine di pagine di documenti relativi ai parametri di valutazione e ai criteri di valutazione e sottoporsi a due o tre cicli di annotazioni di prova. Se, una volta soddisfatti i requisiti, durante la fase di annotazione formale la loro accuratezza scende al di sotto del livello medio, perderanno la qualifica e saranno espulsi dalla chat di gruppo.
La cosa più opprimente è che questi standard non sono affatto fissi. Di fronte a domande e risposte simili, valutarle con lo stesso ragionamento può portare a risultati completamente opposti. È come fare un compito in classe che non finisce mai e per il quale non esiste una risposta standard. La precisione non può essere migliorata con lo sforzo personale o lo studio; si finisce solo per girare a vuoto all’infinito, esaurendo le energie sia mentali che fisiche.
Questa è la nuova forma di sfruttamento nell'era dei modelli su larga scala: il "class folding".
La conoscenza, un tempo considerata una scala d’oro per abbattere le barriere e scalare la società, è ormai diventata un materiale digitale più complesso, offerto agli algoritmi come cibo da masticare. Di fronte al potere assoluto degli algoritmi e dei sistemi, gli studenti dei master delle università d’élite, chiusi nelle loro torri d’avorio, e i giovani delle piccole città dell’altopiano del Loess hanno intrapreso un percorso di convergenza davvero bizzarro.
Insieme precipitano in questa voragine senza fondo dell’estrazione digitale, spogliati delle loro aureole, cancellando ogni differenza, trasformati tutti in ingranaggi da quattro soldi sul nastro trasportatore, sostituibili in qualsiasi momento.
All'estero è lo stesso. Nel 2024, Apple ha licenziato direttamente un team di 121 persone addetto all'annotazione vocale basata sull'intelligenza artificiale a San Diego. Questi dipendenti erano incaricati di migliorare le capacità di elaborazione multilingue di Siri. Un tempo pensavano di trovarsi al centro delle attività principali di un colosso tecnologico, per poi precipitare all’improvviso nell’abisso della disoccupazione.
Agli occhi dei giganti della tecnologia, che si tratti di una signora di mezza età che gestisce un negozio di alimentari in una piccola città di provincia o di un istruttore di logica con una formazione prestigiosa, in fondo sono tutti "beni di consumo" che possono essere sostituiti in qualsiasi momento.
Nessuno pensa che ci sia qualcosa di sbagliato in questo.
Una Torre di Babele da mille miliardi di dollari, costruita con pochi centesimi di sfruttamento
Secondo i dati diffusi dall'Istituto cinese di ricerca sulle informazioni e le comunicazioni, il mercato cinese dell'annotazione dei dati ha raggiunto un valore di 6,08 miliardi di yuan nel 2023 e si prevede che raggiungerà i 20-30 miliardi di yuan entro il 2025. Si prevede che entro il 2030 il fatturato del mercato globale dei servizi di annotazione dei dati raggiungerà i 117,1 miliardi di yuan.
Dietro questi numeri si celano giganti della tecnologia come OpenAI, Microsoft e ByteDance, con valutazioni che raggiungono i trilioni di dollari.
Tuttavia, questa ricchezza smisurata non è andata a beneficio di coloro che realmente "alimentano" l'IA.
Nel settore cinese dell'etichettatura dei dati si osserva chiaramente una tipica struttura di outsourcing a piramide rovesciata. Al vertice si trovano i giganti della tecnologia, che detengono saldamente il controllo degli algoritmi fondamentali; il secondo livello è costituito dai grandi fornitori di servizi di dati; il terzo livello comprende i centri di etichettatura dei dati e le piccole e medie imprese di outsourcing sparse in tutto il paese; solo alla base troviamo i lavoratori a cottimo: gli addetti all’etichettatura.
Ogni livello di esternalizzazione si prende una bella fetta. Quando le grandi fabbriche offrono un prezzo unitario di 0,5 RMB, dopo una serie di livelli di sfruttamento, ciò che finisce nelle mani di un addetto all’etichettatura in una cittadina di provincia può essere meno di 0,05 RMB.
Nel suo libro "Techno-Feudalism", l'ex ministro delle Finanze greco Yanis Varoufakis ha avanzato una tesi penetrante: i giganti tecnologici di oggi non sono più capitalisti nel senso tradizionale del termine, ma "cloudalisti".
Non possiedono fabbriche e macchinari, ma algoritmi, piattaforme e potenza di calcolo: i territori digitali dell’era cibernetica. In questo nuovo sistema feudale, gli utenti non sono consumatori, ma servi digitali. Ogni "Mi piace", commento e visita sui social media è lavoro gratuito che fornisce dati ai Cloudalisti.
Nel frattempo, gli addetti all'etichettatura dei dati nei mercati emergenti rappresentano la classe più bassa di lavoratori digitali in questo sistema. Non solo devono produrre dati, ma anche pulire, classificare e valutare enormi quantità di dati grezzi, trasformandoli in un feed di alta qualità che i modelli di grandi dimensioni possano elaborare.
Si tratta di un movimento segreto che promuove l'isolamento cognitivo. Proprio come le leggi sull'enclosure dell'Inghilterra del XIX secolo costrinsero i contadini a lavorare nelle fabbriche tessili, l'attuale ondata di intelligenza artificiale sta spingendo i giovani che non riescono a trovare un posto nell'economia reale davanti agli schermi.
L'intelligenza artificiale non ha ridotto il divario sociale; al contrario, ha creato una sorta di "catena di montaggio di dati, sangue e sudore" che collega le piccole contee della Cina centrale e occidentale direttamente alle sedi dei giganti tecnologici a Pechino, Shanghai, Guangzhou e Shenzhen. Il racconto della rivoluzione tecnologica è sempre grandioso e maestoso, ma alla base c'è sempre lo sfruttamento su larga scala della manodopera a basso costo.
A quanto pare nessuno ritiene che ci sia qualcosa di sbagliato in questo.
Un domani senza bisogno degli esseri umani
Il finale più brutale si avvicina a grandi passi, sempre più velocemente.
Con lo sviluppo delle capacità dei modelli su larga scala, i compiti che un tempo richiedevano un impegno umano incessante vengono ora svolti dall'intelligenza artificiale stessa.
Nell'aprile 2023, Li Xiang, fondatore di Ideal Auto, ha rivelato durante un forum che in passato Ideal era solita etichettare manualmente circa 10 milioni di fotogrammi di immagini relative alla guida autonoma all'anno, con costi di esternalizzazione vicini al miliardo. Tuttavia, dopo aver iniziato a utilizzare modelli di grandi dimensioni per l'etichettatura automatizzata, ciò che prima richiedeva un anno per essere completato ora può essere fatto in circa 3 ore.
L'efficienza è 1000 volte superiore a quella degli esseri umani, e questo risultato è stato raggiunto già nel 2023. Solo lo scorso marzo, Ideals ha lanciato MindVLA-o1, il motore di annotazione automatica di nuova generazione.
Nel settore circola un detto autoironico, tristemente vero: "Più è intelligente, più è artificiale." Ma ora si è registrato un crollo vertiginoso, dell'ordine del 40-50%, nell'esternalizzazione dell'annotazione dei dati da parte dei giganti della tecnologia.
Quei giovani provenienti da piccole città che hanno trascorso innumerevoli giorni e notti davanti al computer, con gli occhi arrossati per lo sforzo, hanno creato con le loro mani un colosso. E ora questo colosso sta cambiando rotta, mettendo a repentaglio il loro posto di lavoro.
Al calar della notte, gli edifici degli uffici nel distretto di Pingcheng a Datong rimangono illuminati come se fosse giorno. I giovani in servizio si scambiano in silenzio i turni nell’atrio dell’ascensore. In questo spazio piegato, imprigionato da innumerevoli poligoni, a nessuno importa dell’epico balzo in avanti compiuto dall’architettura Transformer dall’altra parte dell’oceano, né qualcuno comprende il rombo della potenza di calcolo che si cela dietro quei cento miliardi di parametri.
Il loro sguardo è incollato alla barra di avanzamento rossa e verde del backstage che rappresenta la «soglia di sopravvivenza», cercando di capire se i magri guadagni a cottimo basteranno a mettere insieme una vita dignitosa entro la fine del mese.
Da un lato, la chiusura del Nasdaq e la continua copertura mediatica da parte dei media tecnologici spingono i giganti a brindare all’avvento dell’IA generale; dall’altro, questi servi digitali che hanno nutrito l’IA con la propria carne e il proprio sangue non possono fare altro che, in un sonno tormentato, attendere con ansia che il colosso che hanno creato con le loro stesse mani calpesti con nonchalance le loro fonti di sostentamento in una mattina qualsiasi.
Nessuno pensa che ci sia qualcosa di sbagliato in questo.
Potrebbe interessarti anche
Come la guerra tra Stati Uniti e Iran potrebbe influire sui prezzi del petrolio e del Bitcoin (ultima analisi)
Lo scoppio della guerra tra Stati Uniti e Iran il 28 febbraio 2026 ha offerto un banco di prova in tempo reale senza precedenti per comprendere come gli shock petroliferi geopolitici interagiscano con un mercato delle criptovalute sempre più istituzionalizzato. Questo articolo esamina il rapporto tra i prezzi del petrolio greggio e il Bitcoin nel corso del conflitto, analizzando l'andamento dei prezzi, i modelli di correlazione e i meccanismi di trasmissione sottostanti.

OpenAI vuole stabilire le proprie regole|Rewire News Brief

Chaos Labs esce, chi assumerà il rischio di Aave?

Guerra finanziaria segreta? L'Iran raccoglie le tariffe di transito dello Stretto in stablecoin

OpenAlice: Una persona, quella è Jane Street | Panoramica del progetto

Resoconto mattutino | La scorsa settimana Strategy ha aumentato le proprie partecipazioni di 4.871 BTC; Toss intende sviluppare una propria blockchain ed emettere una criptovaluta nativa; il direttore finanziario di OpenAI ha espresso in privato dei dubbi

Ricerca: Le stablecoin registrano un volume di scambi pari a 35.000 miliardi all'anno: quale percentuale di questo volume corrisponde a pagamenti effettivi?

Galaxy Research: Gli agenti di intelligenza artificiale stanno dando vita a nuove forme di entità sulla blockchain: come le aziende senza personale umano mettono in moto il volano finanziario

Ricerca sui dati: Quanto è ampio il divario di liquidità tra Hyperliquid e il petrolio greggio del CME?

Perché i prezzi delle GPU stanno salendo alle stelle senza alcun controllo?

Come padroneggiare completamente Claude Cowork?

Una lettera riservata di 70 pagine denuncia la prima accusa di "mentire", Altman dichiara al consiglio di amministrazione: "Non posso cambiare la mia personalità".

La stagione delle altcoin inizierà nel 2026? Cosa dovrebbero tenere d'occhio i trader in questo momento
I segnali della stagione delle altcoin stanno diventando più evidenti nel 2026, con l'accelerarsi della rotazione di capitali nei mercati delle criptovalute. Ecco a cosa dovrebbero prestare attenzione gli operatori e come si sta evolvendo la partecipazione basata sulle strategie nell'attuale ciclo di mercato.

La strategia di Visa in materia di stablecoin: Le carte, il regolamento e il futuro

Afflussi di ETF Bitcoin nel 2026: Impatto sul prezzo di BTC e tendenze del mercato delle criptovalute
Gli afflussi di ETF Bitcoin stanno rimodellando le tendenze dei prezzi di BTC e la liquidità del mercato delle criptovalute nel 2026. Scopri come il capitale istituzionale sta influenzando la volatilità, il comportamento di trading e le strategie di allocazione del portafoglio nei mercati delle criptovalute.

Mercato azionario diviso

Come individuare il prossimo leader nella dinamica dei mercati predittivi?

"Legale" schema Ponzi? Rivelazione del prestito circolare dell'exchange Gemini e del suo fondatore
Come la guerra tra Stati Uniti e Iran potrebbe influire sui prezzi del petrolio e del Bitcoin (ultima analisi)
Lo scoppio della guerra tra Stati Uniti e Iran il 28 febbraio 2026 ha offerto un banco di prova in tempo reale senza precedenti per comprendere come gli shock petroliferi geopolitici interagiscano con un mercato delle criptovalute sempre più istituzionalizzato. Questo articolo esamina il rapporto tra i prezzi del petrolio greggio e il Bitcoin nel corso del conflitto, analizzando l'andamento dei prezzi, i modelli di correlazione e i meccanismi di trasmissione sottostanti.
