Il miglioramento dei software di traduzione basati sull’intelligenza artificiale pone una serie di rischi per quanto riguarda la comprensione e gli scambi tra culture diverse
All’inizio di aprile è circolato molto sui social media un breve video in cui il sindaco di Venezia Luigi Brugnaro informa i turisti sul sistema di ingresso a pagamento in città previsto in alcuni giorni dell’anno e in vigore da qualche mese. Nel filmato, dichiaratamente creato rielaborando un altro video con un software di intelligenza artificiale, Brugnaro parla in inglese fluente, con la sua voce, e in modo apparentemente realistico.
Da tempo diverse aziende di tecnologia offrono strumenti integrati di traduzione, doppiaggio ed editing video che a partire da un filmato in cui una persona parla permettono di crearne uno equivalente in cui la stessa persona esprime gli stessi concetti parlando un’altra lingua. Sono strumenti pratici e relativamente economici per l’utente finale, ma la loro crescente efficienza e la loro popolarità hanno stimolato un dibattito parallelo sui rischi che implicano. Si discute non soltanto di quelli relativi a possibili abusi e utilizzi non autorizzati, ma anche del rischio di un progressivo venir meno del bisogno di imparare nuove lingue se non per ragioni specifiche di studio.
Il dubbio condiviso nel dibattito è che la diffusione di software di intelligenza artificiale applicati alla traduzione vocale possa ridurre gli incentivi pratici all’apprendimento delle lingue. Samsung, per esempio, promuove da mesi una funzione di traduzione istantanea delle telefonate disponibile su un suo famoso modello di smartphone. A settembre Spotify ha avviato con OpenAI, l’azienda produttrice del software ChatGPT, un progetto sperimentale di traduzione vocale dei podcast in altre lingue mantenendo le voci originali di conduttori e conduttrici.
I sistemi più recenti di traduzione automatica delle voci sono stati resi possibili dai rapidi miglioramenti nel campo dell’intelligenza artificiale e in particolare dei processi di machine learning, cioè le attività di apprendimento dei computer tramite i dati. Sono di conseguenza sistemi che funzionano molto bene con le cosiddette lingue ad alta disponibilità di risorse, come l’inglese ma anche l’italiano, di cui esistono grandi quantità di dati.
Funzionano invece meno bene con le lingue africane come lo swahili, o lingue indoarie come l’urdu, la lingua ufficiale in Pakistan e in parti dell’India. Sono lingue parlate da centinaia di milioni di persone nel mondo, ma scarsamente diffuse in formato digitale. La carenza di dati si ripercuote negativamente sulla disponibilità e sulla qualità delle traduzioni da queste lingue ottenute attraverso programmi di intelligenza artificiale, che sono peraltro utilizzati anche in situazioni molto rischiose: la traduzione di testimonianze di richiedenti asilo o di persone in contesti di guerra, per esempio.
Senza associarla direttamente alla diffusione dei sistemi di traduzione e doppiaggio tramite software di intelligenza artificiale, l’Atlantic ha segnalato una recente contrazione nel numero di persone che studiano lingue straniere in diversi paesi occidentali. Negli Stati Uniti sono diminuite del 29,3 per cento dal 2009 al 2021. In Australia la quantità di studenti delle superiori che studiavano una lingua straniera nel 2021 è stata la più bassa di sempre (8,6 per cento). E in Corea del Sud e Nuova Zelanda le università stanno chiudendo i dipartimenti di francese, tedesco e italiano. Anche la conoscenza dell’inglese è diminuita tra i giovani, secondo un rapporto di EF Education First, una società internazionale che organizza corsi di lingua inglese e scambi culturali in tutto il mondo.
Indipendentemente dai vari fattori che potrebbero spiegare il fenomeno, tra cui le interruzioni scolastiche durante la pandemia e la riduzione dei finanziamenti ai programmi di discipline umanistiche, molte persone non stanno di fatto apprendendo nuove lingue in un momento storico contraddistinto dall’ampia disponibilità di strumenti con cui possono parlarle senza conoscerle.
Uno dei rischi principali nella prospettiva di un mondo in cui si usano le lingue straniere senza studiarle è considerarle tutte equivalenti: che è un modo molto riduttivo di intenderle. Oltre un secolo fa, contribuendo a definire il concetto moderno di relatività linguistica, linguisti come Wilhelm von Humboldt prima e Edward Sapir e Benjamin Lee Whorf poi teorizzarono che la lingua non è un mezzo di trasmissione del pensiero, ma un modo di interpretare la realtà stessa. Imparare una nuova lingua equivale, sotto molti aspetti, ad apprendere un modo nuovo di vedere il mondo e di pensare.
«Man mano che la tecnologia si normalizza, potremmo scoprire di aver consentito che le profonde connessioni umane venissero sostituite da una comunicazione tecnicamente competente, ma in definitiva vuota», ha scritto l’Atlantic.
Di recente l’uso di software di intelligenza artificiale ha interessato non soltanto la traduzione e il doppiaggio delle voci, ma anche l’apprendimento stesso delle lingue. Su social come Instagram e Facebook capita di imbattersi in pubblicità di servizi che offrono un insegnamento delle lingue basato su un’interazione con una persona bilingue che non esiste nella realtà. In alcuni casi la mancanza di una valutazione umana dei progressi e di eventuali errori, quindi di un giudizio, è esplicitamente descritta come un valore.
La parte umana delle relazioni è tuttavia il fattore più importante non soltanto nello studio delle lingue, ma in qualsiasi scambio tra culture diverse. Gabriel Nicholas, ricercatore del Center for Democracy and Technology, una ong statunitense che promuove i valori democratici e i diritti dell’individuo nello sviluppo delle tecnologie, ha detto all’Atlantic che una parte del problema dei programmi di intelligenza artificiale applicati alle lingue è che portano gli utenti a pensare che la traduzione sia qualcosa di «neutrale». E non sviluppano invece la capacità fondamentale di «muoversi da una lingua a un’altra» assumendo di volta in volta una prospettiva diversa a seconda delle circostanze e delle intenzioni.
In altre parole, sebbene non esista un solo modo giusto di tradurre una frase da una lingua a un’altra, molti software funzionano come se il modo giusto fosse effettivamente uno soltanto: tanto più nel caso di lingue a bassa disponibilità di risorse. Nei corsi di insegnamento delle lingue con persone madrelingua capita invece che, alla domanda degli studenti su come dire una certa frase in un’altra lingua, il più delle volte l’insegnante risponda di cambiare prospettiva e girare diversamente la frase, a seconda dei casi.
Secondo diversi studiosi di linguistica, a fronte della crescente diffusione dei software di intelligenza artificiale, servirebbero maggiori investimenti in uno studio diverso delle lingue. Dovrebbe essere più basato sullo sviluppo di competenze culturali e sulla comprensione approfondita delle convinzioni e delle pratiche diffuse nelle popolazioni di altri paesi, peraltro diverse anche a seconda dell’estrazione sociale, dell’età dei parlanti e del contesto comunicativo.
Allo stesso tempo servirebbe investire nello studio e nella raccolta di informazioni relative alle lingue a bassa disponibilità di risorse, per cercare di controbilanciare la preponderanza di testi online in lingua inglese, la principale fonte di dati per l’addestramento dei software. Quasi il 90 per cento dei siti è scritto in 10 lingue: a parte l’inglese, che rappresenta oltre il 50 per cento, sono russo, spagnolo, tedesco, francese, giapponese, turco, portoghese, italiano e persiano. Delle oltre 7mila lingue parlate nel mondo, Google Translate ne supporta 133, e i chatbot più popolari sono ancora più limitati, perché la maggior parte dei modelli linguistici più evoluti serve tra le otto e le dieci lingue.
Spiegando all’Atlantic l’importanza delle componenti interculturali dell’apprendimento delle lingue, Paula Krebs, direttrice esecutiva della Modern Language Association, associazione che riunisce studiosi ed esperti statunitensi in lingue e letterature moderne, ha citato un episodio della serie fantascientifica degli anni Novanta Star Trek: The Next Generation, intitolato Darmok.
Nell’episodio l’equipaggio a bordo dell’Enterprise non riesce a decifrare con chiarezza una comunicazione proveniente da un’astronave in orbita su un pianeta chiamato El-Adrel IV, abitato dai Tamariani. Sembra un invito, ma la struttura sconosciuta della lingua non permette di capirlo. Attraverso una specie di traduttore universale l’equipaggio riesce a comprendere la sintassi e la semantica di base della lingua dei Tamariani, ma non il significato profondo delle loro espressioni. Man mano che l’episodio prosegue diventa chiaro che la lingua dei Tamariani ruota attorno ad allegorie radicate nella loro storia e nelle loro pratiche uniche, traducibili ma incomprensibili senza una condivisione di quegli aspetti non formali della lingua.
«Più di 30 anni dopo, sulla Terra si sta sviluppando qualcosa di simile a un traduttore universale. Ma come quello non ha il potere di colmare le divisioni culturali nel modo in cui possono farlo gli esseri umani», ha concluso l’Atlantic.