Internet ha ricostruito la Torre di Babele. GiĆ gli aerei avevano dato una mano, ma ora, dopo essersi dispersi per i quattro angoli della Terra, gli uomini si sono definitivamente ritrovati tutti in uno stesso cyber-luogo. Il problema (o piĆ¹ probabilmente la fortuna) ĆØ che questi stessi uomini continuano a parlare qualche migliaio di lingue differenti.
Google Translate non ĆØ la soluzione (o non lo ĆØ per ora), ma ĆØ sicuramente uno strumento utile per ammorbidire le barriere linguistiche e aiutare nei bisogni o nelle curiositĆ della vita di tutti i giorni. Grazie a Google Translate potete provare a capire cosa si dice in patria del centravanti ceco che la vostra squadra ha appena acquistato, potete provare a fare colpo su WhatsApp col bellissimo Erasmus russo appena arrivato o capire grossomodo cosa dice quel nuovo articolo su Kierkegaard, tanto potenzialmente illuminante, quanto drammaticamente scritto in danese.
Insomma, con Google Translate ci si arrangia nella Babele digitale. Ma come funziona? Come riesce a fornire delle brevi traduzioni grossomodo accettabili tra piĆ¹ di 100 lingue? Ma soprattutto, Google Translate traduce perchĆ© comprende il significato espresso e dunque, in virtĆ¹ di questa comprensione, traduce? PuĆ² dirci qualcosa su come gli uomini usano e comprendono una lingua?
Sbirciare nellāalgoritmo: una complessitĆ āsempliceā
Google Translate non ha mai ālettoā nĆ© un vocabolario nĆ© un libro di grammatica: lāalgoritmo non āsaā nulla nĆ© del significato delle singole parole nĆ© delle regole per combinarle correttamente in una frase. Il modo in cui āimparaā a tracciare delle relazioni tra la parola x della lingua A e la parola y nella lingua B dipende semplicemente dalla sua enorme capacitĆ di processare dati. Lāalgoritmo si limita a calcolare milioni e milioni di documenti scritti sia nella lingua A che nella lingua B e dunque a scoprire in che modo e con che frequenza la parola x della lingua A ricorra insieme alle parole della lingua B. Semplificando molto, se quando si presenta x nella lingua A, molto spesso si ha y in quella B, allora ciĆ² costituirĆ una correlazione ricorrente, uno schema per tradurre x quando questa viene digitata dallāutente di Google Translate. Lo stesso tipo di āapprendimentoā porta lāalgoritmo anche a ācapireā come combinare tra loro le parole in una frase.
Dal 2016, dieci anni dopo la sua nascita, Google Translate ha decisamente migliorato le sue prestazioni. CiĆ² si ĆØ dovuto al passaggio dal Phrase-Based Machine Translation (PBMT) al Neural Machine Translation (NMT). Il primo sistema spezzava la proposizione-input, traducendo come unitĆ indipendenti le singole parole ed espressioni per poi ricomporle nellāoutput-traduzione. Al contrario, il secondo sistema considera lāintera proposizione-input (ciĆ² che si chiede di tradurre) come unitĆ per la traduzione: nel generare la sua risposta, Google Translate considera cosƬ i rapporti tra la possibile traduzione di una singola parola e tutte le altre parole presenti nella proposizione input. Insomma, Google Translate considera il contesto linguistico in cui ĆØ inserita la singola parola della lingua A e, basandosi sulle relazioni probabilistiche che i suoi possibili corrispondenti nella lingua B intrattengono con lāintero contesto, propone la sua traduzione.
Google Transalate ĆØ una realizzazione della teoria del significato di Wittgestein? (e dunque il suo modo di comprendere il linguaggio ĆØ spiegabile allo stesso modo di quello umano?)
Questo ĆØ il titolo (fino alla partentesi) di un articolo comparso il 13 febbraio su Quartz. Il ragionamento che vi svolge puĆ² essere riassunto cosƬ:
Premessa A: Nelle Ricerche Filosofiche Wittgenstein afferma che āil significato di una parola ĆØ il suo uso nel linguaggioā,
Premessa B: Google Translate non opera sulla base di significati giĆ definiti a-priori, ma traccia delle correlazioni probabilistiche tra le parole di lingue diverse in base al modo in cui queste vengono usate:
b1) allāinterno del loro contesto linguistico, cioĆØ tenendo conto delle altre parole con cui co-occorrono (determina il significato a partire dai diversi usi che quella stessa parola puĆ² avere nel linguaggio),
b2) allāinterno di una parte significativa di testi effettivamente prodotti (determina il significato da usi concreti, storicamente situati), dunque
Conclusione: Google Translate comprende il significato delle parole.
Il problema di questo argomento ĆØ nellāidentificazione tra āusoā, dunque āsignificatoā e ācontesto linguisticoā. Per Witgenstein āparlare un linguaggioā, cioĆØ usare le parole fa, in modo molto piĆ¹ ampio e complesso, āparte di unāattivitĆ , di una forma di vitaā: le parole sono comprese solo allāinterno di una prassi sociale in cui lāuomo ĆØ completamente immerso, mente e corpo, riflessione e sensibilitĆ . Non si tratta di una questione di probabilitĆ o correlazioni frequenti: mentre lāalgoritmo di Google Translate ĆØ staticamente vincolato ai risultati del suo calcolo sulle parole giĆ dette o scritte, il parlante umano puĆ² andare oltre, continuando a giocare il gioco linguistico della ātraduzioneā anche davanti a ciĆ² che ĆØ del tutto nuovo o assolutamente improbabile. Lo puĆ² fare appoggiandosi ad una esperienza del linguaggio che va ben oltre le semplici parole giĆ dette o ascoltate, ma che lo coinvolge come āviventeā.
Ad oggi, giocando ad esempio sulle omonimie, si puĆ² ancora confondere Google Translate in tanti modi. Ad esempio āLuca fa segno col capo di andareā viene tradotto in inglese correttamente con āLuca makes a sign with his head to goā, mentre āIl sergente fa segno col capo di attaccareā diventa āThe sergeant signal his boss to attackā. Tuttavia ĆØ probabile che con il tempo Google Translate riuscirĆ a migliorarsi sempre di piĆ¹. Ma non potrĆ mai neanche soltanto azzardare la traduzione di un enunciato di questo genere: āHo capito che non la smetteva piĆ¹ di piangere, perĆ² non si possono nemmeno tirare quegli squaquaraqua in faccia ad un bambino di due anniā. Al contrario, ogni lettore umano si sarĆ fatto una certa idea di come sia traducibile āsquaquaraquaā.