La lingua indiana Oriya è stata aggiunta ai servizi di traduzione di Google e Microsoft

Collage of Odia Book Covers. Image via Flickr by Erin Mclaughlin. From the Flickr set Odia Book Covers. CC BY 2.0.

Collage di Copertine di Libri Oriya. Immagine via Flickr di Erin Mclaughlin. Dal set di Flickr Copertine di Libri Oriya. CC-BY 2.0.

Mentre le iniziative open-source sono ancora in corso, quest'anno Google e Microsoft hanno entrambi aggiunto la lingua Oriya [it] ai loro rispettivi motori di traduzione automatica — Google Translate [en, come tutti i link successivi, salvo diversa indicazione] a febbraio e Microsoft più recentemente, il 13 agosto.

L'oriya è la lingua ufficiale dello stato indiano di Orissa [it] e la seconda lingua ufficiale dello stato di Jharkhand [it]. È parlato da circa 35 milioni di madrelingua e come seconda lingua da circa 4 milioni di persone. Viene anche classificata dal governo indiano come una delle lingue classiche del paese, basata su una serie di requisiti che includono una tradizione letteraria di più di 1500 anni.

Tuttavia, la presenza digitale dell'oriya è limitata. Ad esempio, Wikipedia in Oriya, che è uno dei più grandi archivi di contenuti testuali, ha attualmente solo 15.858 articoli dopo essere stato ripreso nel 2011 in seguito ad una pausa di nove anni. Al contrario, su Wikipedia, il Malayalm, che è parlato da circa quasi lo stesso numeri di parlanti dell'oriya, ha circa 70 milioni di articoli. I contenuti in oriya erano disponibili online in formato immagine e PDF per un lungo periodo — alcuni, tra cui la rivista governativa statale dello stato di Orissa Utkal Prasanga continuano ancora a pubblicare in una combinazione di immagini e PDF. L’adozione tardiva di Unicode ha reso i contenuti meno ricercabili.

La traduzione automatica contribuisce in modo significativo ad aumentare la presenza digitale delle lingue rendendo i contenuti più ricercabili e più accessibili ai non-parlanti.

I servizi cloud gestiti da Microsoft, tra cui Microsoft Translator app, Office, Translator for Bing, e tramite Azure Cognitive Services Translator, ora supporteranno tutte le traduzioni dall'oriya. Sia Microsoft Translator che Google Translate (disponibili entrambi sul web e come applicazione) consentono la traduzione del testo copiato direttamente nel campo di input.

Inoltre, queste piattaforme supportano anche la traduzione di documenti testuali, siti web e chat dal vivo. L'applicazione mobile di Google Translate ha caratteristiche aggiuntive, tra cui la traduzione offline, il riconoscimento della grafia, la scansione, la traduzione e lettura di testi dalle immagini, e l’utilizzo di comandi vocali per parlare con un parlante in lingua straniera. Una caratteristica chiamata “tocca per tradurre” consente all'utente di tradurre direttamente un testo digitato all'interno di qualsiasi applicazione. Si può anche ascoltare come viene pronunciato un testo in una lingua supportata, usando la sintesi vocale di Google.

L'aggiunta dell'oriya è stata, quindi, ben accolta dal governo dello stato di Orissa. L'ufficio del Primo Ministro di Orissa ha twittato:

#OdiaTranslation è stata ora aggiunta da @Microsoft al suo @mstranslator, diventando la dodicesima lingua indiana comunemente usata da aggiungere. Questo faciliterà l'accesso all'informazione globale in #Odia e promuoverà le interazioni linguistiche.

Anche il Dipartimento di Elettronica e Tecnologia dell'Informazione ha reagito:

Utilizzato da milioni di persone in tutte il mondo, @Google Translate ha ora aggiunto #Odia alla sua lista di lingue supportate. Un passo importante verso la promozione dell'alfabetizzazione digitale nella nostra lingua madre e per aiutare milioni di non parlanti ad accoglierla. #OdiaOnGoogle

Traduzione automatica
La traduzione automatica viene utilizzata per tradurre il testo o il parlato della lingua di origine in una lingua di destinazione. La traduzione che Google utilizza si basa sulla Neural Machine Translation, un sistema computazionale che utilizza una tecnica chiamata rete neurale artificiale [it] in cui per l'addestramento vengono utilizzati grandi set di dati costituiti dalla traduzione di frasi (dalla lingua di origine alla lingua di destinazione).

Con l'inclusione dell'oriya, Google Translate e Microsoft Translator ora supportano 11 lingue indiane ciascuno. In totale, Google supporta 109 lingue mondiali mentre Microsoft ne supporta 73.

Nel frattempo, le iniziative open-source devono ancora creare progetti di traduzione automatica di successo in oriya.

Almeno un progetto open-source guidato dalla comunità è in fase di sviluppo: MTEnglish2Odia sta addestrando un motore di traduzione automatica raccogliendo coppie di traduzioni da fonti esistenti come Wikipedia in lingua Odia e crowdsourcing dai contributi degli utenti su Twitter.

Inoltre, ci sono alcune ricerche e risorse che possono essere utilizzate per costruire motori di traduzione automatica da altre organizzazioni.

La politica della traduzione automatica

La tecnologia utilizzata da Google Translate o Microsoft Translator è articolata da aspetti sociali, legali, etici e relativi ai diritti.

Una piattaforma di traduzione automatica può essere di grande utilità per molte persone, tra cui giornalisti che possono accedere rapidamente alle notizie da più lingue o gli studenti che desiderano imparare da risorse multilingue.

Allo stesso modo, il supporto della sintesi vocale aiuta le persone con disabilità, in particolare la cecità, ad accedere e condividere le informazioni più facilmente.

Anche l'istruzione, i media e l'industria dell'intrattenimento traggono vantaggio dal potenziale di Google Translate di tradurre grandi quantità di contenuti in un breve periodo di tempo.

D'altra parte, la traduzione automatica può contribuire a diffondere disinformazione, mentre la sintesi vocale facilita i truffatori che cercano di depredare le persone comunicando con loro nella loro lingua.

Esistono oltre 6.000 lingue documentate in tutto il mondo e solo una minoranza di esse ha stabilito sistemi di scrittura. Quelle sono le lingue che possono essere incluse nei progetti di traduzione automatica come Google Translate e Microsoft Translator.

La disponibilità di contenuti online, così come il numero degli utenti di interno che parlano una determinata lingua, sono i principali fattori che le società a scopo di lucro prendono in considerazione quando decidono quali lingue includere nei loro sistemi. Più lingue supporta una società, più contenuti mirati possono offrire agli utenti – e maggiori sono le entrate che genera dagli annunci.

Inoltre, esistono questioni etiche di attribuzione e remunerazione in progetti come Google Translate, che ha una struttura di community di collaboratori per rivedere le traduzioni esistenti (che aiutano gli ingegneri a migliorare regolarmente lo strumento).

Sebbene Google sia un'azienda a scopo di lucro con molti prodotti a pagamento, incluso un servizio di traduzione in cloud [it], né i singoli volontari né le numerose fonti pubbliche da cui la macchina apprende vengono retribuiti o remunerati.

Anche l'uso di comunicazioni private per migliorare l'apprendimento automatico e l'intelligenza artificiale è controverso dal punto di vista della privacy, sebbene Google abbia lavorato per rendere anonimi tali dati.

In un paese come l'India, dove la creazioni di contenuti multilingue affronta gli impasse a causa dei costi, i prodotti come Google Translate e Microsoft Translator possono rivoluzionare l'economia dei contenuti indiana. Possono fare una differenza per progetti come Wikipedia, attualmente in 23 lingue indiane, o StoryWeaver, una piattaforma online di letteratura per bambini che si basa fortemente sul lavoro di volontariato.

Con la rapida scomparsa di molte lingue indiane e l'ulteriore sfida dell'analfabetismo e dell'accessibilità digitale, il percorso di comunicazione necessita di maggiore innovazione nella tecnologia vocale e visiva. La traduzione automatica può essere uno strumento valido per fermare l'estinzione della lingua – ma in India, ha ancora molta strada da fare.

Avvertenza: L'autore ha collaborato con Odia Wikipedia come volontario dal 2011 e con MTEnglish2Odia sin dalle sue prime fasi.

avvia la conversazione

login autori login »

linee-guida

  • tutti i commenti sono moderati. non inserire lo stesso commento più di una volta, altrimenti verrà interpretato come spam.
  • ricordiamoci di rispettare gli altri. commenti contenenti termini violenti, osceni o razzisti, o attacchi personali non verranno approvati.