- Global Voices in Italiano - https://it.globalvoices.org -

Dovrebbero esserci versioni in lingua shona di Google e dei social media? Questo tecnologo zimbawese dice di sì

Categorie: Africa sub-sahariana, Zimbabwe, Citizen Media, Cyber-attivismo, Etnia, Indigeni, Linguaggi, Rising Voices

Danzatori e tamburini tradizionali dello Zimbabwe. Immagine di TJ Maposhere via Wikimedia Commons (CC BY-SA 4.0).

Nota dell'editor: Dal 13 al 19 aprile 2021, Blessing Sibanda ospiterà l'account Twitter a rotazione @DigiAfricanLang [1], che esplora come la tecnologia può essere utilizzata per rivitalizzare le lingue africane. Leggi di più sulla campagna qui [2].

Lo shona, lingua ufficiale dello Zimbabwe, è una delle lingue bantu [3] [en, come tutti i link successivi, salvo diversa indicazione]più parlate, con circa 10,8 milioni di parlanti. Ma mentre ci sono un certo numero di risorse storiche [4] e letterarie [5] consolidate in shona, la visibilità della lingua online è tutt'altro che incoraggiante.

Blessing Sibanda, un ingegnere del software, è in prima linea nello sforzo di far riconoscere la lingua shona nel campo dell'elaborazione del linguaggio naturale [6], l'area dell'intelligenza artificiale che si occupa di far “capire” e decodificare ai computer il linguaggio scritto e parlato.

Adéṣinà Ọmọ Yoòbá di Rising Voices ha parlato con Blessing per saperne di più sul suo lavoro per ottenere il riconoscimento della lingua Shona in contesti di apprendimento automatico e online.

Adéṣinà Ọmọ Yoòbá (AOY): Potresti parlarci di te?

Blessing Kudzaishe Sibanda. Immagine usata con permesso.

Blessing Kudzaishe Sibanda (BKS): My name is Blessing Kudzaishe Sibanda. I am a software engineer and researcher. I am currently pursuing a Master’s degree in Computer Science at Namibia University of Science and Technology. My research interests are in Computer Vision and natural language processing (NLP).

I am part of Masakhane [7], where I am conducting NLP research on low-resource languages, specifically concentrating on my native language Shona. I have been particularly involved in the machine translation and named-entity recognition [8] (NER) initiatives for Shona.

Blessing Kudzaishe Sibanda (BKS): Il mio nome è Blessing Kudzaishe Sibanda. Sono un ingegnere del software e un ricercatore. Attualmente sto conseguendo un Master in Informatica presso la Namibia University of Science and Technology. I miei interessi di ricerca sono nella Computer Vision e nell'elaborazione del linguaggio naturale (NLP). Faccio parte di Masakhane [7], dove sto conducendo ricerche NLP su lingue a bassa risorsa, concentrandomi in particolare sulla mia lingua madre Shona. Sono stata particolarmente coinvolta nelle iniziative di traduzione automatica e di riconoscimento delle entità nominate [8] (NER) per lo shona.

AOY: Qual è lo stato attuale della tua lingua offline, oltre che online?

BKS: Shona is very active and vibrant offline. According to the website mustgo, [9] it is one of the most spoken Bantu languages, with an estimated 10.7 million speakers. It has a rich history and literature [10] with a lot of a documentation. Although it has great resources offline, there still a lot potential to increase its presence online.

BKS: Lo shona è molto attivo e vivace offline. Secondo il sito web mustgo [9], è una delle lingue bantu più parlate, con una stima di 10,7 milioni di parlanti. Ha una ricca storia e letteratura [10] con molta documentazione. Anche se ha grandi risorse offline, c'è ancora molto potenziale per aumentare la sua presenza online.

AOY: Quali pensi siano le maggiori sfide che la tua comunità linguistica deve affrontare per quanto riguarda la comunicazione digitale o la creazione di contenuti digitali nella loro lingua madre?

BKS: I think in most African countries, inclusive of my country, the biggest challenge is that of having the language of the former colonisers as the first language. Although this has been of advantage when communicating on an international stage, it has made our own native languages not be appreciated as they should. This has to some extent made those who speak for example English be thought of as more educated or of a higher social class whilst looking down upon our own native languages. So, you find people preferring the foreign language more than the native one.

With this, I think the biggest issue which needs to be dealt with is the perspective of the native language, it needs to be shifted to make it more appealing to use whether in business or on the internet, so that people can better embrace it. From a technological standpoint, it is lagging behind in terms of tools and software which make it easier and accessible to use online. This is mostly because of the lack of resources which can be used to produce those tools. Tools and services like dictionaries, translation, keyboards (for languages with diacritics), speech, amongst others, will pay off in the long run as they make it easier to communicate with our own language online.

BKS: penso che nella maggior parte dei paesi africani, compreso il mio paese, la sfida più grande è quella di avere la lingua degli ex colonizzatori come prima lingua. Anche se questo è stato un vantaggio quando si comunica su una scena internazionale, ha fatto sì che le nostre lingue native non siano apprezzate come dovrebbero. Questo ha fatto sì che coloro che parlano, per esempio, l'inglese siano considerati più istruiti o di una classe sociale superiore, mentre guardano dall'alto in basso le nostre lingue native. Così, si trova la gente che preferisce la lingua straniera più di quella nativa. Con questo, penso che il problema più grande che deve essere affrontato è la prospettiva della lingua nativa, deve essere spostata per renderla più attraente da usare sia negli affari che su internet, in modo che la gente possa abbracciarla meglio. Da un punto di vista tecnologico, è in ritardo in termini di strumenti e software che lo rendono più facile e accessibile da usare online. Questo è principalmente dovuto alla mancanza di risorse che possono essere utilizzate per produrre questi strumenti. Strumenti e servizi come dizionari, traduzioni, tastiere (per le lingue con diacritici), parlato, tra gli altri, ripagheranno a lungo termine, poiché facilitano la comunicazione online con la nostra lingua.

AOY: Secondo te, quali sono alcuni dei passi che si potrebbero fare a breve termine per incoraggiare un maggiore uso della lingua su internet? 

BKS: I believe the integration of local languages into everyday online tools and technologies that we use can encourage the increased use of the language on the internet. For example, with Google Search, if you could switch the main language to Shona and everything gets displayed in Shona. This should also be the option for social media sites, where most of the languages from Africa are not covered for personalising display language.

Another example is with Wikipedia. People can contribute pages using their own native languages which in a way increases the discoverability of these languages. I believe another step, as earlier noted, is investment in research and products which utilize native languages.

From a technological perspective, there is a lot of ground to cover compared to the most widely spoken languages to be at par in terms of research and products. This is an impediment, as we cannot fully express our own language whilst making those unfamiliar with it able to understand it, as the internet has made the world a global village. With these concerted efforts I believe the use of native languages online can be encouraged.

BKS: credo che l'integrazione delle lingue locali negli strumenti quotidiani online e nelle tecnologie che usiamo possa incoraggiare l'aumento dell'uso della lingua su internet. Per esempio, con Google Search, se si potesse cambiare la lingua principale in Shona e tutto viene visualizzato in Shona. Questa dovrebbe essere l'opzione anche per i siti di social media, dove la maggior parte delle lingue dell'Africa non sono coperte per personalizzare la lingua di visualizzazione. Un altro esempio è con Wikipedia. Le persone possono contribuire alle pagine usando le loro lingue native che in un certo senso aumenta la scopribilità di queste lingue. Credo che un altro passo, come già detto, sia l'investimento nella ricerca e nei prodotti che utilizzano le lingue native. Da un punto di vista tecnologico, c'è molto terreno da coprire rispetto alle lingue più parlate per essere alla pari in termini di ricerca e prodotti. Questo è un impedimento, perché non possiamo esprimere pienamente la nostra lingua e allo stesso tempo rendere comprensibile a chi non la conosce, visto che internet ha reso il mondo un villaggio globale. Con questi sforzi concertati credo che l'uso delle lingue native online possa essere incoraggiato.

AOY: Qual è la tua motivazione principale per lavorare per vedere la tua lingua e la tua cultura disponibili su internet?

BKS: My motivation is to see a lot of activity when it comes to NLP technologies for Shona, and to have tools that are comparable in performance to the widely adopted languages on the internet. I believe competent tools will inevitably encourage the use of the language on the internet, and for this to happen the native speakers should be at the forefront of researching and producing these tools as they better understand their own language.

This is why I adore and am part of the Masakhane Community. It is bringing the native speakers to work and research on their own languages. It is lowering the barrier of entry into working with these technologies, providing a community and mentors to help along this journey of producing these tools. In addition to this, it is publishing research which will make it easier for others to continue this work and make sure native languages are represented in technology.

BKS: la mia motivazione è quella di vedere un sacco di attività quando si tratta di tecnologie NLP per lo Shona, e di avere strumenti che siano paragonabili per prestazioni alle lingue ampiamente adottate su internet. Credo che strumenti competenti incoraggeranno inevitabilmente l'uso della lingua su internet, e perché questo accada i madrelingua dovrebbero essere in prima linea nella ricerca e nella produzione di questi strumenti in quanto comprendono meglio la loro lingua. Questo è il motivo per cui adoro e faccio parte della Comunità Masakhane. Sta portando i madrelingua a lavorare e ricercare sulle loro lingue. Sta abbassando la barriera d'ingresso per lavorare con queste tecnologie, fornendo una comunità e dei mentori per aiutare lungo questo percorso di produzione di questi strumenti. Oltre a questo, sta pubblicando ricerche che renderanno più facile per altri continuare questo lavoro e assicurarsi che le lingue native siano rappresentate nella tecnologia.