Newsletter DigiGlot: le innovazioni dell'IA portano buone e cattive notizie per le lingue indigene e minoritarie

Foto di albyantoniazzi, utilizzata con licenza CC BY-NC-SA 2.0.

C'è un grande interesse per le tecnologie di Intelligenza Artificiale (IA) in grado di interpretare in vari modi il linguaggio umano. Chatbot, software di traduzione e assistenti virtuali come Siri o Alexa dipendono tutti dalla comprensione del modo in cui utilizziamo il linguaggio.

Qualche settimana fa, l'organizzazione no-profit di ricerca OpenAI [en, come tutti i link successivi, salvo diversa indicazione] ha pubblicato un articolo che illustra il suo nuovo approccio al modello computazionale della lingua inglese. Gli autori forniscono una serie di esempi di testi generati al computer e derivanti dal loro nuovo modello i quali, secondo loro, sarebbero impossibili da distinguere da quanto potrebbe produrre un essere umano. OpenAI ha deciso di non pubblicare il modello per paura che possa essere utilizzato in modo improprio, ad esempio per creare bot dannosi su Twitter o altri social network.

Come sempre, questo potrebbe significare sia una buona che una cattiva notizia per le lingue indigene e minoritarie. La buona notizia è che questi modelli non hanno bisogno di dati particolari per il training; possono essere realizzati a patto che i programmatori dispongano di una raccolta di file di testo sufficientemente ampia nella lingua di destinazione (ad esempio da Wikipedia). Una volta creato, un modello può essere utilizzato per sviluppare in quella lingua tecnologie IA più avanzate.

Qualche brutta notizia: innanzitutto, questi modelli richiedono un'enorme quantità di file di testo per il training, molti milioni o miliardi di parole e una notevole potenza di calcolo. Inoltre, la ricerca in questo settore continua a concentrarsi quasi al 100% sull'inglese e non ci sono garanzie che gli stessi modelli funzionino anche per lingue più complesse. Ed è sempre importante ricordare che queste tecnologie possono essere utilizzate tanto a beneficio dell'interesse pubblico quanto per facilitare la raccolta di dati da parte di aziende tecnologiche. Tuttavia, ci auguriamo di vedere più ricerca in questo settore per le lingue con risorse limitate e, infine, tecnologie IA a sostegno di queste lingue.

Ascolta gli ‘Ultimi Sussurri’ delle lingue morenti

Un antico enigma Zen [it] chiede: Qual è il suono di una sola mano che applaude? Lo scopo è quello di liberare un individuo dal suo normale modo di pensare, per consentirgli di ragionare in modo diverso.

Prendendo in esame la biodiversità linguistica del mondo e considerando a che velocità allarmante si estinguono le lingue, l'artista visiva multimediale Lena Herzog ha pensato di rappresentare le lingue in via di estinzione in un modo radicalmente diverso.

Lena ha creato un montaggio mettendo insieme le registrazioni di alcune lingue in fase di estinzione o già estinte e le riprese con drone di luoghi naturali, per realizzare quello che lei descrive come un “oratorio immersivo di 45 minuti”. Il risultato, intitolato Last Whispers, è un inquietante viaggio audiovisivo in bianco e nero attraverso una foresta di suoni articolati in Tehuelche, Nivkh, Nahuatl, Warlpiri, Ainu, Koyukon, Nafsan, Jul'hoan, Surel, Ongota e Qaqet. Quando queste lingue non hanno più persone che le parlano, gli ascoltatori si ritrovano in una foresta avvolta da un silenzio tombale.

La mappatura delle prime lingue australiane

First Languages Australia ha recentemente rilanciato la sua risorsa online Gambay che mostra i nomi preferiti delle lingue degli aborigeni e degli isolani dello stretto di Torres e la loro posizione in tutto il paese. La parola Gambay significa “insieme” nella lingua Butchulla. La mappa, creata su Mapbox, una piattaforma di mappatura open-source, consente agli utenti di localizzare i centri linguistici in prima linea negli sforzi di rivitalizzazione linguistica, offrendo anche soluzioni migliori per incorporare media digitali da fonti diverse.

Screenshot della mappa Gambay.

 

Iscriviti alla Newsletter DigiGlot

 

 

Kevin Scannell, Filip Noubel e Eddie Avila hanno contribuito all’articolo con l'aiuto per l'editing di Ellery Biddle.

avvia la conversazione

login autori login »

linee-guida

  • tutti i commenti sono moderati. non inserire lo stesso commento più di una volta, altrimenti verrà interpretato come spam.
  • ricordiamoci di rispettare gli altri. commenti contenenti termini violenti, osceni o razzisti, o attacchi personali non verranno approvati.