Dix jours après l’annonce, par Google, de l’intégration de dix nouvelles langues africaines à son traducteur automatique Google Translate, l’entreprise américaine les a mises en ligne. Le Wolof et le Fula, eux, ne sont pas concernés.
24 nouvelles langues ont été ajoutées par Google à son traducteur automatique Google Translate. Parmi elles, 10 sont africaines. Une nouveauté importante, car elle permettra la traduction de sites entiers en Lingala, Twi, Tigrinya, Sepedi, Oromo, Bambara, Luganda, Krio, Luganda et Tsonga. Ou, plus simplement, d’apprendre des langues locales pour les natifs de plusieurs pays africains.
Selon le chef du projet de Google, Isaac Caswell, l’un des objectifs de ces ajouts est « la prise en charge des langues indigènes, souvent négligées par la technologie ». « Jusqu’à il y a quelques années, il n’était pas technologiquement possible d’ajouter des langues comme celles-ci, qui sont appelées ‘une faible ressource’. Ce qui signifie qu’il n’y a pas beaucoup de ressources textuelles », explique l’ingénieur.
En effet, c’est grâce à la nouvelle technologie d’intelligence artificielle Zero-shot Neural Machine Translation (NMT) que les logiciels de traduction peuvent aujourd’hui prendre en charge des langues peu utilisées sur Internet, et peu documentées en général. On le remarque avec Google Translate, cependant, les traductions s’améliorent surtout avec la participation des utilisateurs. Les linguistes relèvent de nombreux défauts avec les 24 nouvelles langues traduites, certes. Mais même pour les langues néo-latines, le processus de traduction automatique n’est pas non plus encore abouti. Reste que, Google Translate a été mis en ligne en 2006, et depuis, la traduction s’est beaucoup améliorée.
Le Fula et la Wolof, les grands oubliés de Google
Mais le choix par Google des langues africaines choisies pose problème. Car depuis l’invention, par Google, de Zero-shot NMT, le problème des sources écrites d’une langue ne se pose plus. Le Lingala, le Luganda le Bambara, l’Oromo, l’Ewé et le Twi sont des langues très pratiquées, en Afrique et sur internet. Mais d’un autre côté, le Tsonga et le Krio ont beaucoup moins d’utilisateurs que le Fula ou le Wolof.
Dans l’absolu, les langues natives ouest-africaines font partie des rares langues pour lesquelles il n’existe aucun traducteur automatique. Si les critères objectifs pour lesquels une langue est choisie par Google sont la démographie et la connectivité, le Fula et le Wolof semblent ignorés par les linguistes et les développeurs.
Au-delà des langues africaines ajoutées par Google Translate, certaines langues asiatiques et latino-américaines prises en charge n’ont que quelques milliers d’utilisateurs. Le Sanskrit, par exemple, n’est parlé que par 20 000 personnes dans une partie de l’Inde. Le Dhivehi, langue des Maldives, n’est pratiqué que par 300 000 personnes. D’autres langues choisies par Google n’ont que 2 à 3 millions d’utilisateurs natifs. Et la plupart ne sont pas des langues écrites, et manquent autant — sans doute plus — de ressources que le Fula et le Wolof. Parmi les 24 langues ajoutées par Google Translate, aussi, 15 langues représentent, cumulativement, 24 millions de pratiquants, contre 37 millions pour le Fula seulement.
Quant à la connectivité, une la banque de données de l’université Harvard montre que 62 % des utilisateurs parlant Fula utilisent internet. Pour le Wolof, ce taux monte à 80 % et représente 16,5 millions de personnes.