Le breton bientôt offert par Google Traduction ?

Dépêche publié le 19/02/23 13:34 dans Langues de Bretagne par Philippe Argouarch pour ABP
t:1
https://abp.bzh/thumbs/56/56943/56943_1.png
133 langues mais toujours pas de breton

Google Traduction (anglais : Google Translate) est un service de traduction automatique gratuit fourni par l'entreprise américaine Alphabet lancé en 2006. On peut y traduire des textes de moins de 5000 caractères et des pages WEB.

En 2009, Google a ajouté le gallois, l'irlandais et le gaélique écossais.

En mai 2022, Google a ajouté 24 nouvelles langues : Assamese, Aymara, Bambara, Bhojpuri, Dhivehi, Dogri, Ewe, Guarani, Ilocano, Konkani, Krio, Lingala, Luganda, Maithili, Meiteilon (Manipuri), Mizo, Oromo, Quechua, Sanskrit, Sepedi, Sorani Kurdish, Tigrinya, Tsonga, and Twi. Ce sont principalement des langues parlées aux Indes par des millions de personnes. Le Bhojpuri est parlé par 50 millions de personnes à comparer au breton parlé par seulement 200 000 personnes.

Oui mais voilà, ils ont aussi ajouté le sanscrit parlé par seulement 20 000 personnes, et le gaélique écossais, qui y figure depuis 2009, n'est parlé que par 60 000 personnes. Le corse et le basque sont aussi dans la liste depuis 2016.

Pour que le breton arrive, l'excuse de ne pas pouvoir envoyer un corpus de textes avec traductions important n'est plus valide puisque Google vient d'abandonner la méthode basée sur les statistiques (SMT) pour une méthode basée sur l'ensemble de son corpus de textes dans toutes les langues intitulé Zero-Shot Machine Translation (ZMT). Cette méthode n'est pas aussi bonne que la précédente certes, mais elle permet d'offrir plus de langues. Avant, avec la méthode statistiques, Google avait besoin de milliers, voire de millions de pages traduites sur internet et le breton n'avait pas ce corpus.

Le nouveau système de traduction mis au point par Google utilise toutes les langues et l'intelligence artificielle. Les structures des phrases des langues ne sont pas infinies. La machine peut mémoriser toutes les possibilité de construire une phrase dans toutes les langues connues. Une fois cette grammaire comprise la machine peut contexter, voire deviner un mot. Autrefois, des traductions du finlandais en grec étaient impossibles, mais sont aujourd'hui possibles en passant par le ZMT et l'intelligence artificielle. Mais c'est surtout la méthode utilisée qui est révolutionnaire. Avec ZMT, le traducteur peut deviner un mot sans jamais l'avoir utilisé. Si en plus il a en mémoire toutes les definitions des mots d'une langue il est capable de les grouper pour en déduire le sens dans le contexte de la phrase.

Le ZMT accélère donc la possibilité pour le breton d'être bientôt une des langues traduites par Google. D'autres langues sont en préparation comme le romanche, le cherokee ou le tibétain... Le breton ? Il suffit que suffisamment de Bretons et de Bretonnes le décident pour que le breton y figure. Vous n'avez pas honte que le romanche ou le cherokee, parlé seulement par 22 000 personnes, arrive avant le breton ?

Pour contribuer à l'arrivée du breton sur Google Traduction vous pouvez aller sur cette page


Vos commentaires :
Mardi 30 avril 2024
Vous pouvez utiliser Analouder pour le breton aussi open source et c'est pour le breton.
0

Écrire un commentaire :

Cette fonctionnalité est indisponible en ce moment, mais existe sur votre ordinateur.

Combien font 7 multiplié par 6 ?
Note : Ce lieu est un lieu de débat. Les attaques personnelles ne sont pas autorisées. Le trolling est interdit. Les lois contre le racisme, le sexisme, et la diffamation doivent être respectées. LES COMMENTAIRES ÉCRITS DANS UNE LANGUE AUTRE QUE CELLE DE L'ARTICLE NE SERONT PAS MIS EN LIGNE.