Aujourd'hui l'entreprise américaine Alphabet a annoncé
Abkhaz, Acehnese, Acholi, Afar, Alur, Avar, Awadhi, Balinese, Baluchi, Baoulé, Bashkir, Batak Karo, Batak Simalungun, Batak Toba, Bemba, Betawi, Bikol, Breton, Buryat, Cantonese, Chamorro, Chechen, Chuukese, Chuvash, Crimean Tatar, Dari, Dinka, Dombe, Dyula, Dzongkha, Faroese, Fijian, Fon, Friulian, Fulani, Ga, Hakha Chin, Hiligaynon, Hunsrik, Iban, Jamaican Patois, Jingpo, Kalaallisut, Kanuri, Kapampangan, Khasi, Kiga, Kikongo, Kituba, Kokborok, Komi, Latgalian, Ligurian, Limburgish, Lombard, Luo, Madurese, Makassar, Malay (Jawi), Mam, Manx, Marshallese, Marwadi, Mauritian Creole, Meadow Mari, Minang, Nahuatl (Eastern Huasteca), Ndau, Ndebele (South), Nepalbhasa (Newari), NKo, Nuer, Occitan, Ossetian, Pangasinan, Papiamento, Portuguese (Portugal), Punjabi (Shahmukhi), Q'eqchi', Romani, Rundi, Sami (North), Sango, Santali, Seychellois Creole, Shan, Sicilian, Silesian, Susu, Swati, Tahitian, Tamazight, Tamazight (Tifinagh), Tetum, Tibetan, Tiv, Tok Pisin, Tongan, Tswana, Tulu, Tumbuka, Tuvan, Udmurt, Venda, Venetian, Waray, Wolof, Yakut, Yucatec Maya, Zapotec.
Google utilise son nouveau modèle basé sur l'IA, appelé Pathways Language Large Model 2. Ce modèle réduit la nécessité de construire de vastes corpus de milliers de phrases traduites (les corpus dits alignés). Un problème pour les petites langues comme le breton. L'intelligence artificielle permet une approche dynamique influencée à la fois par l'usage et le contexte au sein des phrases. Chaque mot est représenté par un vecteur principal correspondant à son sens principal, mais il peut également posséder plusieurs autres vecteurs pondérés pour ses sens alternatifs, y compris des nuances dialectales. La force de ces vecteurs varie en fonction du contexte et des autres mots de la phrase. Le vecteur avec l'amplitude la plus forte donne la traduction du mot dans une phrase donnée.
Pathways Language Model 2 repose sur une architecture qui optimise l'apprentissage et le traitement des données en dirigeant dynamiquement les tâches à travers des sous-réseaux spécialisés pour l'oral, l'écrit et les images. Cette approche améliore significativement l'efficacité et les performances du modèle dans diverses tâches de traitement du langage naturel. Cette approche multi-vectorielle et contextuelle va , on l'espère, catapulter le breton au même niveau que toute autre langue.
Le traducteur accepte un collage d'un texte jusqu'à 5000 caractères à la fois ( à comparer avec le traducteur de Ofis Publik ar brezhoneg qui ne prend que 400 caractères) . ABP a traduit l'article écrit en breton (voir notre article) et voici le résultat étonnant donné par Google traduction :
L'appropriation culturelle dit que tout signifie la même chose. La neutralité dit qu’il n’y a plus rien qui ait un sens. Le déconstructionnisme dit que le passé ne veut rien dire. Voici trois vents effrayants qui rendent nos terres stériles ; des vents violents qui frappent les murs de nos maisons. Faut-il partir en vacances ? C’est l’une des questions que vous trouverez dans mon livre « Faiblesses » récemment publié.
Je me concentre sur des sujets contemporains : le blasphème, les fêtes islamiques, les foules, les frontières, la violence politique, l'intrusion extraterrestre, le robot et l'homme, l'homme et les animaux, le drame, la realpolitik, la liberté d'expression, les femmes et les hommes, la culture en déclin, l'autonomisation, les voyages interstellaires. , la nécessité d'affirmer le « moi masculin », le « moi masculin » étant ici tout ce que nous héritons de nos parents et de notre éducation.
En conclusion, l'ouvrage se termine par cette proposition : trouver un accord global pour la Bretagne, à la fois culturel, politique et anthropologique. --fin de la traduction en français
Une traduction assez remarquable !
Comme Google prévoit 1000 langues on peut même espérer de voir un jour le gallo.
Les contributeurs d'ABP peuvent dès maintenant créer une version en français de leur article en breton et vice-versa, à condition de faire une relecture.
Comme l'entreprise Alphabet est aussi propriétaire de Youtube, il va de soi que le sous-titrage automatique en français des vidéos en breton et vice-versa va arriver très bientôt. En attendant, vous pouvez dorénavant traduire les fichiers chronométrés de sous-titres, fichiers SBV ou SRT, avec Google traduction et les envoyer sur Youtube avec votre vidéo.
■J’ai l’habitude, en fonction des besoins, de proposer des néologismes lorsque j’écris en breton. Les termes hervezouriezh et disavedouriezh ont été ainsi utilisés pour la première fois en breton dans ce texte. Le premier mot a pour base le terme hervez, selon, pour traduire relativisme. Hervezouriezh pourrait alors se traduire par «selonisme». L’IA a buggé en traduisant par appropriation culturelle. Que ce terme n’ait pas été reconnu est donc tout à fait compréhensible. Par contre, la traduction de disavedouriezh est parfaite, «déconstructionnisme» est équivalent à «déconstructivisme», voire plus facile à comprendre, bravo ! Netraouriezh, nihilisme, terme non-nouveau en breton, pourrait se traduire par «rienisme». L’IA le traduit par neutralité, alors que la neutralité en breton se dit neptuegezh, sur la base neptu, d’aucun côté.
Etonnant aussi que Poentoù diflach, points fixes, ait été traduit par Faiblesses, pobl par foules, galloud-prenañ, pouvoir d’achat, par autonomisation.
Les autres erreurs viennent de confusions de mots. Gouel a deux sens : fête religieuse ou voile. Dramm, drogue, a été pris pour drama, drame. «Gour-me», a été traduit par «moi masculin», gour, masculin et me, moi. Donc la traduction est immédiate. Sauf qu’ici, gour est un préfixe qui veut dire, sur, au-dessus de, utilisé pour exprimer la notion de sur-moi.
Une traduction amusante aussi, - puisque nous sommes en été ! -, est d’avoir traduit «Ha dleout a rafemp mont da gantreidi ?» par «Faut-il partir en vacances ?», alors que kantread veut dire nomade.
La dernière phrase de conclusion est parfaitement traduite : trouver un accord global pour la Bretagne, à la fois culturel, politique et anthropologique. Puisse cette proposition - lancée comme une bouteille à la mer et comprise par l’IA-, avoir quelque part un écho favorable !