L'intelligence artificielle peut-elle sauver la langue bretonne de l'extinction ?

Reportage publié le 11/08/23 15:34 dans Science et Technologie par Philippe Argouarch pour Philippe Argouarch
https://abp.bzh/thumbs/58/58230/58230_2.png
Mélanie Jouitteau, chercheuse au CNRS en sciences du Langage
Comment les langues à corpus restreint peuvent-elles survivre à l'intelligence artificielle ? (223 vues)

Dans le cadre des conférences offertes par le Festival interceltique de Lorient 2023, la chercheuse du CNRS Mélanie Jouitteau a exposé ses analyses de la révolution de l'intelligence artificielle en cours dans le cadre des langues minorisées et en particulier du breton.

La découverte de l'imprimerie avait en soi révolutionné et démocratisé les connaissances, du moins pour une certaine classe de la société, mais aux dépens des dialectes et des langues moins répandues. L'imprimeur ne pouvait pas imprimer son livre dans tous les dialectes et les langues du pays. La révolution numérique cinq siècles plus tard, en éliminant le papier et l'encre, permet d'enregistrer, de codifier et d'utiliser absolument toutes les expressions du genre humain, orales, écrites, et sans doute un jour, la pensée elle-même avec des capteurs dans nos cerveaux.

Le seul problème, et pas des moindres, c'est que plus ces langues sont minorisées, plus petit est le corpus (le corpus est l'ensemble des textes et des enregistrements récoltés). Ces ressources permettent de donner une intelligence aux transcripteurs, aux traducteurs, aux sous-titreurs, aux correcteurs de saisie, et à la reconnaissance optique (inexistante pour le breton). Il faut instruire les machines avec des millions de textes et d'enregistrements. Pour l'anglais, parlé par un milliard de personnes, les résultats d'applications comme ChatGPT 4.0 ou comme Whisper (numérisation de l'anglais oral) sont prometteuses. Par contre, ABP a demandé à ChatGPT 3.5 de traduire une phrase du français en breton et le résultat a été inacceptable. ChatGPT 4.0 serait meilleur mais il est payant.

Le Traitement Automatique des Langues (TAL)

Des scientifiques, et pas seulement bretons, construisent le corpus de la langue bretonne avec des agrégateurs qui parcourent l'internet à la recherche de données libres de droits. Pour faciliter la tâche des robots ou BOTs, il est recommandé, insiste Mélanie Jouitteau, d'utiliser [[Creative Commons]] c'est-à-dire d'indiquer sur toutes vos communications publiques en breton numérisé, les droits et les possibilités de partages y compris à usage commercial. Pour choisir la licence qui vous convient, l'outil de Creative Commons est facile d'usage

Mélanie Jouitteau aborde aussi les problèmes que posent la fabrication de corpus, les problèmes juridiques de droits d'auteur, les problèmes de surexploitation de ceux, dans des pays pauvres lointains, qui entrent les données dans les ordinateurs. Et pas des moindres, le danger de la privatisation du bien commun qu'est une langue. Les langues, y compris les langages informatiques, sont dans le domaine public, il n'y a aucune raison que le corpus des langues ne le soient pas. Les choses iraient beaucoup plus vite si les corpus étaient accessibles à tous.

Où en est la langue bretonne ?

La Bretagne a pris un certain retard dans les applications. On constate l'absence du breton dans les traducteurs populaires comme Google Translate ou les application de traduction sur mobile. Ofis ar brezhoneg a finalement sorti un traducteur correct français - breton sur son site et merci à Alan Entem et Brendan-Budok Durand-Le Ludec pour leur travail. Il remplace un traducteur un premier traducteur lancé en 2010 (Apertium). Apertium avait été développé par Frank Tyers, de l'université d'Alicante. Il a aussi développé le premier corpus Universal Dependencies pour le breton en 2018 avec Vinit Ravishankar de l'université d'Oslo.

Vu que le corpus rassemblé par les langues minorisées comme le breton est restreint, la qualité des applications est forcément moindre car l'intelligence artificielle est basée sur le deep learning et l'apprentissage des machines demande le plus de données possible. Comme les humains, les machines doivent apprendre par l'expérience et les machines apprennent bien moins vite que les enfants pour des raisons encore inexpliquées. Elles ne raisonnent pas pareil. Pour le moment, notre effort doit donc porter sur l'envoi et la collecte de textes, de vidéos, et d'enregistrements en breton, nous explique Mélanie Jouitteau. Pour aller plus loin sur l'histoire du développement de breton numérique voir la page du CNRS

Polémique entre domaine public et domaine privé

La polémique autour du bien commun, du domaine public et du privé nous fait penser à l'affaire du sang contaminé, un des plus grands scandales sanitaires en France. Entre 1984 et 1985, 2000 hémophiles ont reçu le virus du sida (VIH) suite à des transfusions de sang contaminé. On sait aujourd'hui que le ministère de la Santé n'avait pas voulu acheter le test du laboratoire américain Abbott très efficace pourtant. Les filtres français de l'institut Pasteur ont été préférés et ils étaient défectueux et en plus, plus chers. 200 personnes sont mortes à cause d'une décision politique. Aujourd'hui, la langue bretonne est en train de mourir pour les mêmes raisons. ABP a reçu ce commentaire de quelqu'un travaillant pour Ofis ar Brezhoneg à propos de Google «Ce n'est pas le travail de l'Office Public de la Langue Bretonne de travailler pour une entreprise privée qui gagne des milliards chaque année.» Pourtant le succès de l'internet est dû à une fantastique symbiose entre le secteur public (les protocoles, les structures, le réseau) et des entreprises privées comme Alphabet (Google) ou les réseaux sociaux. La même chose devra se faire pour l'intelligence artificielle si on veut aboutir. Mélanie Jouitteau précise que « les corpus, financés par le public, financés par le privé, ou les deux, doivent être libres d'accès, et distribués de façon pérenne. L'important est que ces ressources pérennes soient ouvertes à tous, repérables à l'autre bout du monde par n'importe quel développeur. Il faut des corpus libres, en ligne avec une conformité aux principes FAIR (Findable, Accessible, Interoperable, Reusable).Les organismes de recherche actuels comme le CNRS ont les moyens d'opérer cette distribution en ligne, via le site cocoon par exemple. »

Pour Yann Lecun, directeur de la recherche en IA chez META, « Il suffirait de convaincre la Ministre de la culture de collecter les textes en langues régionales et de financer l'entraînement d'un LLM (Large Language Model) open source avec ces données ». Yann Lecun précise que META « a déjà produit des systèmes de reconnaissance de parole pour un millier de langues dont des systèmes de traduction pour des dialectes parlés, sans système d'écriture, et des systèmes de traduction pour 200 langues ». Le breton qui y était au début n'y figure plus car le corpus est trop petit selon Yann Lecun. Voir à ce sujet No language left behind . Yann Lecun précise que tous les corpus (il s'agirait donc de 1000 langues) sont open source

Alors quoi faire ? Quand vous écrivez ou dites quoi ce soit en breton sur l'internet, et qui n'est pas du domaine privé, pensez à lui mettre une licence ouverte, car ce matériel permettra la création d'outils qui peuvent sauver la langue bretonne et d'une façon générale la création d'une intelligence qui, on l'espère, finira pas dépasser la nôtre.


Vos commentaires :
jojo
Vendredi 22 novembre 2024
D'oú l'intérêt de donner un statut officiel à ces langues, ce qui stimule aussi la production de rapports, documentations et autres dans la langue et permet de les laisser disponibles pour entrainer les machines. C'est aussi pour cela que les langues minoritaires d'Espagne ou de Grande Bretagne sont sur google trad et pas celles de france hormis le corse, seule exception il me semble (et basque et catalan mais grâce aux Communautés espagnoles...)

Franck Pleskop
Vendredi 22 novembre 2024
Pourquoi Chat GPT donnerait des résultats prometteurs alors que le corpus de textes en breton présent sur Internet est littéralement famélique ?

Le nerf de la guerre, c'est l'alimentation de ces neurones artificielles en données déjà existantes...


Pcosquer
Vendredi 22 novembre 2024
Dans des conditions satisfaisantes, un enfant apprend à une vitesse étonnante.
Un enfant peut faire la différence entre deux langues sans qu'on lui ai donné la moindre explication sur ces différences.., et à l'âge où la phrase n'est pas acquise.
Un enfant peut extrapoler une règle de grammaire (vécue mais non expliquée ) à un ensemble plus vaste sujet à cette règle.
Un enfant associe son apprentissage à l'émotion qu'il en éprouve.
Un enfant différencie les sons (phonèmes) mais aussi les sonorités (émotives) et il est sensible au débit du langage qu'il associe à la situation...
Il est sensible à l'image inconsciente (positive mais aussi négative) véhiculée par les locuteurs qu'il entend.
Une langue associe toutes les personnes qui s'en réclament qu'ils soient locuteurs ou non à une communauté d'appartenance et par extension à un territoire donné. Il y a «enracinement».
Ha kement zo!...

Il est probable que la machine ne fera pas de telles différences avant quelques temps si elle y arrive un jour ce qui n'est pas prouvé.
C'est peut-être cela qui rend lent l «apprentissage» fait par la machine. En revanche, peut-être que la pérennisation de sa mémoire est plus fiable que celle de l'humain.

Par ailleurs, l'image émotionnelle positive qui émane d'une langue est primordiale pour sa transmission d'où l'importance de l'entourage immédiat et plus tard de l'importance de la société.
On connaît bien ce phénomène inversé en Bretagne et les graves résultats qui en ont découlé et qui en découlent encore...
J'ai tendance à penser qu'une langue purement business n'a pas forcément un avenir solide justement parce que «l'argent reste l'argent» et toute communication est bonne dans ce but; le changement de langue est alors dans ce cadre purement technique et il est bien évidemment très loin de ce qu'éprouve un enfant quand il apprend de sa communauté d'origine.


pierre daniel
Vendredi 22 novembre 2024
Le Breton comme langue officielle c'est la seule solution ,le reste n'est que fuite en avant jacobine pour se laver du crime d'ethnocide.
La technologie ne sauvera pas la langue Bretonne ,une pratique journalière dans tous les endroits de notre nation, et par le plus grand nombre de Breton sera plus efficace et durable .
Les jacobins le savent et lancent à la face des Bretons un énième piège dans lequel les Bretons se précipitent comme d'habitude.
Les jacobins ne disent pas que cette technologie sauvera le Français, NON ils imposent leur langue c'est tout
Une seule solution BREZHONEG YEZH OFIZIEL

a galon


Alice Donnard
Vendredi 22 novembre 2024
L'important c'est surtout la qualité du corpus. Il faut sélectionner des textes de qualité impeccable, écrit par des gens qualifiés, par des Docteurs de la Faculté, l'exemple le plus évident est Fanny Chauffin, dont le breton authentique, vivant, riche et savoureux, capable de dire tout avec une infinité de nuances, demeure la référence incontestée.

L'article soulève aussi un point important : Le fait que les enfants sont la clé de la survie du breton. Pas étonnant que les cours du soir pour adultes sont une voie sans issue et une perte de temps. Seul les enfants ont le cheminement intellectuel et la motivation nécessaires pour devenir des locuteurs actifs, et ça la recherche scientifique l'a bien prouvé.

Heureusement le CNRS, dont l'excellence n'est plus à démontrer, est une fois encore à la hauteur du défi : sauver la langue bretonne en numérisant des locuteurs natifs, sans oublier de prendre les selfies qui vont bien. Bravo et merci.


Jean Carfantan
Vendredi 22 novembre 2024
Voici l'organisme pour la langue basque chargé de l'utilisation de l'IA
Voir le site
et pour l'occitan
Voir le site
Est-ce que la région Bretagne prévoit de créer un organisme similaire ou en existe-t-il un pour la langue bretonne ?

Penn Kaled
Vendredi 22 novembre 2024
Vous dites Pas étonnant que les cours du soir pour adultes sont une voie sans issue et une perte de temps
Je ne suis pas du tout de votre avis .Au contraire d'abord ces adultes vont améliorer la pratique de la langue et hésiteront moins à la pratiquer au quotidien .De plus si c'est le cas de jeunes parents , ces cours leurs permettront de dialoguer avec leurs enfants qui sont à diwan ou en bilingue ainsi ceux ci abandonneront moins la pratique du breton une fois la scolarité terminée . De plus ces cours permettent de sauvegarder un minimum de lien avec locuteurs natifs ,atténuant un peu les dégâts à ce niveau

Kevin Moorcock
Vendredi 22 novembre 2024
Merci Alice pour cette analyse toute en finesse et pleine de bon sens. Je me permettrais de rappeler que 95% des professeurs, écrivains et penseurs bretonnants sont d'anciens élèves des filières bilingues, et qu'aucun pour ainsi dire n'est issu des cours du soir... CQFD !

David Tabolleau
Vendredi 22 novembre 2024
Il parait que des bornes interactives holographiques sont en préparation... on appuie sur un simple bouton et un hologramme de Mona Bouzec apparaît, avec le son bien entendu. Quelle grande dame ! Quelle émotion ! Et l'émotion, c'est un facteur primordial dans l'utilisation intelligente et raisonnée des nouvelles technologies. C'est tellement important que les génération futures puissent établir un lien affectif avec une personne qui a toujours refusé de quitter son pays natal et a toujours pratiqué le breton avec ses enfants. Qui plus est cette grande dame a toujours su trouver les mots pour encourager les jeunes apprenants. On ne remerciera jamais assez les chercheu.ses.rs du CNRS, qui outre le fait de sauver la langue bretonne, nous la font aimer et pratiquer. Irremplaçable CNRS.

P.Bulot
Vendredi 22 novembre 2024
«Est-ce que la région Bretagne prévoit de créer un organisme similaire ou en existe-t-il un pour la langue bretonne ?»

Vous oubliez l'IA pour le Gallo. Point d'IA pour le Gallo, point d'IA pour le breton.
Mais attendons la création d'un comité via Métavers et la version Chat GPT.50 qui créera un Gallo avec une graphie révolutionnaire digne de la cryptographie de cyberdéfense.


Pcosquer
Vendredi 22 novembre 2024
@D'accord avec vous sur ce point , Penn Kaled.
@Alice Donnart: Je rajoute à ce débat quelque chose qui me semble primordiale: Si on prend la génération née aux alentours des années 60 ( période noire de la transmission de la langue bretonne) on comprend qu'elle est, aujourd'hui, la seule génération capable de parler du temps d'autrefois (avant 75) mais aussi du temps moderne (surtout depuis 90). Compte tenu de l'évolution ultra rapide que l'on connaît et de la volonté d'uniformisation, cette position dans le temps fait de cette génération des témoins particuliers:
D'une part, ils ont la capacité de juger des sons du breton parlé parce que beaucoup d'entre-eux ont pu l'entendre dans leur enfance et adolescence, ce qui n'est plus le cas de la jeunesse actuelle.
D'autre part, et c'est tout aussi important, ils ont aussi la capacité de jauger la modernité au regard du passé...
De fait, cette génération est la seule capable d'aplanir les problèmes internes à la langue bretonne notamment la diglossie qui y persiste. Beaucoup d'entre-eux sont des locuteurs passifs et ils offrent un réel potentiel d «apprenants» du breton une fois la retraite arrivée (il y a certaines conditions cependant). Les cours du soir ont donc toute leur place ( je dirais même que ceux qui le souhaitent dans cette génération devraient pouvoir bénéficier à coût abordable de formation longue ). Avec leur témoignage sur la notion «de progrès» et son lot de destructions culturelles ( vis-à-vis de sa vision uniformisatrice particulièrement...qui ne s'embarrasse d'aucun sentiment à l'égard des petits peuples et de leurs cultures ), cette génération possède des clés qui peuvent aider à refermer bon nombre de plaies dans la société bretonne dont celle de la perte culturelle où de la coupure inter-générationnelle qui pour moi prend ses sources dans un modernisme débridé et dangereux. Cette génération est une génération qui se tait et qui n'a jamais été interrogée, son point de vue est totalement ignoré...et pourtant son intervention aujourd'hui dans l'avenir du breton pourrait changer son avenir. Il faut y voir ici, bien évidemment, un accompagnement de la jeunesse dans sa réappropriation culturelle en «re»bretonnisant l'espace social)
Un autre fait d'importance; une langue est le fait d'un peuple et son évolution se fait selon son évolution sociale et culturelle (sauf à considérer des problèmes externes ) pour moi, toute personne pratiquant le breton est bretonnant quelque soit son niveau de pratique; le corpus de la langue est aussi social et il me semble assez dangereux de sélectionner les écrits les plus élevés pour la caractériser... Il s'agirait ici de prolonger notre bonne «vieille» diglossie dans l'avenir par une sélection technique. Dans un texte il y aussi les idées dont certaines qui ne verraient donc jamais le jour par ce que la personne qui les auraient exprimés ne possèderait pas assez tel ou tel breton?
La machine est issu d'un concept quand ce n'est pas d'un copiage, la nature est issue de quelque chose qui nous dépasse ne croyez-vous pas ? La machine doit rester un outil et pas autre chose: Mettre la technologie au-dessus de tout est d'ailleurs un des grands échecs, à mon avis, du monde occidental.
@David Tabolleau Je serais très étonné que les jeunes fassent un affectif avec une personne qui s'exprimerait à travers une machine même accompagnée en image...Je pense que vous attribuez des vertus humaines à une machine et vous risquez d'être très déçu.
cela ne diminue en rien évidemment l'importance du témoignage dont vous parlez. C'est la machine qui me semble là encore mise bien trop en avant.

Emilie Le Berre
Vendredi 22 novembre 2024
L'IA pour sauver la langue bretonne ? Hmmm, encore une façon des bretons à vivre leur émancipation par procuration, de se dispenser du moindre effort puisqu'on nous dit quelle sera sauvée.

Penn Kaled
Vendredi 22 novembre 2024
A bouez pes o peus skrivet Posquer
Pour cette fois votre commentaire est brillant .Je me reconnais dans la génération d'avant 1975 à la différence que je n'ai pas été passif étant donné que à partir de dix sept ans j'ai commencé à parler breton par conviction , ce qui était facilité par le fait que mon entourage le pratiquait ,mais ce n'est pas ma langue maternelle
Mais à l'époque ce n'était pas toujours bien perçu par cet entourage .

Alain E. VALLÉE
Vendredi 22 novembre 2024
L'électricité, la bicyclette, le train, la radio, le téléphone, la télévision, l'ordinateur, Internet, ..., très admirables outils, ont-ils sauvé le grac, le latin et la breton ? Malheureusement Non !
Car ces moyens sont d'abord au service des ennemis déclarés des langues dont les peuples perdirent les guerres et qui veulent imposer la leur aux vaincus. Le cas du polonais et de l'hébreu sont des exceptions si rares qui confirment cette loi historique.
Non évidemment car l'enjeu de la survie, du renouveau, de l'usage des langues n'est ni technique ni dépendant d'une quelconque quincaillerie fut-elle ultra-sophistiquée suite à des recherches avec finalité même bienveillante. Il n'est que dans la conscience et la volonté, dans l'ethnos et dans l'ethos.
AV

P. Argouarch
Vendredi 22 novembre 2024
@Alain : Je ne suis pas du tout d'accord avec ce que vous dites. Toutes les inventions ne se valent pas au niveau de la préservation de la diversité linguistique et culturelle.Comme je le dis dans mon article, l'invention de l'imprimerie a été un désastre pour les langues et les dialectes qui existaient dans tel ou tel pays. Alors que le curé du village parlait la langue des paroissiens , l'imprimeur ne pouvait pas imprimer dans toutes les langues. Question de sous. C'est même pour ca que les langues ont été standardisées avec une seule officielle. Même chose pour la radio et la télévision que vous citez. Tout au contraire l'intelligence artificielle va permettre de traduire en temps réels toutes les langues du monde. Vous écouterez TF1 ou ARTE, le présentateur parlera francais et vous entendrez du breton ou du basque ou du gallo etc ...selon votre choix et en temps réel, c'est à dire en synchronisation avec la personne qui parle (en moins le mouvement des lèvres et la longueur des phrases).

Alain E. VALLÉE
Vendredi 22 novembre 2024
Certes, « (...) le présentateur parlera français et vous entendrez du breton ou du basque ou du gallo etc ... selon votre choix et en temps réel, (...) » mais nécessairement dans votre casque si vous êtes plusieurs sinon sans si vous êtes seul.
Et ces réels progrès et quelques autres, s'il sont loyalement généralisés à un coût bas sans chicane ni péage, seront-ils suffisants pour que les gens parlent breton ?
Supposons qu'un locuteur parlant français dans une machine sous IA, puisse être entendu en breton, ce serait très bien sauf qu'il ne parlerait toujours pas la langue de ses ancêtres.
Avec l'IA, on peut sincèrement espérer des progrès pour le breton mais le contraire reste possible.
AV

Naon-e-dad
Vendredi 22 novembre 2024
@Pcosquer
La rupture linguistique s’est faite massivement dans la décennie cinquante, puis aussi dans la décennie soixante, et j’ai même entendu quelques témoignages épars et tardifs en début des soixante-dix. Personnellement, dès l’âge de raison (sept ans), j’ai compris tout seul sans que quiconque ne me dise rien, dans ce silence assourdissant, que la langue cesserait (dans mon vocabulaire enfantin) si les adultes ne parlaient pas aux enfants. Nous y sommes ou presque.
.
Ce que vous dites m’impressionne, et je suis d’accord avec vous. Déjà à l’époque des soeurs Gwadeg (natives de Treffrin), qui étaient en tout point semblables aux femmes à coiffe dans mon environnement estival (vacances scolaires), je regrettais qu’elles ne fussent pas enregistrées autrement qu’en chantant. Leur breton, leurs intonations étaient celles que j’entendais, qui m’enchantaient mais que je ne comprenais pas.
.
D’un point de vue réalistique, je ne serai jamais qu’un né-bretonnant, certes. Mais le fait d’avoir entendu la langue à cette époque, donne un repérage sûr et table. Comme ceux de ma génération – la première après la rupture (sur une période vertigineuse : quinze, vingt siècles, plus… ? - je connais les sons du breton. Je les connais en mémoire profonde et dans le système articulatoire. Car la rupture (politico-sociale) n’a pu supprimer la situation de récepteur passif…qui était celle de l’enfant captant tout….sauf le sens…
.
Que faut-il faire ? Participer à des enregistrements vocaux. Ce serait déjà utile pour les générations aval….Même si la prononciation est intermédiaire – du fait de l’apprentissage de la langue écrite, qui ne reprend pas la praxis entendue (intonation, musicalité, parfois lexique), ou alors partiellement, de manière étouffée ou aplanie – , elle peut être un apport contributif très utile, en effet. Qui nous en donnera l’occasion, ou le prétexte ?
.
Curieusement – et cela va peut-être choquer - , je me dis que je ne regretterai pas les accents très forts du Poher. De toute façon on ne les entend plus, depuis longtemps. Mais une belle prononciation, avec ses harmoniques, sa rythmique et ses vibrations est un objectif nécessaire. Pas toujours atteint, ou alors imparfaitement, par ceux que l’on entend médiatiquement… Si l’oreille bretonne subsiste (rôle de la musique ?), je pense cependant que à la longue, une prononciation satisfaisante devrait être préservée ou émerger…
.
On pourrait faire une remarque analogue pour la syntaxe. Trop de néo-bretonnants, se calquant sur le français, construisent leurs phrases sur le modèle sujet - verbe-complément qui n’est pas faux en tant que tel, mais qui reste très secondaire en breton. Et je ne parle pas des « anaforennoù » et autres particularités qui font que la langue a du goût et procure du plaisir…
.
Et si je parais trop sévère, cela voudrait dire que je sous-évalue le niveau des apprenants ou pratiquants d’aujourd’hui. Quoi qu’il en soit, viser un breton de bonne qualité, pour l’usage quotidien (je ne parle pas ici des domaines de spécialité professionnelle ou scientifique), qui ne soit pas un décalque du français (phonologie, syntaxe, et même lexique) est un objectif légitime, ambitieux et nécessaire pour quiconque veut accéder pleinement aux joies de la langue…
.
Un dernier point, pour en terminer sur ces considérations. Quel que soit le niveau, il est important de pratiquer verbalement, c’est-à-dire d’humain à humain (la machine n’a rien à voir là-dedans). Hélas, et comme me le disait quelqu’un au FIL de Lorient ces jours-ci : les bretonnants aujourd’hui sont isolés, chacun dans leur coin. Il faudrait des lieux de rencontre sociale spontané, pour parler de tout et de rien. « Evit bevañ », me disait mon interlocuteur. Je ne suis pas le dernier à le constater.
.
A-dra-sur, joa a vo evit ar vrezhonegerien mod-nevez. Gant ma vo tizhet gante ur gwir varregezh. « Evit bevañ ! » , « Evit bevañ ! »

Borges
Vendredi 22 novembre 2024
«Avec l'IA, on peut sincèrement espérer des progrès pour le breton mais le contraire reste possible.»

L'IA n'est qu'un instrument...si il n'y a pas de (vrais) locuteurs de breton, pas de publications en breton, il n'y aura pas d'IA en breton.
Pour que l'IA en breton fonctionne, il faut de très nombreux textes en breton (et pas de 5 lignes), des textes qui n'existent pas sur Internet notamment. Il suffit de regarder les traducteurs en ligne (très utiles pour les personnes qui veulent se perfectionner en breton en mode loisir), le breton est très très mal représenté. L'Internet n'a pas développé la production en breton, et l'écart s'est creusé avec les langues dominantes.
Nous avons un défaut énorme de production en breton, des langues qui étaient bien plus minoritaires que le breton il y a 50 ans sont largement en avance actuellement.

Concernant l'impact de l'IA (ou précédemment de l'Internet, les deux étant liés) sur les langues minoritaires, je comprends vos réserves, j'irais même au-delà.
Prenons l'exemple très concret de Wikipedia qui produit du texte globalement sérieux, de la vulgarisation scientifique, de l'information universelle, qui est utilisé par un très très grand nombre.
Théoriquement on pourrait penser qu'il pourrait être un moyen de démocratiser les langues minoritaires, de les relier à la modernité.
Sauf que concrètement à titre personnel, les pages en breton sont d'une telle pauvreté qu'il parait inconcevable de s'en contenter. D'ailleurs il n'y a pas de pages wikipedia en breton sur à peu près tous les sujets. Donc connaitre le breton ne permet pas d'apprendre avec Wikipedia. Alors que la fonctionnalité est ouverte pourtant.

Mais ce n'est pas tout, en réalité même les pages en français font pâle figure à côté de l'anglais, c'est même de plus en plus criant avec le temps, sauf sur des sujets, personnalités strictement françaises.
Il m'arrive de plus en plus souvent d'aller directement et uniquement sur la page Wikipedia anglais, car c'est complet, contrairement au français.
Alors, j'utilise aussi régulièrement (mais pas toujours) le traducteur de cette page en anglais vers le français, une sorte d'IA finalement.
Mais cela suppose que moi-même ma langue maternelle ne soit pas l'anglais. Au final Wikipedia est un formidable outil d'unification linguistique, je n'ai jamais lu autant l'anglais qu'avec Wikipedia, alors que pourtant dans l'absolu Wikipedia en manx ou breton existe.

Pour le breton, c'est assez simple d'en tirer des conclusions par rapport au développement de l'IA : il y a un manque de données, mais même avec les données, l'IA en breton n'a d'intérêt que si les gens parlent eux-mêmes d'ores et déjà couramment le breton. Mais à quoi bon apprendre le breton si les données dans les langues plus courantes que nous maitrisons (ou qui sont notre langue maternelle) sont infiniment plus riches en ressources/informations/données ?

Ma conclusion c'est qu'en réalité la massification des données, la multiplication de l'échange de l'information avec ces nouvelles technologies nous conduisent tout droit vers le monolinguisme et non vers la diversité.
Ce n'est que la volonté des Etats qui peut actuellement freiner (mais de moins en moins) ce processus. Le breton n'a pas d'Etat.
La survie du breton pourrait à la limite passer par une forme de marginalité vis à vis de ces nouvelles technologies...parler, et utiliser le breton pourrait permettre d'être à la marge de l'algorithme et du fichage généralisé, une forme de liberté...c'est une dimension qui est à creuser, une sorte de communauté post-Internet.


Pcosquer
Vendredi 22 novembre 2024
La technologie est un leurre en matière d' humanité. A partir du moment ou on vénère un outil l'âme humaine n'existe plus dans le temps présent. L'informatique est une forme de totalitarisme basée sur «l'intelligence séduisante » que laisse supposer la conception de l'outil informatique. Il fascine et prend le rôle de «divinité» du future.
L'être humain perd le contrôle de sa vie et de son avenir en tant qu'être humain et on le lui fait perdre...
La langue bretonne ( comme chaque langue ) est le seul rempart crédible pour se protéger de l'uniformisation du mondialisme. La langue est la forme humaine la plus puissante de structuration sociale sans laquelle la communauté humaine n'existe pour ainsi dire pas ou avec peu de chance de survie. Mais ce qui est vrai pour un groupe humain l'est aussi pour l'humanité entière; L'anglais n'a de la valeur que si d'autres langues existes et cela est valable pour chaque langue. La vérité humaine ne se crée au cours du temps que par la confrontation d'idée différentes et les langues agissent comme démultiplicateur de concept tout simplement parce qu'elles sont la source d'expérience de vie différentes mener dans des milieux différents. Ces expériences façonnent les langues et les concepts qu'elles peuvent exprimer. Leurs confrontation crée une richesse de réflexion humaine à l'échelle de la planète... Encore faut-il bannir «La Méthode» qui est un carcan à l'émergence d'une réflexion véritable...
Je pense que L'IA ne pourra jamais créer cela parce qu'elle ne peut pas concevoir le rapport que l'être humain entretien avec la nature. On remarque d'ailleurs que ce rapport à la nature est dégradé pour ne pas dire combattu et pour cause...

Anti-spam : Combien font 6 multiplié par 3 ?