La Bretagne vue par l'intelligence artificielle

Chronique publié le 24/12/22 10:06 dans Culture par Jean-Pierre Le Mat pour Jean-Pierre Le Mat
https://abp.bzh/thumbs/56/56593/56593_1.jpg
autonomisme

Nous autres Bretons, nous ne pourrons pas nous tenir à l’écart de la déferlante de l’intelligence artificielle. Certes, on peut critiquer le mot choisi pour désigner cet ensemble d’algorithmes et de données. Mais n’empêche, il est intéressant de voir comment la Bretagne et les Bretons sont vus et analysés par ces «intelligences».

La plus connue des intelligences artificielles est le moteur de recherche Google. Les moteurs de recherche sont d’une intelligence à la fois limitée et influençable. Ainsi quand je tape «Bretagne», le trio de tête est la page Wikipedia, le site de la région administrative et le site «Tourisme Bretagne» de la même région administrative, avec d’ailleurs, en bas de la page d’accueil, une curieuse carte de Bretagne de 4 départements et demi. Quand je tape «nationalisme breton», les trois premiers sites sont la page Wikipedia sur le nationalisme breton, l’étude universitaire d’un chercheur inconnu et le site antinationaliste breton GRIB.

L’intelligence artificielle peut faire bien d’autres choses que des listes de sites internet. Voyons, dans ce court article, comment la Bretagne et le nationalisme breton sont vus par deux sites utilisant une véritable intelligence artificielle.

S’amuser avec l’intelligence artificielle

Le premier, le plus drôle, est le site degaucheoudedroite Les réponses sont générées par une intelligence artificielle, mais il est possible de dire qu’on n’est pas d’accord, ce qui influence les résultats ultérieurs.

Voici ce que j’ai trouvé. Le mot «Bretagne» est de gauche. «Union Démocratique Bretonne» est de gauche. «Parti Breton» est de droite. «Nationalisme breton» est de droite. «Autonomisme» est de droite et de gauche, mais «autonomisme breton» est de gauche. J’apprends aussi que «Jean Pierre Le Mat» est de gauche. Je serais curieux de savoir par quels algorithmes et quelles données piochées sur internet ils en sont arrivés à cette conclusion.

Notons que la dualité droite-gauche, qui semblait universelle après-guerre, ne l’est plus depuis la chute de l’empire soviétique, la fin des décolonisations, ainsi que la fin des Printemps arabes. Elle n’a gardé de l’importance que dans les pays de tradition catholique, en Europe et en Amérique du Sud. Ce site d’intelligence artificielle n’est donc pas multiculturel.

Éclaircir ses idées avec l’intelligence artificielle

Le second site est un site d’openAI, c’est-à-dire d’intelligence artificielle indépendante. Le concept est intéressant et nous ouvre des voies d’avenir. Il existe des systèmes d’exploitation (Linux) et des suites bureautiques (OpenOffice) qui ont été développés de manière communautaire et souvent bénévole. Ces outils sont indépendants des grandes entreprises américaines. La création d’intelligences artificielles «libres» est plutôt une bonne nouvelle.

J’utilise le site OpenAI (https://beta.openai.com/playground). Il faut s’inscrire au préalable. Il répond à des questions posées en anglais, en français ou en breton. Je n’ai pas essayé d’autres langues, mais je pense que tout est possible.

À la question «Qu’est-ce que le nationalisme breton ?», la réponse est : «Le nationalisme breton est un mouvement politique qui cherche à promouvoir l'identité culturelle et linguistique bretonne et à préserver l'autonomie et l'indépendance politique de la Bretagne. Il s'est développé à partir des années 1960 et a été un moteur de l'émancipation de la Bretagne. Il se définit par une volonté de défendre la culture bretonne, sa langue et ses traditions et de s'opposer à l'uniformisation culturelle et linguistique imposée par le gouvernement français.»

Je trouve cette réponse tout à fait sensée, même si elle ne concerne que le nationalisme breton d’après-guerre.

Deuxième question : «Quelle différence entre autonomie et indépendance ?».

Réponse : «L'autonomie et l'indépendance sont des concepts similaires qui peuvent être facilement confondus. L'autonomie est le pouvoir de prendre des décisions et de fonctionner sans l'aide ou l'influence d'autres personnes. L'indépendance, en revanche, se réfère à la capacité d'une personne ou d'une organisation à fonctionner sans l'aide ou l'influence d'un autre groupe ou pays. En d'autres termes, l'autonomie se réfère à l'indépendance à l'intérieur d'un groupe ou d'un pays, tandis que l'indépendance se réfère à l'autonomie à l'échelle internationale.»

Cette réponse est sans doute insuffisante, mais elle permet d’aborder la question hors des préjugés et des passions partisanes.

Questions en breton

Troisième question «Piv e oa Nominoë ?», la réponse est en français. «Nominoë est le premier roi de Bretagne. Il est né vers 790 et a régné de 845 à 851. Il a été le premier à unifier la Bretagne et à établir la dynastie bretonne des Ducs de Bretagne. Il a également été à l'origine de la création des ordres religieux et des premiers Monastères en Bretagne. Il est considéré comme le fondateur de l'État Breton et est célébré chaque année à l'occasion de la fête de la Saint Nominoë le 8 août.»

On peut ne pas être d’accord sur certains points, mais c’est bien résumé. J'aurais sans doute dû écrire «Nevenoe» au lieu de «Nominoë».

Quatrième question : «Petra eo ar Brezhoneg ?».

La réponse est en breton. «Petra eo ar Brezhoneg? Eo ur yezh rannyezhel eus Bro-C'hall, skrivet ivez evel Brezhoneg. Emañ ar yezh e broioù an Norzh ha Norzh-Kreiz Breizh. Ar brezhoneg a vez implijet gant miliadoù a dud er vro-se, a vez komzet ivez er c'hornaouegoù a-bezh e Breizh. Ar brezhoneg a zo unan eus ar yezhoù rannvroel ofisiel e Bro-C'hall.»

On peut se moquer du brezhoneg chimik, mais la réponse donne à réfléchir.

L’avenir de l’éducation ?

Les réponses sont certes contestables, mais elles ne sont ni subjectives ni passionnelles. L’intelligence artificielle ne les formule pas au hasard. Elle analyse des millions d’écrits et de statistiques récupérées sur l’internet, et pas seulement sur Wikipedia. Les erreurs sont inscrites quelque part sur l’internet et l’intelligence artificielle ne fait que les collecter.

Là où j’en arrive, c’est que la «culture» des nouvelles générations bretonnes va évoluer. En plus du milieu familial, les anciennes générations bretonnes puisaient leurs convictions dans les livres, dans l’exemple et le témoignage des militants, et aussi chez nos poètes, nos artistes, nos créateurs, nos entrepreneurs. Aujourd’hui, nous avons, en plus, accès à des milliers de sites internet, ainsi qu’à des discussions superficielles et souvent inutiles sur les réseaux sociaux.

Les sites d’intelligence artificielle sont de nouvelles sources d’informations, pour l’instant peu connues. Leur particularité est de donner des réponses synthétiques. On peut bien sûr les contester, je l’ai déjà dit. Mais la clarté et la concision des réponses tranche avec la subjectivité et les développements inutiles des sources traditionnelles. On ne perd pas de temps.

Que des Bretons travaillent sur ces technologies serait une bonne chose pour éclairer l’avenir de la Bretagne.


Vos commentaires :
Jack Leguen
Vendredi 22 novembre 2024
D'après le premier site que vous citez, ABP serait de gauche !

Jean Pierre LE MAT
Vendredi 22 novembre 2024
C'est vrai. Selon le site, Ouest-France est aussi de gauche. En revanche, le Télégramme et Breizh Info sont de droite...

June
Vendredi 22 novembre 2024
Gaël Fleurent c'est de gauche et de de droite
Frank Darcel c'est de gauche
Gaël Briand c'est de gauche
Mathieu Guihard c'est de droite
Rigolo

Jean Pierre LE MAT
Vendredi 22 novembre 2024
Je viens de poser à OpenAI une question qui a été d'actualité, du fait d'une exposition rennaise foireuse.
les Bretons sont-ils des Celtes?
Réponse : «Oui, les Bretons sont des Celtes. La Bretagne est l'une des régions celtiques les plus anciennes et, à ce titre, les Bretons se considèrent comme des Celtes, avec leurs propres coutumes, langue et culture. Les origines de la culture celtique en Bretagne remontent à l'âge du bronze, mais leur culture a été influencée par les Celtes des îles Britanniques, les Saxons et les Normands.»

Jean Pierre LE MAT
Vendredi 22 novembre 2024
Il ne faut pas oublier que l'intelligence artificielle analyse et synthétise un nombre de documents énorme, sans commune mesure avec ce que peut faire une équipe de chercheurs, même s'ils sont tous surdiplômés.

KLG
Vendredi 22 novembre 2024
Pays de la Loire, c'est de droite

Nantes, c'est de gauche

Angers c'est de droite

Rennes c'est de gauche

Vannes c'est de droite

France c'est de gauche et de droite

Macron, c'est de droite

Alsace c'est de droite

Sans blague...


Thomas
Vendredi 22 novembre 2024
Oui mais non.
De la même manière que google donne un score à chaque page, «degaucheoudedroite» va donner un score à chaque mot.
L'exemple de «Autonomisme» démontre bien ceci avec 0.5 à gauche 0.5 à droite mais si on y ajoute breton alors le résultat tend vers 0.6 à gauche et 0.4 à droite car breton a un score de 0.7 à gauche et 0.3 à droite ((0.5+0.7)/2=0.6 et (0.5+0.3)/2=0.4), etc
Ainsi on peut facilement truquer le score en modifiant les données entrées. Ceci est d'ailleurs une pratique très courante sur google car l'algorythme qualifie par la quantification.

De plus, comme vous le soulignez, «Les erreurs sont inscrites quelque part sur l’internet et l’intelligence artificielle ne fait que les collecter.»
Pour contrer ce problème d'erreur, il lui suffit juste de comparer les sources ce qui mettra en avant les différences et, celles-ci, seront qualifiées de la même manière (par quantification).
Les avancées grâce à ces systèmes de quantification sont bien sûr énormes par exemple, dans le domaine de la santé, et spécifiquement du diagnostic, l'ordinateur possédant une base de données sans limites pour comparer différents clichés même les plus incongrus.
De la même manière, on pourrait analyser l'ensemble des phonèmes des enregistrements d'anciens parlant bretons pour en déterminer les sonorités et ainsi se rapprocher du breton parlé avant la césure de l'après guerre.
Donc oui mais ce n'est pas de l'intelligence artificielle qui est la capacité pour l'ordinateur à résoudre de nouveaux problèmes, à extrapoler les données collectées.
Et, pour le moment, l'ia en est encore à un stade expérimental, très loin de toutes applications concrêtes.
Il y a beaucoup plus à faire dans l'optimisation des flux interhumains. Par exemple, waytome.


V. Velluire
Vendredi 22 novembre 2024
«L'exemple de »Autonomisme« démontre bien ceci avec 0.5 à gauche 0.5 à droite mais si on y ajoute breton alors le résultat tend vers 0.6 à gauche et 0.4 à droite car breton a un score de 0.7 à gauche et 0.3 à droite ((0.5+0.7)/2=0.6 et (0.5+0.3)/2=0.4), etc»

Je n'ai absolument pas compris où vous vouliez en venir. Vous confirmez plutôt la pertinence de l'algorithme là en fait...c'est tout à fait normal et cohérent que pour «autonomisme» et à «autonomisme breton» le résultat ne soit pas calculé de la même façon.


Al Coin
Vendredi 22 novembre 2024
À mon humble avis.
L'intelligence humaine/biologique, souvent bien artificielle a ses «raisons», que l«I A robotique (intelligence relative) n'a pas!

L'I.A humaine a beau jeu de traiter la seconde avec un certain mépris, mais au moins celle-ci ne juge, ne truque, mais rationalise sur les quelques seuls postulats logiques établis »et qui lui sont/seraient transmis pour être cogités«! Cogito, ergo sum? L'Homme qui ne fait que répèter ce que d'autres pensent, ou répètent eux-mêmes pensent-ils réellement? Et sont-ils donc réellement des »je suis« libres?
Si seulement la »
bio« transmet à la »méca« des arguments ou autres qui présenteraient des cohérences et réalités rationnelles, ,des comparaisons ayant logique imparable avec celle qui lui apparaitrait logiques avec des faits historiques similaires existants ou ayant existé, et présentant bien des caractéristiques identiques dans les applications sociales, culturelles et politiques, l'I.A »méca« ne peut que déduire des analyses logiques (qui toutes comme de bien entendu ne plairont pas aux braves humains, qui ont pour cela toujours de »bonnes raisons"!
De la connaissance de ces applications politiques et de gouvernances aux sociétés sur la planète, et dans diverses sociétés humaines, par l'Homme qui les aurait honnêtement dénombrées et soumises à la rigueur robotique, si cette connaissance lui est apportée pour analyse,elle ne peut qu'en retirer des conclusion logiques, sinon ne pas faire mieux que Dupont T ou D accoudé au zinc répétant les infos de la bande des quatre reines de l'info en France.


Thomas
Vendredi 22 novembre 2024
@V. Velluire
Le but était d'expliquer que le calcul est le même pour «autonomisme» et «breton et que l'ensemble est additionné pour trouver la valeur de »autonomisme breton«.
Le site utilise GPT3 et les premières »
réponses« ont été initiées par l'auteur (plus de détails ici : Voir le site
En citant l'auteur du site, pour aussi répondre à l'auteur de l'article sur pourquoi son nom est de gauche,
»
90% des nouvelles requêtes étaient les prénoms et les noms des utilisateurs du site[...]l'IA ne faisaient sûrement pas mieux que de l'aléatoire pour ce genre de proposition«.
Et autre exemple pour démontrer l'absence de pertinence de cet algo
»
si deux tiers des utilisateurs ne sont pas d'accord avec le résultat d'une recherche donnée, alors le résultat est modifié"
Il n'y a donc pas d'intelligence derrière ce bot, juste un peu de maths et l'avis des humains.
Pour compléter, les vidéos plutôt anciennes de Samuel Arzt vous démontreront à quel point l'IA est laborieuse sur des choses basiques et qu'il est à l'heure actuelle plus simple de coder directement des instructions que laisser faire la machine. Ou autre exemple, rechercher GPT3 et patient.

Jean Carfantan
Vendredi 22 novembre 2024
J'utilise l'application de openAI whisper pour transcrire du français ou de l'anglais, de l'oral à l'écrit. C'est pratique pour transposer des conférences ou des notes dictées. À quand pourra-t-on ajouter le breton?
Voir le site

Naon-e-dad
Vendredi 22 novembre 2024
Peut-être est-ce l’occasion de réfléchir un peu.
.
Basiquement, un ordinateur sait faire trois choses :

. comparer deux quantités
. copier (et donc déplacer) du contenu
. additionner (en binaire), et de-là soustraire (par une astuce technique), multiplier, diviser, porter une puissance n , etc…
.
Apparemment, nous sommes dans le domaine de la simple arithmétique. Pourtant, si l’on attribue par convention un caractère alphabétique ou spécial à une valeur binaire (code EBCDIC en IBM, codes ASCII ou ASCII étendu dans l’univers PC) on peut manipuler des chaines de caractères, autrement dit du texte (correspondant à une langue naturelle : english, français, brezhoneg, etc…). La machine est-elle pour autant rentrée sur le territoire de l’intelligence ? Evidemment non. Un mot est considéré de l’extérieur comme un objet. Il est possible de comparer deux mots (sont-ils identiques ou non ?), et donc faire du classement, des recherches, des rapprochements textuels, etc… Rentrer dans la sémantique ou la compréhension est tout autre chose.
.
Ces actions sur des contenus « mémoire » ou données sont mises-en-oeuvre par des « instructions », qui peuvent être très simples ou plus complexes… Un « langage » n’est rien d’autre qu’un catalogue d’instructions, un répertoire dans lequel le programmeur-concepteur puisera pour rédiger un programme (un algorithme).
.
Les langages sont classés selon une typologie qui va du plus proche de la machine au plus proche de l’humain :
. langage binaire (suite de 0 et d e1, strictement illisible, qui s’exécute sur le processeur)
. langage de type assembleur (Assembleur 370 IBM, assembleur 86 sur processeur Microsoft,..). Le spécialiste peut déjà intervenir.
. langage « évolué » (Cobol en gestion, C,…). Accessible à l’informaticien développeur, généraliste.

Jusqu’ici, le cheminement des actions (l’algorithmique) est conçue et maitrisée par l’humain, auteur du programme informatique. Nous sommes dans le domaine de l’informatique « procédurale », classique.
.
La machine est-elle intelligente, au sens où l’on parle d’intelligence humaine ? Evidemment non. Par contre, elle est plus performante que l’humain. C’est même tout son intérêt que de « traiter » rapidement des séries de données. Pour une opération unitaire, quelle qu’elle soit, autant tout faire soi-même à la main. L’informatique ne se justifie que si une certaine volumétrie est en jeu.
.
. plus récemment se sont généralisés les langages « à objets », utilisés dans la programmation internet
.
L’on franchit encore un degré dans la généralité. Le cheminement (de programme en programme, ou de macro-instruction à macro-instruction) et la transformation du jeu de données initiales, dépend lui -même des transformations ou résultats intermédiaires. Cependant, il est important de garder en vue que derrière l’apparente complexité, in fine c’est toujours la simplicité qui règne.
.
Y-a-t-il une once d’intelligence dans la machine ? Comprend-elle quoi que ce soit à ce qu’elle fait ? Toujours pas. Et ce n’est pas demain la veille ni l’avant-veille.
.
Tout cela est utile et suscite l’admiration, et nous amène vers des possibles insoupçonnés jusqu’alors. Fabuleux ou tristes jusqu’à l’insondable, c’est selon ce que nous déciderons d’en faire. Comme pour l’atome. Le meilleur ou le pire. Voilà notre responsabilité. Et voilà pourquoi il vaut mieux réfléchir, un peu, avant.
.
Pour en revenir aux résultats proposés dans l’article. Le résultat est assez impressionnant. Cependant, les phrases fournies en réponse (même si elles proviennent d’assemblages divers) ont été rédigées à un moment ou à un autre par une intelligence humaine (bizarrerie ou maladresse syntaxique comprise : « Eo ur yezh rannyezhel »).
.
A propos, où en est l’ambitieux projet d’un traducteur français-breton ? Je crains le pire, ou plutôt je crains que l’on aboutisse à du breton qui structurellement ne serait que du français déguisé, à peine colorié (comme on le voit parfois dans de médiocres traductions réalisées par des gens qui peinent à changer de schéma d’expression et restent mentalement dans le français, plus familier sans doute). Mais traduire, c’est prendre le risque de se déplacer vers un autre territoire. C’est gambader vers une autre expression de soi-même, ce n’est pas mimer le voisin. La part d’originalité doit être défendue, utilisée, vivifiée. Gant ma chomo bev ha dispar, evit gwir, hon brezhoneg.
.
Setu. Bravig eo ar stlenneg. Galloudus eo an urzhiater. Padal…chom a ra den an den. Chom a ra mekanik ar mekanik.
.


Thomas
Vendredi 22 novembre 2024
Le breton est présent dans tokenizer.py mais la documentation ne l'inclue que dans la partie traduction, pas dans la partie reconnaissance (avec 269 heures?).
Avez vous essayez «--language br» ?
A titre d'autre exemple, le package de Common voice de mozilla en est quand à lui à 42% avec 26k heures enregistrées dont 16k validées.
Vous pouvez aussi créer votre propre transcripteur avec, par exemple, DeepSpeech.

Jack Leguen
Vendredi 22 novembre 2024
Dans votre analyse de l'IA je suis surpris que vous ignorez complètement le deep learning...

Jean Pierre LE MAT
Vendredi 22 novembre 2024
@Jack Leguen
Mon article ne visait pas à décrire les évolutions autour de l'informatique, mais à voir comment la Bretagne et les Bretons sont analysés par deux intelligences artificielles «libres»..
Le deep learning, les réseaux neuronaux, le machine learning sont des révolutions technologiques qui permettent aux machines d'apprendre et non plus seulement d'utiliser les données et les algorithmes de départ. C'est vrai qu'il serait intéressant de voir comment une machine pourrait «apprendre» la Bretagne...

Naon-e-dad
Vendredi 22 novembre 2024
@Jack Leguen

Merci pour votre remarque, stimulante.
.
On pouvait comprendre de mon message que je n’appartiens pas aux générations actuellement à l’œuvre en entreprise.
Néanmoins la réflexion sur l’IA, et les avancées techniques ne se déploient que très progressivement et sur le temps long.
.
Une piste : interroger google avec ces mots-clés : « test Turing ». Ce dernier, pionnier de la réflexion informatique avait imaginé le test suivant : placer un sujet humain face à un vis-à-vis, masqué par un rideau, qui pouvait être soit un humain, soir une machine. L’exercice consistait en échanges, assez rudimentaires, au terme desquels le sujet humain devait décider si son partenaire caché était une machine ou un humain. Si le sujet humain était incapable de décider, ou qu’il se trompait dans sa décision, on en concluait que la machine était « intelligente » puisqu’elle avait réussi à leurrer l’homme. C’est celà qui était enseigné aux étudiants en informatique à une époque. Je parle au passé, parce qu’aujourd’hui, et malgré les avancées spectaculaires de la machine, on est devenu beaucoup plus prudent. Pourtant, certains (recherche google, mots-clés « deep learning ») s’obstinent dans ce type de conclusion à savoir qu’une machine peut être déclarée « intelligente ».
.
Quel est l’enjeu de l’IA ? Obtenir par le biais d’une machine – tant qu’à faire plus rapidement et plus efficacement encore – des résultats jusqu’alors obtenus par une intelligence humaine. A ce titre, on pourrait considérer que la calculatrice de Pascal (1645), laquelle exploite mécaniquement les avantages de la numération positionnelle, système simple, fruit du génie humain - les Romains eux-mêmes n’en avaient pas eu l’idée, tout au plus l’avaient-ils (insuffisamment) pressenti - , est une machine « intelligente ». Pourtant, elle précède largement l’ère informatique.
.
Où veux-je en venir ? Il est possible – c’est même ce que l’on espère - que les recherches en informatique et en neurobiologie permettent de mieux circonscrire le domaine de l’« intelligence humaine », voire de comprendre certains aspects de son fonctionnement. Ou pour le dire autrement, que l’on parvienne à détecter ce qui dans l’intelligence humaine peut être externalisé et reproduit par automate (cf le calcul de la machine de Pascal). De là à rêver, de façon démiurgique, d’un hypothétique « Golem », cette figurine de la culture juive (cf aussi le Psaume 139) qui reste à animer, il y a un pas que je ne franchirai pas, qu’en tout cas personne à ce jour n’a franchi. Si Adam est sorti de la terre (c’est là l’étymologie et le sens du mot Adam), cela signifie qu’il est (et reste) une créature, et non pas le divin Créateur. Il n’y a d’ailleurs et au fond qu’un seul «péché » capital ou « ratage » chez l’humain, c’est de se tromper dans ce jeu de rôle grandiose et de se prendre pour Dieu, comme les dictateurs nous en administrent la preuve tout au long de l’Histoire, jusqu’à aujourd’hui (Poutine, en Russie). On voit le résultat : mensonge et crime, à tous les étages.
.
On pourrait s’interroger sur le fait qu’une partie du vocabulaire technique informatique soit anthropomorphique : « langage », « lire », « écrire », « connaissance » (base de connaissances) ou « cognitif », « intelligence » (IA), « apprentissage » (deep learning, que vous citez).
.
Benoit XVI / Benead XVI (e brezhoneg) qui vient de mourir hier, 31 décembre 2022, est un penseur majeur dans la pensée chrétienne, par la clarté de son style et la profondeur de sa réflexion. N’est-il pas prophétique qu’il se soit particulièrement intéressé à la thématique « Foi et Raison ? Il pourrait (devrait ?) être lu par les théoriciens et professionnels de l’informatique.
.
Hag evit echuiñ, un notenn diwar gerioù zo :
.
. « réalité » e galleg, (diwar al latineg « res » hag a dalv « chose », da lâret eo « tra »).
. « gwirvoud » e brezhoneg (diwar ar brezhoneg « gwir », ha marteze « boud » pe « bout », me ne ouian ket ?)
.
Kit da vurchal e-barzh ho keriadur. Réalité (e galleg) = Gwirvoud (e brezhoneg). Peadra da brederiañ, n’eo ket ta ?

A galon, hag ur « Bloavezh mat » d’an holl , evit 2023!


Gweltaz DG
Vendredi 22 novembre 2024
Bonjour,
L'adaptation de ces technologies pour le breton est déjà en cours.
L'office public de la langue bretonne fait développer des modèles de synthèse vocale, reconnaissance vocale et traduction automatique (dans les deux sens) qui dépassent largement les résultats obtenus par les technologies précédentes.
De mon côté je travaille également (bénévolement) sur un modèle pour la reconnaissance vocale en breton. Vous pouvez déjà le tester le prototype ici ( Voir le site
Il n'est pas encore assez efficace pour être utilisé sur des vraies tâches mais ça peut donner une idée.
Le problème est le manque de données alignés (audio/texte) pour la langue bretonne.
On peut contourner le problème en utilisant des modèles pré-entraînés sur un tas de langues différentes, puis l'adapter au breton avec peu de données (c'est le cas du modèle Wav2vec 2.0 de Facebook, par ex).
Je n'ai pas bien compris le message de Thomas ni à quoi correspondent les nombres d'heures et les pourcentages qu'il donne mais je peux affirmer que créer son propre transcripteur n'est, pour le moment, pas une tâche à la portée de tout le monde ! :D

KLG
Vendredi 22 novembre 2024
Ouest-France, Intelligence Artificielle, Nantes en Bretagne ? : Voir le site

LE MAT Jean Pierre
Vendredi 22 novembre 2024
@KLG
Nantes en Bretagne? La réponse varie selon que l'on prend un point de vue administratif , historique ou national. L’IA passant en revue le maximum de documents présents sur internet, si on ne précise pas la demande, la réponse sera d’abord administrative, compte tenu du nombre de documents administratifs. Si on veut une réponse d'un point de vue historique ou national, il faut le préciser. l'IA, comme tous les outils, ne sera utile que pour ceux qui sauront l'utiliser efficacement.

Anti-spam : Combien font 8 multiplié par 2 ?