Les assistants personnels dotés d'intelligence artificielle parleront-ils breton ?

Point de vue publié le 6/02/24 12:41 dans Langues de Bretagne par Philippe Argouarch pour Philippe Argouarch
https://abp.bzh/thumbs/59/59103/59103_1.png
Mélanie Jouitteau : Les politiques de soutien linguistique doivent repenser leur arsenal de soutien en les organisant autour des corpus nécessaires. Elles doivent favoriser l’émergence de cellules transdisciplinaires de collaboration entre les gens qui savent coder, éduquer l’IA aux langues à corpus restreint, et les gens qui savent parler aux gens, récolter la matière langage et l’enrichir avec précision d’annotations standard.

Le développement de l’IA prépare le déploiement d'application sur données personnelles. On va avoir des assistants virtuels qui mémoriseront tout pour nous, payeront nos factures, nos impôts et s'occuperont de nos tâches administratives, voire de notre budget et de notre santé. En quoi cela présente t-il un danger pour les langues minorisées ou en voie d'extinction comme le breton ?

Mélanie Jouitteau explique précisément pourquoi ces applications d’IA sur nos données personnelles présentent un danger pour la diversité linguistique mondiale à très court terme. Comme l’intégration rapide de l’IA dans notre quotidien est inéluctable, cette réduction linguistique est inévitable vu les langues qui seront offertes et qui seront les langues majoritaires sur cette planète comme l'anglais, le chinois ou le français.

Dans le papier en PDF ci-dessous, Mélanie Jouitteau, une linguiste, chercheuse au CNRS, analyse la situation et en appelle à une mobilisation publique, industrielle, scientifique et sociétale pour que les langues humaines passent le cap. Sa conclusion est claire : «Les politiques de soutien linguistique doivent repenser leur arsenal de soutien en les organisant autour des corpus nécessaires. Elles doivent favoriser l’émergence de cellules transdisciplinaires de collaboration entre les gens qui savent coder, éduquer l’IA aux langues à corpus restreint, et les gens qui savent parler aux gens, récolter la matière langage et l’enrichir avec précision d’annotations standard. Les communautés parlantes doivent pouvoir être mises en capacité de construire elles-mêmes les ressources numériques nécessaires à leur inclusion dans les nouveaux outils. Quant aux communautés scientifiques qui produisent, traitent et travaillent les corpus, très très chers collègues, linguistes descriptivistes et formels, travailleurs de terrain, linguistes de corpus et d’élicitation, annotateurs de l’ombre et ingénieurs des architectures de données, nous avons une occasion historique de sauvegarder pour les sociétés humaines l’objet de notre recherche. C’est le moment d’être à la hauteur, et de leur montrer ce qu’on sait faire.»