Google et les langues minoritaires

Chronique publié le 6/09/18 23:19 dans Media et Internet par Philippe Argouarch pour ABP
t:2
https://abp.bzh/thumbs/45/45657/45657_1.png
Google paramètré avec interface en breton et résultats en anglais et en français.
https://abp.bzh/thumbs/45/45657/45657_2.jpg
L'algorithme de base de google qui tourne en permanence depuis 20 ans calculant au fur et à mesure pour chaque page le nombre de liens entrants, les liens sortants, et en loop, pour chaque lien entrant, le page rank de la page qui envoie un lien entrant vers la page évaluée. Le calcul est dynamique et perpétuel sur 130 mille milliards de pages indexées. On voit que pour évaluer une page, google doit avant évaluer toutes les pages qui y font référence et ainsi de suite.

Le moteur de recherche Google peut savoir très facilement quelles langues vous pratiquez juste en analysant les langues des mots de vos recherches ou des pages que vous visitez, mais il ne le fait pas. Même si vous pouvez paramétrer plusieurs langues parmi 45 possibles dans les résultats de recherche, votre bilinguisme ou plurilinguisme ne rentre pas dans l'algorithme de Google, une formule tenue secrète mais dont on connaît les principaux critères. A noter que le breton ne figure pas en tant que langue de résultats proposée par Google mais existe dans le groupe des langues associées au français, les pages écrites en breton sont indexées par google et sont présentées si vous tapez des mots bretons dans le moteur de recherche.

L'algorithme de Google décide, pas vous, l'importance de telle ou telle langue dans les résultats. J'ai paramétré Google pour des résultats en français et en anglais mais 90% de mes résultats sont en français.

Une exception semble avoir été faite pour la Catalogne où les résultats des recherches, faites en Catalogne, sont pour moitié en espagnol et moitié en catalan. Cherchez "Joaquim Torra" en Catalogne sur cat.google.com ou sur es.google.com et les résultats donnent la page wikipédia en Catalan et celle en espagnol, alors que Joaquim Torra est juste un patronyme sans référence à une langue ou à une autre.

On peut toutefois avoir une interface en breton, une des 150 langues proposées en option pour l'interface. Pour le breton on ajoute à l'URL l'option de la langue d'interface : google.com/?hl=br (voir le site)

Le code et le facteur humain

D'après le New York Times google a embauché environ 10 000 agents d'observations dont le rôle principal est de surveiller les résultats des recherches. Le NYT fait remarquer que cette surveillance humaine n'éliminera pas les préjugés racistes ou ethniques, culturels ou sexistes qui existeront forcement au sein de cette communauté d'observateurs.

Google ne peut éviter aussi le vice fondamental de la presse papier, c'est-à-dire ce besoin (financier) de plaire à la majorité. Pour google, ce vice est au coeur de l'algorithme. Le vice est codé dans l'algorithme. C'est un "vice" extrêmement puissant qui a éliminé tous les autres moteurs de recherches de l'époque ! Il s'appelle le PageRank. Le "rang" d'une page, un concept inventé par Larry Page et Serguey Brin, les deux doctorants en mathématiques qui ont créé Google, il y a exactement 20 ans cette semaine, est déterminé par le nombre de liens qui renvoient vers cette page. Oui la valeur d'une page est déterminée par sa popularité. On voit tout de suite les limites du concept, car comme sur les réseaux sociaux, une fakenews peut être très populaire mais n'en reste pas moins fake. L'autre limite que partage google avec le système démocratique c'est que la vérité est le plus souvent déterminée par la majorité, même si l'opinion minoritaire existe à la douzième page des résultats.

modifié le 7/09/18 à 14:30


Vos commentaires :
Jeudi 2 mai 2024
@ Naon e dad

«QWANT - j'ignorai son origine bretonne»

C'est l'un des problèmes majeurs du Mouvement Breton qui évoque une Bretagne ''prospère et ouverte'' à qui veut l’entendre... alors que dans les faits ils sont incapable de promouvoir les entreprises innovantes de Bretagne...

Moi même, je m'étonne toujours de toutes ces entreprises qui existent chez nous...

Nul doute que si nous étions Ecossais, Gallois ou Catalans, ces entreprises recevraient un écho tout autre qui galvaniserait leur fièreté...

Et après cela, on s'étonne que nos entreprises préfèrent communiquer sur le Made in France que sur le Made in Brittany...

Tout comme on s'étonne qu'environ 50% de nos diplômés partent en France chercher du travail alors que ces entreprises innovantes bretonnes sont obligés de recruter de jeunes diplômes Français fautes de trouver des Bretons...

0

Écrire un commentaire :

Cette fonctionnalité est indisponible en ce moment, mais existe sur votre ordinateur.

Combien font 9 multiplié par 6 ?
Note : Ce lieu est un lieu de débat. Les attaques personnelles ne sont pas autorisées. Le trolling est interdit. Les lois contre le racisme, le sexisme, et la diffamation doivent être respectées. LES COMMENTAIRES ÉCRITS DANS UNE LANGUE AUTRE QUE CELLE DE L'ARTICLE NE SERONT PAS MIS EN LIGNE.