Google et les langues minoritaires

Chronique publié le 6/09/18 23:19 dans Media et Internet par Philippe Argouarch pour Philippe Argouarch
https://abp.bzh/thumbs/45/45657/45657_1.png
Google paramètré avec interface en breton et résultats en anglais et en français.
https://abp.bzh/thumbs/45/45657/45657_2.jpg
L'algorithme de base de google qui tourne en permanence depuis 20 ans calculant au fur et à mesure pour chaque page le nombre de liens entrants, les liens sortants, et en loop, pour chaque lien entrant, le page rank de la page qui envoie un lien entrant vers la page évaluée. Le calcul est dynamique et perpétuel sur 130 mille milliards de pages indexées. On voit que pour évaluer une page, google doit avant évaluer toutes les pages qui y font référence et ainsi de suite.

Le moteur de recherche Google peut savoir très facilement quelles langues vous pratiquez juste en analysant les langues des mots de vos recherches ou des pages que vous visitez, mais il ne le fait pas. Même si vous pouvez paramétrer plusieurs langues parmi 45 possibles dans les résultats de recherche, votre bilinguisme ou plurilinguisme ne rentre pas dans l'algorithme de Google, une formule tenue secrète mais dont on connaît les principaux critères. A noter que le breton ne figure pas en tant que langue de résultats proposée par Google mais existe dans le groupe des langues associées au français, les pages écrites en breton sont indexées par google et sont présentées si vous tapez des mots bretons dans le moteur de recherche.

L'algorithme de Google décide, pas vous, l'importance de telle ou telle langue dans les résultats. J'ai paramétré Google pour des résultats en français et en anglais mais 90% de mes résultats sont en français.

Une exception semble avoir été faite pour la Catalogne où les résultats des recherches, faites en Catalogne, sont pour moitié en espagnol et moitié en catalan. Cherchez «Joaquim Torra» en Catalogne sur cat.google.com ou sur es.google.com et les résultats donnent la page wikipédia en Catalan et celle en espagnol, alors que Joaquim Torra est juste un patronyme sans référence à une langue ou à une autre.

On peut toutefois avoir une interface en breton, une des 150 langues proposées en option pour l'interface. Pour le breton on ajoute à l'URL l'option de la langue d'interface : google.com/?hl=br (voir le site)

Le code et le facteur humain

D'après le New York Times google a embauché environ 10 000 agents d'observations dont le rôle principal est de surveiller les résultats des recherches. Le NYT fait remarquer que cette surveillance humaine n'éliminera pas les préjugés racistes ou ethniques, culturels ou sexistes qui existeront forcement au sein de cette communauté d'observateurs.

Google ne peut éviter aussi le vice fondamental de la presse papier, c'est-à-dire ce besoin (financier) de plaire à la majorité. Pour google, ce vice est au coeur de l'algorithme. Le vice est codé dans l'algorithme. C'est un «vice» extrêmement puissant qui a éliminé tous les autres moteurs de recherches de l'époque ! Il s'appelle le PageRank. Le «rang» d'une page, un concept inventé par Larry Page et Serguey Brin, les deux doctorants en mathématiques qui ont créé Google, il y a exactement 20 ans cette semaine, est déterminé par le nombre de liens qui renvoient vers cette page. Oui la valeur d'une page est déterminée par sa popularité. On voit tout de suite les limites du concept, car comme sur les réseaux sociaux, une fakenews peut être très populaire mais n'en reste pas moins fake. L'autre limite que partage google avec le système démocratique c'est que la vérité est le plus souvent déterminée par la majorité, même si l'opinion minoritaire existe à la douzième page des résultats.

modifié le 7/09/18 à 14:30


Vos commentaires :
Naon-e-dad
Vendredi 22 novembre 2024
A ce propos, deux remarques connues des concepteurs, amis pas forcément des lecteurs ou programmeurs débutants:

. «page ranking». Ce système de «scoring» interne à Google concerne la «page» en tant que telle et pas le site internet à laquelle elle appartient, globalement. Autrement dit, Google de ce point de vue ne «voit» pas l'architecture d'un site, mais seulement un ensemble de pages individuelles. C'est du moins ce qu'enseignent les spécialistes du «référencement naturel» (l'art d'être vu sur le net).

. multi-linguisme. Techniquement parlant, Google (c'est à dire ses robots d'indexation) n'apprécie pas qu'une page soit rédigée en plusieurs langues, quelles que soient celles-ci. Il est donc prudent et important, si l'on vise une bonne visibilité de prévoir des pages monolingues. entièrement en breton, entièrement en anglais, entièrement en français,, etc... C'est d'ailleurs l'architecture très généralement constatée, y compris sur l'ABP :-).

A-hend-all, a-du on ganeoc'h. Autrement, je suis d'accord avec vous: Google pourrait ouvrir ses critères de recherche pour faciliter la vie des langues de fait minoritaires.


P. Argouarch
Vendredi 22 novembre 2024
Cette article a été réécrit, donc des commentaires qui n'étaient plus relevants au nouveau texte ont été supprimés. Merci à Émilie Le Berre et Paul Chérel pour leurs remarques.

Jacques
Vendredi 22 novembre 2024
Ce n'est pas un secret que GOOGLE est très flexible vis à vis des idéologies des différents pays...
Et sauf erreur, la République serait l'un des états intervenants le plus dans le contrôle d'internet...

Maintenant pourquoi se référer à GOOGLE?
C'est la question que je pose... si quelqu'un peut y répondre, j'apprécierai... pour comprendre...

En Bretagne, même si nous ne sommes pas les USA ni la Californie, nous avons 2 moteurs de recherche : gwenood.bzh et qwant.com.
Voir le site
Voir le site

Gwenood se veut centé sur la Bretagne et QWANT rien de moins qu'une alternative à GOOGLE (du moins au niveau du moteur de recherche).

Personnellement, j'ai configuré QWANT en breton... et du fait tout l'interface est en breton...

Plus tôt que d'analyser Google vis à vis duquel nous ne pouvons pas grand chose, ne devrait t'on pas analyser Gwenood et surtout QWANT?

J'ai découvert QWANT au moment de la censure de Breizh Atao... QWANT se refusant à cette démarche anti-démocratique j'ai changé immédiatement de moteur de recherche d'autant plus qu'il est Breton... ce n'est pas à Google de décider de ma liberté à avoir accès à un site internet et quelque soit mon opinion vis à vis de ce site...

Maintenant, je regrette que QWANT dans ses propositions de ''news/info'' soit franco centré et non britto/européo... et je ne pense pas que cela soit configurable... mais ce serait certainement plus facile d'évoquer ce sujet avec eux qu'avec GOOGLE...

Donc, plutôt que GOOGLE ne devrait t-on pas penser QWANT?

Et pour la question qui fâche... quel pourcentage de bretons et militants bretons utilisent QWANT plutôt que GOOGLE...? (dans cette réponse on risquerait malheureusement de retrouver la problématique brito-bretonne...)


Naon-e-dad
Vendredi 22 novembre 2024
@Jacques
Vous avez raison, il y a aussi, outre QWANT - j'ignorai son origine bretonne - qui est déjà assez connu, le moteur Duckduckgo:

. sa page wikipedia: Voir le site
. son site: Voir le site

En matière de réseaux sociaux et d'outils numériques, les Chinois - par ailleurs, ils ont racheté la branche PC d'IBM, il y a quelques années, pour la perpétuer et la distribuer sous le nom de LENOVO - ont fait le choix de se poser en alternative à l'existant américain.

Au final, reste à décider à qui confier un fenêtrage sur ses données personnelles: USA? Chine? République Française?...humm, humm...

Il me semble qu'une part du succède Google - ou disons son aspect pratique - est l'écosystème informatique dans lequel il baigne: en tapant une adresse, on voit arriver la carte géographique associée, etc... C'est un exemple d'avantage concurrentiel. A l'inverse la pub envahissante «ciblée», supposée attirer l'internaute, peut avoir un effet de repoussoir.

N'eo ket aes a-wechoù mont ha dont e-barzh bedig-bed an internet(pe ar rouedad) ! Evit ober ur choaj?


Jacques
Vendredi 22 novembre 2024
@ Naon e dad

«QWANT - j'ignorai son origine bretonne»

C'est l'un des problèmes majeurs du Mouvement Breton qui évoque une Bretagne ''prospère et ouverte'' à qui veut l’entendre... alors que dans les faits ils sont incapable de promouvoir les entreprises innovantes de Bretagne...

Moi même, je m'étonne toujours de toutes ces entreprises qui existent chez nous...

Nul doute que si nous étions Ecossais, Gallois ou Catalans, ces entreprises recevraient un écho tout autre qui galvaniserait leur fièreté...

Et après cela, on s'étonne que nos entreprises préfèrent communiquer sur le Made in France que sur le Made in Brittany...

Tout comme on s'étonne qu'environ 50% de nos diplômés partent en France chercher du travail alors que ces entreprises innovantes bretonnes sont obligés de recruter de jeunes diplômes Français fautes de trouver des Bretons...


Anti-spam : Combien font 0 multiplié par 6 ?