Pourquoi la section recherche de Google essuie-t-elle une vague de critiques sans précédent ?

Cette semaine, nous vous proposons quelque-chose d’un peu particulier. Il s’agit de la traduction d’un article du site Search Engine Land, un des piliers outre-Atlantique en matière de référencement web. Particulièrement convaincant, il pointe du doigt les problèmes actuels de Google. En effet, ce-dernier essuie depuis plusieurs mois d’énormes critiques tous azimuts concernant ses capacités à fournir des résultats pertinents. L’auteur, Danny Sullivan, vous propose une immersion dans l’une des plus grosses crises de confiance du géant californien…

Une profonde analyse sur la plus grosse crise des résultats de recherche de Google

Ces derniers mois, la réputation de la section recherche de Google a pris un grand coup. Longtemps considérée comme étant la référence dans la recherche sur Internet, Google a vu ses résultats remis en cause comme jamais auparavant. C’est une claque pour un service qui se devait d’être irréprochable, au moment où Google se tourne vers de nouveaux horizons. Se relever d’un tel fiasco n’est pas évident. Ce qu’il se passe pour la recherche de Google est comparable aux problèmes de l’Apple Maps ou à l’explosion des Galaxys Note 7 de Samsung.

Encore aujourd’hui, les gens continuent de faire des blagues sur Apple Maps, quand bien même le service s’est retrouvé grandement amélioré. Samsumg n’est pas en reste, leurs téléphones n’explosent plus mais les blaguent continuent de plus belle. Google se confronte désormais au même problème. Certains résultats de recherche sont, au mieux drôles, souvent embarrassants, quand ils ne sont pas dangereux.

Comment Google est-il sorti de son sillon ?

En novembre dernier, Google s’est retrouvé entraîné au sein des problèmes de fausses informations de Facebook, lorsqu’en haut de ses résultats dans la section “Dans l’actualité”, le moteur a listé une page qui promettait les résultats définitifs de l’élection présidentielle de 2016 (Note du traducteur – NDT : aux USA). Cette page n’avait pas le comptage des résultats finaux, ni même un chiffrage très précis.

Résultats de Google : Final votes

Le mois suivant, en décembre, Google a pris un autre coup après qu’un article du Guardian ait mis en évidence comment, pour certaines recherches, Google se donnait à des réponses souvent déroutantes. Par exemple, voici que Google Home Speaking se mettait à nous expliquer que les femmes possédaient un certain niveau de débauche et qu’elles incarnaient le Mal.

Une semaine plus tard, le Guardian était de retour, soulignant comment Google déniait que l’holocauste eût existé en proposant, en haut de ses pages de recherche, des résultats comme “did the holocaust happen” (NDT : est-ce que l’holocauste s’est produit).

Résultats de Google : Did the holocaust happen ?

Cela n’est toujours pas retombé dans l’oubli quand le mois dernier (NDT : début mars 2017), Google se retrouvait à annoncer que l’ancien président Barack Obama prévoyait un coup d’état.

Et il ne s’agit que de quelques “extraits” présentés ou de “vraies fausses réponses” apparaissant en haut des résultats de recherche de Google.

Il y a moins de deux semaines, Google s’est attiré d’autres critiques lorsqu’il a mis en avant le site Breitbart (NDT : un site très controversé d’extrême droite, favorable à Donald Trump) pour une recherche sur la science.

D’ailleurs, ce n’est pas ce qu’il s’est vraiment passé. J’y reviendrai plus tard. Mais cela n’aide clairement pas à endiguer les réactions du type WTF Google ? (NDT : c’est quoi ce bordel avec Google ?). En effet, ces réactions se produisent parce que Google a perdu la confiance qu’on lui avait accordé à lui demander tout et n’importe quoi et à détenir en retour la bonne réponse. Les résultats de Google pourraient être meilleurs que jamais. Ils sont mêmes très certainement meilleurs que jamais. Mais si le public a une perception différente et s’il pense que Google a un problème avec ses résultats, alors cette opinion deviendra la réalité. Pour la bonne raison que nous n’avons aucun chiffre à donner concernant leurs pertinences.

Nous n’avons aucune évaluation des moteurs de recherche

Nous ne savons pas quel moteur de recherche a les meilleurs résultats. Il n’existe aucun organisme tiers indépendant habilité à constamment évaluer les résultats. Nous recueillons tout au plus des enquêtes de satisfaction des consommateurs, mais celles-ci n’essaient pas de vérifier que les utilisateurs sont eux-mêmes en capacité d’évaluer la qualité des résultats.

Sans données qualifiées, Google a acquis la réputation d’être le meilleur moteur de recherche, tout simplement parce qu’au tout début, il était facilement démontrable qu’il offrait de meilleurs résultats que les autres. Mais dès lors que ces-derniers ont rattrapé leur retard, tout était fini. Les gens ont arrêté d’employer le terme de moteur de recherche pour s’orienter vers de nouveaux mots comme “Googling” (NDT : Googler), Google étant vu comme le meilleur et le plus sérieux moyen d’avoir une information. En 2003, dans les colonnes du New York Times, Thomas Friedman se demandait même si “Google est Dieu ?” (NDT : Is Google God?).

Le seul vrai challenger de Google ces dernières années aura été Bing, moqué dès le départ en tant que concurrent crédible au géant californien. Il faut dire que Bing n’a pas aidé à faire taire les critiques en espionnant les résultats de Google pour mieux les copier dans ses propres résultats. De toute façon, Google était incontesté. Google était le meilleur. N’importe qui dans le référencement web ou chez les spécialistes du marketing savait que ce n’était pas forcément le cas. Google avait des faiblesses. Mais nous sommes une niche d’acteurs dont le discours est rejeté. Il faut que quelque-chose émerge parmi les gens “normaux” pour amocher la si belle réputation de Google. Et il n’y a pas eu tant d’occasions que ça.

Google et ses précédents défis en matière de recherche

En 2003, Google était sous le coup des critiques après que ses résultats aient été “googlebombés”, dans le but de faire apparaître en tête des recherches pour la requête “miserable failure” (NDT : échec minable) la biographie de George W. Bush. Mais il ne s’agissait pas d’une crise majeure pour l’entreprise. En effet, Google l’a vu comme une priorité si faible qu’il aura mis 3 ans pour déployer un correctif.

Une bien plus grosse crise aura lieu en avril 2004, lorsque le site anti-juif Jew Watch apparaîtra en tête des recherches de Google pour la requête “Jew” (NDT : Juif). Il y aura d’ailleurs de nombreuses plaintes pour qu’il soit tout bonnement supprimé des résultats de recherche. Google décidera d’envoyer un message de rassemblement plutôt que d’exclusion en choisissant de publier une clause de non-responsabilité en parallèle à ces résultats, qui changeront avec le temps. Par la suite, le problème sera balayé d’un revers de la main.

En août 2005, Google a pris un petit coup au moral lorsque Yahoo s’est enorgueilli d’avoir réussi à indexer plus de pages. Dans un monde sans estimation de la qualité des résultats pour mesurer les performances d’un moteur de recherche, le nombre de pages est souvent vu comme un indicateur proche. Aussi insignifiant qu’ait pu être ce chiffre, Google est entré en état d’alerte rouge pour ensuite annoncer un mois plus tard qu’il avait de nouveau dépassé Yahoo – et que dorénavant, il ne considérait plus le nombre de pages indexées comme une variable.

Selon moi, le challenge le plus sérieux qu’est pu rencontrer Google jusqu’à présent est survenu le 1er janvier 2011. Dans les semaines précédentes, il y a eu quelques plaintes concernant des fermes de contenu qui utilisaient les résultats de Google dans l’unique but de répondre aux questions de la vie de tous les jours. C’est alors que le 1er janvier 2011, Vivek Wadhwa publia un article sur le pourquoi un meilleur Google était “désespérément” nécessaire.

Cet article, d’une condamnation outrancière, visait le degré de qualité des recherches de Google en soutenant l’idée qu’il n’existait aucune mesure fiable. Google répondait pourtant avec succès à des centaines de millions de recherche par jour, dans le cas contraire ses utilisateurs seraient allés voir ailleurs. Et ce n’était pas le cas. Mais l’article de Wadhwa entrait en résonance avec d’autres bloggeurs technos très influents qui arguaient que pour de nombreuses raisons, ils ressentaient que Google avait un problème de taille.

De nouveau, Google entra en alerte rouge. En l’espace de deux mois, il lancera ce que l’on appellera plus tard la mise à jour Panda, dont le but principal est l’éradication des fermes et du contenu de piètre qualité. Les gens normaux se sont alors détendus, considérant que tout avait été réglé. Pendant ce temps, les référenceurs et autres professionnels du marketing ont relevé que, pour endiguer le problème, Google avait dû déployer pas moins d’une trentaine de mises à jour en l’espace de 4 ans.

Le nouveau défi de Google : la réputation de ses recherches

Les crises passées ne sont rien au regard de ce qu’il se joue aujourd’hui. Désormais, Google est régulièrement confronté à la qualité de ses résultats de recherche, souvent avec relativisme et légèreté, parfois avec de foncières inexactitudes caractérisées par des faits. Par exemple, le Guardian a fait un travail fantastique en mettant sur le devant de la scène des problèmes très sérieux relatifs à Google. Mais leur article a également fait mention, en décembre dernier, du fait que Google encourageait systématiquement les tendances venues de droite.

Ce n’est pas la vérité. Si vous souhaitez comprendre en détails pourquoi c’est faux, je vous encourage à lire mes explications à la fin de cet article. La réalité, c’est que Google a des problèmes qui peuvent sembler favoriser les sites extrêmes de tout bord. Les journalistes du Guardian n’ont tout simplement pas pris la peine de contrôler leurs sources d’informations et de voir au-delà des sites de droite. Il faut aussi prendre en considération le problème mentionné plus tôt, lorsque Google a listé parmi 3 autres brèves le site Breitbart pour la recherche “great barrier reef” (NDT : grande barrière de corail). A la suite d’un tweet, des questions légitimes ont été soulevées quant à savoir si Breitbart devait être considéré comme étant une source d’actualités scientifique. Mais ce qu’il manque, c’est surtout une analyse du problème.

Au lieu de ça, Gizmodo a condamné Google pour avoir fait apparaître Brietbard comme résultat de recherche pour des termes liés à la science du climat, puis déclaré en gros titre : “Google affirme que son travail est de promouvoir les théories conspirationnistes sur le changement climatique”. Rien de ce qui est dit n’est la vérité. C’est même totalement ironique. Google a été attaqué pour savoir si il fait oui ou non son travail en présentant des informations factuelles par des articles qui rencontrent eux-mêmes d’autres problèmes factuels.

Google : une analyse sur les prétendus échecs

Une recherche avec les termes “great barrier reaf” n’est pas nécessairement une recherche sur la science, tout comme une recherche avec les termes “climate science”. Il est possible que ce soit la recherche d’un lieu. D’une information scientifique. D’une information touristique. Voire d’une information commerciale sur la région. Ils veulent peut-être une carte. Google n’a aucune manière de connaître l’intention derrière cette démarche. C’est la raison pour laquelle il propose une grande variété de résultats, certains relatifs au tourisme, d’autres relatifs à la science du climat. Ces résultats incluent des pages provenant de trois sources majeurs et généralement respectables, à savoir : CNN, le New York Times et le Guardian, qui disent que la Grande Barrière de corail est majoritairement morte, ou qu’elle subit des pressions (NDT : de la part de l’Homme) mais qu’elle n’est pas encore morte, ou qu’elle n’est pas morte du tout :

Résultats de Google : Great Barrier Reef

(Ces différents titres proviennent tous du même rapport indiquant que la Grande Barrière de corail a de sérieux problèmes. Mais comme de nombreux articles ont réagi à ce rapport initial en disant que la Grande Barrière était morte, les chercheurs et autres tours opérateurs se sont mis à nuancer ces propos, causant ainsi une flopée d’histoires sur la prétendue agonie et mort ou non de cette Grande Barrière.)

Lorsque les gens font une recherche sur quelque-chose, ils peuvent aussi vouloir connaître les actualités récentes ou les informations relatives à cette chose. C’est pour cette raison que Google a un encart “Les meilleures histoires”. Et pour cette recherche, c’est la même chose. Les personnes qui font une recherche avec les termes “great barrier reef” ne veulent pas nécessairement des informations scientifiques. Google leur propose donc une variété d’actualités toutes différentes les unes des autres. Le jour où ce problème est sorti, il y avait des actualités concernant le niveau de stress que subit actuellement la Grande Barrière de corail. Breitbart a commenté l’information. Ça peut arriver d’être en première position

Cet article n’était pas épinglé en permanence comme le suggérait Gizmodo. L’encart changeait à mesure que l’information évoluait. Ce n’était pas non plus une nouvelle concernant une recherche sur la science, comme précédemment expliqué. Et non, Google n’a pas dit que cet article avait été placé là pour promouvoir des idées conspirationnistes sur le changement climatique. Google a communiqué sur le fait qu’il s’agissait d’une conséquence de la pluralité des actualités – ce qui, en général, on est en droit de rechercher d’un moteur de recherche. Si tant est que vous souhaitiez allé plus loin dans l’analyse de ce problème, reportez-vous à certains de mes commentaires Twitter. Mais les faits importent peu dans cette quête d’une meilleure réputation des résultats de recherche de Google. La machine à calomnies tourne à plein régime.

Après tant d’échecs, j’ai tendance à dire que beaucoup de monde n’en ont rien à faire des faits et des questions importantes sur la recherche, y compris comment la censure pourrait avoir un effet néfaste sur celle-ci. Ces personnes voient juste Google se prendre à nouveau les pieds dans le tapis et s’ajoutent à la grogne générale. Ils disent : réglez le problème !

Google a bien des problèmes qui méritent d’être réglés

Ne me faites pas dire ce que je n’ai pas dit. Google mérite des critiques pour certains problèmes. Quand bien même pour quelques-uns d’entres-eux il puisse exister des raisons sous-jacentes qui tendent à les relativiser, cela n’excuse en rien le fait que Google se doit de prendre des mesures correctives. Voici quelques éléments qui pourraient être améliorés.

Suggestion de recherche / auto-complétion : En février, Google a commencé à tester une fonctionnalité permettant à des personnes de signaler des suggestions offensantes et a promis d’améliorer les suggestions dans leur ensemble. Mais pratiquement deux mois plus tard, on peut constater que l’outil n’a toujours pas été déployé dans sa totalité. Encore aujourd’hui, il est facile de trouver des suggestions que d’aucuns trouveraient offensantes.

Résultats de Google : Why are Republicans... ?

Résultats de Google : Why are Democrats... ?

Ces recherches concernent les parties politiques comme les Démocrates ou les Républicains, mais croyez-moi, vous pourriez facilement trouver des choses similaires à propos de la race, des ethnies et des orientations sexuelles. Tout cela continuera tant que Google proposera des suggestions de recherche, qui pour rappel sont basées sur les volumes de recherche des utilisateurs. Avec le temps, peut-être ces volumes se trouveront-ils réduits. Mais avec une telle quantité de choses à rechercher, vous ne pouvez pas tout régler. Tout comme Bing, d’ailleurs :

Résultats de Bing : Why are Republicans... ?

Résultats de Bing : Why are Democrats... ?

Google a besoin de cet outil le plus rapidement possible, afin de couper court à tous ces propos offensants. Il faut aussi envisager d’éliminer les suggestions sur la version ordinateur, car ils ne sont pas aussi nécessaires que dans leur utilisation sur mobile. Il doit veiller à augmenter les moyens de filtrer les suggestions offensantes. C’est un problème qui dure depuis au moins 6 ans. Google se doit d’en faire plus.

Les extraits enrichis (ou Featured snippets) : Google pourrait, et même devrait, supprimer les extraits enrichis sur la version ordinateur, car ils ne sont pas nécessaires. Cela encouragerait les utilisateurs à évaluer la véracité d’une réponse sur un panel de résultats au lieu de simplement se fixer sur une seule réponse qui, en définitive, pourrait s’avérer fausse. En revanche, il est beaucoup plus difficile de supprimer les extraits enrichis pour Google Assistant et Google Home parce que ça marche – et ça marche même souvent. Ils ont une capacité distincte a être mis au devant d’autres systèmes comme Siri d’Apple ou Alexa d’Amazon.

Google espère qu’avec son annonce du mois dernier, impliquant notamment des évaluations de pertinence de la qualité, il rendra le contenu douteux et discutable moins susceptible d’apparaître dans ses résultats de recherche. Encore que cela ne saura empêcher un site comme Quora, qui en règle générale est indiscutable, de proposer des réponses farfelues comme lorsqu’on lui demande qui a inventé le travail à domicile :

Résultats de Google : Who invented homework ?

Cette personne n’existe pas et n’a pas inventée le travail à domicile, mais puisque cette page semble proposer une réponse à la question, Google l’a jugée pertinente. Tout comme Bing, je l’avais d’ailleurs noté le mois dernier. Depuis, Bing a fait le choix de changer de partenaire en utilisant son service Bing Distill, où des volontaires essaient de répondre aux questions :

Résultats de Bing : Who invented homework ?

C’est mieux, mais ce n’est pas une solution qui pourrait évoluer sur le long terme et régler tous les problèmes. Les utilisateurs veulent une réponse rapide quel qu’en soit le sujet. Plus un moteur de recherche essayera de comprendre toutes les questions, plus il est probable qu’il fasse des erreurs pour des questions très peu fréquentes ou qui n’auraient pas lieu d’être.

La solution médiane serait que nos assistants vocaux puissent faire un meilleur travail en insistant sur le fait qu’il font “la meilleure estimation possible” (NDT : de la réponse proposée) tout en nous encourageant à chercher d’autres réponses. Cela pourrait nous impliquer, en tant que chercheurs, pour nous faire comprendre qu’il n’y a pas toujours une vraie bonne réponse à tout et que nous devrions être un peu plus critique à propos des réponses qui nous sont proposées, en cherchant encore plus s’il le faut.

La qualité de la recherche : Outre la présentation d’une réponse dans l’encart des extraits enrichis, Google a un problème quand il propose en premier résultat de recherche des contenus offensants ou quand les résultats rencontrent des problèmes, comme c’est le cas pour des recherches sur le fait de savoir si l’holocauste s’était bien produit. En décembre, Google a déployé dans la foulée un algorithme corrigeant ce problème. Cela a eu pour conséquence de rapidement changer les résultats de la requête sur l’Holocauste. Cette modification a aussi aidée à régler d’autres problèmes, en ce temps j’ai d’ailleurs écris un article sur le sujet. Les données provenant de source d’évaluation de la qualité peuvent permettre d’aller dans le bon sens.

Cependant, Google ne pourra pas éliminer tous les résultats plus ou moins discutables. Inévitablement, quelqu’un tombera sur quelque-chose qui sera faux. La vraie question sera alors de savoir si ce sera vu comme étant une défaillance de Google parce qu’il n’en aurait pas fait assez, ou parce que Google ne peut pas répondre correctement à tout ce qu’on lui demande.

Les meilleures histoires : Le problème des fausses nouvelles ou du contenu douteux apparaissant dans l’encart “Les meilleures histoires” de Google est imputable à ce-dernier. Google a délibérément choisi d’autoriser les publications au-delà des restrictions depuis octobre 2014. C’est la raison pour laquelle ces faux résultats d’élection sont apparus à cet endroit. Changer le nom de la section de “À la une” à “Les meilleures histoires” en décembre dernier n’aura finalement rien réglé.

Tout comme le retour à des sites vérifiés ne résoudra pas le problème Breitbart. Breitbart est un site vérifié et admit par Google News. Le seul moyen pour que le contenu n’apparaisse pas dans l’encart serait de tout simplement bannir le site de Google News. Certains seront d’accord avec ça, d’autres plaideront – arguments à l’appuie – qu’un des seuls sites proposant une interview en tête-à-tête avec le président Donald Trump est en droit d’avoir sa place en tant que source d’actualités.

La recherche ne sera jamais parfaite

Pour conclure, il est bon que Google traverse une crise sur la qualité de ses recherches. Cette piqûre de rappel le force à régler des problèmes qui ne devraient plus avoir lieu. Toutefois, il n’est pas dit que Google arrive à régler son plus gros problème : le flot de critiques inhérent à son énorme catalogue et qu’aucun moteur de recherche ne pourra jamais complètement étouffé. Google sert 5.5 milliards de recherches par jour. Par jour ! Des milliards de recherches, avec 15 % de recherches entièrement nouvelles, dont les termes n’ont jamais été utilisés avant. Google essaie de répondre à ces questions en produisant des réponses grâce aux milliards de pages web dans son catalogue. C’est une tâche impossible que d’avoir toujours réponse à tout, tout le temps.

En prenant n’importe quel terme, vous pourriez tomber sur des pages de résultats au contenu douteux voire répréhensible. Ce n’est pas quelque-chose de nouveau, comme le dénombre les précédentes crises de qualité de la recherche chez Google. Au plus le nombre de contenus douteux s’ajoute, au plus les gens sont en mesure de vérifier si un tel contenu se trouve dans les résultats de recherche. Une tâche impossible, quand bien même la lutte pour la perfection demeure cruciale.

Dylann Roof, reconnu coupable du meurtre de 9 personnes lors d’une tuerie dans une église de Charleston, est un exemple de l’importance d’une telle situation. Roof a déclaré avoir fait une recherche Google pour en apprendre plus à propos des crimes des Blancs à l’encontre des Noirs. Et que le premier site qui lui a été proposé fut un site suprématiste blanc qui l’aurait convaincu à commettre ces meurtres, comme le raconte cette histoire du NPR. Google ne référence plus ce site dans la première page de ses résultats de recherche. Ce n’est en revanche pas le cas de Bing, à l’heure où j’écris ces lignes. Je soupçonne que même si les résultats de recherche de Google n’avaient pas présentés ce site, Roof aurait continué à chercher jusqu’à tomber sur une information confirmant le parti pris qu’il avait déjà. Une autre partie de son “manifeste” qui défend la haine du noir provient de ce qu’il appelle “sa propre expérience” et non des recherches qu’il a fait sur Google.

Mais passons. Obtenir des résultats aussi justes que possible, même si cela peut sembler impossible. La recherche, c’est difficile. Par le passé, le grand défi des ingénieurs de la recherche était de lutter contre le spam qui permettait alors de s’octroyer des positions élevées dans les pages de recherche. Désormais, ils doivent faire face à la “post-vérité”, où les pages qui semblent fournir des informations factuelles et sommes toutes véridiques peuvent en fait cacher n’importe quoi.

Il nous faut continuer à tirer vers le haut les moteurs de recherche et en particulier Google, tout en soulignant lorsque ceux-ci font fausse route. Mais nous devons aussi comprendre que la perfection n’est pas de ce monde. Qu’avec des moteurs de recherche imparfaits, il va nous falloir déployer plus de compétences et de réflexions critiques pour les recherches que nous effectuons – et pour les choses que nous enseignerons à la génération future. La vie elle-même propose rarement “une seule vraie réponse” à tout. Espérer d’un moteur de recherche ou de Google qu’il saura répondre à votre question est une erreur.

Vos commentaires