L'internet des annuaires

DMOZ, l'annuaire Yahoo, Lycos, les indexes ...

L'internet des moteurs

Altavista, Ask Jeeves, Exalead, Bing, Google...

Dès lors que la tâche est automatisée (parcourir le web, ramener les URL, indexer, classer...) il est évident qu'il va falloir remplacer le flair d'un évaluateur humain par une bardée de mesures logicielles. Chez Google, c'est ainsi plus de 200 signaux différents qui sont fièrement mis en avant pour décider du sort d'un site. La copie d'écran ci-dessous est tirée de la page https://productforums.google.com/forum/#!category-topic/webmaster-fr/actions-manuelles/P1KqFL0bzRY, et le passage est un extrait de la réponse d'une employée de la Search Quality Team de Google, zinebb :

Prenons maintenant quelques instants pour bien assimiler l'information. Vous réalisez la portée de ce qui est dit, et que tous les référenceurs connaissent déjà ? La machinerie complexe déployée par le moteur de recherche le plus populaire au monde ? Et quand bien même, avec ça, ce moteur serait à la merci de professionnels du web dont le métier consiste à mettre en avant les sites internet de leurs clients.

A tel point que, malgré cette technologie, Google fait appel à des entreprises extérieures pour recruter des Quality Raters chargés d'évaluer la qualité et la pertinence des pages, par rapport à une requête donnée.

Waouw. Google, c'est 16 ans d'existence, des moyens considérables (consultez la page Wikipedia au besoin http://fr.wikipedia.org/wiki/Google), et, à part le fait de posséder l'index le plus important au monde, c'est aussi un constat d'échec pour arriver à vraiment qualifier les contenus que le moteur référence.

La fin du règne des moteurs ?

Qu'est-ce qui explique le succès des moteurs de recherche web ?

  • La facilité d'utilisation
  • Le volumétrie de leur index
  • la sophistication de leurs fonctionnalités (chercher dans le texte, dans le titre, dans l'Url, par date, par typologie de site, etc)

En quelques secondes, on peut ainsi fouiller de façon sensible les entrailles des interwebs pour les sujets mainstream (le reste, c'est le fameux "web invisible"). Alors qu'auparavant, il fallait bien souvent plusieurs clics pour naviguer dans les catégories d'un annuaire et accéder précisément aux contenus.

Distinguo annuaire/moteur

Quand on cherche sur un annuaire, on a un but précis. La navigation dans l'arborescence en est la preuve. Si je cherche un référenceur pour analyser mon site, je parcours souvent les thématiques suivantes (exemple) internet > création de site > référencement > seo > audit... car l'internaute a la connaissance des familles de métier ou la dénomination des activités.

Quand on cherche "référenceur" sur un moteur comme Google, on a tout à la fois sur la première page : référentiel métier, définition, formation pour devenir référenceur, exemple d'un référenceur dans les média, prestataire en référencement et bien sûr publicités pour des prestataires ayant payé pour leur visibilité dans les Serps.

Le moteur fonctionne donc à l'identique de l'annuaire, si je tape "analyser mon site" j'obtiens des résultats plus ciblés et proches de ce que je souhaite. Sauf que je me retrouve aussi avec des logiciels d'analyse de site (je souhaite faire appel à un professionnel puisque ma première requête était "référenceur"), et également des analyses de sécurité informatique de site. En fait, tout comme dans le cas précédent, je ne retrouve qu'un résultat naturel qui semble correspondre à un prestataire, bien que j'ai précisé ma requête.

Un moteur comme Google est très fort pour associer les termes sémantiques et autre n-grams, pour retrouver une marque, une location. Bien que parfois, on ait encore des surprises comme avec la requête "skateboard tony". Je me place dans l'optique de chercher ce skater de la team Zephyr de Dogtown, j'ai juste retenu son prénom. Google me sort des serps quasi exclusivement dédiées à Tony Hawk, qui ici ne m'intéresse pas. Il me faut aller en fin de page 3 pour reconnaître le nom de celui que je cherchais, Tony Alva. Dans ce cas précis, l’exhaustivité du moteur (différents types de résultats, ici différentes personnes) est proche de zéro. Ou alors, faut chercher dans les serps : autant prendre un annuaire.

Alors bon.

Je sais que ma vision peut faire sourire. Mais si on en est là aujourd'hui, c'est bien par fainéantise, pas parce qu'un logiciel possède la réponse à toutes nos questions, bulle de personnalisation (en étant connecté à son compte Google) ou non.

Le retour des Annuaires ?

Un annuaire de qualité, c'est un boulot énorme pour écrémer les soumissions de fainéants, qualifier les sites, veiller à filtrer le duplicate content pour satisfaire monsieur Google (je rappelle qu'à l'origine dans les RP le Communiqué de Presse est le même document envoyé à toutes les régies, et repris tel quel partout), bloquer les sites spammy / MFA, éliminer les sites en construction, etc

Parmi les incontournables, citons les annuaires El Annuaire et Ociwen qui remplissent les conditions ci-dessus, classent et vérifient leurs pages, comme d'inlassables araignées qui recommencent leur toile chaque matin...

Quant à la récente sanction infligée par Google à certains, je dirais ceci (raisonnement simplifié) :

Google s'est développé sur un certain modèle technique lié aux liens et aux ancres de liens. Les liens "cliquez ici" ont vite laissé la place aux ancres explicites "annuaire dmoz" afin de gagner en lisibilité et ergonomie (ou UX, User Experience). Google s'appuyant sur ces informations pour classer les sites, son algorithme s'est vite trouvé débordé. Depuis que la méthode de classement a été modifiée, notamment en tenant compte de la sémantique, Google se méfie des liens et prône des ancres anonymes, qui n'influenceraient pas directement son algorithme. En somme, avec Google, il faudrait revenir au web de 1995 dans nos liens.