Comment fonctionne un moteur de recherche ?

par | 15 Sep 2021

Temps de lecture : 3 minutes

Les moteurs de recherche fonctionnent en explorant des centaines de milliards de pages web, en les indexant puis en vous les proposant à travers de résultats des recherche.

Lorsque vous tapez une requête dans un moteur de recherche, les robots d’exploration, appelés bots ou spiders, parcourent des milliers, voire des millions de pages dans leur index, choisissent celles qui sont les plus pertinentes (en fonction de nombreux facteurs) et vous proposent une réponse.

👉 Dans ce guide, nous allons vous expliquer la base du fonctionnement des moteurs de recherche à travers trois étapes :

  1. L’exploration
  2. L’indexation
  3. Le classement

processus moteur de recherche

L’exploration (crawling)

Pour que les moteurs de recherche vous proposent des pages web, ils doivent d’abord les découvrir. En mai 2020, on estimait qu’il y avait 1,7 milliard de sites web sur la toile, ce qui représente des milliards de pages. Il n’existe pas d’endroit unique où tous les sites et toutes les pages se trouvent. Les moteurs de recherche doivent donc être constamment à la recherche de nouvelles pages et les ajouter à leur index.

Les moteurs de recherche trouvent les pages web de plusieurs façons. L’une d’elles consiste à suivre un lien depuis une page déjà trouvée. Une autre façon est de lire un sitemap. Un sitemap est un fichier XML hébergé sur un site et qui contient des informations, telles que des pages, des images ou des vidéos sur votre site, organisées de manière à faciliter la compréhension des robots des moteurs de recherche.

De nombreux CMS comme WordPress génèrent automatiquement des sitemaps grâce à des extensions comme Yoast.

Une fois que les moteurs de recherche trouvent les pages, ils les explorent. En termes simples, cela signifie que leurs robots les lisent et identifient de quoi elles traitent. Ils analysent le contenu écrit, le contenu non écrit, l’aspect visuel et la mise en page générale.

Les sites web qui peuvent être trouvés par les moteurs de recherche sont ou peuvent être explorés à des fréquences variables, allant de tous les jours à toutes les semaines, voire tous les mois. Des facteurs tels que la popularité des pages, le nombre, la saisonnalité et la structure du site jouent tous un rôle dans la fréquence de crawl de votre site.

 

Indexation

L’indexation est le processus d’analyse d’une page, de son stockage et de son catalogage. Après qu’une page a été trouvée et explorée, les informations pertinentes sont indexées. Cependant, toutes les informations explorées ne sont pas pertinentes : ce n’est pas parce qu’une page est trouvée et explorée qu’elle sera indexée.

💡 A travers l’indexation, le moteur de recherche organise les sites explorés. Certains seront indexés et d’autres non.

Toutes les informations indexées sont conservées dans un index de recherche. La taille et l’échelle des index de recherche sont gigantesques. Par exemple, celui de Google dépasse largement les 100 000 000 gigaoctets et est hébergé sur environ 2,5 millions de serveurs dans le monde. Les index de recherche sont conçus pour associer les demandes de recherche des internautes aux URL, ce qui permet aux utilisateurs d’effectuer facilement une recherche et de recevoir des centaines de milliards de résultats en moins d’une seconde.

 

Classement (ranking)

Une fois que les pages ont été explorées et indexées, elles sont éligibles pour être affichées dans une page de résultats de moteurs de recherche (SERP).

C’est ici que l’algorithme du moteur de recherche entre en action pour déterminer, à partir de centaines de facteurs, le classement des pages dans ses pages de résultats.

Les SERP sont ce que vous obtenez juste après avoir tapé une requête dans un moteur de recherche. Les résultats pertinents figurant sur une SERP sont classés : le numéro 1 figure en haut de la page (souvent sous les publicités Google Ads), suivi des autres pages, dans l’ordre croissant.

serp google analyse

Les moteurs de recherche déterminent les classements en fonction de nombreux facteurs. Ils prennent en compte la pertinence, la qualité, votre localisation, l’autorité et votre device, pour n’en citer que quelques-uns.

👉 Décoder les facteurs de positionnement et déterminer ceux que votre site web doit améliorer est la base de l’optimisation des moteurs de recherche : le SEO.

Dans la vidéo ci-dessous publiée par Google, il est expliqué en 5 minutes comment fonctionne son moteur de recherche.

0 commentaires

Soumettre un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *