Agence 90 » Actualités et guides » SEO » Guides SEO » Qu’est-ce que le cache Google et comment ça fonctionne ?

Qu’est-ce que le cache Google et comment ça fonctionne ?

par | 28 Avr 2022

Temps de lecture : 4 minutes

L’idée qui sous-tend le stockage des pages en cache par Google est simple : elle permet aux utilisateurs de naviguer sur une page lorsque celle-ci est indisponible ou en cas d’interruption temporaire.

 

Qu’est-ce que le cache de Google ?

Le cache de Google est une fonctionnalité de la recherche qui fournit des copies de pages web disponibles pour les chercheurs, indépendamment des pages actives du site web d’origine. Google fait une copie de la page web à un moment donné et la diffuse à la demande de l’utilisateur.

Pourquoi Google met-il les pages en cache ?

Google met les pages en cache principalement pour permettre aux internautes d’y accéder même si le site web est hors service. Par exemple, si le site cdiscount.com était indisponible, vous pourriez tout de même afficher une version mise en cache de cdiscount.com via la recherche Google.

 

Comment Google met-il les pages en cache ?

Google met les pages en cache en explorant une page web, en stockant son code HTML dans une base de données, puis en restituant ce code pour la version en cache de la page lorsqu’elle est demandée. Google précise toutefois qu’il ne crée pas une version en cache d’une page web à chaque fois qu’elle est explorée.

 

Qu’est-ce qu’une page en cache ?

Une page en cache est le résultat du rendu par Google de son HTML stocké pour la page qu’il a explorée à ce moment-là.

Il est important de garder à l’esprit que la version en cache d’une page est un instantané de cette page à ce moment précis. Si Google crée une version en cache de votre page le lundi et que votre site est modifié le mardi, la version en cache ne reflétera pas ces modifications. Les modifications n’apparaîtront que lorsque Google explorera à nouveau votre site et décidera de prendre un nouvel instantané de cette page à ce moment-là.

Retenez aussi que Google effectue principalement un rendu HTML pour la version en cache d’une page. Les éléments dépendant du javascript peuvent ne pas être inclus dans la version en cache de la page, en fonction du moment où le javascript a été exécuté par rapport au moment où le HTML a été rendu.

 

Pourquoi le cache de Google est-il important pour le SEO ?

Vous pouvez utiliser le cache de Google pour avoir une idée du contenu que Google peut voir et explorer lorsqu’il arrive sur une page web. C’est très important lorsqu’on essaie de déterminer si des éléments d’un site sont visibles par Googlebot à des fins d’indexation. Par conséquent, jeter un œil à comment vos pages sont mises en cache par Google peut être utile pour votre SEO.

 

Comment afficher les pages en cache dans Google ?

Méthode 1

Vous pouvez utiliser Google.fr pour afficher les pages en cache en procédant comme suit :

  1. Allez sur google.fr
  2. Saisissez une requête ou un domaine dans le champ de recherche pour rechercher la page.
  3. Cliquez sur la petite flèche vers le bas située à droite de l’URL du domaine puis sur « En cache ».

cache exemple 1

La version cache de la page va ensuite se charger.

cache exemple 2

 

Méthode 2

Vous pouvez également rechercher des versions en cache d’une URL spécifique en utilisant l’opérateur de recherche « cache : ».

Pour ce faire, suivez les étapes ci-dessous :

  1. Accédez à google.fr ou utilisez la barre de recherche de Chrome.
  2. Tapez cache:  et l’URL dont vous voulez voir la version en cache.
  3. Une fois que vous avez appuyé sur la touche « Entrée », la version en cache de la page se chargera automatiquement.

cache exemple 3

 

Comprendre la page en cache

Vous remarquerez qu’une fois que la page en cache charge l’URL, des paramètres supplémentaires sont ajoutés.

Dans notre exemple, l’URL en cache est la suivante : https://webcache.googleusercontent.com/search?q=cache:TPYHN2ZEF2QJ:https://www.cdiscount.com/electromenager/preparation-culinaire/robots-blenders/v-1102201-1102201.html+&cd=1&hl=fr&ct=clnk&gl=fr

Ces paramètres sont utilisés par Google pour récupérer la page en cache. Ils peuvent être ignorés dans la mesure où ils ne fournissent aucune information utile.

💡 Dans l’encadré gris en haut de la page, vous pouvez également voir d’autres informations sur la page en cache.

cache exemple 6

Dans cette zone, vous pouvez voir le jour et l’heure exacte où la page a été mise en cache. Au moment où nous écrivons ces lignes, la page a été mise en cache le 27/04/2022 à 17:50:42 GMT.

Lorsque vous consultez la version en cache d’une page, vous pouvez utiliser trois « vues » différentes pour voir différentes parties de la page.

cache exemple 5

 

Version intégrale

La première vue/version est celle qui est chargée par défaut, c’est la version intégrale.

Elle comprend la page rendue au moment où Google la met en cache. Elle inclut tous les éléments de style et de HTML.

cache exemple 2

 

Version en texte seule

La vue suivante est une version en texte seule.

Il s’agit d’une version de la page sans style, qui affiche uniquement le texte de la page.

cache exemple 7

 

Version source

Enfin, vous pouvez utiliser l’option « Afficher la source » pour visualiser le code source complet de la page.

cache exemple 8

 

Choses à retenir

Pourquoi n’y a-t-il pas de version en cache d’une page ?

Toutes les pages ne sont pas mises en cache par Google.

Les pages qui dépendent de Javascript peuvent ne pas être mises en cache et, si c’est le cas, elles peuvent être vides si aucun HTML n’a été chargé lors de la prise de l’instantané.

Google ne met pas en cache toutes les pages qu’il explore. Il se peut donc que certaines des pages que vous vérifiez n’aient pas de version en cache. Cela ne signifie pas que la page n’a pas été explorée, mais Google ne peut pas mettre en cache toutes les pages qu’il explore. Cela ne signifie pas non plus que la page ne sera jamais mise en cache, mais qu’elle ne l’a pas encore été.

Certaines pages web ne seront pas mises en cache car elles demandent à Googlebot de ne pas mettre la page en cache à l’aide d’une balise robots :

<META NAME= »GOOGLEBOT » CONTENT= »NOARCHIVE »>

Les pages en cache ne remplacent pas un fichier log

Le cache de Google n’est pas une bonne métrique à utiliser pour s’assurer que Googlebot explore votre site. Étant donné que Google ne crée pas une version en cache à chaque fois qu’il visite le site, vous ne devez pas vous fier à la date de la page en cache comme indicateur de la dernière exploration de votre site par Google.

Il est préférable de vous fier aux fichiers log d’un site, si vous y avez accès, pour déterminer la date de la dernière exploration d’une page par Googlebot.

0 commentaires

Soumettre un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *