
Fin du cache Google : conséquences et alternatives
Le cache de Google était une fonction historique du leader des moteurs de recherche. Cette sauvegarde HTML des sites permettait, entre autres, d’afficher les pages même lorsqu’elles étaient indisponibles. Cependant, avec les progrès techniques des sites, ce type de problème, fréquent autrefois, n’avait plus trop lieu d’être aujourd’hui. Cette fonction était donc devenue obsolète pour Google.
Seul bémol : Google cache était très utilisé par les professionnels du référencement naturel (SEO). Ces derniers pouvaient en effet s’en servir pour surveiller l’optimisation des sites Web et la bonne indexation des pages.
Par conséquent, lorsque Google a annoncé la disparition progressive de cette fonctionnalité historique en février 2024, de nombreux spécialistes du Web n’ont pas vu cette décision d’un très bon œil. Alors, quelles sont les conséquences réelles de cette suppression ? Et surtout, comment s’y adapter ? C’est ce que l’on va voir.
Cache Google : définition et utilité
Pour bien comprendre les raisons et conséquences de la disparition du Google Cache, voyons ce qu’il était.
Lorsque les robots d’indexation parcouraient Internet pour découvrir et indexer les sites Web, ils créaient une copie de chaque page Web à un instant T. C’était le Google Cache. Cette « photo » HTML de la page était ensuite stockée et référencée par Google.
Pour les utilisateurs (internautes et professionnels du marketing digital), il y avait plusieurs avantages :
- consulter une page en panne et/ou temporairement hors ligne ou supprimée ;
- limiter le temps de chargement d’une page ;
- diagnostiquer les problèmes de SEO en voyant comment Google percevait et indexait la page ;
- obtenir les données de la dernière exploration (heure et date du dernier passage du Googlebot) et notamment évaluer la fréquence d’indexation ;
- vérifier le contenu dupliqué, car en cas de contenu dupliqué, Google ne conserve qu’une seule page en cache (un lien en cache peut donc renvoyer sur une page différente de celle d’origine) ;
- vérifier le respect des balises canoniques (et éviter le contenu dupliqué) par Google ;
- s’assurer de l’indexation des changements marketing apportés sur une page ;
- identifier les modifications apportées aux sites concurrents en cas de changement de position sur la SERP (la page des résultats) ;
- récupérer une version récente du site en cas de problèmes techniques ou de piratage.
Concrètement, il était possible d’accéder aux caches des pages de deux façons.
- Grâce à la commande « cache:https://www.exemple.com » directement dans la barre de recherche de Google.
- Par l’intermédiaire du triangle pointant vers le bas accolé à chaque résultat de recherche de la SERP.
Cache Google : la raison de sa suppression
Le 1er février 2024, Daniel Sullivan, responsable de la recherche chez Google, a annoncé la fin de Google Cache via un post sur X (ex-Twitter). Il a justifié cette décision par le fait que la fonction cache n’était désormais plus utile avec l’amélioration du réseau.
Comme nous l’avons vu, le cache servait principalement à accéder à des pages momentanément indisponibles et à limiter les temps de chargement. Or, aujourd’hui, les sites sont de plus en plus rapides, ce qui réduit ledit temps de chargement. En outre, ils sont aussi plus fiables, ce qui assure une disponibilité quasi permanente.
En ce qui concerne la balise Noarchive, il paraît donc évident qu’elle n’a plus son utilité sur Google. Toutefois, les autres moteurs de recherche n’ont pas supprimé leurs caches. Cette balise est par conséquent toujours utile pour empêcher l’enregistrement en cache des pages sur ces derniers.
Fin du cache Google : les répercussions pour les internautes et les experts du SEO
Clairement, la suppression du cache Google n’a pas eu de répercussions sur les internautes. Ils étaient peu nombreux à connaître cette fonction puisque la fiabilité des sites l’avait rendu invisible.
La plus grande crainte venait plutôt des professionnels du marketing digital, et notamment des experts SEO, comme l’avaient prouvé les nombreuses réactions à l’annonce de la suppression du cache Google sur X en février 2024.
Comme nous l’avons évoqué plus haut, les professionnels du SEO utilisaient essentiellement cette fonctionnalité pour évaluer comment Google voyait réellement une page et ainsi identifier les problèmes d’indexation ou de contenu. L'outil était d'autant plus apprécié qu'il était rapide d'accès et particulièrement fiable.
Mais cette mini-tempête n’avait pas vraiment lieu d’être, puisque d’autres outils existent à cette fin. De même, si les spécialistes du marketing digital se plaignaient de ne plus avoir accès aux versions antérieures des pages Web, il est important de rappeler que le cache était une unique copie d'une page Web en HTML, réalisée à un instant T par les robots de Google lors de leur travail d'indexation. Il n'était donc possible de visualiser que la dernière version enregistrée, et non les anciennes versions.
Autre grief évoqué avec la suppression du Google cache : ne plus connaître la fréquence d'analyse d'une page par les robots d'indexation. Or, il semble utile de rappeler que l'outil n'indiquait pas la date de leur dernier passage. Croire que le cache était mis à jour chaque fois qu’un robot Google analysait une page était une fausse croyance. John Mueller de Google l’expliquait bien mieux que nous dans un ancien fil d’aide :
En général, nous ne mettons pas toujours à jour la page en cache chaque fois que nous analysons une page. En particulier lorsque la page ne change pas de manière significative. Nous pouvons choisir de simplement conserver l’ancienne date.
Ajoutons à cela que de nombreuses pages indexées n’étaient pas toujours mises en cache. À ce propos, John Mueller expliquait aussi sur X :
Nous ne mettons pas en cache toutes les pages que nous indexons, donc cela peut arriver. Parfois, cela prend un certain temps, parfois nous ne la mettons pas du tout en cache. Ça peut être toutes sortes de pages pour des bizarreries techniques. Le cache est en quelque sorte séparé, donc il n’est pas indicatif de ce que nous indexons et classons.
Fin du cache Google : les alternatives possibles
Pour faire simple, la fonction cache de Google servait essentiellement à voir comment la page était perçue par Google. La suppression de la fréquence d’analyse des sites, de la consultation des anciennes versions de pages et de tous les griefs abordés précédemment ne peut donc pas être reprochée à la firme américaine, puisque comme nous l'avons vu, la fiabilité de ces données était plus que limitée.
Cependant, faisons un tour d’horizon des différentes solutions pour identifier ces éléments de façon plus efficace.
L’outil des résultats enrichis de Google : comment Google interprète-t-il votre contenu ?
Si la fonction cache permettait de voir rapidement et simplement la manière dont Google interprétait une page, il reste possible de tester la page avec l’outil des résultats enrichis de Google.
En effet, celui-ci permet de visualiser le rendu que propose Google. Pour cela, il suffit de renseigner l’URL de la page, puis une fois l’analyse terminée, de se rendre dans « afficher la page testée » et « capture d’écran».
Pour un meilleur confort visuel, vous pouvez utiliser onlineviewer. Copiez le code HTML fourni par l’outil de test des résultats enrichis et collez-le dans l’interface de cet outil. La visualisation de votre page a le mérite, ici, d’être sur une moitié d’écran.
Google Search Console pour l’indexation des pages
Le cache Google ne permettait pas réellement d’identifier les problèmes d’indexation, puisqu'une page qui n'était pas mise en cache n’impliquait pas qu'elle ne soit pas indexée. La seule méthode fiable pour savoir si une page est indexée reste la Google Search Console.
En plus de pouvoir vérifier si les pages sont indexées et quand a eu lieu la dernière exploration, l’outil permet de diagnostiquer les problèmes d’indexation.
Pour cela, il faut saisir l’URL de la page dans la barre de recherche d’inspection d’URL en haut de la Search Console. L’indication « L’URL est sur Google » signifie que la page a été indexée. Le cas échéant, c’est l’indication « La page n’est pas sur Google » qui apparaît avec les raisons de la non-indexation.
Vous avez modifié une page récemment et vous n’êtes pas sûr que Google ait indexé la nouvelle version ? Vous venez de créer une page et souhaitez son indexation ? Avec la Google Search Console, vous pouvez demander l’indexation en cliquant simplement sur « Demander l’indexation ». Simple et efficace !
Web Archive (Wayback Machine) pour les anciennes versions d’un site
Si le cache Google permettait de voir la dernière version d’une page (avant qu’il ne soit mis à jour lors d’une nouvelle exploration), d’autres outils permettent d’analyser les anciennes versions d’un site.
Le plus connu est sans conteste Web Archive, également appelé Wayback Machine, d’Internet Archive. Vous pouvez explorer l’historique d’une page à l’aide de snapshots sauvegardés, et ce, depuis 1996.
Il suffit d’entrer l’URL de la page ou du site à consulter.
Comme vous le constatez sur cette image, vous pouvez visualiser les différentes versions sauvegardées au fil du temps dans l’onglet « Calendar ». En cliquant sur une date de sauvegarde (dans un rond bleu ici), vous consultez le site tel qu’il était le jour de cette sauvegarde.
Le code couleur indique d’ailleurs différents types de sauvegardes :
- bleu : scan réussi
- vert : redirection
- orange : URL introuvable
- rouge : erreur de serveur.
Vous pouvez également consulter l’historique des modifications via l’onglet « Changes ».
Dans un article de blog datant du 11 septembre 2024, Internet Archive annonce l’intégration des liens vers la Wayback Machine directement depuis les résultats de recherche Google, ce qui facilite l’accès à cet outil.
Toutefois, l’ajout de liens vers la Wayback Machine est en cours de déploiement par Google. Cette fonction n’est pas encore active à l’heure où nous rédigeons ces lignes.
Lorsque le déploiement sera terminé, vous accéderez au lien de la façon suivante :
- effectuez votre recherche sur Google ;
- cliquez sur les trois points positionnés à côté d’un lien proposé en résultat de recherche ;
- cliquez sur « En savoir plus sur cette page » ou « En savoir plus sur ce résultat » dans le panneau d’information qui s’ouvre sur la droite de la page ;
- une nouvelle page s’ouvre, vous devriez voir apparaître un lien vers la Wayback Machine.
Archive today : archivez vous-même une page Web et suivez la concurrence
Archive today est un outil français qui repose sur le même principe que Wayback Machine, en plus modeste. Nombre de sites n’y sont pas sauvegardés. Toutefois, si nous vous présentons cet outil, c’est pour une autre fonction intéressante.
En effet, vous pouvez archiver vous-même votre site via Archive today. Ainsi, le cliché instantané restera en ligne, même si la page originale disparaît. Il sauvegarde le texte et une copie graphique de la page. De plus, vous pouvez prendre un instantané de n’importe quel site Web, y compris celui de vos concurrents.
À noter qu’il existe une extension Google Chrome pour Archive today afin de faciliter les captures.
CachedView pour trouver toutes les archives d’un site
CachedView est une sorte de moteur de recherche d’archives. Effectivement, il permet d’interroger plusieurs outils pour trouver les archives d’un site, et ce, depuis une seule interface. Les outils disponibles sont, entre autres, le cache de Google, Wayback Machine et Archive today.
Notons que l’outil Google Cache Checker permettait d’obtenir un rapport complet sur l’état du cache des pages, y compris l’heure et la date de la dernière capture par Google. Cependant, avec la suppression du cache, cet outil n’a plus d’utilité.
Enfin, si Google a supprimé le cache opérateur, ce n’est pas le cas de tous les autres moteurs de recherche. Aussi, ces derniers, à l’instar de Bing, offrent encore cette possibilité.
En bref, Google adapte les fonctionnalités de son moteur de recherche au gré des évolutions technologiques et des besoins du Web d’aujourd’hui. La recherche sur Internet ne cessant d’évoluer, les experts du SEO n’ont d’autres choix que de s’adapter et de faire évoluer leurs pratiques en conséquence. Une chose est sûre, la suppression du cache de Google ne signifie pas la fin des enregistrements d’archives du Web, puisqu’il existe bien d’autres outils pour cela. Ces alternatives permettent en plus d’obtenir les mêmes informations, voire plus. Irons-nous donc jusqu’à dire que Google a bien fait ?
Crédit photo : Dragos Condrea

