Cache Google : quelques petites réflexions
Table des matières
Bonjour et bienvenue dans cette 100ème (!) édition de la newsletter SEO Memento.
Et voilà, encore une fonctionnalité qui disparaît de la page de résultats Google : le lien vers la version en cache.
Depuis quelque temps déjà, le lien avait été "dissimulé" dans la fenêtre modale qui s'affichait au clic sur les 3 petits points verticaux, à côté de chaque résultat de recherche.
Aujourd'hui, ce lien a disparu.
Quelle solution pour voir le cache ?
Pour obtenir la version mise en cache par Google, il reste deux solutions (mais pour combien de temps encore ?) :
- taper la commande
cache:
suivi de l'URL à vérifier, exemplecache:https://www.seomemento.com/
- utiliser un bookmarklet pour ouvrir directement le cache d'URL en cours
javascript:var a=location.href;window.open("https://webcache.googleusercontent.com/search?q=cache:"+a)
À noter qu'il est possible de jouer avec les paramètres de l'URL pour obtenir directement le résultat souhaité :
- version texte (sans les CSS/JS) : ajouter le paramètre
strip=1
Exemple : https://webcache.googleusercontent.com/search?q=cache:https://www.seomemento.com/&strip=1
- version HTML : ajouter le paramètre
vwsrc=1
("vwsrc" pour "view:source")
Exemple : https://webcache.googleusercontent.com/search?q=cache:https://www.seomemento.com/&vwsrc=1
Version en cache ≠ version dans l'index
Petit rappel d'importance : ce que Google affiche dans la version texte ne correspond pas forcément à ce que les robots de Google ont indexé.
En effet, comme expliqué dans la doc, le cache correspond à la version HTML brute obtenue par les robots de Google.
Version que le navigateur essaie d'interpréter lorsqu'il charge la page à l'adresse https://webcache.googleusercontent.com/search?q=cache:monsite.com.
Il est donc possible (mais toutefois pas garanti) que Google ait indexé du contenu supplémentaire lors de la phase de rendering, et donc que celui-ci ne soit pas visible dans la version "en texte seul".
Le cache m'affiche une page "cassée", pourquoi ?
Cross-Origin Resource Sharing (CORS)
Si le cache en version intégrale affiche une page cassée – typiquement à cause de fichiers JS non exécutés – c'est en général lié au mécanisme CORS (Cross Origin Requests).
En effet, par mesure de sécurité, les navigateurs modernes empêchent tout nom d'hôte non autorisé (en l'occurrence ici https://webcache.googleusercontent.com) de charger une ressource lorsque le header Access-Control-Allow-Origin est absent de la réponse HTTP.
Pour en savoir plus : https://developer.mozilla.org/fr/docs/Glossary/CORS.
Problème de CSS
Autre hypothèse : le fichier CSS utilisé par la page a été mis à jour, ce qui a généré un nouveau nom de fichier.
Si Google n'est pas encore repassé sur la page, il n'a pas connaissance de ce nouveau fichier. La page en cache appelle donc encore l'ancienne URL du fichier CSS, qui répond en 404. Résultat : aucun style n'est chargé.
C'est souvent le cas avec les frameworks modernes, qui génèrent un nouveau hash à chaque modification de fichier CSS et/ou JS. L'objectif étant de "forcer" les navigateurs à télécharger la nouvelle version.
Le cache est-il fiable ?
On a pu le voir avec les points précédents, il ne faut pas se fier au cache Google car ce n'est pas une représentation exacte de ce que Google "voit".
C'est utile :
- pour voir à quelle date Google a exploré une page pour la dernière fois (et si les changements effectués sur celle-ci ont été pris en compte)
- pour inspecter, éventuellement, le snapshot HTML qui a été récupéré
- pour détecter un cloaking
Mais ce n'est pas un outil suffisant pour aider à la prise de décision.
Pour être sûr de ce que Google "voit", mieux vaut tester ce qui s'affiche dans la Search Console (Inspection de l'URL > Tester l'URL active)
Empêcher Google de mettre une page en cache
Dernière chose, il est possible d'empêcher Google d'afficher un lien en cache en utilisant la valeur noarchive de la meta robots.
Voilà, j'espère que ça pourra t'aider à y voir plus clair sur le cache de Google 😀
- Partager sur Twitter
- Partager sur Facebook
- Partager sur LinkedIn
- Partager sur Pinterest
- Partager par E-mail
- Copier le lien
Un Template Google Sheets Offert ! 🎁
Rejoins ma newsletter et reçois une astuce SEO chaque mercredi ! En cadeau, je t'offre un template Google Sheets avec 50 fonctions de scraping prêtes à l'emploi.