Aller au contenu

Comment crawler un site multilingue avec Screaming Frog ?

Antoine Brisset
Antoine Brisset
Temps de lecture : 2 min
Comment crawler un site multilingue avec Screaming Frog ?
Photo by Zdeněk Macháček / Unsplash

Table des matières

Aujourd'hui, je te donne une petite astuce pour crawler un site multilingue au complet avec Screaming Frog.

Préambule

Attention, je pars ici du principe que depuis l'URL de départ, Screaming Frog peut accéder à chacune des versions multilingues :

  • soit via un lien hypertexte
Paramétrage des liens (👉 cocher Follow External "nofollow" uniquement si nécessaire)
  • soit via une balise hreflang
Paramétrage du hreflang (👉 cocher Crawl)
  • soit via le sitemap XML
Paramétrage des sitemaps XML (👉 cocher Crawl Linked XML Sitemaps)

Configuration n°1 : 1 langue = 1 répertoire

Exemple :

Ici, ça ne pose pas de problème. Screaming Frog pourra parcourir tous les sous-dossiers (sous réserve de ce que j'ai mentionné en préambule).

Aucune configuration supplémentaire à prévoir.

Configuration n°2 : 1 langue = 1 sous-domaine

Exemple :

Dans cette configuration, il faut bien penser à cocher "All Subdomains" avant de lancer le crawl.

En effet, par défaut, le crawler ne suit que les liens du sous-domaine "de départ". Tout lien vers un autre sous-domaine est donc considéré comme un lien externe.

Configuration n°3 : 1 langue = 1 site web

Exemple :

Là, c'est un peu plus tricky.

S'il existe une version de site par extension, qu'elles sont toutes liées entre elles et que tu souhaites crawler toutes les URLs de tous les sites, alors il faudra effectuer la manipulation suivante :

  • aller dans Configuration > Spider > Crawl
  • cliquer sur CDNs
  • ajouter chacune des versions

Avant de valider, tu peux vérifier si le paramétrage correspond bien au comportement attendu en renseignant les champs "Start URL" et "Test URL".

Ajout des différentes extensions

À noter que dans cette configuration, les liens entre les différentes versions seront considérés comme des liens internes.

Pratique donc pour faire un audit global mais à garder en tête lors de l'analyse du maillage interne.

Et voilà !

Screaming Frog

Antoine Brisset Twitter

Consultant SEO depuis 2010. Je traque les clics inutiles et j'automatise les tâches répétitives pour gagner du temps dans mon quotidien de travailleur du web.


Articles Similaires

Membres Public

Balise strong dans une balise hn : détectez la suroptimisation avec Screaming Frog !

Quand je reçois des contenus au format Word ou Google Docs, il arrive souvent qu'en les collant dans l'éditeur WordPress (ou un autre éditeur WYSIWIG), les titres soient automatiquement mis en gras. Ce qui donne par exemple ce type de code HTML : <h2><

Balise strong dans une balise hn : détectez la suroptimisation avec Screaming Frog !
Membres Public

Comment vérifier ses liens d'affiliation avec Screaming Frog ?

Quand on fait de l'édition de sites, on passe beaucoup de temps à créer du contenu, à le promouvoir, à faire des liens. Mais on oublie parfois le plus important : s'assurer que les liens d'affiliation qu'on a glissés dans nos contenus sont

Comment vérifier ses liens d'affiliation avec Screaming Frog ?
Membres Public

Brotli, tu connais ?

Il y a quelques mois, j'avais partagé l'astuce suivante sur Twitter. Petit tips #ScreamingFrog La configuration par défaut de Screaming Frog n'ajoute pas automatiquement la compression Brotli au champ "Accept-Encoding" (il n'y a que Gzip). — Antoine Brisset (@ABrisset) March 27,

Brotli, tu connais ?