Aller au contenu

Comment sauvegarder ses extractions personnalisées (XPath, regex) dans Screaming Frog ?

Antoine Brisset
Antoine Brisset
Temps de lecture : 2 min
Comment sauvegarder ses extractions personnalisées (XPath, regex) dans Screaming Frog ?
Photo by Onur Buz / Unsplash

Table des matières

Le tips du jour fait suite à une question très intéressante que m'a posée Christophe aka @stonetatara au sujet de Screaming Frog.

La question est la suivante : est-il possible d'enregistrer une collection de requêtes XPath dans une librairie permanente, de manière à pouvoir les réutiliser à chaque crawl, peu importe le projet ?

Et bien, si tu toi aussi tu te poses la question, sache que oui c'est possible.

Voici comment faire.

Créer les différentes extractions

Rien de sorcier ici, il suffit de lancer Screaming Frog, puis de se rendre dans Configuration > Custom Extraction et de créer les différentes requêtes XPath dont tu as besoin (et/ou les regex).

Custom Extraction

Enregistrer la configuration

Pour les enregistrer et les rendre disponibles à la prochaine ouverture du crawler, l'astuce consiste ensuite à se rendre dans File > Configuration puis à cliquer sur Save Current Configuration as Default.

Save Current Configuration as Default

Désormais, à chaque lancement de Screaming Frog, ces différentes extractions seront présentes par défaut.

Plus besoin de les recréer.

Cool, non ?

Edit du 16/02/2024 : l'interface a changé, il faut maintenant aller dans Configuration > Profiles > Save Current Configuration as Default

Créer plusieurs configurations

Bien entendu, tu peux créer autant de configurations que tu le souhaites.

Par exemple, tu peux sauvegarder dans "Default" les XPath et les regex que tu utilises systématiquement pour tous tes projets.

Mais tu peux également créer un fichier de config :

  • pour chaque typologie de site
  • pour chaque CMS
  • pour chaque client
  • etc.

Pour ce faire, il suffit de créer les extractions qui vont bien puis d'aller dans File > Configuration > Save as et d'enregistrer chaque config avec un nom explicite, comme wordpress.seospiderconfig.

Save config file

Exporter les configurations

Si tu souhaites partager tes configurations à un collègue ou à un membre de ton équipe, tu pourras tout simplement lui envoyer le fichier xxx.seospiderconfig.

Il n'aura qu'à le charger de son côté dans l'outil (File > Configuration > Load).

Petite précision : quand tu sauvegardes une configuration, tous les paramètres que tu as éventuellement modifiés (User-Agent, vitesse de crawl, rendering, etc.) sont également sauvegardés dans le fichier de config.

Screaming FrogRegexXPath

Antoine Brisset Twitter

Consultant SEO depuis 2010. Je traque les clics inutiles et j'automatise les tâches répétitives pour gagner du temps dans mon quotidien de travailleur du web.


Articles Similaires

Membres Public

Balise strong dans une balise hn : détectez la suroptimisation avec Screaming Frog !

Quand je reçois des contenus au format Word ou Google Docs, il arrive souvent qu'en les collant dans l'éditeur WordPress (ou un autre éditeur WYSIWIG), les titres soient automatiquement mis en gras. Ce qui donne par exemple ce type de code HTML : <h2><

Balise strong dans une balise hn : détectez la suroptimisation avec Screaming Frog !
Membres Public

Comment vérifier ses liens d'affiliation avec Screaming Frog ?

Quand on fait de l'édition de sites, on passe beaucoup de temps à créer du contenu, à le promouvoir, à faire des liens. Mais on oublie parfois le plus important : s'assurer que les liens d'affiliation qu'on a glissés dans nos contenus sont

Comment vérifier ses liens d'affiliation avec Screaming Frog ?
Membres Public

Brotli, tu connais ?

Il y a quelques mois, j'avais partagé l'astuce suivante sur Twitter. Petit tips #ScreamingFrog La configuration par défaut de Screaming Frog n'ajoute pas automatiquement la compression Brotli au champ "Accept-Encoding" (il n'y a que Gzip). — Antoine Brisset (@ABrisset) March 27,

Brotli, tu connais ?