Comment identifier des balises Hn vides avec Screaming Frog ?
Table des matières
L'étude du balisage sémantique fait partie des nombreux points de ma checklist lorsque je réalise un audit SEO.
À ce niveau, je m'attarde généralement en priorité sur :
- la présence d'une balise h1
- non dupliquée
- unique dans la page
- la hiérarchie des élements dans le DOM : d'abord un h1, puis éventuellement un h2, puis éventuellement un h3, etc.
- le bon usage des balises header, nav, section, article, aside, footer
Je regarde aussi, pour chaque template de page, si des balises Hn vides ne trainent pas dans le code source.
Et oui, ça peut paraître fou mais c'est un problème que je rencontre souvent, et qui peut avoir des causes multiples :
- un oubli du développeur
- une mauvaise manipulation lors de l'ajout d'un saut de ligne via l'éditeur de texte (courant sur WordPress)
- un bug dans la matrice
Pour corriger ce genre d'écueil, j'utilise l'excellent plugin Headings Map en passant au crible, manuellement, chaque template de page.
Mais quand le problème se répète de façon anarchique, dans des dizaines voire des centaines d'articles de blog par exemple, cela devient beaucoup trop chronophage de faire ce travail à la main.
Alors comment procéder pour automatiser la vérification des balises Hn vides lors d'un crawl avec Screaming Frog par exemple ?
Nativement, ce n'est pas possible. Enfin si, mais partiellement.
Pour les balises h1 et h2, on a en effet l'info de la longueur de la balise dans les onglets H1 et H2, mais uniquement pour les 2 premières balises h1 ou h2 trouvées dans la page. Si celle-ci en compte davantage, on n'a tout simplement pas l'info.
Pour les balises h3 à h6, en revanche, nada.
Ce qui serait cool, c'est d'avoir une colonne avec le nombre de balises Hn vides trouvées, pour chaque URL crawlée.
Du coup, ce qu'on va faire, c'est qu'on va utiliser la (géniale) fonctionnalité "Custom Extraction" que vous retrouverez dans le menu Configuration > Custom > Extraction.
Il suffit de donner un titre à notre champ, par exemple "h2 vides" et de renseigner le xpath suivant :
count(//h2[normalize-space(.)=""])
Explications :
- je récupère le contenu des h2 figurant dans le document avec
//h2
- je nettoie celui-ci en supprimant les espaces éventuels via
normalize-space(.)
- je ne garde que ceux qui sont vides (
=""
) - et je les compte grâce à la fonction
count
Je sélectionne ensuite "Function Value" dans le dernier champ, je valide et je lance le crawl.
Pour chaque URL, je retrouve alors le nombre de balises h2 vides dans l'onglet Custom Extraction. S'il n'y en a aucune, la valeur affichée sera 0.
Bien entendu, on peut répéter l'opération avec l'ensemble des balises Hn, de h1 à h6.
Enjoy !
- Partager sur Twitter
- Partager sur Facebook
- Partager sur LinkedIn
- Partager sur Pinterest
- Partager par E-mail
- Copier le lien
Un Template Google Sheets Offert ! 🎁
Rejoins ma newsletter et reçois une astuce SEO chaque mercredi ! En cadeau, je t'offre un template Google Sheets avec 50 fonctions de scraping prêtes à l'emploi.