Comment extraire le root domain d'une liste d'URLs en bulk ? (OUTIL GRATUIT)

Antoine Brisset

18 oct. 2023 — Temps de lecture : 1 min

Table des matières

C'est un problème qui revient régulièrement dans la sphère SEO : comment extraire le domaine racine d'une URL ?

J'ai souvent vu passer des tweets à ce sujet, comme ici ou là.

Nicolas de Tremplin Numérique en a même parlé dernièrement dans sa conférence sur les sites Google News.

Les solutions proposées à chaque fois fonctionnent... sauf cas particuliers :

s'il y a plusieurs sous-domaines dans l'URL
si le nom de domaine se termine par un TLD exotique comme .com.br ou .gouv.fr
si le domaine est privé, comme blogspot.com
etc.

Et sur internet, la plupart des outils que j'ai testés présentent les mêmes limites.

Du coup, ça m'a donné envie de me (re)pencher sur le sujet et de créer un outil en ligne qui fonctionne "à tous les coups".

Il est disponible gratuitement ici : https://affiloop.com/tools/url-to-root

Il s'appuie sur la Public Suffix List, un projet à l'initiative de Mozilla dont l'objectif est de répertorier l'ensemble des extensions de noms de domaines disponibles.

Pour utiliser l'outil, c'est simple :

tu entres une liste d'URLs
tu cliques sur "dédupliquer les domaines" si tu veux supprimer les doublons
tu cliques sur "garder le sous-domaine" si tu as besoin de conserver les sous-domaines (exemple : toto.blogspot.com)
tu cliques sur le bouton "convertir"

Et hop. Plus qu'à copier les résultats.

Si tu veux aller plus loin sur le sujet, tu peux aussi :

tester la regex donnée par Walid (Light On SEO)
relire mon article sur le parsing d'URL avec Google Sheets
jeter un coup d'oeil à Gadgeto (y'a un tool complet pour triturer les URLs)

Et voilà !

Divers

Antoine Brisset Twitter

Consultant SEO depuis 2010. Je traque les clics inutiles et j'automatise les tâches répétitives pour gagner du temps dans mon quotidien de travailleur du web.

Cache Google : quelques petites réflexions

Bonjour et bienvenue dans cette 100ème (!) édition de la newsletter SEO Memento. Et voilà, encore une fonctionnalité qui disparaît de la page de résultats Google : le lien vers la version en cache. Depuis quelque temps déjà, le lien avait été "dissimulé" dans la fenêtre modale qui s'

20 déc. 2023

Payant Membres Public

Sais-tu ce que Google pense de ton site ?

Aujourd'hui, j'aimerais te parler d'une fonctionnalité Google assez méconnue. Il s'agit du menu "À propos de ce résultat" que Google affiche quand on clique sur les 3 petits points à droite des résultats de recherche. Pourtant, celui-ci contient des informations

19 avr. 2023

Payant Membres Public

Automatisation : comment savoir quand "ça vaut le coup" ?

Comme tu as pu le constater en lisant les éditions précédentes de la newsletter, je m'intéresse beaucoup à l'automatisation. Pas vraiment à celle qui consiste à monter des sites de spamdexing en appuyant sur un bouton, à créer un PBN en lançant une commande linux ou

Table des matières

Antoine Brisset Twitter

Un Template Google Sheets Offert ! 🎁

Articles Similaires

Cache Google : quelques petites réflexions

Sais-tu ce que Google pense de ton site ?

Automatisation : comment savoir quand "ça vaut le coup" ?