30 regex indispensables pour vos analyses dans la Google Search Console

La Google Search Console (GSC) est l’un des outils les plus puissants à disposition des SEO – et pourtant, l’une de ses fonctionnalités les plus sous-exploitées reste le filtrage par expressions régulières (regex). La plupart des professionnels s’arrêtent aux filtres textuels basiques (contient, commence par, est exactement), sans jamais franchir le cap des regex. C’est une erreur : les regex permettent des analyses d’une précision et d’une finesse impossibles à atteindre autrement.

Cet article vous donne 30 regex directement utilisables dans la GSC, avec pour chacune : l’objectif SEO visé, la syntaxe exacte, et les cas d’usage concrets.

Ce qu’il faut savoir avant de commencer

Où saisir ces regex dans GSC

Dans le rapport Performances, cliquez sur + Ajouter un filtre dans la barre de filtres, puis sélectionnez Requêtes ou Pages. Dans le menu déroulant du mode de filtre, choisissez Personnalisée (expression régulière).

Vous pouvez également choisir « Ne correspond pas à l’expression régulière » pour exclure des données – ce qui est aussi puissant que d’en inclure.

Le moteur regex de GSC : RE2

GSC utilise le moteur RE2 de Google. Il faut connaître ses limitations par rapport à PCRE (le regex « standard ») :

  • Pas supporté : lookahead, lookbehind, bacréférences
  • Supporté : classes de caractères ([a-z], \d, \w, \s), quantificateurs (*, +, ?, {n,m}), alternance (|), ancres (^, $), groupes non capturants ((?:...))

Important : les regex dans GSC sont insensibles à la casse par défaut pour les requêtes. Pour les URLs, la casse est respectée.

Partie 1 – Regex sur les requêtes

Catégorie 1 : intention de recherche

Regex #1 – Détecter toutes les requêtes sous forme de question

Objectif SEO : Identifier le potentiel pour les featured snippets, le contenu FAQ et les rich results.

^(comment|pourquoi|quand|où|qui|quoi|quel|quelle|quels|quelles|combien|est-ce que|est-ce qu)

Explication : L’ancre ^ impose que la requête commence par l’un de ces mots interrogatifs. L’alternance | entre chaque terme couvre l’ensemble des formulations interrogatives françaises courantes.

Cas d’usage : Filtrer ces requêtes, puis trier par Impressions décroissantes. Les requêtes avec beaucoup d’impressions mais un CTR faible sont vos meilleures opportunités de featured snippet.

Regex #2 – Requêtes à intention transactionnelle

Objectif SEO : Isoler les requêtes à fort potentiel commercial pour analyser vos performances sur les pages de conversion.

(acheter|commander|prix|tarif|devis|promo|promotion|réduction|pas cher|solde|offre|boutique|shop)

Explication : Aucune ancre ici – on cherche ces termes n’importe où dans la requête. L’alternance couvre le champ lexical de l’achat.

Cas d’usage : Croiser avec le filtre de pages pour vérifier que ce sont bien vos pages produits/catégories qui captent ce trafic, et non vos articles de blog.

Regex #3 – Requêtes à intention informationnelle

Objectif SEO : Identifier les requêtes de type TOFU (top of funnel) pour évaluer la performance de votre contenu éditorial.

(guide|tutoriel|tuto|définition|qu'est-ce|c'est quoi|signification|explication|exemple|comprendre|apprendre)

Cas d’usage : Trier par Position moyenne. Si vos contenus informationnels ressortent en position 8-15, un travail d’optimisation on-page peut suffire à les faire basculer dans le top 5.

Regex #4 – Requêtes de comparaison et d’évaluation

Objectif SEO : Repérer les requêtes MOFU (middle of funnel) où l’internaute hésite entre plusieurs solutions.

(avis|test|comparatif|comparaison|\svs\s|versus|meilleur|top [0-9]|classement|alternative|différence)

Explication : \svs\s utilise \s (whitespace) pour ne capturer que « vs » entouré d’espaces, évitant les faux positifs. top [0-9] cible les formulations « top 5 », « top 10 », etc.

Regex #5 – Requêtes avec termes de navigation branded

Objectif SEO : Détecter les internautes qui cherchent à accéder à une page précise de votre site (espace client, connexion, support).

(connexion|login|se connecter|mon compte|espace client|tableau de bord|support|contact|aide)

Cas d’usage : Si ces requêtes génèrent beaucoup d’impressions, votre menu de navigation ou votre page d’accueil ne répond peut-être pas bien à ces besoins. Vérifiez aussi si certaines de ces pages sont indexées à tort.

Regex #6 – Requêtes signalant un problème ou une frustration

Objectif SEO : Identifier une demande de contenu troubleshooting, souvent peu couverte et très bien convertissante.

(problème|erreur|bug|ne fonctionne pas|ne marche pas|panne|dysfonctionnement|résoudre|corriger|réparer)

Cas d’usage : Ces requêtes convertissent bien car l’internaute a un besoin urgent et précis. Si vous n’y répondez pas, un concurrent le fera.

Regex #7 – Requêtes avec « gratuit » ou synonymes

Objectif SEO : Mesurer la part du trafic attirée par des offres gratuites, à comparer avec votre positionnement réel sur ces pages.

(gratuit|gratu|free|offert|sans frais|sans abonnement|open source)

Catégorie 2 : branded vs non-branded

Regex #8 – Requêtes brandés (à personnaliser)

Objectif SEO : Isoler proprement le trafic de marque pour ne pas le mélanger avec le trafic générique dans vos analyses de performance SEO.

(votre-marque|votresite|acronyme-marque)

Conseil : Intégrez toutes les variantes orthographiques de votre marque : avec/sans tiret, avec/sans accent, abréviations. Exemple pour une marque fictive « Acmé Corp » : (acmé|acme|acmecorp|acme corp).

Cas d’usage clé : Utilisez ensuite le filtre « ne correspond pas à l’expression régulière » avec cette même regex pour analyser exclusivement votre trafic non-brandé – bien plus révélateur de votre performance SEO organique réelle.

Regex #9 – Requêtes brandés avec modificateur de navigation

Objectif SEO : Repérer les utilisateurs qui cherchent votre marque + une fonctionnalité ou page spécifique. Utile pour détecter des frictions UX.

^(votre-marque).+(connexion|prix|contact|avis|support|télécharger|appli|application)

Explication : Le .+ entre les deux groupes capture n’importe quel caractère entre la marque et le modificateur.

Regex #10 – Requêtes mentionnant un concurrent (à personnaliser)

Objectif SEO : Mesurer la visibilité de votre site sur les requêtes orientées concurrents.

(concurrent1|concurrent2|concurrent3)

Cas d’usage : Si vous captez des impressions sur le nom d’un concurrent mais avec un CTR très faible, vous apparaissez dans les SERP sans convaincre. C’est une piste de contenu comparatif à creuser.

Catégorie 3 : longue traîne et volume

Regex #11 – Requêtes longue traîne (5 mots et plus)

Objectif SEO : Isoler les requêtes très précises, souvent à fort taux de conversion et faible concurrence.

^(\S+\s){4,}\S+$

Explication : \S+ capture un mot (suite de caractères non-espaces), \s capture l’espace entre deux mots. {4,} impose 4 espaces minimum, soit 5 mots minimum. Les ancres ^ et $ garantissent qu’on analyse la requête dans sa totalité.

Cas d’usage : Filtrez sur la longue traîne, puis triez par Impressions décroissantes. Les requêtes avec beaucoup d’impressions mais une position moyenne supérieure à 10 représentent des opportunités de contenu ciblé à fort ROI.

Regex #12 – Requêtes courtes (1 ou 2 mots)

Objectif SEO : Identifier les mots-clés très génériques sur lesquels vous êtes visible pour évaluer votre autorité thématique.

^\S+(\s\S+)?$

Explication : (\s\S+)? rend le deuxième mot optionnel via ?. On obtient ainsi toutes les requêtes d’un ou deux mots.

Regex #13 – Requêtes contenant des chiffres

Objectif SEO : Détecter les requêtes avec prix, années, quantités, tailles – souvent très précises et commerciales.

[0-9]

Cas d’usage : Croisez avec le filtre de position. Des requêtes du type « modèle X 2024 prix » en position supérieure à 5 signalent que vos fiches produits manquent peut-être de données structurées ou de contenu sur la génération concernée.

Regex #14 – Requêtes avec année(s) précise(s)

Objectif SEO : Identifier le contenu saisonnier et les requêtes « millésimées » pour planifier vos mises à jour éditoriales.

(2023|2024|2025|2026)

Cas d’usage : Si vous avez des articles titrés « Meilleur X en 2023 » qui génèrent encore des impressions en 2025, une mise à jour combinée à un changement de date dans le titre peut faire remonter votre CTR significativement.

Regex #15 – Requêtes locales génériques

Objectif SEO : Mesurer l’étendue de votre visibilité locale sans avoir à saisir chaque ville manuellement.

(paris|lyon|marseille|bordeaux|toulouse|nantes|nice|strasbourg|montpellier|rennes|près de|proche de|à proximité)

Conseil : Adaptez la liste des villes à votre secteur géographique cible. Pour un acteur régional, listez les communes et agglomérations pertinentes.

Catégorie 4 : opportunités de contenu et enrichissements SERP

Regex #16 – Opportunités de featured snippets (questions directes)

Objectif SEO : Affiner la regex #1 pour cibler les formulations qui déclenchent le plus souvent un featured snippet en position 0.

^(comment |pourquoi |qu'est-ce que |qu'est-ce qu'|quel est |quelle est |c'est quoi )

Explication : L’espace après chaque terme est intentionnel – il force la présence d’un mot suivant, éliminant les faux positifs sur une requête constituée d’un seul mot interrogatif.

Cas d’usage : Vérifiez si un featured snippet est déjà présent dans les SERP. S’il ne vous appartient pas, structurez votre réponse avec un paragraphe direct de 40 à 60 mots suivi d’une liste ou d’un tableau.

Regex #17 – Requêtes « téléchargement » et assets numériques

Objectif SEO : Identifier une intention de récupération d’un fichier ou d’un outil. Fort potentiel de lead generation.

(télécharger|téléchargement|download|installer|installation|template|modèle|outil|logiciel|pdf)

Regex #18 – Requêtes avec « sans » (intention d’exclusion)

Objectif SEO : Repérer des besoins négatifs spécifiques (sans abonnement, sans carte bancaire, sans inscription) – très révélateurs des objections de vos prospects.

\bsans\b

Explication : \b est une ancre de limite de mot (word boundary). Elle garantit que « sans » est bien un mot isolé et non une sous-chaîne (exemple : « paysan »).

Regex #19 – Requêtes de type voice search / recherche conversationnelle

Objectif SEO : Identifier les requêtes longues et phrasisées, caractéristiques des recherches vocales ou des formulations très naturelles.

^(comment |pourquoi |qu'est-ce |quel est |quelle est |c'est quoi |dis-moi |aide-moi ).{25,}$

Explication : .{25,} impose une longueur minimale de 25 caractères après le mot introductif, filtrant les questions trop courtes pour être conversationnelles.

Regex #20 – Requêtes avec « meilleur(e)(s) »

Objectif SEO : Capturer toutes les variantes de « meilleur » – marqueur fort d’intention de décision en phase de comparaison.

meilleur(e)?s?(\s|$)

Explication : (e)? rend le « e » optionnel (meilleur/meilleure), s? rend le pluriel optionnel. (\s|$) garantit que le mot est suivi d’un espace ou d’une fin de requête.

Partie 2 – Regex sur les pages (URLs)

Catégorie 5 : segmentation de la structure du site

Regex #21 – Pages d’un sous-dossier spécifique

Objectif SEO : Analyser les performances d’une section précise du site (blog, documentation, produits) de manière isolée.

^https?://[^/]+/blog/

Explication : [^/]+ capture le domaine (n’importe quelle suite de caractères sans slash). Remplacez /blog/ par le sous-dossier de votre choix : /produits/, /docs/, /categorie/, etc.

Variante multi-dossiers :

^https?://[^/]+/(blog|ressources|guides)/

Regex #22 – Pages paginées

Objectif SEO : Identifier toutes les pages de pagination pour les exclure de vos analyses de performance ou vérifier qu’elles ne génèrent pas un trafic indésirable.

/(page|p)/[0-9]+/?$|[?&]page=[0-9]+

Explication : La première partie couvre les paginations dans le chemin URL (exemple : /blog/page/2/). La seconde couvre les paginations en paramètre GET (exemple : ?page=2). Le | combine les deux cas.

Regex #23 – Pages avec paramètres d’URL

Objectif SEO : Repérer toutes les URLs paramétrées indexées – souvent sources de contenu dupliqué et de gaspillage de crawl budget.

\?[a-z_-]+=

Explication : \? détecte le ? introduisant les paramètres (il doit être échappé car ? est un caractère spécial en regex). [a-z_-]+= capte le nom du paramètre suivi du signe =.

Cas d’usage : Si ces URLs apparaissent dans GSC avec des impressions, elles sont indexées. Vérifiez si elles doivent porter une balise noindex ou être consolidées avec des canonical.

Regex #24 – Pages avec paramètres de tracking UTM indexées

Objectif SEO : Détecter une erreur technique grave – des URLs avec paramètres UTM qui auraient été crawlées et indexées.

[?&]utm_

Cas d’usage : Si cette regex retourne des résultats, c’est une anomalie technique à corriger immédiatement : ajout de canonical, blocage via robots.txt ou configuration dans l’outil de paramètres d’URL de GSC.

Regex #25 – Pages à une profondeur de 2 niveaux

Objectif SEO : Isoler les pages de second niveau pour analyser leur performance par rapport aux pages racines.

^https?://[^/]+(/[^/]+){2}/?$

Explication : (/[^/]+){2} impose exactement deux segments de chemin après le domaine. /?$ autorise ou non le slash final.

Variante pour 3 niveaux :

^https?://[^/]+(/[^/]+){3}/?$

Regex #26 – Pages AMP

Objectif SEO : Contrôler la visibilité et les performances des versions AMP si votre site en utilise encore.

/amp/?$|\?amp($|&|=)

Explication : La première partie couvre le chemin /amp/ en fin d’URL. La seconde couvre le paramètre ?amp ou ?amp=1.

Regex #27 – Pages avec extension de fichier explicite

Objectif SEO : Repérer les URLs techniques ou legacy qui exposent l’extension du fichier serveur – souvent symptomatiques de migrations incomplètes.

\.(php|html|htm|asp|aspx)(\?|$)

Explication : \. échappe le point littéral. (\?|$) garantit que l’extension est en fin d’URL ou suivie d’un ?, évitant les faux positifs.

Regex #28 – Pages d’une version linguistique internationale

Objectif SEO : Analyser les performances d’une langue ou d’un marché spécifique dans un site multilingue.

Pour un sous-dossier de langue :

^https?://[^/]+/(en|es|de|it|pt|nl)/

Pour un sous-domaine de langue :

^https?://(en|es|de|it)\.[^/]+/

Cas d’usage : Filtrez par langue, puis comparez les positions moyennes et CTR entre les différentes versions pour prioriser vos efforts de localisation SEO.

Regex #29 – URLs contenant des majuscules dans le chemin

Objectif SEO : Détecter des URLs mal canonicalisées ou des doublons techniques liés à une casse incohérente.

/[A-Z]

Explication : Détecte la présence d’une majuscule dans le chemin de l’URL. Les URLs en majuscules et en minuscules sont techniquement distinctes pour les serveurs Linux – source potentielle de contenu dupliqué.

Cas d’usage : Toute URL retournée par ce filtre doit faire l’objet d’une redirection 301 vers sa version en minuscules.

Regex #30 – URLs avec double slash dans le chemin

Objectif SEO : Détecter une erreur de concaténation de chemin côté serveur ou CMS qui génère des doublons d’URLs.

[^:]//

Explication : [^:] exclut le : qui précède normalement le // du protocole (https://). On ne capture donc que les doubles slashes dans le chemin, et non ceux du protocole.

Cas d’usage : Des URLs comme https://monsite.fr//blog//article sont indexées séparément de https://monsite.fr/blog/article. Redirection 301 et correction côté CMS sont obligatoires.

Récapitulatif des 30 regex

#FiltreObjectifRegex
1RequêtesQuestions (FR)^(comment|pourquoi|quand|où|qui|quoi|quel|quelle|combien|est-ce que)
2RequêtesIntention transactionnelle(acheter|commander|prix|tarif|devis|promo|pas cher|solde)
3RequêtesIntention informationnelle(guide|tutoriel|définition|qu'est-ce|c'est quoi|explication|exemple)
4RequêtesComparaison / avis(avis|test|comparatif|\svs\s|meilleur|top [0-9]|alternative)
5RequêtesNavigation branded(connexion|login|mon compte|espace client|support|contact)
6RequêtesProblème / frustration(problème|erreur|bug|ne fonctionne pas|panne|résoudre)
7RequêtesGratuit / freemium(gratuit|free|offert|sans frais|open source)
8RequêtesBranded (à personnaliser)(votre-marque|acronyme)
9RequêtesBranded + modificateur^(votre-marque).+(connexion|prix|avis|support)
10RequêtesConcurrents(concurrent1|concurrent2|concurrent3)
11RequêtesLongue traîne (5+ mots)^(\S+\s){4,}\S+$
12RequêtesCourtes (1-2 mots)^\S+(\s\S+)?$
13RequêtesAvec chiffres[0-9]
14RequêtesAvec année(2023|2024|2025|2026)
15RequêtesLocales(paris|lyon|marseille|près de|proche de|à proximité)
16RequêtesFeatured snippets^(comment |pourquoi |qu'est-ce que |quel est |quelle est )
17RequêtesTéléchargement / assets(télécharger|download|installer|template|modèle|pdf)
18RequêtesIntention d’exclusion « sans »\bsans\b
19RequêtesVoice search^(comment |pourquoi |qu'est-ce |quel est ).{25,}$
20Requêtes« Meilleur(e)(s) »meilleur(e)?s?(\s|$)
21PagesSous-dossier spécifique^https?://[^/]+/blog/
22PagesPages paginées/(page|p)/[0-9]+/?$|[?&]page=[0-9]+
23PagesURLs paramétrées\?[a-z_-]+=
24PagesParamètres UTM indexés[?&]utm_
25PagesProfondeur de 2 niveaux^https?://[^/]+(/[^/]+){2}/?$
26PagesPages AMP/amp/?$|\?amp($|&|=)
27PagesExtension fichier legacy\.(php|html|htm|asp)(\?|$)
28PagesVersion linguistique^https?://[^/]+/(en|es|de|it)/
29PagesMajuscules dans l’URL/[A-Z]
30PagesDouble slash dans le chemin[^:]//

Bonnes pratiques pour aller plus loin

Combinez les filtres. GSC permet d’empiler plusieurs filtres simultanément. Vous pouvez combiner un filtre regex sur les requêtes (intention transactionnelle) avec un filtre regex sur les pages (sous-dossier /produits/) pour une analyse croisée très précise.

Exportez avant de filtrer. Pour des analyses plus complexes, exportez vos données en CSV puis appliquez vos regex dans Google Sheets avec la fonction =REGEXMATCH(), dans Python avec le module re, ou dans votre outil d’analyse préféré.

Sauvegardez vos filtres. L’interface GSC ne permet pas de sauvegarder des filtres nommés. Conservez un document de référence avec vos regex les plus utilisées.

Utilisez « Ne correspond pas à l’expression régulière ». Le mode d’exclusion est aussi puissant que l’inclusion. Exclure le branded de votre analyse globale, exclure les pages paginées de votre audit de contenu, exclure certains sous-dossiers de vos rapports de performance : ces exclusions transforment radicalement la lisibilité de vos données.

Conclusion

Les regex dans la Google Search Console ne sont pas réservées aux développeurs. Elles sont l’outil manquant entre une analyse SEO superficielle et une analyse réellement actionnable. Les 30 expressions présentées ici couvrent l’essentiel des besoins d’un SEO expert : segmentation par intention, identification d’opportunités SERP, détection d’anomalies techniques, et analyse fine de la structure du site.

L’investissement pour les maîtriser est faible – RE2 est un sous-ensemble volontairement simplifié de regex – et le retour en termes de précision analytique est immédiat.

Il ne vous reste plus qu’à les tester sur vos propres données.

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.

Ce contenu vous a plu ?

Inscrivez-vous gratuitement à notre newsletter et recevez chaque semaine l'actualité de l'IA directement dans votre boîte email. Vous pouvez vous désabonner à tout moment !