Digimood

Niveau : Débutant

Pré-requis : Avoir un site Web sur la Google Search Console

Besoin de supprimer rapidement du contenu de la recherche Google ?

Suppressions temporaires, contenu obsolète, filtrage Safesearch…

La suppression d’URL sur Google est une problématique assez fréquente. Il est nécessaire avant de lire ce tutoriel de bien comprendre les notions de crawl, d’indexation et de positionnement.

Demande de suppression via la Google Search Console

Pour effectuer une demande de suppression il vous suffit de vous rendre sur la Google Search Console : “Index >> Supressions >> Nouvelle Demande” ou de vous rendre directement sur https://search.google.com/search-console/removals puis de sélectionner la propriété (site web) de votre choix.

Votre demande devra concerner une page ou un ensemble de pages :

  • Une URL précise (ex : pour supprimer /ma-page.html)

  • L’ensemble des URL contenant un préfixe (ex : pour supprimer toutes les pages situées dans /mon-dossier/)

Google indique que “l’utilisation de cet outil dans certains cas de figure peut générer des problèmes au niveau de votre site”. Google suggère d’utiliser cet outil uniquement en cas d’urgence et de laisser les robots traiter “naturellement” les pages de votre site dans tous les autres cas.

“L’ancienne Search Console” présentait un outil permettant aux webmasters de “Supprimer temporairement” une page des résultats de recherche. La nouvelle Search Console présente un outil similaire avec 3 onglets :

  • Suppressions temporaires (anciennement “Masquer temporairement”) :
    • Supprimer temporairement l’URL,
    • Effacer l’URL mise en cache.
  • Contenu obsolète,
  • Filtrage Safesearch.

Dans la Google Search Console, seul le premier onglet présente un formulaire de “Nouvelle demande”, il s’agit de l’onglet suppressions temporaires. Pour faire une demande dans un des deux autres onglets vous devez vous rendre directement sur les outils respectifs :

Fonctionnalité “Suppressions temporaires”

La fonctionnalité “Suppressions temporaires” est par exemple utile dans les cas suivants :

  • Modification sur un nombre important d’URLs nécessitant d’être impactées rapidement. On fera par exemple désindexer l’ensemble d’un sous-dossier,
  • Demande de suppression légitime formulée par un tiers (ex. respect du RGPD),
  • Supprimer la version d’une page dans le cache de Google uniquement.

Cette fonctionnalité permet de supprimer 1 seule URL à la fois ou toutes les URL “correspondant à ce préfixe” (ex. pour supprimer toutes les pages situées dans /mon-dossier/).

Supprimez la ou les URLs des résultats de recherche Google pendant environ six mois et éliminez l’extrait ainsi que la version mise en cache actuels (qui seront recréés lors de la prochaine exploration). Pour une suppression permanente, empêchez l’indexation des pages concernées ou supprimez-les entièrement de votre site.

Précautions à prendre

Pour faire en sorte que cette URL ne soit pas ré-indexée par Google au bout de la période indiquée par l’outil, vous devrez faire en sorte (au choix) :

  • Qu’elle retourne un code d’erreur accepté par Google (404, 410, voire dans certains cas 401, 403),
  • D’indiquer une directive “noindex” dans une balise “meta” ou dans l’en-tête “X-Robots-Tag” pour cette URL,
  • Qu’elle soit en redirection 301 vers une autre URL.

Robots.txt, Disallow et Contenu obsolète

Google déconseille l’utilisation du Robots.txt comme “mécanisme de blocage”. Il est toutefois possible, sous certaines conditions d’utiliser la règle Disallow pour interdire l’accès aux robots de Crawl sur une ou plusieurs pages.

Notons également la particularité de “Contenu osbolète” qui permet de supprimer “Si vous voyez un résultat de recherche que vous ne possédez pas, et que l’extrait du résultat ou le résultat en cache (stocké) dans les résultats de recherche diffèrent de la page actuelle, OU que la page n’existe plus.”

Crawl, indexation, positionnement

Ces trois notions sont essentielles pour bien comprendre à quel stade la demande de suppression intervient et la nécessité pour “supprimer durablement” une page de mettre en place des implémentations techniques.

Crawl
Google parcours la page

Indexation
Google ajoute la page à son index

Positionnement
Google positionne votre page et présente un snippet dans les pages de résultats

Comment contrôler à quelle étape en est une page de mon site ?

Crawl
Logs Apache / plugin de statistique stockant les accès de Google, ou Google Search Console.

Indexation
Via la commande “site:” ou via la Google Search Console (onglet “Couverture” ou la fonction d’Inspection d’une URL).

Positionnement
En suivant une ou plusieurs requêtes avec un outil de relevé de position ou via la Google Search Console (onglet Performances).

2 étapes cruciales

Ajoutons à ces 3 étapes, une étape préliminaire (avant le Crawl) et une mettant fin à la séquence (après Positionnement) :

Autorisation (avant le Crawl)

Avant de parcourir une page, Google s’assure d’être autorisé pour le faire en consultant le robots.txt. La règle “Disallow”, peut donc empêcher le Crawl. Cette règle est à ne pas confondre avec le “noindex” qui interdit (au moment du Crawl) à Google d’indexer la page.

Suppression (après le positionnement)

Une fois une page indexée, voire positionnée, il est possible à tout moment de la supprimer. Cette suppression entraînera la disparition temporaire ou permanente de la page de l’index de Google. La durée de la suppression dépendra de l’implémentation technique qui a été faite.