Le code d’état HTTP « 404 introuvable » apparaît dans la fenêtre du navigateur si l’URL ou le fichier demandé n’existe pas sur le serveur. Ce message est l’un des messages d’erreur côté client les plus courants. Les causes en sont notamment les suivantes

  • les fichiers déplacés dont les liens internes ou externes n’ont pas été ajustés,
  • des fichiers supprimés tels que des images, mais tous les liens n’ont pas été supprimés,
  • Refonte de l’URL et relance complète du site Web,
  • URL inexistantes qui sont causées par des erreurs de copie, par exemple.

404 Reconnaissance et correction du code d’état

Les Google Webmaster Tools (GWT) révèlent si et quelles erreurs 404 sont présentes dans la section « Erreurs de recherche » sous la rubrique « Non trouvé ». Après avoir cliqué sur l’URL erronée, des informations détaillées sur le lien apparaissent. Les moteurs de recherche devraient vérifier cette liste régulièrement et corriger les erreurs. Après un traitement réussi, ils peuvent être marqués comme corrigés. Comme alternative au GWT, des outils d’optimisation spéciaux et les modules d’évaluation de Searchmetrics ou Sistrix sont également disponibles pour l’analyse des erreurs.

Idéalement, un site Web génère le moins de messages possible (404). Ni les visiteurs du site ni le Googlebot n’aiment quand ils ne trouvent pas ce qu’ils attendent. Au minimum, une page d’erreur 404 utile devrait apparaître si une ressource n’est plus disponible sur le serveur. Le code suivant est utilisé dans le fichier.htaccess à cet effet :

ErreurDocument 404 /404.php

Le fichier script php définit si un message d’erreur est affiché ou si une redirection 301 est effectuée lorsqu’une ressource n’est pas trouvée. Si l’URL est intégrée dans le code avant la barre oblique, une redirection se produit en premier, que Google évalue comme une erreur Soft-404.

Erreur Soft-404

Il s’agit d’un contenu manquant pour lequel aucun message d’état 404 ou 410 n’est enregistré. Au lieu de cela, le serveur envoie par erreur « 302 trouvé » ou « 200 OK » et est un tricheur pour Google. Cela peut également se produire avec des redirections vers la page d’accueil, car le contenu ne répond pas aux attentes de l’utilisateur. Selon Google, les ressources inexistantes en permanence qui ne peuvent pas être remplacées par du contenu connexe devraient toujours porter le code de réponse HTTP 404 ou le code de statut « 410 Gone ».

Les informations les plus précises possibles pour l’utilisateur sur une page d’erreur spécialement définie augmentent la facilité d’utilisation. Dans les boutiques en ligne, par exemple, le texte « Cet article n’est malheureusement plus disponible » pourrait apparaître.

Google ne supprime pas immédiatement 404 pages des résultats de recherche afin de laisser le temps de corriger des problèmes techniques temporaires ou des erreurs de configuration du serveur.

Quels impacts les erreurs 404 ont sur votre SEO ?

Est-ce que les erreurs 404 impactent le SEO ?

A faible dose, les erreurs 404 n’auront pas un effet dévastateur sur votre référencement naturel. Toutefois, c’est lorsqu’elles s’accumulent que cela devient problématique. En effet, il faut savoir qu’une erreur 404 renvoie un mauvais signal à Google. En parlant simplement, cela revient à faire perdre du temps aux robots de Google. Vous les incitez à se rendre sur une page qui n’existe pas ou plus. Et comme le temps, c’est de l’argent…à force d’envoyer des mauvais signaux aux googlebot, Google pourrait vous « pénaliser » un peu en baissant un peu le positionnement naturel des pages de votre site. Encore une fois, ce n’est que l’accumulation d’erreurs 404 qui est véritablement problématique.

Par exemple, j’ai déjà eu à faire à des clients qui disposaient dans leurs données de logs, de 3 fois plus de hits sur des URLs au statut code 404 que de hits sur des URLs répondant en code 200…C’est compliqué à ce moment là d’obtenir de bons résultats en référencement naturel.

Comment identifier une erreur 404 ?

Il existe plusieurs solutions pour identifier des erreurs 404 sur votre site.

Un crawler type Screaming Frog

La première solution est de faire passer un crawler sur votre site.

Un logiciel type Screaming Frog navigue de liens en liens pour retracer toute l’arborescence de votre site. Si un lien est cassé, il identifiera l’erreur 404 et vous préviendra.

Les logs

Les données de logs serveurs restent également un moyen sur d’identifier les erreurs 404 que Googlebot aura crawlé.

Google Search Console

Enfin, autre moyen d’identifier des pages d’erreurs 404 sur votre site, l’outil préféré des référenceurs : Google Search Console. Il existe dans cet outil, une fonctionnalité pour suivre et monitorer l’évolution de vos erreurs d’explorations…autrement dit, les erreurs 404, les erreurs 4XX d’une manière plus générale mais également vos erreurs serveurs avec des codes 5XX.

Comment corriger une erreur 404 ?

La correction d’une erreur 404 peut passer par la mise en place d’une redirection 301. Cette dernière permet le transfert de la majeure partie de la popularité. Cela indiquera donc à Google que vous avez bien compris que la page n’existait plus et que Google pouvait transférer le crédit et l’historique à la page de destination.

C’est notamment la solution à adopter lorsque vous obtenir des backlinks qui renvoient vers des pages obsolètes en 404.

Si vous disposez d’un nombre incalculable d’erreurs 404 et que vous ne disposez pas véritablement d’alternatives crédibles pour vos redirections 301, vous pouvez opter pour le statut code 410 qui indiquera à Google que votre page n’existe plus et qu’il n’est plus nécessaire pour lui de venir la crawler.

Bref, ne snobbez pas vos erreurs 404 et prenez le temps de les analyser et de les corriger !