Ne négligez pas votre fichier robots.txt

Le fichier robots.txt est utilisé pour autoriser ou bloquer l’accès à votre site par les robots des moteurs de recherche. N’étant pas forcément installé par défaut sur un serveur, le fichier n’est pas non plus généré par Wordpress lors de l’installation du CMS.

Je me permets de vous avertir sur l’importance de ce fichier dans le sens ou il peut, s’il est mal configuré, empêcher purement et simplement le référencement de tout votre site. En vous rendant sur l’admin Wordpress, vous pouvez le créer à partir de Réglages > Vie privée et en sélectionnant :

Je souhaite bloquer les moteurs de recherche, mais autoriser les visiteurs normaux

En revanche, il semblerait qu’un bug empêche la modification du fichier pour revenir à l’état initial, à savoir le fait de rendre le blog visible à tous, y compris les moteurs de recherche. J’en ai fait les frais sur mon blog et je ne souhaite pas que cela vous arrive. Prenez garde donc si vous avez sélectionné puis désélectionné cette option. Editez le fichier robots.txt à la main, c’est plus sûr.

Pour info, si vous souhaitez autoriser l’indexation de votre site par les robots, voici la syntaxe à intégrer :

User-Agent: *
Allow: /

Cependant, si pour une raison ou une autre, vous souhaitez interdire l’indexation de votre site à certains robots, voici la marche à suivre :

User-Agent : Googlebot
Disallow : /

Ici par exemple, on choisit d’interdire au robot Google de parcourir l’ensemble de votre site web. Enfin, si vous ne rencontrez pas de problème d’indexation, vérifiez tout de même que vous avez un fichier robots.txt avec la syntaxe par défaut autorisant l’indexation de votre site, c’est plus propre. Le fichier doit bien se nommer “robots.txt”, tout en minuscules et doit être placé à la racine de votre site.

> En savoir plus sur le fichier robots.txt.

L'auteur : Arnaud

Référenceur et membre du staff de Wordpress Francophone

Retrouver mon blog sur le : référencement naturel

Et mon site web : www.ramenos.net

Informations annexes à l'article

Cet article a été publié le Mercredi 15 octobre 2008 à 12:05 et est classé dans Référencement.

Vous pouvez en suivre les commentaires par le biais du flux RSS 2.0.

Vous pouvez laisser un commentaire, ou faire un trackback depuis votre propre site.

Article lu 4 436 fois.

Méta

1 étoile2 étoiles3 étoiles4 étoiles5 étoiles (3 votes, moyenne: 3,67 sur un total de 5)
Loading ... Loading ...
Imprimer cette article Envoyer cet article à un ami

8 commentaires

  1. Je pensais que Wordpress générait le robots.txt à “la volée” via son routeur interne, et non qu’il le créait physiquement (d’ailleurs, il faudrait donner les droits d’écriture sur le wwwroot ce qui serait relativement dangereux).
    Du coup, ce serait un bug dans le moteur de Wordpress ? Sur quel(s) version(s) ?

  2. J’ai rencontré ce bug sur la dernière version de Wordpress, à savoir la 2.6.2…

  3. Merci du conseil ;-)

  4. Pour ceux qui sont intéressé, voici le contenu de notre robots.txt :
    User-agent: *
    Disallow: /cgi-bin/
    Disallow: /memo/
    Disallow: /wp-admin/
    Disallow: /wp-includes/
    Disallow: /wp-content/plugins/
    Disallow: /wp-content/cache/
    Disallow: /wp-content/themes/
    Disallow: /feed/
    Disallow: /trackback/
    Disallow: /comments/
    Disallow: /category/*/*
    Disallow: */trackback/
    Disallow: */comments/
    Disallow: /*?*
    Disallow: /*?

    Allow: /wp-content/uploads/

    User-agent: Googlebot
    Disallow: /*.php$
    Disallow: /*.js$
    Disallow: /*.inc$
    Disallow: /*.css$

    # Google Image
    User-agent: Googlebot-Image
    Disallow:
    Allow: /*

    # Google AdSense
    User-agent: Mediapartners-Google*
    Disallow:
    Allow: /*

    # Internet Archiver Wayback Machine
    User-agent: ia_archiver
    Disallow: /

    # digg mirror
    User-agent: duggmirror
    Disallow: /

    # BEGIN XML-SITEMAP-PLUGIN
    Sitemap: http://www.infoslibres.fr/sitemap.xml.gz
    # END XML-SITEMAP-PLUGIN

  5. Et on le trouve où le robot.txt

    car jai fait tout mon blog par le ftp et je trouve rien…

  6. Normal, c’est à toi de le créer dans ce cas ;)

  7. > beni : le fichier robots.txt doit se trouver dans le répertoire racine de ton site. Si ce n’est pas le cas, alors dans ce cas tu dois le créer, comme l’a dit Benoît.

  8. Pourquoi ce site Web n’ont pas l’autre appui de langues ?

Laisser un commentaire

xHTML: Vous pouvez utiliser ces tags: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

écrire un commentaire