Question pour un robot.txt

Fermé
reywas Messages postés 19 Date d'inscription dimanche 29 août 2010 Statut Membre Dernière intervention 1 mars 2013 - 31 mai 2012 à 15:53
 Max - 1 juin 2012 à 14:10
Bonjour !

J'ai un site pour lequel des milliers de pages de recherches sont indexées par google et j'aimerai arrêter le massacre.
Toutes ces pages de recherches contiennent dans leur url un point d'interrogation donc le plus simple est encore de dire à google de ne pas visiter les pages dont les url contiennent un '?'.

J'aimerai donc insérer une ligne dans le fichier robot.txt qui me permet de faire ça. Est ce que vous pensez que ma proposition ci-dessous est correcte ou cette ligne ne fonctionnera pas ?

Voici la ligne que je pensais insérer dans robot.txt pour empêcher que google ne visite les pages contenant des points d'interrogations :
Disallow: /*?

Vous paraît-elle correcte ?

J'aimerai aussi savoir si j'ai bien compris cette ligne :
Disallow: /dossier/

Mon interprétation : Toutes les url qui commencent par http://www.monndd.fr/dossier/ sont bloquées.
Est-ce la bonne interprétation ?

Merci d'avance !

Bonne journée !

2 réponses

LeChikito Messages postés 1589 Date d'inscription lundi 19 mars 2012 Statut Membre Dernière intervention 3 août 2012 322
31 mai 2012 à 16:00
Bonjour,
Pour la première question, j'avoue ne plus savoir.

Pour la deuxième par contre
J'aimerai aussi savoir si j'ai bien compris cette ligne :
Disallow: /dossier/

Mon interprétation : Toutes les url qui commencent par http://www.monndd.fr/dossier/ sont bloquées.
Est-ce la bonne interprétation ?

C'est tout à fait çà ^_^

Cordialement,
0
Pour la première question : oui c'est bien ça. Tu peux bloquer des URL dynamiques grâce aux wildcards.

User-agent: * 
Disallow: /*?


Pour plus d'infos : http://robots-txt.com/ressources/robots-txt-wildcard/
0