Question pour un robot.txt

reywas Messages postés 30 Statut Membre -  
 Max -
Bonjour !

J'ai un site pour lequel des milliers de pages de recherches sont indexées par google et j'aimerai arrêter le massacre.
Toutes ces pages de recherches contiennent dans leur url un point d'interrogation donc le plus simple est encore de dire à google de ne pas visiter les pages dont les url contiennent un '?'.

J'aimerai donc insérer une ligne dans le fichier robot.txt qui me permet de faire ça. Est ce que vous pensez que ma proposition ci-dessous est correcte ou cette ligne ne fonctionnera pas ?

Voici la ligne que je pensais insérer dans robot.txt pour empêcher que google ne visite les pages contenant des points d'interrogations :
Disallow: /*?

Vous paraît-elle correcte ?

J'aimerai aussi savoir si j'ai bien compris cette ligne :
Disallow: /dossier/

Mon interprétation : Toutes les url qui commencent par http://www.monndd.fr/dossier/ sont bloquées.
Est-ce la bonne interprétation ?

Merci d'avance !

Bonne journée !

2 réponses

LeChikito Messages postés 1589 Date d'inscription   Statut Membre Dernière intervention   323
 
Bonjour,
Pour la première question, j'avoue ne plus savoir.

Pour la deuxième par contre
J'aimerai aussi savoir si j'ai bien compris cette ligne :
Disallow: /dossier/

Mon interprétation : Toutes les url qui commencent par http://www.monndd.fr/dossier/ sont bloquées.
Est-ce la bonne interprétation ?

C'est tout à fait çà ^_^

Cordialement,
0
Max
 
Pour la première question : oui c'est bien ça. Tu peux bloquer des URL dynamiques grâce aux wildcards.

User-agent: * 
Disallow: /*?


Pour plus d'infos : http://robots-txt.com/ressources/robots-txt-wildcard/
0