Robot.txt: c'est quoi ça ?
Fermé
agathe
-
7 nov. 2014 à 16:51
bg62 Messages postés 23664 Date d'inscription samedi 22 octobre 2005 Statut Modérateur Dernière intervention 17 décembre 2024 - 8 nov. 2014 à 09:40
bg62 Messages postés 23664 Date d'inscription samedi 22 octobre 2005 Statut Modérateur Dernière intervention 17 décembre 2024 - 8 nov. 2014 à 09:40
4 réponses
elgazar
Messages postés
5841
Date d'inscription
mercredi 30 octobre 2013
Statut
Membre
Dernière intervention
17 mars 2021
1 325
Modifié par elgazar le 8/11/2014 à 06:42
Modifié par elgazar le 8/11/2014 à 06:42
pour répondre a ta question, j'ai trouvé une réponse hallucinante d'un responsable jimdo, cette réponse date de 3 ans donc elle n'est pas forcément toujours d'actualité
en gros, ils disent qu'il faut ajouter du contenu et montrer une certaine activité sur ton site (sans plus de précision), au bout d'un moment la plateforme changera automatiquement le robots.txt et autorisera l'indexation de toutes les pages
At the moment, we have a spam blocker on new JimdoPages that prevents those sites from being indexed by Google. So what we recommend is that you add content to the site and show some activity on it. When our system picks up the activity, the robots.txt file should change to
User-agent: *
Allow: /
and your site should be indexed by Google.
en gros, ils disent qu'il faut ajouter du contenu et montrer une certaine activité sur ton site (sans plus de précision), au bout d'un moment la plateforme changera automatiquement le robots.txt et autorisera l'indexation de toutes les pages
elgazar
Messages postés
5841
Date d'inscription
mercredi 30 octobre 2013
Statut
Membre
Dernière intervention
17 mars 2021
1 325
7 nov. 2014 à 17:13
7 nov. 2014 à 17:13
le fichier robot.txt permet de donner des indications aux robots des moteurs de recherche qui vont indexer ton site.
Avec ce fichier tu peux donc dire aux moteurs de recherche de ne pas indexer telle page ou tel dossier
par exemple
User-Agent: *
Disallow: /mondossier/page.html
Disallow: /admin/
signifie que tous les robots ( le signe * signifiant tous les moteurs) ne doivent pas indexer le fichier page.html qui se trouve dans le répertoire mondossier ni le dossier admin mais qu'ils peuvent indexer tous les autres fichiers qu'ils trouvent sur le site
tu peux aussi personnaliser en mettant le nom du robot
User-Agent: googlebot
Disallow: /dossier/page.html
Disallow: /admin/
dans cet exemple, seul le robot de google ne devra pas indexer le fichier et le dossier, les robots des autres moteurs peuvent le faire
Avec ce fichier tu peux donc dire aux moteurs de recherche de ne pas indexer telle page ou tel dossier
par exemple
User-Agent: *
Disallow: /mondossier/page.html
Disallow: /admin/
signifie que tous les robots ( le signe * signifiant tous les moteurs) ne doivent pas indexer le fichier page.html qui se trouve dans le répertoire mondossier ni le dossier admin mais qu'ils peuvent indexer tous les autres fichiers qu'ils trouvent sur le site
tu peux aussi personnaliser en mettant le nom du robot
User-Agent: googlebot
Disallow: /dossier/page.html
Disallow: /admin/
dans cet exemple, seul le robot de google ne devra pas indexer le fichier et le dossier, les robots des autres moteurs peuvent le faire
Merci mais malheureusement ça ne répond pas à ma question.
Dans mon cas, avec marqué dissalow : / mon site va-t-il est indexé ? Si non comment y remedier avec l'interface Jimdo ?
Dans mon cas, avec marqué dissalow : / mon site va-t-il est indexé ? Si non comment y remedier avec l'interface Jimdo ?
bg62
Messages postés
23664
Date d'inscription
samedi 22 octobre 2005
Statut
Modérateur
Dernière intervention
17 décembre 2024
2 392
7 nov. 2014 à 22:49
7 nov. 2014 à 22:49
lut;)
voir ici:
https://forums.commentcamarche.net/forum/affich-37584840-robots-txt-un-fichier-important
tu as ceci :
'
User-agent: *
Disallow: /
,
ce qui veut donc dire que pour tous les moteurs, tous les bots, au moins ceux qui respectent ce protocole, comme Google et autres moteurs de recherche et d'indexation ...
tu leur ' interdis ' ... tout = ils n'explorent donc rien :)
ton site ne sera donc pas indexé dans ce cas
Pour qu'il le soit il faudrait le modifier de cette manière, au moins:
' '
( --> Un fichier robots.txt vide ou inexistant aura une conséquence identique. et donc permettra les visites Et l'indexation )
attention également aux fautes d'orthographe ...
voir ici:
https://forums.commentcamarche.net/forum/affich-37584840-robots-txt-un-fichier-important
tu as ceci :
'
User-agent: *
Disallow: /
,
ce qui veut donc dire que pour tous les moteurs, tous les bots, au moins ceux qui respectent ce protocole, comme Google et autres moteurs de recherche et d'indexation ...
tu leur ' interdis ' ... tout = ils n'explorent donc rien :)
ton site ne sera donc pas indexé dans ce cas
Pour qu'il le soit il faudrait le modifier de cette manière, au moins:
' '
( --> Un fichier robots.txt vide ou inexistant aura une conséquence identique. et donc permettra les visites Et l'indexation )
attention également aux fautes d'orthographe ...
8 nov. 2014 à 09:40
pas mal ça !!!
quand on dit et redit ... d'aller voir ailleurs ;)
..........................