Le fichier robots.txt

Résolu
cocodu67... Messages postés 3178 Date d'inscription   Statut Membre Dernière intervention   -  
cocodu67... Messages postés 3178 Date d'inscription   Statut Membre Dernière intervention   -
Bonsoir

J'ai vu qu'on peut empêcher l'indexation d'un répertoire dans un fichier robots.txt. Le problème c'est que si on souhaite qu'un répertoire ne soit pas indexé c'est la plupart du temps car on ne souhaite que personne consulte les pages qui y sont.

Le soucis c'est qu'il suffit de faire adresseDuSite/robots.txt pour connaître les répertoires secrets. J'aimerais donc savoir s'il n'y a pas une autre solution.

Merci^^
A voir également:

2 réponses

InformatiWeb Messages postés 1656 Date d'inscription   Statut Membre Dernière intervention   450
 
Bonjour,
il suffit d'ajouter la balise suivante entre les balises <head></head> de la page que tu ne veux pas référencer :
<META NAME="robots" CONTENT="noindex,follow">
0
cocodu67... Messages postés 3178 Date d'inscription   Statut Membre Dernière intervention   145
 
Je l'ai fais mais il parait que tous les moteurs de recherche ne comprennent pas le noindex.

Il y a aussi la possibilité de bloquer toutes les IP dans le htaccess mais je n'ai pas une IP fixe et pour accéder au répertoire de n'importe quel ordinateur il faudrait que je télécharge à chaque fois filezilla pour éditer le fichier. Vraiment pas pratique.

Si j'oblige à marquer un identifiant et mot de passe pour voir le contenu d'une page, est ce que la page sera quand même indexée ? Je sais que son contenu ne pourra pas l'être mais est ce qu'avec une recherche sur un moteur de recherche on risque de tomber sur cette page même s'il faut s'identifier ?
0
InformatiWeb Messages postés 1656 Date d'inscription   Statut Membre Dernière intervention   450
 
non, si tu met un mot de passe via un fichier .htaccess, la page ne sera pas indexée car Google recevra une erreur 403 (accès refusé).
0
cocodu67... Messages postés 3178 Date d'inscription   Statut Membre Dernière intervention   145
 
Et un fichier htpasswd c'est sécurisé un minimum ? Je veux dire, il suffit pas de faire un petit truc à la portée de tout le monde pour ne pas avoir à s'identifier pour voir le contenu de la page ?

Il n'y a aucune donnée confidentielle ou illégale mais bon si ce système est pas du tout efficace autant ne pas essayer de comprendre comment le mettre en place.
0
InformatiWeb Messages postés 1656 Date d'inscription   Statut Membre Dernière intervention   450
 
Oui c'est efficace, il est impossible d'accéder aux fichiers ".quelque chose" depuis Internet. Ce sont des fichiers cachés sous Linux. Il n'y a que le serveur qui a accès à ces fichiers pour savoir si ton nom d'utilisateur / mot de passe est correct ou non.
0
cocodu67... Messages postés 3178 Date d'inscription   Statut Membre Dernière intervention   145
 
D'accord merci de ton aide :)

Bonne soirée
0
Utilisateur anonyme
 
Les fichiers .htaccess ont des failles. La plus connu est le limit GET POST

Je ne vais pas m'étendre plus sur le sujet !!!!

https://www.google.com/search?q=htacess+limit+get+post+corriger&ie=utf-8&oe=utf-8&aq=t&rls=org.mozilla:fr:unofficial&client=iceweasel-a&channel=fflb

bonne soirée
׺°"~'"°º×]|I{*------» LÖBÖTÖ «------*}I|[׺°"~'"°º×
0
InformatiWeb Messages postés 1656 Date d'inscription   Statut Membre Dernière intervention   450
 
merci pour l'information.

En regardant sur cette page : http://www.segmentationfault.fr/securite-informatique/contourner-htaccess-limit-get-post/
En résumé, il ne faut pas mettre les lignes d'authentification requise dans les balises <limit ...>.
0
Utilisateur anonyme
 
oui je me souviens être tombé dénu quand j'ai appris cela...j'hésitais à publié cela sur ce forum car finalement sa fourni des informations supplémentaire sur une faille. Cependant ce problème est connu maintenant et je me dis que cela pourra aider à protéger un peu mieux certain dossiers. Bonne soirée
0
cocodu67... Messages postés 3178 Date d'inscription   Statut Membre Dernière intervention   145
 
Merci de cette précision. En effet, sans le limit get post ça marche quand même.
0