[référencement] Ne pas être référencé [Résolu/Fermé]

Signaler
Messages postés
4088
Date d'inscription
jeudi 7 avril 2005
Statut
Contributeur
Dernière intervention
30 septembre 2013
-
 Searaphina -
Bonsoir,

Je voulais savoir comment ne pas référencer son site internet par google ou un autre moteur de recherche ?
Je pose la question pour le probleme suivant :

Quand je tape sous google le nom de mon domaine, je tombe sur l'une des pages d'un de mes sites hébergé sous mon domaine.
Je ne voudrais plus l'avoir via une recherche google car le chemin d'acces à mes pages apparait ^^


Merci de votre aide :)

~ N'oubliez pas la balise "Résolu" lorsque votre problème est... résolu :) ~

5 réponses

Messages postés
4606
Date d'inscription
lundi 7 novembre 2005
Statut
Contributeur
Dernière intervention
30 avril 2020
1 263
<META NAME="ROBOTS" content="noindex"> dans toutes les pages à exclure
18
Merci

Quelques mots de remerciements seront grandement appréciés. Ajouter un commentaire

CCM 56960 internautes nous ont dit merci ce mois-ci

Messages postés
165
Date d'inscription
lundi 4 juin 2007
Statut
Membre
Dernière intervention
3 juillet 2008
1
Salut

Pour ne pas être référencé (bizarre) il faut mettre quelques indications sur l'index de ton site pour les robots.txt (de google)

Voici des exemples de fichier robots.txt :

* Exclusion de toutes les pages :

User-Agent: *
Disallow: /

* Exclusion d'aucune page (équivalent à l'absence de fichier robots.txt, toutes les pages sont visitées) :

User-Agent: *
Disallow:

* Autorisation d'un seul robot :

User-Agent: nomDuRobot
Disallow :
User-Agent: *
Disallow: /

* Exclusion d'un robot :

User-Agent: NomDuRobot
Disallow: /
User-Agent: *
Disallow:

* Exclusion d'une page :

User-Agent: *
Disallow: /repertoire/chemin/page.html

* Exclusion de toutes les pages d'un répertoire et ses sous-dossiers :

User-Agent: *
Disallow: /repertoire/
Messages postés
4088
Date d'inscription
jeudi 7 avril 2005
Statut
Contributeur
Dernière intervention
30 septembre 2013
840
Oui exact, merci pour la réponse.
J'avais trouvé entre temps également sur la page sur le référencement naturel, je me permet donc de compléter la réponse.

Voici les différentes valeur pour l'attribut 'content' :
- all : permet à tous les robots d'indexer, archiver, etc. vos pages
- noindex : permet d'interdire l'indexation à tous les robots
- nofollow : permet de ne pas faire suivre vos pages / liens
- noarchive: permet de ne pas archiver vos pages
- none : équivalent à 'noindex,nofollow'

Ex : <META NAME="ROBOTS" content="none,noarchive">


Si vos pages sont déjà référencé sur le net par google ou un autre robot, il vous faudra placer un fichier nommé 'robot.txt' à la racine de votre site. Dans ce fichier vous mettrez la ligne suivante :

# robots.txt
User-agent: *
Disallow: /


User-agent: permet de spécifier quel type de robot. '*' signifie donc tous les robots. Si vous ne souhaitez interdire l'indexation que sur google, remplacez '*' par 'googleBot'
Disallow: permet de spécifier quel répertoire de votre site ne doit pas être indexé.
Vous pouvez donc mettre autant de ligne qu'il faut pour chaque répertoire à interdire comme suit par exemple :

# robots.txt
User-agent: *
Disallow: /toto/
Disallow: /mesPhotos/


Le '/' du premier exemple signifie le répertoire courant (ou est mis le fichier texte robot.txt)

Voilou :)


EDIT : Autant pour moi Jérémi, je n'avais pas vu ton post ^^

Par contre, je cite :
pour les robots.txt (de google) 

En fait c'est le standard pour n'importe quel robot normalement, donc ca fonctionne pour d'autre que google.
Ce n'est pas forcément "bizarre" de ne pas vouloir référencer son site sur Google; pour ma part, j'ai développé un outil pour un jeu en ligne, et j'ai pas envie que nos adversaires puissent nous espionner ou même tenter de hacker l'application.

Merci :)
En tant qu'expert en référencement, je ne saurais que vous conseiller d'utiliser les sites qui vous référence dans tous les moteurs, c'est rapide et efficace, par exemple : http://referencement.w00tz.info , c'est vraiment rapide et pratique !

A bientôt
Merci zupo13 pour ton site, comme tu dis, c'est vraiment rapide et efficace :)
sunbim t'es fort pour découvrir et juger de l'utilité d'un site en moins de 3min =)
Idem, je ne vois rien de bizarre à ne pas vouloir être référencé.

Genre tu développe un site pour un client, tu as une version en prod qui doit être référencé, et une version de dev ou tu peux bidouiller et faire voir l'avancement au client. La version de dev n'a aucune raison et ne doit pas être référencé.

Vous allez me dire que si aucun lien extérieur ne pointe vers la version de dev, il n'y a aucune raison que les google vienne dessus!!! C'est vrai, mais il suffit qu'un blaireau (et les clients le sont souvent!!!) mette le lien de la version de dev dans un forum pour en parler à un ami, et hop les robots se font l'incruste en suivant le lien!!!!

La théorie de se brillant algorithme qu'est pageRank veut que les robots se contentent de suivre les liens et se baladent de page en page. En pratique, ces gentils petits robots sont bien plus indiscret qu'ils ne devraient!!! Une fois qu'ils ont mis le nez sur votre site, ils scannent, référencent, et mettent en cache tout ce qu'ils trouvent.

Je parle en connaissance de cause en vous disant que des documents placés dans un répertoire de votre site web peuvent être référencé et mis en cache même si aucun lien ne pointe dessus!!!

La prudence s'impose, Big Brother vous observe!!!!
parfois on met le site en ligne mais avec un domaine provisoire c'est pour cela on ne veux pas que notre site soit indexe (référencer par google ) pour ne pas tombé dans le cas du contenus dupliqué