Lister URL d'un site sur xml
Biohazard-34
-
UgglyBoy Messages postés 440 Statut Membre -
UgglyBoy Messages postés 440 Statut Membre -
Bonjour,
j'aimerai créer un script qui prendra en entrée l’URL d’un site et devra fournir en sortie le fichier Sitemap XML complet. La difficulté est en fait que le script doit parcourir l’intégralité du site et répertorier de manière exhaustive les URLs du site (plusieurs milliers de pages). Ce script sera par la suite hébergé sur serveur Linux distribution Gentoo.
Dans l'attente d'un réponse de votre part, je vous remerci d'avance.
j'aimerai créer un script qui prendra en entrée l’URL d’un site et devra fournir en sortie le fichier Sitemap XML complet. La difficulté est en fait que le script doit parcourir l’intégralité du site et répertorier de manière exhaustive les URLs du site (plusieurs milliers de pages). Ce script sera par la suite hébergé sur serveur Linux distribution Gentoo.
Dans l'attente d'un réponse de votre part, je vous remerci d'avance.
A voir également:
- Lister URL d'un site sur xml
- Url - Guide
- Site de telechargement - Accueil - Outils
- Site x - Guide
- Site comme coco - Accueil - Réseaux sociaux
- Xml viewer - Télécharger - Édition & Programmation
5 réponses
Désolé pour moi la question était évidente...Seulement pour moi alors ^^
Avez vous une idée concernant le code permettant d'effectuer un tel traitement en récuperant l'URL placer un paramètre ?
Avez vous une idée concernant le code permettant d'effectuer un tel traitement en récuperant l'URL placer un paramètre ?
Dans une page donnée (pour une url) il y a 2 moyens pour récupérer qqchose:
oldschool:
comparaison de chaîne de caractères: recherche ce qui commence par "href="...
newschool:
à travers le DOM:
maintenant "anchorTags" est un tableau contenant toutes les ancres.
après nettoyage du tableau, le but est d'aller suivre récursivement chaque lien et de refaire ceci pour tous les url d'un domaine/sous-domaine... woaw! Je ne sais pas si on peut faire ceci qu'en js...
oldschool:
comparaison de chaîne de caractères: recherche ce qui commence par "href="...
newschool:
à travers le DOM:
var anchorTags = document.getElementsByTagName('a');
maintenant "anchorTags" est un tableau contenant toutes les ancres.
après nettoyage du tableau, le but est d'aller suivre récursivement chaque lien et de refaire ceci pour tous les url d'un domaine/sous-domaine... woaw! Je ne sais pas si on peut faire ceci qu'en js...
Vous n’avez pas trouvé la réponse que vous recherchez ?
Posez votre question