Extraire et lister les liens d'une page Web
wirsinda
Messages postés
1
Statut
Membre
-
brotapz -
brotapz -
Bonjour,
Je souhaite écrire un petit programme permettant de faire la liste des liens contenus sur une page web donnée.
J'imagine la procédure suivante :
-enregistrer le fichier localement
-l'ouvrir comme fichier txt avec Visual Basic
-rechercher les balises <A HREF >...
Connaissez vous une méthode peut-être plus directe sans passer par une copie locale ?
Merci pour vos idées.
Je souhaite écrire un petit programme permettant de faire la liste des liens contenus sur une page web donnée.
J'imagine la procédure suivante :
-enregistrer le fichier localement
-l'ouvrir comme fichier txt avec Visual Basic
-rechercher les balises <A HREF >...
Connaissez vous une méthode peut-être plus directe sans passer par une copie locale ?
Merci pour vos idées.
Configuration: Windows XP Firefox 2.0.0.4
A voir également:
- Extraire et lister les liens d'une page Web
- Navigateur web - Guide
- Supprimer une page word - Guide
- Web office - Guide
- Page web non disponible - Guide
- Voici un lien vers une page web . quelle est l’adresse web (url) de cette page web ? - Guide
2 réponses
Tu es dans la bonne route, mais seulement essaye de ne pas enregistrer le fichier en local mais juste en mémoire, j'utilise Delphi :
- Ouvrir le code source de la page
- Obtenir les liens dans ( href )
- Ignorer les liens ( mailto:email@email.com )
- Ignorer les liens externe ( si tu veux faire cela la comparaison est la solution )
- ajouter ( http://www.lenomdedomaine.ext ) si le lien est du genre (page.html)
- Ouvrir le code source de la page
- Obtenir les liens dans ( href )
- Ignorer les liens ( mailto:email@email.com )
- Ignorer les liens externe ( si tu veux faire cela la comparaison est la solution )
- ajouter ( http://www.lenomdedomaine.ext ) si le lien est du genre (page.html)