Extraire et lister les liens d'une page Web

wirsinda Messages postés 1 Statut Membre -  
 brotapz -
Bonjour,

Je souhaite écrire un petit programme permettant de faire la liste des liens contenus sur une page web donnée.

J'imagine la procédure suivante :
-enregistrer le fichier localement
-l'ouvrir comme fichier txt avec Visual Basic
-rechercher les balises <A HREF >...

Connaissez vous une méthode peut-être plus directe sans passer par une copie locale ?

Merci pour vos idées.
A voir également:

2 réponses

Zakaria
 
Tu es dans la bonne route, mais seulement essaye de ne pas enregistrer le fichier en local mais juste en mémoire, j'utilise Delphi :
- Ouvrir le code source de la page
- Obtenir les liens dans ( href )
- Ignorer les liens ( mailto:email@email.com )
- Ignorer les liens externe ( si tu veux faire cela la comparaison est la solution )
- ajouter ( http://www.lenomdedomaine.ext ) si le lien est du genre (page.html)
0
brotapz
 
Merci bien Zakaria, mais, tu n'aurais pas un bout de code, quelque chose, même en delphi...
0