[Java][RegExp] Extraire lien HTML

Résolu
djschorn Messages postés 13 Date d'inscription   Statut Membre Dernière intervention   -  
asevere Messages postés 13095 Date d'inscription   Statut Webmaster Dernière intervention   -
Bonjour,

Voilà je voudrais extraire d'une page HTML tout les liens qui y sont contenu.
J'ai essayé un truc du style :

Pattern pattern = Pattern.compile("(<A HREF=).*(</A>)");
Matcher matcher = pattern.matcher(maChaine);

while(matcher.find())
System.out.println(matcher.group());

Mais ca m'affiche tout le texte contenu entre le 1er et le dernier lien (inclus) :-(

Il est évident que l'erreur vient du pattern, mais comment faire ?

Merci d'avance
A voir également:

3 réponses

asevere Messages postés 13095 Date d'inscription   Statut Webmaster Dernière intervention   426
 
Salut,
Je ne me souviens plus des expressions regulieres en java,
Mais selon le standard des erxpressions il me semble qu'un patern comme celui là:
"<a href=[^>]*>[^<]*</a>" devrai te donner pour chaque lien quelque chose du type
<a href="...">nomdulien</a>

[^>]* et [^<]* représentent normalement n'importe quel caractére exepté '>', respectivement '<' .

essaye ca et dis moi si ca marche :o)

++

Na kaer eo va Breizh,
gand ar mor glaz èn-dro dezi !
2
djschorn Messages postés 13 Date d'inscription   Statut Membre Dernière intervention  
 
Yep, ca marche, merci bcp ;-))))
0
asevere Messages postés 13095 Date d'inscription   Statut Webmaster Dernière intervention   426
 
Cool :o)

De rien, ravi de t'avoir aidé !

++

Na kaer eo va Breizh,
gand ar mor glaz èn-dro dezi !
0