Syntaxe grep ...

xonxof Messages postés 1 Statut Membre -  
jipicy Messages postés 41342 Statut Modérateur -
Bonjour,
pour extraire des courriels d'une page, j'ai trouvé cette ligne de commande assez sympa.
wget -q -O - http://test03.christophe-charron.org/... | grep -oe '\w*.\w*@\w*.\w*.\w\+'
Mais, il y a un problème d'encadrement des adresses et je ne manipule ni grep ni les expressions régulières et autres outils de cette puissance pour y arriver seul. Je récupère en effet l'espace précédent ou le ">" final, voire le <br> suivant l'adresse.

Comment l'améliorer pour qu'elle fonctionne, c'est à dire ne me renvoie que des chaînes de type "moipasbon_04@maison.com" depuis ma page de test (et sur d'autres) ?

Avez-vous des pistes à me donner ?

Cordialement

1 réponse

jipicy Messages postés 41342 Statut Modérateur 4 896
 
Salut,

Essaie avec :
grep -o '\w*.\W*@\w*.\w\+'
;-))
0