Syntaxe grep ...

Fermé
xonxof Messages postés 1 Date d'inscription mardi 30 septembre 2008 Statut Membre Dernière intervention 30 septembre 2008 - 30 sept. 2008 à 15:52
jipicy Messages postés 40805 Date d'inscription jeudi 28 août 2003 Statut Modérateur Dernière intervention 10 août 2020 - 30 sept. 2008 à 16:08
Bonjour,
pour extraire des courriels d'une page, j'ai trouvé cette ligne de commande assez sympa.
wget -q -O - http://test03.christophe-charron.org/... | grep -oe '\w*.\w*@\w*.\w*.\w\+'
Mais, il y a un problème d'encadrement des adresses et je ne manipule ni grep ni les expressions régulières et autres outils de cette puissance pour y arriver seul. Je récupère en effet l'espace précédent ou le ">" final, voire le <br> suivant l'adresse.

Comment l'améliorer pour qu'elle fonctionne, c'est à dire ne me renvoie que des chaînes de type "moipasbon_04@maison.com" depuis ma page de test (et sur d'autres) ?

Avez-vous des pistes à me donner ?

Cordialement

1 réponse

jipicy Messages postés 40805 Date d'inscription jeudi 28 août 2003 Statut Modérateur Dernière intervention 10 août 2020 4 901
30 sept. 2008 à 16:08
Salut,

Essaie avec :
grep -o '\w*.\W*@\w*.\w\+'
;-))
0