A voir également:
- Parser html avec perl
- Editeur html - Télécharger - HTML
- Html download - Télécharger - HTML
- Br html ✓ - Forum Webmastering
- /Var/www/html/index.html ✓ - Forum Linux / Unix
- &Nbsp html ✓ - Forum Webmastering
2 réponses
lami20j
Messages postés
21331
Date d'inscription
jeudi 4 novembre 2004
Statut
Modérateur, Contributeur sécurité
Dernière intervention
30 octobre 2019
3 567
15 mars 2009 à 22:14
15 mars 2009 à 22:14
Salut,
Si la méthode n'importe alors tu peux utiliser le programme html2text
Sinon pour parser html tu peux utiliser HTML::PARSER au lieu de passer par XML.
Si la méthode n'importe alors tu peux utiliser le programme html2text
Sinon pour parser html tu peux utiliser HTML::PARSER au lieu de passer par XML.
lami20j
Messages postés
21331
Date d'inscription
jeudi 4 novembre 2004
Statut
Modérateur, Contributeur sécurité
Dernière intervention
30 octobre 2019
3 567
15 mars 2009 à 23:34
15 mars 2009 à 23:34
Re,
Je suis désolé mais ce soir je n'ai plus le temps.
Si tu ne trouves pas une solution je regarderai demain soir.
Je suis désolé mais ce soir je n'ai plus le temps.
Si tu ne trouves pas une solution je regarderai demain soir.
15 mars 2009 à 23:31
j ai pris des scripts de html::parser mais ça marche je ne sais pas comment ça fonctionne ex:
#!/usr/bin/perl
use strict;
use warnings;
use LWP::Simple;
use HTML::Parser;
use HTML::Form;
my $page = get( "lien");
# création de mon parser
my $parser = HTML::Parser->new();
# définition des mes evenements
$parser->handler( text => \&text, "text" );
$parser->handler( start => \&start, "tagname,attr" );
$parser->handler( end => \&end, "tagname" );
$parser->parse($page);
print &get_data();
parser->eof;
{
my $in;
my @data;
sub start {
my ($tag, $attr) = @_;
$in++
if $tag eq 'div'
and exists $attr->{id}
and $attr->{id} eq 'profilename';
}
sub end {
my ($tag) = @_;
$in-- if ($tag eq 'div' and $in='1');
}
sub text {
my ($text) = @_;
push @data, $text if ($in );
}
sub get_data {
#print "in : ".$in;
return @data;
}
}
exit;
mais ça ne me donne rien