Comparaison html avec Perl

Monlog Messages postés 6 Date d'inscription   Statut Membre Dernière intervention   -  
Monlog Messages postés 6 Date d'inscription   Statut Membre Dernière intervention   -
Hi !

Je cherche de l'aide pour un projet, voila j'aimerai, en faisant un get sur un site (ou autre), comparer une chaine de caractère pour voir si on la trouve dans le code source d'une page html passée en paramètre.
Si quelqu'un pourrait m'aider, ou aurait fait un script dans le genre parce que je suis complétement bloqué :/

merci d'avance
A voir également:

8 réponses

Leviathan49 Messages postés 257 Date d'inscription   Statut Membre Dernière intervention   70
 
Tu pourrais recupérer le contenu de ta page dans une var et utiliser une expression reguliere par dessus.

#!/usr/bin/perl

use strict;
use LWP::Simple;

my $html = get("https://forums.commentcamarche.net/forum/affich-22521812-comparaison-html-avec-perl") or die "erreur";

if( $html =~ /(utiliser .* dessus)/i) { print "$1\n"; }
else { print "pas present\n"; }
1
Leviathan49 Messages postés 257 Date d'inscription   Statut Membre Dernière intervention   70
 
Voilà un petit cours sur le regex en perl => ici

Sinon pour ce qui est du motif de ma regex : /(utiliser .* dessus)/i
Analyse
/                 séparateur debut  
(                 début parenthèse capturante  
'utiliser '      utiliser suivi d'un espace  
.*               0 à n caractère quelquonque (ici c'est 'une expression reguliere par')  
' dessus'      dessus précédé d'un espace  
)                 fin parenthèse capturante  
/                 séparateur fin  
i                 indique que 'lon ne tient pas compte de la casse 

En perl, les expressions régulières se font très simplement avec l'operateur ~ (voir cours)
Si tu as des problèmes sur la conception de ton motif n'hésite pas à demander
1
jisisv Messages postés 3645 Date d'inscription   Statut Modérateur Dernière intervention   934
 
... et tu disposes de quel langage?
Si c'est Perl, j'avoue mon manque de connaissance des bibliothèques CPAN.
Si c'st PHP ou Python, je peux t'aider.
En gros, essaye de trouver une biliothèque qui te charge une page (genre cURL)
et effectue-s'y une recherhe (regexp, ou si tu connais la structure de la page et si elle est bien formée, avec un parseur XML).

Gates gave ^H sold you the windows.
GNU gave us the whole house.(Alexandrin)
0
Monlog Messages postés 6 Date d'inscription   Statut Membre Dernière intervention  
 
c'est uniquement Perl =)

Je vois comment récupérer le code source d'une page html, le soucis c'est de chercher dans le code source , si elle contient ma variable :/
0

Vous n’avez pas trouvé la réponse que vous recherchez ?

Posez votre question
Monlog Messages postés 6 Date d'inscription   Statut Membre Dernière intervention  
 
up :)
0
Monlog Messages postés 6 Date d'inscription   Statut Membre Dernière intervention  
 
toujours personne :'( ?
0
Monlog Messages postés 6 Date d'inscription   Statut Membre Dernière intervention  
 
merci super =)

pour faire une comparaison ça marche comment ?

si tu peux me détailler le fonctionnement en fait, je suis pas très calé niveau regex :/

encore merci pour ton aide =)
0
Monlog Messages postés 6 Date d'inscription   Statut Membre Dernière intervention  
 
merci beaucoup je vais explorer tout ça et puis je te redis si j'ai un soucis ^.^


si par exemple je veut faire une variable $chain je peux donc la mettre ici

f( $html =~ /($chain)/i) { print "$1\n"; }

??
0