Parser une page html
Robin S.
-
mr05j Messages postés 295 Date d'inscription Statut Membre Dernière intervention -
mr05j Messages postés 295 Date d'inscription Statut Membre Dernière intervention -
Bonjour,
Je suis actuellement en train de monter un site qui récupérer un tas de données sur différents sites afin de les rassemblée sur un seul.
Au commencement, je travaillais principalement sur un fichier xml qui me permettais d'avoir les principales info j'avais besoin. Cependant ce fichier xml n'existe plus. Il me faut donc moi même le créer à partir de sa source.
Je pensais utiliser des regex du style preg_match afin de récupérer certains champs en fonction de certaine balise.
La regex donnait :
preg_match('<p class="toto">(.*)</p>#', $content, $matches, PREG_OFFSET_CAPTURE);
echo '<pre>';
print_r($matches);
echo '</pre>';
$content contient toute la page contenant toutes les informations.
Cette balise étant unique, je pensais pouvoir après n'afficher que la valeur souhaitée.
Malheureusement la regex ne me renvoi rien.
Y'aurait'il d'autres façons pour parser une page html ou pas ?
Un collègue vient de me dire d'essayer de prendre la page html comme une page xml.
je vais essayer cette autre façon afin de vérifier si ça pourrait fonctionner.
Je suis actuellement en train de monter un site qui récupérer un tas de données sur différents sites afin de les rassemblée sur un seul.
Au commencement, je travaillais principalement sur un fichier xml qui me permettais d'avoir les principales info j'avais besoin. Cependant ce fichier xml n'existe plus. Il me faut donc moi même le créer à partir de sa source.
Je pensais utiliser des regex du style preg_match afin de récupérer certains champs en fonction de certaine balise.
La regex donnait :
preg_match('<p class="toto">(.*)</p>#', $content, $matches, PREG_OFFSET_CAPTURE);
echo '<pre>';
print_r($matches);
echo '</pre>';
$content contient toute la page contenant toutes les informations.
Cette balise étant unique, je pensais pouvoir après n'afficher que la valeur souhaitée.
Malheureusement la regex ne me renvoi rien.
Y'aurait'il d'autres façons pour parser une page html ou pas ?
Un collègue vient de me dire d'essayer de prendre la page html comme une page xml.
je vais essayer cette autre façon afin de vérifier si ça pourrait fonctionner.
A voir également:
- Parser une page html
- Supprimer une page word - Guide
- Imprimer tableau excel sur une page - Guide
- Editeur html - Télécharger - HTML
- Créer une page facebook - Guide
- Comment traduire une page - Guide