Parser une page html

Question

Bonjour, Je suis actuellement en train de monter un site qui récupérer un tas de données sur différents sites afin de les rassemblée sur un seul. Au commencement, je travaillais principalement sur un fichier xml qui me permettais d'avoir les principales info j'avais besoin. Cependant ce fichier xml n'existe plus. Il me faut donc moi même le créer à partir de sa source. Je pensais utiliser des regex du style preg_match afin de récupérer certains champs en fonction de certaine balise. La regex donnait : preg_match('

(.*)

#', $content, $matches, PREG_OFFSET_CAPTURE); echo '

';
print_r($matches);
echo '

'; $content contient toute la page contenant toutes les informations. Cette balise étant unique, je pensais pouvoir après n'afficher que la valeur souhaitée. Malheureusement la regex ne me renvoi rien. Y'aurait'il d'autres façons pour parser une page html ou pas ? Un collègue vient de me dire d'essayer de prendre la page html comme une page xml. je vais essayer cette autre façon afin de vérifier si ça pourrait fonctionner.

avion-f16 · Answer

Tu peux essayer avec DOM, en faisant un getElementsByTagName puis tu vérifies si l'attribut class == 'toto'

Robin S. · Answer

Je suis pas fan des DOM, mais si ça peut faire ce dont j'ai besoin je vais essayé et rebosser les DOM pour utiliser ton exemple. Merci à toi :)

mr05j · Answer

avion-f16, tu est un expert toi   tu est le mireurs 100/100

Parser une page html

3 réponses

Discussions similaires

Newsletters