[PHP] -> lectures des balises HTML

Fermé
mugen23 Messages postés 125 Date d'inscription mardi 4 août 2009 Statut Membre Dernière intervention 27 novembre 2010 - 13 sept. 2009 à 17:39
mugen23 Messages postés 125 Date d'inscription mardi 4 août 2009 Statut Membre Dernière intervention 27 novembre 2010 - 13 sept. 2009 à 20:47
Salut, j'ai beau chercher une solution un peux partout mais rien de très concluant :s

voici mon but, je souhaite lire une série de page web, jusque là, pas de problème, hors je souhaiterais récupérer le contenu de certaines balise, par exemple :

<div class="article" >
    <span class="pseudo">un premier pseudo</span>
    <div class="avatar"><img src ="..." /></div>
    <div class="content">du contenu, en veux tu en voilas .....</div>
</div>


donc pouvoir stocker dans un tableau, le contenue des balises, ce qui pourrais donner ça :

Array :

   ['pseudo'] => "un premier pseudo"; 
   ['avatar'] => "url_de_l_image";
   ['content'] => "du contenu, en veux tu en voilas ...";


c'est là que je plante, en effet, chaque pages contient plusieurs articles, je cherche donc en plus à indexer le tableau.

pour le moment je passe par une expression régulière qui me permet de récupérer le contenue de mes balises, pour les fin de balise, j'ai ajouter un paramètre à cette dernière, c'est pas jolie jolie mais ça me permet de savoir où ce trouve la fermeture de balise :

eregi("<div id=\"pseudo\">(.*)</div key=\"pseudo\">",$p,$retour);



pour info, ce projet serrais pour récupérer le contenue d'un forum pour lequel les bases de données sont inaccessible, histoire de pouvoir récupérer un minimum de contenue avant de dire ciao.

quelqu'un aurais une piste ? là sur le coup je plante grave :s
A voir également:

2 réponses

avion-f16 Messages postés 19252 Date d'inscription dimanche 17 février 2008 Statut Contributeur Dernière intervention 10 février 2025 4 505
13 sept. 2009 à 19:18
Peux-être avec SimpleXMLElements ...
Lis la doc.
0
mugen23 Messages postés 125 Date d'inscription mardi 4 août 2009 Statut Membre Dernière intervention 27 novembre 2010 2
13 sept. 2009 à 20:47
merci pour l'info, je vais y jeter un œil !
0