[PHP] -> lectures des balises HTML

mugen23 Messages postés 125 Date d'inscription   Statut Membre Dernière intervention   -  
mugen23 Messages postés 125 Date d'inscription   Statut Membre Dernière intervention   -
Salut, j'ai beau chercher une solution un peux partout mais rien de très concluant :s

voici mon but, je souhaite lire une série de page web, jusque là, pas de problème, hors je souhaiterais récupérer le contenu de certaines balise, par exemple :

<div class="article" >
    <span class="pseudo">un premier pseudo</span>
    <div class="avatar"><img src ="..." /></div>
    <div class="content">du contenu, en veux tu en voilas .....</div>
</div>


donc pouvoir stocker dans un tableau, le contenue des balises, ce qui pourrais donner ça :

Array :

   ['pseudo'] => "un premier pseudo"; 
   ['avatar'] => "url_de_l_image";
   ['content'] => "du contenu, en veux tu en voilas ...";


c'est là que je plante, en effet, chaque pages contient plusieurs articles, je cherche donc en plus à indexer le tableau.

pour le moment je passe par une expression régulière qui me permet de récupérer le contenue de mes balises, pour les fin de balise, j'ai ajouter un paramètre à cette dernière, c'est pas jolie jolie mais ça me permet de savoir où ce trouve la fermeture de balise :

eregi("<div id=\"pseudo\">(.*)</div key=\"pseudo\">",$p,$retour);



pour info, ce projet serrais pour récupérer le contenue d'un forum pour lequel les bases de données sont inaccessible, histoire de pouvoir récupérer un minimum de contenue avant de dire ciao.

quelqu'un aurais une piste ? là sur le coup je plante grave :s
A voir également:

2 réponses

avion-f16 Messages postés 19252 Date d'inscription   Statut Contributeur Dernière intervention   4 507
 
Peux-être avec SimpleXMLElements ...
Lis la doc.
0
mugen23 Messages postés 125 Date d'inscription   Statut Membre Dernière intervention   2
 
merci pour l'info, je vais y jeter un œil !
0