Tris du code HTML

DonJoe -  
Ssylvainsab Messages postés 2884 Date d'inscription   Statut Modérateur Dernière intervention   -
Bonjour,
je voudrais savoir si c'était possible de faire ce qui suit:
1) De coder une application PHP qui récupère un fichier HTML généré dynamiquement par un autre site.
2) Tris le code HTML de cette page pour ne prendre qu'une information précise (par exemple, trier toutes les balises images et les afficher...ne me proposez pas de prendre les URLs direct des images parce que la page est générée dynamiquement).
3) Afficher le tris sans que l'utilisateur qui s'est rendu sur mon site voit la page qui a été chargée.

Donc voila, je voulais savoir si c'était possible de le faire, si oui, comment faire ?

Merci d'avance
A voir également:

1 réponse

Ssylvainsab Messages postés 2884 Date d'inscription   Statut Modérateur Dernière intervention   825
 
Bonjour.

Je pense que c'est possible avec des regex.

D'abord, tu utilise la fonction require pour recupérer la page générée dynamiquement.
Exemple :
@require('http://lurldusite.com/lurdelapage.php')
Le @ sert pour ne rien afficher en cas d'erreur.

Ensuite, tu sélectionnes les images avec des regex, ce qui te donnerai un truc du genre :
$page=@require('....');
$page=stripslashes(nl2br(htmlspecialchars($page));
$images=preg_replace('#<img(.+)src="-([\w.]+)"(.*)/>#isU', '<img src="$2'' />',$page);
echo $page;

Mais bon, je maitrise pas trop les regex, c'est pas la meilleur facon a mon avis.
On peut peut-être aussi faire avec des arrays...

Attends l'aide de quelqu'un plus expérimenté en php.

a plus
0