Récuperer le contenu d'une page web en php
Fermé
Zakl
Messages postés
49
Date d'inscription
mardi 22 avril 2008
Statut
Membre
Dernière intervention
10 mai 2014
-
14 juil. 2012 à 15:04
jisisv Messages postés 3645 Date d'inscription dimanche 18 mars 2001 Statut Modérateur Dernière intervention 15 janvier 2017 - 15 juil. 2012 à 18:52
jisisv Messages postés 3645 Date d'inscription dimanche 18 mars 2001 Statut Modérateur Dernière intervention 15 janvier 2017 - 15 juil. 2012 à 18:52
A voir également:
- Récuperer le contenu d'une page web en php
- Supprimer une page word - Guide
- Traduire une page web - Guide
- Recuperer message whatsapp supprimé - Guide
- Recuperer video youtube - Guide
- Enregistrer une page web en pdf - Guide
4 réponses
wrest54
Messages postés
105
Date d'inscription
dimanche 26 décembre 2010
Statut
Membre
Dernière intervention
13 juin 2014
19
14 juil. 2012 à 15:05
14 juil. 2012 à 15:05
Une simple capture d'écran peu peut-être t'aider non ?
Zakl
Messages postés
49
Date d'inscription
mardi 22 avril 2008
Statut
Membre
Dernière intervention
10 mai 2014
14 juil. 2012 à 15:07
14 juil. 2012 à 15:07
non car je souhaite réafficher le resultat sur une page web
Zakl
Messages postés
49
Date d'inscription
mardi 22 avril 2008
Statut
Membre
Dernière intervention
10 mai 2014
15 juil. 2012 à 12:49
15 juil. 2012 à 12:49
personne?
jisisv
Messages postés
3645
Date d'inscription
dimanche 18 mars 2001
Statut
Modérateur
Dernière intervention
15 janvier 2017
934
Modifié par jisisv le 15/07/2012 à 18:53
Modifié par jisisv le 15/07/2012 à 18:53
Tu peux déjà commencer par récupérer la page en vue de l'analyser. J'utilise ici cURL:cURL
Malheureusement mon proxy ne semble pas fonctionner...
J'ai ajouté des sauts de lignes afin d'obtenir une page HTML lisible pour l'humain.
Par contre, c'est de très loin un document XML conforme (au sens large). Il faudra tripatouille pour extraire les données, puisque ce document ne sera pas analysé correctement par les outils XML standards.
Gates gave ^H sold you the windows.
GNU gave us the whole house.(Alexandrin)
Malheureusement mon proxy ne semble pas fonctionner...
J'ai ajouté des sauts de lignes afin d'obtenir une page HTML lisible pour l'humain.
Par contre, c'est de très loin un document XML conforme (au sens large). Il faudra tripatouille pour extraire les données, puisque ce document ne sera pas analysé correctement par les outils XML standards.
johand@osiris: ~/src/CCM/php $ cat get_xwis_data.php <?php $URL="http://xwis.net/ra2/pl/goodbye/"; $XML_DATA = "data.xml"; function get_data($url, &$page_content, $xml_file) { $timeout = 10; $proxy_host = 'http://192.168.0.8'; // host $proxy_port = 3128; $proxy_ident = ''; // username:password $ch = curl_init($url); curl_setopt($ch, CURLOPT_FRESH_CONNECT, true); curl_setopt($ch, CURLOPT_TIMEOUT, $timeout); curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $timeout); if (preg_match(''^[https:// https://'i',] $url)) { curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false); curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, 0); } curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true); curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); // Activation de l'utilisation d'un serveur proxy curl_setopt($ch, CURLOPT_HTTPPROXYTUNNEL, false); // Définition de l'adresse du proxy curl_setopt($ch, CURLOPT_PROXY, $proxy_host); curl_setopt($ch, CURLOPT_PROXYPORT, $proxy_port); // Définition des identifiants si le proxy requiert une identification if ($proxy_ident) { curl_setopt($ch, CURLOPT_PROXYUSERPWD, $proxy_ident); } curl_setopt($ch, CURLOPT_ENCODING , "gzip"); $headers_enabled = 0; curl_setopt($ch, CURLOPT_HEADER, $headers_enabled); $page_content = curl_exec($ch); curl_close($ch); $handle = fopen($xml_file, "w"); fwrite($handle, $page_content); print("HERE"); fclose($handle); } $page_content=""; if( file_exists($XML_DATA)) { $handle = fopen($XML_DATA, "r"); if ( $handle ) { $page_content = fread($handle, filesize($XML_DATA)); } } else { get_data($URL, $page_content, $XML_DATA); } // preg_lace ( mixed $pattern , mixed $replacement , mixed $subject ) $page_content = preg_replace('!<!im' ,"\n<", $page_content); $page_content = preg_replace('!>!im' , ">\n", $page_content); echo $page_content; ?>
Gates gave ^H sold you the windows.
GNU gave us the whole house.(Alexandrin)