Récupération d'une page web avec CURL
Résolu/Fermé
Xeis
-
24 juin 2014 à 11:15
[Dal] Messages postés 6203 Date d'inscription mercredi 15 septembre 2004 Statut Contributeur Dernière intervention 29 janvier 2025 - 24 juin 2014 à 15:05
[Dal] Messages postés 6203 Date d'inscription mercredi 15 septembre 2004 Statut Contributeur Dernière intervention 29 janvier 2025 - 24 juin 2014 à 15:05
A voir également:
- Récupération d'une page web avec CURL
- Supprimer une page word - Guide
- Traduire une page web - Guide
- Web office - Guide
- Faire une capture d'écran d'une page web entière - Guide
- Enregistrer une page web en pdf - Guide
3 réponses
ElementW
Messages postés
4814
Date d'inscription
dimanche 12 juin 2011
Statut
Contributeur
Dernière intervention
5 octobre 2021
1 228
24 juin 2014 à 11:32
24 juin 2014 à 11:32
'lut, j'ai lancé le script sur la page d'accueil de has-sante.fr et j'ai eu ça:
Line # 0 : <!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN">Par "0 résultat", je ne sais pas ce que tu cherches et ce que tu appelles un "résultat", mais si tu te retrouves confronté au même résultat que moi, ça veut dire qu'il va falloir que tu implémentes la gestion des redirections HTTP avec l'en-tête
Line # 1 : <html><head>
Line # 2 : <title>302 Found</title>
Line # 3 : </head><body>
Line # 4 : <h1>Found</h1>
Line # 5 : <p>The document has moved <a href="http://www.has-sante.fr/">here</a>.</p>
Line # 6 : </body></html>
Location:qui t'es renvoyé par le site, que tu peux obtenir avec
curl_setopt($ch, CURLOPT_HEADER, true);et
$header_size = curl_getinfo($ch, CURLINFO_HEADER_SIZE); $header = substr($file_contents, 0, $header_size); $body = substr($file_contents, $header_size);
Nhay
Messages postés
838
Date d'inscription
vendredi 2 novembre 2012
Statut
Membre
Dernière intervention
17 décembre 2015
126
24 juin 2014 à 13:03
24 juin 2014 à 13:03
Sinon, tu devrait changer le User-agent de ta requête Curl, certains site bloque celui par Défaut.
ElementW
Messages postés
4814
Date d'inscription
dimanche 12 juin 2011
Statut
Contributeur
Dernière intervention
5 octobre 2021
1 228
24 juin 2014 à 14:44
24 juin 2014 à 14:44
J'ai suspecté ça aussi, mais cURL, sans config manuelle, prend l'UA du php.ini, qui sur certaines config (ex. PHP sur ArchLinux) n'est pas défini (donc je sais pas sur quoi il est paramétré).
[Dal]
Messages postés
6203
Date d'inscription
mercredi 15 septembre 2004
Statut
Contributeur
Dernière intervention
29 janvier 2025
1 098
Modifié par [Dal] le 24/06/2014 à 15:14
Modifié par [Dal] le 24/06/2014 à 15:14
Salut,
L'adresse en question renvoie plusieurs codes http 302 qui sont des codes de redirection "moved temporarily".
Pour faire que cURL suive les redirections proposées par le serveur, il faut ajouter cette option :
Dal
L'adresse en question renvoie plusieurs codes http 302 qui sont des codes de redirection "moved temporarily".
Pour faire que cURL suive les redirections proposées par le serveur, il faut ajouter cette option :
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);
Dal
24 juin 2014 à 11:49
6,326 résultats pour votre recherche en texte intégral.
Et dans mon script il me renvoie :
0 résultat pour votre recherche en texte intégral.
Alors que l'url spécifié est éxactement là même.
Merci,