Récupération d'une page web avec CURL Résolu

Question

Bonjour, J'ai fait une petit programme pour récupérérer tous le contenue d'une page web. Je l'ai tester sur plusieurs site, avec certain cela fonctionne très bien mais avec d'autre c'est moin évident exemple avec cette url : http://www.has-sante.fr/... C'est une adresse avec plein de résultat, malheuresement quand je lance mon fichier php avec CURL je me retrouve avec 0 résultat. Avez-vous une idée d'ou proviens le problème? Est-il simplement impossible de récupérer les résultats ici ? Car gérer en JS ou autre ? Cordialement, $line) { if( htmlspecialchars($line) != "") { //echo "Line # {$line_num} : ".htmlspecialchars($line)."
"; $line = str_replace(" ","", $line); file_put_contents("test.txt", $line." ",FILE_APPEND); } }?>

ElementW · Answer

'lut, j'ai lancé le script sur la page d'accueil de has-sante.fr et j'ai eu ça: Line # 0 : Line # 1 : Line # 2 : 302 FoundLine # 3 : Line # 4 :

Found

Line # 5 :

The document has moved here.

Line # 6 : Par "0 résultat", je ne sais pas ce que tu cherches et ce que tu appelles un "résultat", mais si tu te retrouves confronté au même résultat que moi, ça veut dire qu'il va falloir que tu implémentes la gestion des redirections HTTP avec l'en-tête Location: qui t'es renvoyé par le site, que tu peux obtenir avec curl_setopt($ch, CURLOPT_HEADER, true); et$header_size = curl_getinfo($ch, CURLINFO_HEADER_SIZE); $header = substr($file_contents, 0, $header_size); $body = substr($file_contents, $header_size);

Nhay · Answer

Sinon, tu devrait changer le User-agent de ta requête Curl, certains site bloque celui par Défaut.

[Dal] · Answer

Salut,

L'adresse en question renvoie plusieurs codes http 302 qui sont des codes de redirection "moved temporarily".

Pour faire que cURL suive les redirections proposées par le serveur, il faut ajouter cette option :

curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);

Dal

Récupération d'une page web avec CURL

3 réponses

Discussions similaires

Newsletters