Wget - ignorer 500 internal server error [Résolu/Fermé]

Signaler
Messages postés
6
Date d'inscription
mercredi 26 octobre 2011
Statut
Membre
Dernière intervention
25 novembre 2011
-
 cpassimple -
Bonjour,
Je souhaiterai récupérer une page avec wget, mais le serveur revoi un status 500 dans l'entete de sa réponse et, wget me laisse avec un fichier vide :

HTTP request sent, awaiting response... 500 Internal Server Error
2011-10-26 23:30:04 ERROR 500: Internal Server Error.

Le corps de la page en question contient pourtant des informations que je souhaiterai récupérer (Firefox par exemple, charge bien la page malgré tout).

Y-a t-il un moyen de forcer wget a ignorer cette erreur 500 et a procéder au téléchargement de la page et enregistrer son contenu dans le fichier spécifié (-O) ? Si non, existe t-il un autre outil qui le ferai ?

Merci par avance de votre aide.

PS : Si la réponse figure dans le documentation, je m'en excuse je ne l'ai pas trouvée.

8 réponses

> zipe31
Merci de ta suggestion mais le site en question ne bloque pas le user-agent de wget. wget n'enregistre pas les pages si la réponse comporte un code d'erreur.

> gm
Effectivement curl se comporte lui exactement comme je le souhaite. J'imagine qu'il doit y avoir un moyen de dire a wget de se comporter de maniéré identique face a un code 500 mais cela résous mon problème, merci beaucoup :-)
3
Merci

Quelques mots de remerciements seront grandement appréciés. Ajouter un commentaire

CCM 65492 internautes nous ont dit merci ce mois-ci

Messages postés
36299
Date d'inscription
dimanche 7 novembre 2010
Statut
Contributeur
Dernière intervention
27 janvier 2021
6 162
Salut,

Essaye avec un '--user-agent="Mozilla"' (ou IE ;-\ )...

;-))
Messages postés
1231
Date d'inscription
mardi 7 juin 2011
Statut
Membre
Dernière intervention
24 mai 2015
334
Bonsoir,

Que veux tu faire du contenu de la page ?

Le stocker comme un fichier texte ?
Ou garder une image de la page ?

Pour le texte, depuis firefox, Ctrl-u te donnes accès au code html de la page, tu peux copier ce qui t'intéresse, et le coller dans un fichier que tu créer.

Pour garder une image, tu peux essayer en faisant une copie d'écran (touche "Impécr").

Mais si le but est de faire un script pour récupérer des données sur pleins de pages différentes, c'est plus compliqué...

Je ne sais pas si ça t'aide...
Messages postés
6
Date d'inscription
mercredi 26 octobre 2011
Statut
Membre
Dernière intervention
25 novembre 2011
1
Bonsoir,

Je cherche simplement a enregistrer une page dans une fichier avec wget, et cela même lorsque le serveur retourne un code d'erreur 500, a des fins de débogage (la page n'est pas vide pour autant).

Actuellement un 'wget www.monsite.com -O reponse.html --post-data='[...]'' me laisse avec un fichier vide si l'entête de la réponse contient un code 500 car wget exit juste après avoir reçu le header(ou alors je m'y prend mal). Je souhaiterai enregistre le contenu de la page dans réponse.html malgré tout.
Messages postés
6
Date d'inscription
mercredi 26 octobre 2011
Statut
Membre
Dernière intervention
25 novembre 2011
1
Apres vérification wget télécharge bien l'intégralité de la page, il ne me remplit juste pas mon fichier comme il le ferai en temps normal avec un status 200 OK.

Je ne sais pas comment lui dire de l'enregistrer quand même.
Messages postés
1231
Date d'inscription
mardi 7 juin 2011
Statut
Membre
Dernière intervention
24 mai 2015
334
Je viens d'essayer ta commande, elle marche sur certains site mais certains semblent fait pour la refuser...

Elle récupère l'intégralité du code html et l'écrit dans le fichier donné en output...

Donc si c'est pour faire un script qui récupère les codes html de pleins de site, ça peut être intéressant de résoudre le problème (pour toi). (peut être en trouvant une astuce avec un navigateur web en mode texte, comme w3m ?)

Si ce n'est que pour une page, tu iras plus vite en accedant au code source de la page et en faisant un copié collé...

bonne chance
Bonjour,

Tu peux peut-être essayer avec curl. La différence principale avec wget est qu'il écrit la page sur la sortie standard, donc il y a juste à rediriger vers un fichier.
Je vois que la question n'est pas d'hier. Mais as tu essayé de faire une restauration système et de retenter de te connecter au site?