Wget 404 not found

Fermé
mopimoi - 27 juin 2011 à 20:37
 mopimoi - 28 juin 2011 à 13:56
Bonjour,

Il m'arrive quelque chose d'étrange... très étrange.

J'ai fait un script bash qui va télécharger automatiquement des affiches de films sur un site grâce à wget.

Je me mange parfois une erreur 404. Pour certaines affiches c'est normal, elles ne sont pas toutes sur le site, mais pour d'autres l'affiche existe bien sur ce site.

Le plus fort, c'est que si je mets l'adresse directement dans firefox, je me mange l'erreur 404 aussi, MAIS (c'est là que ça devient vraiment étrange) si j'accède à cette même page en passant par le site (c'est à dire en cliquant sur un lien qui mène vers la page voulu) ça marche, j'ai plus l'erreur 404. Et si je relance mon script après, l'affiche est bien téléchargée, plus d'erreur 404 -_-'.

Donc j'ai beau ne pas trop être une cruche en informatique, là je sèche complètement... si quelqu'un a une explication je suis preneur, parce que c'est pas facile de résoudre un problème quand on sait pas d'où il vient :D.

Merci d'avance !

3 réponses

En regardant le code source de la page contenant le lien vers l'affiche voulu, j'ai remarqué que l'adresse URL en lien n'est pas la même que celle qui s'affiche dans la barre d'adresse de firefox, pourquoi ?

Pour être plus clair, le lien est
www.moviecovers.com/getjpg.html/BASIC%20INSTINCT.jpg
et quand je clique dessus, c'est
http://data.moviecovers.com/DATA/zipcache/BASIC%20INSTINCT.jpg
qui s'affiche dans la barre d'adresse.

Du coup, j'avais mis pour wget l'adresse en data.moviecovers. J'ai changé avec ma nouvelle découverte et c'est du 403 : forbidden que je me mange... :S
C'est pas beaucoup mieux, mais c'est un peu plus compréhensible. Par contre en mettant l'adresse sur firefox j'ai ni le forbidden ni le not found.... Du coup ça redevient incompréhensible (en tout cas pour moi^^)

Donc si quelqu'un peut :
1°) M'expliquer ce que c'est que ce bordel
2°) Me dire comment je peux m'y prendre pour que mon wget marche (comme la barre d'adresse firefox maintenant)

Je lui en serais très reconnaissant (et je lui ferais peut être même une gâterie)

Merci d'avance... again !
0
dsy73 Messages postés 9252 Date d'inscription dimanche 22 août 2010 Statut Contributeur Dernière intervention 23 octobre 2020 2 482
27 juin 2011 à 21:16
Le webmaster a juste protégé son site contre les voleurs...
0
Que nenni, puisque son site est fait pour partager les affiches de films, donc on peut les télécharger librement...
Et en plus ya quelques affiches qui n'ont pas eu de forbidden. Et d'autres encore qui ont eu un forbidden au match allé mais pas au match retour (c'est à dire que j'ai relancé le script immédiatement et 2-3 affiches de plus ont été récupérées).
0
dsy73 Messages postés 9252 Date d'inscription dimanche 22 août 2010 Statut Contributeur Dernière intervention 23 octobre 2020 2 482
28 juin 2011 à 06:22
Demande au webmaster si tu peux aspirer les données de son site, tu verras bien ce qu'il te répond :
https://moviecovers.com/credits.html
S'il est d'accord, il pourra même t'aider.
0
Hum en effet il y a des infos techniques sur ma FAQ, je devrais donc pouvoir résoudre mon problème, et en prime ils ont l'air de vouloir aider les malheureux qui n'y arrivent pas tout seul ^^.

Du problème solved, en partie... parce que j'aimerais bien quand même comprendre le fonctionnement qui fait que l'adresse change, ou que j'ai un forbidden pour wget mais pas sur firefox.

Donc si quelqu'un peut m'expliquer, je veux bien.

Merci d'avance pour les réponses futur, et merci dsy73 pour ton aide.
0
Le problème de poster sans se connecter c'est qu'on peut pas éditer...

Donc c'est "sur LA FAQ" et pas "ma FAQ", et c'est "Du coup problème solved" et pas "Du problème solved"...

Pas très grave tout ça mais une petite correction ne fait de mal à personne...
0