Télécharger automatiquement des liens sur un site web [Fermé]

Signaler
Messages postés
29
Date d'inscription
dimanche 9 novembre 2014
Statut
Membre
Dernière intervention
9 avril 2020
-
Messages postés
29
Date d'inscription
dimanche 9 novembre 2014
Statut
Membre
Dernière intervention
9 avril 2020
-
Bonjour à tous,

Je souhaite pouvoir récupérer les éléments mis en ligne sur ce site web : https://thetrove.net/Assets/

Le problème étant que, le faire à la main semble plutôt fastidieux, ne pouvant télécharger qu'un élément à la fois, et le site en ayant apparemment des dizaines de milliers..

C'est pourquoi je voudrais savoir comment rendre cela plus rapide, peut-être à partir d'un script python, j'imagine que certains code déjà pré-écrit pourraient servir ? Cependant je ne maîtrise pas encore de langage de programmation.

Merci d'avance pour votre aide !

1 réponse

Messages postés
12312
Date d'inscription
lundi 9 juin 2008
Statut
Contributeur
Dernière intervention
24 septembre 2020
693
bonjour, tu seras peut-être intéressé par un aspirateur de site web.
Messages postés
29
Date d'inscription
dimanche 9 novembre 2014
Statut
Membre
Dernière intervention
9 avril 2020

Bonjour,

Merci, je vais essayer avec HTTrack, cependant je n'avais jamais testé d'aspirateur de site web auparavant, savez-vous si cela me fournira une copie de ce site en local, avec une copie des dossiers et des éléments à l'intérieur de ceux-ci, et pas seulement les liens ?

Merci d'avance !
Messages postés
12312
Date d'inscription
lundi 9 juin 2008
Statut
Contributeur
Dernière intervention
24 septembre 2020
693 >
Messages postés
29
Date d'inscription
dimanche 9 novembre 2014
Statut
Membre
Dernière intervention
9 avril 2020

c'est censé fournir une copie complète du site en local.
Messages postés
29
Date d'inscription
dimanche 9 novembre 2014
Statut
Membre
Dernière intervention
9 avril 2020

Bonjour,

Après plusieurs essais, pour la catégorie qui m’intéresse (Assets) je n’obtiens que des fichiers TMP, inutilisable, cependant pour les autres onglets (qui ne m’intéressent pas malheureusement) l'aspirateur de site web arrive bien à récupérer les ressources mises en lignes..

Auriez-vous une autre solution pour télécharger ce contenu automatiquement ?
Messages postés
12312
Date d'inscription
lundi 9 juin 2008
Statut
Contributeur
Dernière intervention
24 septembre 2020
693 >
Messages postés
29
Date d'inscription
dimanche 9 novembre 2014
Statut
Membre
Dernière intervention
9 avril 2020

quel est le lien vers ce que tu ne peux pas récupérer?
Messages postés
29
Date d'inscription
dimanche 9 novembre 2014
Statut
Membre
Dernière intervention
9 avril 2020

C'est le premier lien, celui vers le répertoire Assets que l'aspirateur n'arrive pas à récupérer (ou du moins ne m'en récupère que des fichiers temporaires) : https://thetrove.net/Assets/

Cependant, par exemple, le répertoire Books lui à bien fonctionné, (après un test avec l'aspirateur depuis la racine du site) https://thetrove.net/Books/index.html

Une idée ?