Webscrapping : certains éléments non accessibles

Résolu

Utilisateur anonyme -
Utilisateur anonyme - 10 août 2015 à 22:05

Bonjour,

Je me penche sur le côté web scrapping de Python et j'ai déjà réussi quelques programmes. Je me retrouve face à des situations où certaines données visibles sur la page directement (grâce à inspecter l'élément) ne sont pas accessibles via le code source (introuvable). J'aurais voulu savoir s'il existe une manière de pouvoir avoir accès à la totalité des éléments d'une page à la manière de "inspecter l'élément".

Merci de bien vouloir me proposer une solution, cordialement.

Afficher la suite

33 réponses

Réponse 21 / 33

Utilisateur anonyme

21ème Up' !

Réponse 22 / 33

Utilisateur anonyme

22ème Up' !

Réponse 23 / 33

Utilisateur anonyme

23ème Up' !

Réponse 24 / 33

Utilisateur anonyme

24ème Up' !

Vous n’avez pas trouvé la réponse que vous recherchez ?

Posez votre question

Réponse 25 / 33

Utilisateur anonyme

25ème Up' !

Réponse 26 / 33

Utilisateur anonyme

26ème Up' !

Réponse 27 / 33

Utilisateur anonyme

27ème Up' !

Réponse 28 / 33

Utilisateur anonyme

28ème Up' !

Réponse 29 / 33

Utilisateur anonyme

29ème Up' !

Réponse 30 / 33

Utilisateur anonyme

30ème Up' !

Réponse 31 / 33

Utilisateur anonyme

31ème Up' ! (Un mois, célébrons ça ! Enfin, je suis seul donc ...)

Réponse 32 / 33

Utilisateur anonyme

32ème Up' !

Réponse 33 / 33

ElementW Messages postés 5690 Statut Contributeur 1 224

'lut, c'est simple: si un contenu est sur la page alors qu'il n'est pas dans la source initiale, c'est qu'il a été ajouté dynamiquement par du JavaScript, donc soit généré soit chargé avec une requête AJAX.
Sauf qu'à ma connaissance les outils de webscrapping n'interprètent ni n'analysent le JS des pages qu'ils rencontrent, d'où le fait que certains éléments ne soient pas accessibles.
Et là, il faut soit trouver/configurer/programmer un outil suffisamment puissant, soit faire une partie du scrapping à la main.
from human import idiocy
del idiocy

Utilisateur anonyme

OK merci. Une piste pour le scrapping en lien avec les requêtes AJAX ?

Webscrapping : certains éléments non accessibles

33 réponses

Votre réponse

Newsletters