Webscrapping : certains éléments non accessibles

Résolu
Utilisateur anonyme -  
 Utilisateur anonyme -
Bonjour,

Je me penche sur le côté web scrapping de Python et j'ai déjà réussi quelques programmes. Je me retrouve face à des situations où certaines données visibles sur la page directement (grâce à inspecter l'élément) ne sont pas accessibles via le code source (introuvable). J'aurais voulu savoir s'il existe une manière de pouvoir avoir accès à la totalité des éléments d'une page à la manière de "inspecter l'élément".

Merci de bien vouloir me proposer une solution, cordialement.

33 réponses

Utilisateur anonyme
 
21ème Up' !
0
Utilisateur anonyme
 
22ème Up' !
0
Utilisateur anonyme
 
23ème Up' !
0
Utilisateur anonyme
 
24ème Up' !
0

Vous n’avez pas trouvé la réponse que vous recherchez ?

Posez votre question
Utilisateur anonyme
 
25ème Up' !
0
Utilisateur anonyme
 
26ème Up' !
0
Utilisateur anonyme
 
27ème Up' !
0
Utilisateur anonyme
 
28ème Up' !
0
Utilisateur anonyme
 
29ème Up' !
0
Utilisateur anonyme
 
30ème Up' !
0
Utilisateur anonyme
 
31ème Up' ! (Un mois, célébrons ça ! Enfin, je suis seul donc ...)
0
Utilisateur anonyme
 
32ème Up' !
0
ElementW Messages postés 4814 Date d'inscription   Statut Contributeur Dernière intervention   1 223
 
'lut, c'est simple: si un contenu est sur la page alors qu'il n'est pas dans la source initiale, c'est qu'il a été ajouté dynamiquement par du JavaScript, donc soit généré soit chargé avec une requête AJAX.
Sauf qu'à ma connaissance les outils de webscrapping n'interprètent ni n'analysent le JS des pages qu'ils rencontrent, d'où le fait que certains éléments ne soient pas accessibles.
Et là, il faut soit trouver/configurer/programmer un outil suffisamment puissant, soit faire une partie du scrapping à la main.
from human import idiocy
del idiocy
0
Utilisateur anonyme
 
OK merci. Une piste pour le scrapping en lien avec les requêtes AJAX ?
0