Web scrapping débutant
Clarisse_Dsge
Messages postés
1
Date d'inscription
Statut
Membre
Dernière intervention
-
Utilisateur anonyme -
Utilisateur anonyme -
Bonjour à tous !
Je vous pose cette question, car je me lance dans le webscrapping pour la première fois.
J'essaye de récupérer des avis clients sur une page web : https://fr.igraal.com/avis/Carrefour-Drive mais je ne sais pas du tout comment faire.
J'ai cru comprendre qu'il faillait récupérer la page html, mais ensuite je suis perdue.
Je ne sais pas quel code utiliser, même en utilisant les tutos sur le net.
Pourriez vous m'aider ?
En vous remerciant par avance
Je vous pose cette question, car je me lance dans le webscrapping pour la première fois.
J'essaye de récupérer des avis clients sur une page web : https://fr.igraal.com/avis/Carrefour-Drive mais je ne sais pas du tout comment faire.
J'ai cru comprendre qu'il faillait récupérer la page html, mais ensuite je suis perdue.
Je ne sais pas quel code utiliser, même en utilisant les tutos sur le net.
Pourriez vous m'aider ?
En vous remerciant par avance
A voir également:
- Web scrapping débutant
- Web office - Guide
- Navigateur web - Guide
- Création site web - Guide
- K9 web protection - Télécharger - Contrôle parental
- Logiciel de programmation pour débutant - Guide
1 réponse
Salut,
Enfiiiin un sujet que je maitrise bien !
Plusieurs niveaux de web scrap.
1°) Les informations que tu recherches sont dans le code source de la page -> urllib.request
2°) Les informations que tu recherches ne sont pas dans le code source de la page (ce sont des éléments dynamiques en JavaScript principalement) -> selenium (il en existe d'autres).
Voici les bibliothèques dont tu auras sans doute besoin :
re (expression régulière)
phantomjs (pour le niveau 2 afin de ne pas afficher le navigateur).
Enfiiiin un sujet que je maitrise bien !
Plusieurs niveaux de web scrap.
1°) Les informations que tu recherches sont dans le code source de la page -> urllib.request
2°) Les informations que tu recherches ne sont pas dans le code source de la page (ce sont des éléments dynamiques en JavaScript principalement) -> selenium (il en existe d'autres).
Voici les bibliothèques dont tu auras sans doute besoin :
re (expression régulière)
phantomjs (pour le niveau 2 afin de ne pas afficher le navigateur).