Scrapping problem
Résolu
RomainGA
Messages postés
128
Statut
Membre
-
yg_be Messages postés 24281 Date d'inscription Statut Contributeur Dernière intervention -
yg_be Messages postés 24281 Date d'inscription Statut Contributeur Dernière intervention -
Bonjour,
Depuis quelques jours, j'essaye de scrapper des liens d'une page Wikipédia.
Mais à chaque exécution de mon script python, une réponse bizarre apparaît
À l'aide s'il vous plaît
1 réponse
Bonjour,
Malheureusement ta question est trop vague pour que nous puissions y répondre :
- Quelle page wikipedia ?
- Quel est le contenu de ton script ? Que cherches-tu as récupérer ?
Mon conseil serait, une fois la page récupérée (par exemple à l'aide du module requests) de regarder du côté de BeautifulSoup pour en extraire du contenu.
Bonne chance
J'aimerais scrapper la page wiki de New-York pour essayer de récupérer la liste des liens qui y apparaissent.
import requests from bs4 import BeautifulSoup url = "https://fr.wikipedia.org/wiki/New_York" r = requests.get(url) print(r) if r.ok: print(r.text)Une façon d'extraire les liens:
import requests from bs4 import BeautifulSoup url = "https://fr.wikipedia.org/wiki/New_York" r = requests.get(url) if r.ok: doc = r.text soup = BeautifulSoup(doc, "html.parser") for lien in soup.find_all("a"): print(lien.get('href'))