Scrapping problem

Résolu
RomainGA Messages postés 128 Statut Membre -  
yg_be Messages postés 24281 Statut Contributeur -

Bonjour,

Depuis quelques jours, j'essaye de scrapper des liens d'une page Wikipédia.
Mais à chaque exécution de mon script python, une réponse bizarre apparaît

À l'aide s'il vous plaît

1 réponse

mamiemando Messages postés 34180 Statut Modérateur 7 887
 

Bonjour,

Malheureusement ta question est trop vague pour que nous puissions y répondre :

  • Quelle page wikipedia ?
  • Quel est le contenu de ton script ? Que cherches-tu as récupérer ?

Mon conseil serait, une fois la page récupérée (par exemple à l'aide du module requests) de regarder du côté de BeautifulSoup pour en extraire du contenu.

Bonne chance

0
RomainGA Messages postés 128 Statut Membre 6
 

J'aimerais scrapper la page wiki de New-York pour essayer de récupérer la liste des liens qui y apparaissent.

import requests
from bs4 import BeautifulSoup

url = "https://fr.wikipedia.org/wiki/New_York"
r = requests.get(url)
print(r)
if r.ok:
    print(r.text)
0
yg_be Messages postés 24281 Statut Contributeur 1 584 > RomainGA Messages postés 128 Statut Membre
 

Une façon d'extraire les liens:

import requests
from bs4 import BeautifulSoup

url = "https://fr.wikipedia.org/wiki/New_York"
r = requests.get(url)
if r.ok:
    doc = r.text
    soup = BeautifulSoup(doc, "html.parser")
    for lien in soup.find_all("a"): 
         print(lien.get('href'))
2