Scrapping problem

Résolu
RomainGA Messages postés 110 Date d'inscription   Statut Membre Dernière intervention   -  
yg_be Messages postés 23541 Date d'inscription   Statut Contributeur Dernière intervention   -

Bonjour,

Depuis quelques jours, j'essaye de scrapper des liens d'une page Wikipédia.
Mais à chaque exécution de mon script python, une réponse bizarre apparaît

À l'aide s'il vous plaît

1 réponse

mamiemando Messages postés 33769 Date d'inscription   Statut Modérateur Dernière intervention   7 878
 

Bonjour,

Malheureusement ta question est trop vague pour que nous puissions y répondre :

  • Quelle page wikipedia ?
  • Quel est le contenu de ton script ? Que cherches-tu as récupérer ?

Mon conseil serait, une fois la page récupérée (par exemple à l'aide du module requests) de regarder du côté de BeautifulSoup pour en extraire du contenu.

Bonne chance

0
RomainGA Messages postés 110 Date d'inscription   Statut Membre Dernière intervention   6
 

J'aimerais scrapper la page wiki de New-York pour essayer de récupérer la liste des liens qui y apparaissent.

import requests
from bs4 import BeautifulSoup

url = "https://fr.wikipedia.org/wiki/New_York"
r = requests.get(url)
print(r)
if r.ok:
    print(r.text)
0
yg_be Messages postés 23541 Date d'inscription   Statut Contributeur Dernière intervention   1 584 > RomainGA Messages postés 110 Date d'inscription   Statut Membre Dernière intervention  
 

Une façon d'extraire les liens:

import requests
from bs4 import BeautifulSoup

url = "https://fr.wikipedia.org/wiki/New_York"
r = requests.get(url)
if r.ok:
    doc = r.text
    soup = BeautifulSoup(doc, "html.parser")
    for lien in soup.find_all("a"): 
         print(lien.get('href'))
2