Scrapping problem

Résolu

RomainGA Messages postés 128 Statut Membre -
yg_be Messages postés 24281 Date d'inscription Statut Contributeur Dernière intervention - 8 déc. 2023 à 13:33

Bonjour,

Depuis quelques jours, j'essaye de scrapper des liens d'une page Wikipédia.
Mais à chaque exécution de mon script python, une réponse bizarre apparaît

À l'aide s'il vous plaît

Afficher la suite

1 réponse

Réponse 1 / 1

mamiemando Messages postés 34209 Date d'inscription Statut Modérateur Dernière intervention 7 896

Bonjour,

Malheureusement ta question est trop vague pour que nous puissions y répondre :

Quelle page wikipedia ?
Quel est le contenu de ton script ? Que cherches-tu as récupérer ?

Mon conseil serait, une fois la page récupérée (par exemple à l'aide du module requests) de regarder du côté de BeautifulSoup pour en extraire du contenu.

Bonne chance

RomainGA Messages postés 128 Statut Membre 6

J'aimerais scrapper la page wiki de New-York pour essayer de récupérer la liste des liens qui y apparaissent.

import requests
from bs4 import BeautifulSoup

url = "https://fr.wikipedia.org/wiki/New_York"
r = requests.get(url)
print(r)
if r.ok:
    print(r.text)

yg_be Messages postés 24281 Date d'inscription Statut Contributeur Dernière intervention 1 585 > RomainGA Messages postés 128 Statut Membre

Une façon d'extraire les liens:

import requests
from bs4 import BeautifulSoup

url = "https://fr.wikipedia.org/wiki/New_York"
r = requests.get(url)
if r.ok:
    doc = r.text
    soup = BeautifulSoup(doc, "html.parser")
    for lien in soup.find_all("a"): 
         print(lien.get('href'))

Scrapping problem

1 réponse

Votre réponse

Newsletters