Extraire données page web Résolu

Question

Bonsoir, Je patine depuis un moment pour extraire des données d' une page web.Afin de clarifier le problème, je joins la partie de la page que je cherche à extraire:

yg_be · Answer

bonjour, tu patines aussi dans l'utilisation des balises de code: relis ceci: https://codes-sources.commentcamarche.net/faq/11288-les-balises-de-code

as-tu consulté la documentation pour déterminer comment écrire le second paramètre de la méthode find()?

ElCatala52 · Answer

Autant pour moi, il manque au moins la moitié du message. Par contre, je ne vois pas comment le modifier?

ElCatala52 · Answer

Bonsoir,
En fait c' est simple. data-is-init est à considérer comme une liste. Il suffit donc de rapatrier cette liste dans une variable puis de décortiquer le contenu de cette variable. Si cela peut aider, je joins une partie du code du script python.
    rqt = urllib.request.Request(url)    rslt = urllib.request.urlopen(rqt)    soup = BeautifulSoup(rslt, 'html.parser') # Création de la liste cotation    listecote=soup.find("div","c-faceplate")    cotation = listecote["data-ist-init"] #Extraire la cote la plus haute    departhaut= cotation.index(',')    departvaleurhaut = cotation.index(':', departhaut)    finhaut = cotation.index(',' , departvaleurhaut)    haut = cotation[(departvaleurhaut + 1):finhaut]
Ce code est sans prétention et est certainement perfectible.

Cordialement

Extraire données page web

EDIT : Correction des balises de code

3 réponses

Discussions similaires

Newsletters