Python + html

Fermé
mnic096 - 2 août 2017 à 10:15
mamiemando Messages postés 33381 Date d'inscription jeudi 12 mai 2005 Statut Modérateur Dernière intervention 26 novembre 2024 - 4 août 2017 à 09:36
Bonjour à tous,
je dois faire un programme faisant intervenir de l'html sous python. Seulement voilà, j'aimerais, grâce à un codage python, récupérer l'url d'une recherche faite sur une page html. J'ai cherché plusieurs heures mais en vain. Pourriez vous me donner des indications ?
Je vous remercie :)
ps : désolé pour le langage un peu approximatif, je débute ^^

A voir également:

1 réponse

mamiemando Messages postés 33381 Date d'inscription jeudi 12 mai 2005 Statut Modérateur Dernière intervention 26 novembre 2024 7 802
4 août 2017 à 09:36
Bonjour

Tu peux utiliser
urllib3
pour récupérer le contenu d'une page web (ici la recherche du mot "tapir" avec google).

#!/usr/bin/env python3
# -*- coding: utf-8 -*-

try:
    import urllib3
except ImportError:
    raise ImportError("python3-urllib3 is not installed: please run: apt-get install python3-urllib3")

query = "https://www.google.fr/search?q=tapir"
http = urllib3.PoolManager(timeout=urllib3.Timeout(connect=1.0, read=2.0))
reply = http.request("GET", query)
if reply.status == 200:
    s = reply.data.decode("latin-1")
    print(s)
else:
    raise RuntimeError("Cannot get reply")


Il suffit ensuite d'extraire de
s
les morceaux qui t'intéressent, par exemple à l'aide d'expression régulières.

Bonne chance
1