Recherche google via script python3
guillaumealiasgros
Messages postés
107
Date d'inscription
Statut
Membre
Dernière intervention
-
Ometeoltloque Messages postés 38 Date d'inscription Statut Membre Dernière intervention -
Ometeoltloque Messages postés 38 Date d'inscription Statut Membre Dernière intervention -
Bien le bonjour.
Alors voilà , je me suis lancé dans la conception d'une petite appli en Python3, et comme je le dis dans le titre, j'aimerais pouvoir faire des recherches avec le moteur Google directement dans mon script, j'ai cherché mais je n'ai rien trouvé qui me convienne dans les modules et librairies Python3, alors dois-je écrire un petit module moi-même ou puis-je trouver quelque chose de convenable qui existe déjà ?
Ah oui, une dernière chose, je suis sous Debian et Linux mint.
Merci de vos futurs réponses , Guillaume.
Alors voilà , je me suis lancé dans la conception d'une petite appli en Python3, et comme je le dis dans le titre, j'aimerais pouvoir faire des recherches avec le moteur Google directement dans mon script, j'ai cherché mais je n'ai rien trouvé qui me convienne dans les modules et librairies Python3, alors dois-je écrire un petit module moi-même ou puis-je trouver quelque chose de convenable qui existe déjà ?
Ah oui, une dernière chose, je suis sous Debian et Linux mint.
Merci de vos futurs réponses , Guillaume.
A voir également:
- Recherche google via script python3
- Google maps satellite - Guide
- Dns google - Guide
- Google maps - Guide
- Google photo - Télécharger - Albums photo
- Créer un compte google - Guide
3 réponses
Dans la page de recherche Google générée, les noms des sites trouvés écrits en bleu sont des liens avec pour URL http://www.google.fr/url?url=http://fr.wikipedia.org/wiki/Google_(moteur_de_recherche)&rct=j&q=&esrc=s&sa=U&ei=cQFVVLGfEYH4Oqu-gMgI&ved=0CD4QFjAI&sig2=PGKXVafIruJk4gTvR3pPjA&usg=AFQjCNEQ6Q0NrM11KsvQPQ3HQJirjWgJkg
Il me semble qu'en Python, il existe des bibliothèques spéciales pour la manipulation de documents XML (et le HTML, c'est du XML), donc tu devrais pouvoir t'en sortir.
Après une "étude" plus approfondie d'une page de recherche Google, j'ai remarqué que les résultats sont rangés dans la deuxième colonne de la première ligne d'un tableau ayant pour id "mn". En extrayant tout les liens de cette colonne, qui sont a priori des liens comme dans l'exemple ci-dessus, tu devrais pouvoir récupérer les URL des sites. Par contre, je pense que tu devrais apprendre avant quelques notions de HTML, ça te sera utile pour te retrouver dans le code source....
Il me semble qu'en Python, il existe des bibliothèques spéciales pour la manipulation de documents XML (et le HTML, c'est du XML), donc tu devrais pouvoir t'en sortir.
Après une "étude" plus approfondie d'une page de recherche Google, j'ai remarqué que les résultats sont rangés dans la deuxième colonne de la première ligne d'un tableau ayant pour id "mn". En extrayant tout les liens de cette colonne, qui sont a priori des liens comme dans l'exemple ci-dessus, tu devrais pouvoir récupérer les URL des sites. Par contre, je pense que tu devrais apprendre avant quelques notions de HTML, ça te sera utile pour te retrouver dans le code source....
Pas franchement certain qu'il existe des bibliothèques pour ça.... Ceci, ça ne doit pas être très compliqué à faire.... Une recherche Google ayant pour URL : https://www.google.fr/search?q=une+recherche+google ce n'est pas très compliqué à construire.
Exactement ! Je suis parti sur ce principe sauf que c'est pas aussi simple, le truc c'est que les adresses des différents sites n'apparaissent pas dans la page web Google générée (ceci dit je ne connais rien en HTLM, ni en PHP) donc impossible de sortir les liens par un tri (c'est la finalité de mon script normalement).
Merci pour cette réponse rapide
Merci pour cette réponse rapide
Je suis en effet un cour sur le HTML, ce qui m'aidera beaucoup pour ce projet.
Je vais poursuivre mes recherches, ton aide m'a été précieuse.
Encore merci, bonne journée.