A voir également:
- Recuperer resultats google
- Google maps satellite - Guide
- Google maps - Guide
- Google photo - Télécharger - Albums photo
- Dns google - Guide
- Resultats foot - Télécharger - Vie quotidienne
3 réponses
Bonsoir Balthazariv.
Pour la sauvegarde des recherches, google le fait déjà.
Pour le traitement de chaînes, perl est ton copain.
Si tu enregistres les résultats dans un fichiers "source_resultat_google.html", tu peux en sortir les urls avec un petit script comme celui-ci par exemple (si tu es sous win', je pense que perl ne va pas être dans /usr/bin/ ;) :
Donc si tu as quelque chose à faire sur la chaine, pas de probleme ici, tu bidouilles $1 avant le le rentrer dans le "*.csv".
A la limite tu peux même ouvrir un socket pour aller chercher directement les infos chez google, sans avoir à passer par un fichier (petite requête sur "https://www.google.fr/search?q=mots_cles&gws_rd=ssl"), mais ce n'est pas le sujet.
Je te donne un exemple en perl, en esperant que la regex soit bonne (pas testé --> fleme. En plus c'est pas de moi, ça trainait dans mon home), mais perl n'est pas le seul à savoir faire cela.
Voilà...
Pour la sauvegarde des recherches, google le fait déjà.
Pour le traitement de chaînes, perl est ton copain.
Si tu enregistres les résultats dans un fichiers "source_resultat_google.html", tu peux en sortir les urls avec un petit script comme celui-ci par exemple (si tu es sous win', je pense que perl ne va pas être dans /usr/bin/ ;) :
#!/usr/bin/perl
open HTM "source_resultat_google.html";
open CSV ">>resultat.csv";
while ( <HTM> ) {
if ( /<a\s*class=l\s*href="(http:\/\/.*?)">/g ) {
print CSV "$1,\n";
}
}
Donc si tu as quelque chose à faire sur la chaine, pas de probleme ici, tu bidouilles $1 avant le le rentrer dans le "*.csv".
A la limite tu peux même ouvrir un socket pour aller chercher directement les infos chez google, sans avoir à passer par un fichier (petite requête sur "https://www.google.fr/search?q=mots_cles&gws_rd=ssl"), mais ce n'est pas le sujet.
Je te donne un exemple en perl, en esperant que la regex soit bonne (pas testé --> fleme. En plus c'est pas de moi, ça trainait dans mon home), mais perl n'est pas le seul à savoir faire cela.
Voilà...