Export données à partir d'un hypertexte

Fermé
dodo45750 Messages postés 2 Date d'inscription jeudi 29 août 2013 Statut Membre Dernière intervention 29 août 2013 - 29 août 2013 à 10:57
ryko1820 Messages postés 1645 Date d'inscription dimanche 28 avril 2013 Statut Membre Dernière intervention 15 août 2021 - 29 août 2013 à 12:01
Bonjour à tous,

Je me prend la tête depuis un peu trop longtemps pour récupérer automatiquement certaines infos des pages internet.

Ces pages sont sous forme de liste en lien hypertexte dans un tableau excel.
J'aimerais pouvoir récupérer les infos dont j'ai besoin afin de ne plus avoir besoin de charger une pages à chaque fois que je veux les récupérer.

Ex:
https://www.fichentreprise.com/home.php?action=recherche&etape=detail&siren=549800373&nic=01536&sens_tri=desc&colonne=3&pointeur=20&salt=1372662988
Sur cette page j'aimerais avoir le nom du responsable et le numéro de téléphone sur excel. Etant donner que ma liste contient plus de 5000 pages identique, cela me serait utile que ce soit automatisé.
Merci pour vos idées.
Cordialement.

3 réponses

ryko1820 Messages postés 1645 Date d'inscription dimanche 28 avril 2013 Statut Membre Dernière intervention 15 août 2021 276
Modifié par ryko1820 le 29/08/2013 à 11:27
Hello,

c'est très facile, je l'avais fait il y a une dizaine d'années pour constituer mes fichiers prospects à partir des sites des CCI, des CR et de "société.com" (car il y a aussi les chiffres d'affaires) sur la même région que toi (+ les Pays de la Loire) ...

Ce qu'il faut, c'est faire un parser qui va extraire les données en fonction, des mots clés ou des balises qu'il trouvera dans le code source de chaque page et constituer des enregistrements avec comme clef le Siret ...

Maintenant à partir d'excel on peut, peut être le faire, mais ça demande de toutes façons, très certainement un minimum de codage. (Je dirais que le prog que j'avais écris faisait 500 lignes) peut être en passant par de l'excel automation ...

Je lançais ça la nuit (pour de meilleures réponses du serveurs) et je ramenais environ 5000 fiches car j'étais sur modem, en quelques jours j'avais toutes les boites ...

Le fichier CSV pouvait être importé dans excel (ou à l'époque on utilisait Sharepoint comme CRM, (mon code comprenait un petit transcodage en XML)).

En choisissant bien ses critères, et le bon argumentaire, on accrochait pratiquement une boîte / un RDV, à chaque fois qu'on décrochait le téléphone ... (mais le gros du boulot consistait aussi à appeler des boites qu'on savait moins prometteuses, par leur activité ou leur chiffre d'affaire et là c'était plus chiant, beaucoup de blabla pour peu de résultat ...).

PS: je crois que maintenant société.com a changé son site et que le data mining y est plus compliqué.
0
dodo45750 Messages postés 2 Date d'inscription jeudi 29 août 2013 Statut Membre Dernière intervention 29 août 2013
29 août 2013 à 11:58
Super je pensait bien que cela serait faisable !

Aurait tu un exemple sur lequel je pourrait me calquer ?
0
ryko1820 Messages postés 1645 Date d'inscription dimanche 28 avril 2013 Statut Membre Dernière intervention 15 août 2021 276
29 août 2013 à 12:01
J'avais écrit mon bot en VBS et il y a peut être d'autres solutions directement en excel (qui serait plus simple pour toi), en 10 ans excel à bien évolué, même si je doute un peu de ses capacités en web data mining ...
0