Parcours d'une page WEB

etudiante-Bac+2 -  
Zep3k!GnO Messages postés 2049 Statut Membre -
Bonjour,

Nous souhaitons récupérer le code source d'une page WEB, parcourir celle-ci en cherchant des mots-clés et les stocker dans une structure de données.
Par exemple, sur le site de Facebook, on souhaite parcourir le code source du site et trouver les occurences du mot "Avatar" afin de stocker dans une structure de donnée tous les utilisateurs ayant ce mot dans leur page.

N'hésitez pas à nous demander des compléments d'information.

Merci d'avance.
A voir également:

1 réponse

Zep3k!GnO Messages postés 2049 Statut Membre 200
 
Selon la techno utlisée, si tu prends tu php je te dirai de jeter un oeil sur fopen, fread, fgets et les expressions régulières pour du preg_match_all.
Après il te faut une liste d'url à crawler.
0