Algo de recherche et d Tri des URLs

Fermé
rami - 25 août 2011 à 03:10
Hxyp Messages postés 401 Date d'inscription vendredi 28 janvier 2011 Statut Membre Dernière intervention 27 avril 2014 - 27 août 2011 à 15:38
Bonjour,
svp je cherche un algorithme pour mon pojet de fin d"étude qui est capable de chercher des URLs sur les serveurs du net, ils les apportent, puis catégorise ces URLs dans des catégories (porno, drogue, téléchargement, sites sociologiques...)
cet algorithme peut stocké ces URLs soit dans une base MySQl ou bien dans des fichiers.
merci infiniment



1 réponse

Hxyp Messages postés 401 Date d'inscription vendredi 28 janvier 2011 Statut Membre Dernière intervention 27 avril 2014 54
27 août 2011 à 15:38
Bonjour, renseignez-vous sur le fonctionnement des bots qu'utilisent les moteurs de recherche vous y trouverez des idées. Pour la classification vous pouvez simplement utiliser un dictionnaire de mots ou expressions par catégories, faire les stats des mots contenus dans une page web et mettre l'url dans la catégorie ayant le plus de points ça devrait être pas trop mal.
0