Algo de recherche et d Tri des URLs

rami -  
Hxyp Messages postés 401 Date d'inscription   Statut Membre Dernière intervention   -
Bonjour,
svp je cherche un algorithme pour mon pojet de fin d"étude qui est capable de chercher des URLs sur les serveurs du net, ils les apportent, puis catégorise ces URLs dans des catégories (porno, drogue, téléchargement, sites sociologiques...)
cet algorithme peut stocké ces URLs soit dans une base MySQl ou bien dans des fichiers.
merci infiniment



A voir également:

1 réponse

Hxyp Messages postés 401 Date d'inscription   Statut Membre Dernière intervention   54
 
Bonjour, renseignez-vous sur le fonctionnement des bots qu'utilisent les moteurs de recherche vous y trouverez des idées. Pour la classification vous pouvez simplement utiliser un dictionnaire de mots ou expressions par catégories, faire les stats des mots contenus dans une page web et mettre l'url dans la catégorie ayant le plus de points ça devrait être pas trop mal.
0