Un bot pour indexer dans un moteur de recherc

darkchristophetd Messages postés 1100 Date d'inscription   Statut Contributeur Dernière intervention   -  
Dalida Messages postés 6728 Date d'inscription   Statut Contributeur Dernière intervention   -
Bonjour.
Je vous explique mon problème :
actuellement, il y a des astuces sur un site que je développe (elle ne sont pas dans une base de données)
Il y a également un moteur de recherche local pour les rechercher.
Le bémole : il faut aller sur une page d'administration, indiquer le titre, description, lien.....
Serais-ce possible de créer un bot en PHP (ou éventuellement en C) pour indexer automatiquement toutes ces astuces ?
Comment faire ? (j'ai cherché sur le site mais je n'ai pas trouvé...)
merci d'avance pour votre réponse
A voir également:

6 réponses

Dalida Messages postés 6728 Date d'inscription   Statut Contributeur Dernière intervention   922
 
salut,

en théorie oui.

tes astuces sont stockées sous quelle forme ?
0
darkchristophetd Messages postés 1100 Date d'inscription   Statut Contributeur Dernière intervention   459
 
ce sont des pages PHP
0
Dalida Messages postés 6728 Date d'inscription   Statut Contributeur Dernière intervention   922
 
donc les infos sont sans doute directement balisées en HTML.

tu peux faire une boucle sur tous les fichiers, extraire le contenu et le traiter pour l'indexer.

si tes données sont bien formatées en XHTML, tu peux utiliser les fonctions XML de PHP pour isoler les infos à récolter.
sinon tu peux le faire avec des expressions régulières.

je ne sais pas quoi te dire de plus, pour le moment on est vraiment dans le vague !
est-ce que tu as un dossier avec tous les articles et comment se présente un article type ?
c'est un bout de HTML que tu inclus dans un template ?
0
darkchristophetd Messages postés 1100 Date d'inscription   Statut Contributeur Dernière intervention   459
 
je n'ai pas de templates.
ce sont des pages PHP avec les balises d'informations (<title>, <meta name="description, keywords">) à la même ligne dans chaque page (j'ai prévu :) )
0

Vous n’avez pas trouvé la réponse que vous recherchez ?

Posez votre question
Dalida Messages postés 6728 Date d'inscription   Statut Contributeur Dernière intervention   922
 
si c'est du XHTML tu peux récupérer chaque info avec XML.

va chez php [point] developpez [point] com, je ne mets pas le lien, à priori ils sont momentanément bloqués sur le forum.
regarde dans les cours, il y a XML dans les bibliothèques en haut.

sinon, les expressions régulières, dis nous ce qui te semble le plus simple !

et dis nous ce que tu attends exactement comme aide.
sais-tu faire une boucle sur le contenu d'un dossier, sais-tu ouvrir un fichier ?

je ne sais pas trop quoi te dire…
0
Dalida Messages postés 6728 Date d'inscription   Statut Contributeur Dernière intervention   922
 
t'ai envoyé des liens par MP, je l'ai ai trouvé en cherchant "php parser html" sur Gogole…
0