Interpréteur HTML

karine -  
 karine -
Bonjour,

est-ce que quelqu'un sait où je pourrais trouver le code source d'un interpréteur HTML ?

J'ai regardé sur le net mais j'ai rien trouvé.

Merci !
A voir également:

5 réponses

Canard007 Messages postés 5931 Date d'inscription   Statut Contributeur Dernière intervention   215
 
tu veux le code source d'un butineur en gros...
mozilla est pas open source?
0
sebsauvage Messages postés 32893 Date d'inscription   Statut Modérateur Dernière intervention   15 662
 
ça dépend, c'est pour faire quoi comme boulot dessus ?


On peut utiliser les expressions régulières, DOM, SAX, BeautifulSoup, ou carrément taper dans des moteurs HTML de rendu comme Gecko.

http://en.wikipedia.org/wiki/Gecko_layout_engine


DOM et SAX sont beaucoup utilisés pour parser du HTML.
0
karine
 
Salut !

En fait je voudrais recuperer le contenu textuel d'une page Web.

Sinon, ou est-ce que je peux trouver le code source de Mozilla ?

Merci
0
sebsauvage Messages postés 32893 Date d'inscription   Statut Modérateur Dernière intervention   15 662
 
si c'est pour récupérer le contenu textuel d'une page, prendre le code source de Mozilla sera trop lourd.

Il vaut mieux passer par DOM ou SAX.

Un petit exemple en Python: extraire tous les liens d'une page avec les expressions régulières, et deux parseurs différents.
http://wikipython.flibuste.net/moin.py/CodesDivers#head-ccb34d58d9ed87fb2d4ac9b116a1844880ef81d9
0

Vous n’avez pas trouvé la réponse que vous recherchez ?

Posez votre question
karine
 
Merci Sebsauvage !

Je vais essayer ce genre de truc.

A+
0