Modélisation d'un parser HTML

Fermé
Jean - 11 janv. 2004 à 20:54
 Jean - 12 janv. 2004 à 20:31
Bonjour à toutes et à tous,

à titre d'exercice, je dois actuellement moédeliser un parser html. En fait, il s'agit pour moi de d'écrire des règles inductives qui décrivent l'état de la page html que l'on cherche à afficher (donc, écriture de la sémantique d'évaluation). On m'a donné la syntaxe abstraite suivante :

Gatégories syntaxiques :

C == a | b | ....|z |A | ... | Z|0|1...| 9| ;|.|…

S == [] | C S

s in S
i in item

h in Html
b in Blocks

ref = reference on files or other web pages

b ==
bold( i ) | % bold <b> S </b>
italic( i ) | % italic <i> S </i>
head1( i ) | % head <h1> S </h1>
head2( i ) | % head <h2> S </h2>
...
head6( i ) | % head <h6> S </h6>
hr|
hr(n)|
par(i) |
font(name,i)|
br | % break
link(ref,i)|
img(ref,x,y)


Structure globale :

h = html(head ,i)

head = title(i)

i = item(s,il,s')
il = b i | b


item = S item | Block | []

Et le problème, c'est que je ne vois pas du tout comment commencer :-(( Je ne vous demande pas de me pondre une réponse toute faite de mon exo, mais je suis par contre preneur de tous les coups de pouce que vous seriez prêts à me donner !!!

Merci d'avance,

Jean
A voir également:

3 réponses

Pas d'idées ???
0
silfaxu Messages postés 102 Date d'inscription jeudi 18 décembre 2003 Statut Contributeur Dernière intervention 6 février 2008 11
12 janv. 2004 à 18:12
Bonsoir,

Je n'ai pas très bien compris ton problème .. Dois-tu vérifier la syntaxe d'un fichier HTML à l'aide de la syntaxe que tu donnes ?
Si c'est ça, as-tu pensé à utiliser lexx et yacc (et leurs pendant sous Windows) ?

@+

sfx
0
En fait, à partire de cette syntaxe abstraite, je dois décrire une syntaxe concrète (par un ensemble de règles définies par induction, ceci doit me servir de base pour ensuite écrire un parser html en prolog). Mais comme je ne suis pas un as de ces histoires de syntaxes, je demande à tout hasard... Mais merci bien pour tes remarques ;-)

Jean
0