Comment écrire une regex avec 2 mots Résolu

Question

Bonjour,

Je souhaite rechercher les mots au pluriel, j'ai une regex qui n'est pas assez efficace. Je recherche tous les motifs qui se terminent par s ou x.
Maintenant, je souhaite changer cette regex en ajoutant une autre règle. Le motif sera le mot qui se termine par s ou x mais qui est précédé par un article tel que les, des, nos...
Je ne vois pas comment modifier la regex sachant que ce sera 2 mots.
Ma regex actuelle : 
"[sx]$"

Merci

[Dal] · Answer

Salut geekat,

Et tu utilises quel moteur de regexp ?

Si tu utilises un moteur PCRE, tu peux faire "(les|des|nos)\s[^\s].+[sx]$" par exemple.

Note que comme tu as mis un $, ta regexp ne matchera que si le s ou x se trouve en fin de chaîne.


Dal

[Dal] · Answer

Salut geekat, On dirait que tu utilises les fonctions POSIX de regexp, si c'est le cas, on dirait que le modificateur est REG_EXTENDED (pas juste EXTENDED). Elles sont effectivement disponibles sur les systèmes POSIX en incluant l'entête (https://pubs.opengroup.org/onlinepubs/009695399/basedefs/xbd_chap09.html). Sous Linux, on a la doc de ces fonctions sous man 3 regex et les pages du standard POSIX donnent aussi des exemples. Je n'avais jamais utilisé ce moteur de regexp en C (ou un autre en C), alors j'ai testé ceci sous Linux Debian, pour voir les possibilités : #include #include #include #define CHAR_SEPARATEURS " .;:,?! " int main(void) { regex_t exp; regmatch_t m; char text[255] = "Les fleurs, des beaux jours... " "multicolores les champs " "les rires des enfants"; char st[255]; char * ptext; printf("testing with string: ----- %s ----- " "Haiku by [Dal] :-) ", text); if (regcomp( &exp, "(les|des|ses)(\s[^\s]+[sx])([" CHAR_SEPARATEURS "]|$)", REG_ICASE | REG_EXTENDED) != 0) { printf("Erreur regcomp() "); return 0; } int r = regexec(&exp, text, 1, &m, 0); ptext = text; if (r == 0) { strncpy(st, ptext + m.rm_so, m.rm_eo - m.rm_so); st[m.rm_eo - m.rm_so] = '\0'; printf("first captured: [%s] ", st); } do { ptext = ptext + m.rm_eo; r = regexec (&exp, ptext, 1, &m, REG_NOTBOL); if (r == 0) { strncpy(st, ptext + m.rm_so, m.rm_eo - m.rm_so); st[m.rm_eo - m.rm_so] = '\0'; printf("next captured: [%s] ", st); } } while (r == 0); return 0; }donne : $ gcc -Wall regexps.c$ ./a.out testing with string:-----Les fleurs, des beaux jours...multicolores les champsles rires des enfants-----Haiku by [Dal] :-)first captured: [Les fleurs,]next captured: [des beaux jours.]next captured: [les champs]next captured: [les rires ]next captured: [des enfants]$ Cela permet rechercher la regexp sur une chaîne C composée éventuellement de plusieurs lignes et de matcher la fin de mot sur la fin de ligne, la fin de la chaîne ou sur un caractère séparateur, avec des majuscules ou pas. C'est presque aussi plaisant à utiliser qu'avec Perl, mais n'exagérons rien, cela doit être le printemps ;-) Dal

Comment écrire une regex avec 2 mots

2 réponses

Discussions similaires

Newsletters