Corriger automatiquement le code html sale ?

johndoe Messages postés 2645 Statut Contributeur -  
johndoe Messages postés 2645 Statut Contributeur -
Coincointousse :-P
La questoin est tres simple :
Je voudrais savoir si il est possible de corriger automatiquement du code html avec linux (quanta ?).
Concretement, je voudrais savoir si un logiciel sous linux peut corriger du code sale, comme cela peut se faire avec html-kit sous ouindaube.
genre à -->"& a g r a v e ;"
Ceci pour que le document puisse etre lu correctement avec un encodage par defaut utf-8.
Merci
sonboir à tous .

No money, no honey, One Boss !
A voir également:

6 réponses

SirHill Messages postés 4070 Statut Contributeur 543
 
0
johndoe Messages postés 2645 Statut Contributeur 386
 
Merci.
De fait c'est ce que je fais avec ouindaube et cela marche tres bien.
J'ai bien pensé aussi ramasser tidy pour pingouin, mais :(((, je n'ai pas réussi à l'installer. Quand je décompresse, j'obtiens un repertoire bin, dans lequel j'ai un executable tidy sans aucune extension du reste. J'ai beau faire un ./tidy, il ne se passe rien du tout :(
Any help should be aviable ?
Autrement dit, un peu d'aide serait bienvenu :-P
have a nice day.

No money, no honey, One Boss !
0
jipicy Messages postés 41342 Statut Modérateur 4 896
 
Hi john,

Essaie un petit "-help" du genre :
[jp@Mandrake bin]$ ./tidy -help
./tidy [option...] [file...] [option...] [file...]
Utility to clean up and pretty print HTML/XHTML/XML
see http://tidy.sourceforge.net/

Options for HTML Tidy for Linux/x86 released on 1st September 2004:

File manipulation
-----------------
-out or -o <file> specify the output markup file
-config <file> set configuration options from the specified <file>
-f <file> write errors to the specified <file>
-modify or -m modify the original input files

Processing directives
---------------------
-indent or -i indent element content
-wrap <column> wrap text at the specified <column> (default is 68)
-upper or -u force tags to upper case (default is lower case)
-clean or -c replace FONT, NOBR and CENTER tags by CSS
-bare or -b strip out smart quotes and em dashes, etc.
-numeric or -n output numeric rather than named entities
-errors or -e only show errors
-quiet or -q suppress nonessential output
-omit omit optional end tags
-xml specify the input is well formed XML
-asxml convert HTML to well formed XHTML
-asxhtml convert HTML to well formed XHTML
-ashtml force XHTML to well formed HTML
-access <level> do additional accessibility checks (<level> = 1, 2, 3)

Character encodings
-------------------
-raw output values above 127 without conversion to entities
-ascii use US-ASCII for output, ISO-8859-1 for input
-latin0 use US-ASCII for output, ISO-8859-15 for input
-latin1 use ISO-8859-1 for both input and output
-iso2022 use ISO-2022 for both input and output
-utf8 use UTF-8 for both input and output
-mac use MacRoman for input, US-ASCII for output
-win1252 use Windows-1252 for input, US-ASCII for output
-ibm858 use IBM-858 (CP850+Euro) for input, US-ASCII for output
-utf16le use UTF-16LE for both input and output
-utf16be use UTF-16BE for both input and output
-utf16 use UTF-16 for both input and output
-big5 use Big5 for both input and output
-shiftjis use Shift_JIS for both input and output
-language <lang> set the two-letter language code <lang> (for future use)

Miscellaneous
-------------
-version or -v show the version of Tidy
-help, -h or -? list the command line options
-help-config list all configuration options
-show-config list the current configuration settings

Use --blah blarg for any configuration option "blah" with argument "blarg"

Input/Output default to stdin/stdout respectively
Single letter options apart from -f may be combined
as in: tidy -f errs.txt -imu foo.html
For further info on HTML see http://www.w3.org/MarkUp


Je te laisses décoder le reste tout seul "like a big boy that you are"...

;-))

Z'@+...che.
JP : Zen, my Nuggets ! ;-)
0
johndoe Messages postés 2645 Statut Contributeur 386
 
coincoin jp,
Pour faire un zinzin -help, faudrait encore que le zinzin en questiuon soit installé :-P
Or justement, je viens de trouver qu'en ramassant les sources on peut faire un rpm pour red hat, et donc fedora ; mais là, je patauge pour l'instant, car le readme que l'on trouve dans le reperoitre décompressé (tidy/build/rpm) n'est pas à jour ! Donc faut trouver les erreurs pour pouvoir fabriquer le rpm :-P
Ensuite j'installerai et alors je regarderai comment ça marche :-D
pfffffffffffffffffffffffffffffffffffffffffffffffffffffff

No money, no honey, One Boss !
0
jipicy Messages postés 41342 Statut Modérateur 4 896
 
Re hi,

Pour faire un zinzin -help, faudrait encore que le zinzin en questiuon soit installé :-P
Ben non, la preuve, j'ai récupéré le "zinzin" comme tu dis et j'ai lancé le "./tidy -help" depuis le répertoire "/bin" (celui créé par l'archive) comme tu peux le voir dans le thread précédent...

Pourquoi chercher le "daemon" de midi à quatorze heures, hein ?
;-DDDDDDD

;-))

Z'@+...che.
JP : Zen, my Nuggets ! ;-)
0

Vous n’avez pas trouvé la réponse que vous recherchez ?

Posez votre question
johndoe Messages postés 2645 Statut Contributeur 386
 
t'as pécho le spirit oukoi ?
:DDDDDDDDDDDDDDDDDDDDDDDDDDDDD

No money, no honey, One Boss !
0
jipicy Messages postés 41342 Statut Modérateur 4 896
 
Nan, JE suis le "spirit" ! Noméô !!!

;-DDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDD

Z'@+...che.
JP : Zen, my Nuggets ! ;-)
0
SirHill Messages postés 4070 Statut Contributeur 543
 
Rhôôôôôô l'aut', eeeehh !

:DDD
0
jipicy Messages postés 41342 Statut Modérateur 4 896 > SirHill Messages postés 4070 Statut Contributeur
 
J'avais z'oublié... plus proche du "white spirit" quand même ... oups ;-))

Z'@+...che.
JP : Zen, my Nuggets ! ;-)
0
johndoe Messages postés 2645 Statut Contributeur 386
 
Bon alors c'est donc bon ! :-P
Donc on cherche un rpm et on le trouve (on fait pas comme moi donc !)
Une fois trouvé et installé, ... c'est magic ! Et c'est beau en plus.
On prend un fichier pourri, genre html pondu par wxxx, et là :
$tidy -imc zinzin.html
À l'arrivée, on a un beau document avec plein de couleur et des beaux caractères tout-comme-il-faut, qui s'affiche sous toutes les latitudes :-D et encodages !
On aura compris que ça se passe en ligne de commande.

si qq'un identifie d'autres commandes interessantes dans le man tidy, -------> give it up :-D

No money, no honey, One Boss !
0