[Python]Encodage du Rich Text Résolu

Question

Salut tout le monde...J'ai fait un script qui me génère un rapport de mes tâches d'outlook, mlaheureusement, dans le champ "Body" qui contient le texte même des mes tâches, on trouve de drôles de caractères: üäößµâéèëœç etc...Et sans doute des trucs pas très pythoniques non plus puisque je fais du drag-drop de excel ou word dans mes tâches (genre au niveau des remplissages de ligne)BrefQuand j'essaye d'encoder ça en latin-1, python y perd le sien, je me retrouve donc à encoder ça en utf-8, ce qui me donne de jolis trucs comme:KÃ¶nntest du das so schnell wie mÃ¶glich klÃ¤ren bitte?à la place de Könntest du das so schnell wie möglich klären bitte?ou alors des suites de Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Je suis donc preneur de bonnes idées en la matière qui me permettrait d'avoir un truc un peu plus joli à l'arrivéeMerci

kilian · Answer

Pour l'allemand ce ne serait pas plutôt latin-2 (iso-8859-2)?http://alis.isoc.org/codage/iso8859/jeuxiso.htm#ISO-8859-2

teebo · Answer

Tout d'abord merci...mais non, toujours:UnicodeEncodeError: 'ascii' codec can't encode character u'\xe9' in position 641: ordinal not in range(128)et ne me demande pas pourquoi il dit "ascii" :(

teebo · Answer

Bon manifestement c'est le rich text qui plante, j'ai réussi à limiter la casse à 2 tâches avec un try/except mais j'aimerai bien que ça marche tout le temps correctement quand même.Je pense que ça vient des retours à la ligne mais je ne sais pas comment vérifier ça simplement ni surtout comment corriger.

teebo · Answer

Arg, nouvelle évolution, apparement c'est un type d'apostrophe simple...Plus précisément le â€™ de l'UTF8...enfin c'est ce qu'il affiche...

teebo · Answer

Arg, qu'il est con le teebo.En fait il suffit de faire montruc.encode("latin-1","ignore")Il me vire les apostrophes et tirets non conforme mais c'est acceptable dans l'ensemble il n'y en a pas tant que ça, et je garde même les accents les ß et autres üäöC'est beau Python mais ça manque d'intelisense notamment pour les fonctions surchargées :)

choubaka · Answer

99% des problèmes se situent entre le clavier et le dossier du siège ..CQFD

sebsauvage · Answer

Pas tout lu, teebo, mais si ça peut aider:https://sebsauvage.net/python/charsets_et_encoding.html

[Python]Encodage du Rich Text

7 réponses

Discussions similaires

Newsletters