Pandas UnicodeDecodeError

salahoum Messages postés 26 Statut Membre -  
salahoum Messages postés 26 Statut Membre -

Bonjour,
y'a un solution ?

Configuration: Windows / Chrome 71.0.3578.98

2 réponses

  1. jordane45 Messages postés 30426 Date d'inscription   Statut Modérateur Dernière intervention   4 830
     
    Bonjour,

    Les images ne nous permettant pas de copier/coller si besoin....., merci de poster tes codes sur le forum en utilisant les BALISES DE CODE
    Explications disponibles ici : https://codes-sources.commentcamarche.net/faq/11288-les-balises-de-code

    0
    1. salahoum Messages postés 26 Statut Membre
       
      mais monsieur le code est très petit
      import pandas as pd
      df = pd.read_csv("transfoo.csv")
      le problème est l'erreur
      et merci
      0
      1. salahoum Messages postés 26 Statut Membre > Utilisateur anonyme
         
        je m’excuse
        0
  2. [Dal] Messages postés 6122 Date d'inscription   Statut Contributeur Dernière intervention   1 108
     
    Donc, ton code est :

    import pandas as pd
    df = pd.read_csv("transfoo.csv") 

    Et l'erreur retournée par pandas est :
    "UnicodeDecodeError: 'utf-8' codec can't decode byte ..."
    .

    Cette erreur peut se produire lorsque le fichier texte que tu passes à pandas a un format d'encodage qui n'est pas Unicode.

    Détermine quel est le format d'encodage de ton fichier. Ensuite, passe la description de ce format avec une option "encoding". Par exemple, pour un format en "ISO-8859-15" :

    import pandas as pd
    df = pd.read_csv('transfoo.csv', encoding = 'ISO-8859-15')

    Dal
    0
    1. [Dal] Messages postés 6122 Date d'inscription   Statut Contributeur Dernière intervention   1 108
       
      Si tu ne connais pas le format d'encodage de ton fichier texte, tu peux essayer de le déterminer (ou de transformer le format en UTF8), en utilisant une des solutions décrites ici : https://stackoverflow.com/questions/33819557/unicodedecodeerror-utf-8-codec-while-reading-a-csv-file/33819765

      Par exemple, cette réponse propose d'utiliser la bibliothèque Python chardet pour tenter de déterminer le format :

      import pandas as pd
      import chardet
      with open('filename.csv', 'rb') as f:
          result = chardet.detect(f.read())  # or readline if the file is large
      
      df = pd.read_csv('transfoo.csv', encoding=result['encoding'])
      0
    2. Utilisateur anonyme
       
      Bonjour Dal, ce post est un quadruplon...
      la discussion initiale est toujours ouverte.
      0
    3. [Dal] Messages postés 6122 Date d'inscription   Statut Contributeur Dernière intervention   1 108
       
      Bonjour Whismeril ,

      J'ai vu ces deux autres fils :

      https://forums.commentcamarche.net/forum/affich-35822704-lire-et-ecrire-des-csv-en-python
      https://forums.commentcamarche.net/forum/affich-35850203-affichage-fichier-csv

      Cependant, la question posée ici est différente, et concerne un problème de format d'encodage d'un fichier passé à la bibliothèque Python pandas empêchant le chargement correct du fichier csv par pandas qui, manifestement, n'affectait pas les éventuels autres fichiers .csv utilisés dans les tests selon les informations échangées. Le fil 35822704 ne concerne pas un problème d'utilisation de la bibliothèque pandas, qui n'est pas utilisée dans le code échangé et le fil 35850203 concerne bien pandas, mais pose une autre question relative au formatage de l'affichage de dataframes par cette bibliothèque (et où aucun problème d'encodage de texte n'affecte la chargement du fichier).

      Je ne vois pas que la même question soit posée 4 fois, ou dans 4 posts différents.. mais peut-être ais-je mal vu ?
      0
    4. Utilisateur anonyme
       
      Je n’avais pas compris que la question était différente.
      Les autres fils ont été supprimés
      0
    5. salahoum Messages postés 26 Statut Membre > [Dal] Messages postés 6122 Date d'inscription   Statut Contributeur Dernière intervention  
       
      apres changer le par Unicode
      0