Pandas UnicodeDecodeError
salahoum
Messages postés
26
Statut
Membre
-
salahoum Messages postés 26 Statut Membre -
salahoum Messages postés 26 Statut Membre -
2 réponses
-
Bonjour,
Les images ne nous permettant pas de copier/coller si besoin....., merci de poster tes codes sur le forum en utilisant les BALISES DE CODE
Explications disponibles ici : https://codes-sources.commentcamarche.net/faq/11288-les-balises-de-code
-
mais monsieur le code est très petit
import pandas as pd
df = pd.read_csv("transfoo.csv")
le problème est l'erreur
et merci- Y’a pas de mais, c’est la troisième fois (au moins) qu’on te le demande.
C’est aussi la troisième fois (au moins) qu’on te demande de rester dans la discussion initiale
https://forums.commentcamarche.net/forum/affich-35822704-lire-et-ecrire-des-csv-en-python
-
-
Donc, ton code est :
import pandas as pd df = pd.read_csv("transfoo.csv")
Et l'erreur retournée par pandas est :"UnicodeDecodeError: 'utf-8' codec can't decode byte ..."
.
Cette erreur peut se produire lorsque le fichier texte que tu passes à pandas a un format d'encodage qui n'est pas Unicode.
Détermine quel est le format d'encodage de ton fichier. Ensuite, passe la description de ce format avec une option "encoding". Par exemple, pour un format en "ISO-8859-15" :
import pandas as pd df = pd.read_csv('transfoo.csv', encoding = 'ISO-8859-15')
Dal-
Si tu ne connais pas le format d'encodage de ton fichier texte, tu peux essayer de le déterminer (ou de transformer le format en UTF8), en utilisant une des solutions décrites ici : https://stackoverflow.com/questions/33819557/unicodedecodeerror-utf-8-codec-while-reading-a-csv-file/33819765
Par exemple, cette réponse propose d'utiliser la bibliothèque Python chardet pour tenter de déterminer le format :
import pandas as pd import chardet with open('filename.csv', 'rb') as f: result = chardet.detect(f.read()) # or readline if the file is large df = pd.read_csv('transfoo.csv', encoding=result['encoding']) -
-
Bonjour Whismeril ,
J'ai vu ces deux autres fils :
https://forums.commentcamarche.net/forum/affich-35822704-lire-et-ecrire-des-csv-en-python
https://forums.commentcamarche.net/forum/affich-35850203-affichage-fichier-csv
Cependant, la question posée ici est différente, et concerne un problème de format d'encodage d'un fichier passé à la bibliothèque Python pandas empêchant le chargement correct du fichier csv par pandas qui, manifestement, n'affectait pas les éventuels autres fichiers .csv utilisés dans les tests selon les informations échangées. Le fil 35822704 ne concerne pas un problème d'utilisation de la bibliothèque pandas, qui n'est pas utilisée dans le code échangé et le fil 35850203 concerne bien pandas, mais pose une autre question relative au formatage de l'affichage de dataframes par cette bibliothèque (et où aucun problème d'encodage de texte n'affecte la chargement du fichier).
Je ne vois pas que la même question soit posée 4 fois, ou dans 4 posts différents.. mais peut-être ais-je mal vu ? -
-
-