Tri tableau csv Résolu

Question

Bonjour, 

Je voudrais trier dans l'ordre croissant les dates d'un fichier .csv . Voici mon programme:

import pandas

df = pandas.read_csv('mon_fichier.csv',  delimiter=';', index_col='Dates')
df = df.sort_values(by=['Dates'], ascending=True)
df.to_csv('new.csv')

Après exécution,  on me met "Key error='Date'", j'ai tout vérifié et je ne comprends pas.

Merci d'avance.

mamiemando · Answer

Bonjour,

Peux-tu donner les premières lignes du fichier csv (voire le fichier complet s'il n'est pas trop long) ainsi que le message erreur complet ? Par ailleurs pandas me paraît un peu surdimensionné si c'est ton seul besoin.

 Si tu veux juste trier ce fichier, et rien d'autre, tu peux importer le fichier dans un tableur (e.g. libreoffice calc et faire le tri),
 Si tu veux récupérer ses données triées en python, tu peux charger le fichier avec le module python csv puis trier la structure de données que tu auras remplie lors de la lecture du fichier avec sorted.

Bonne chance

mamiemando · Answer

Bonjour,

Comme dit précédemment, pandas est overkill et voici comment tu peux faire avec csv.

import csv, io, sys
from operator import itemgetter

def sort_csv(stream, key=itemgetter(0), input_delimiter=";", output_delimiter="	"):
  rows = [row for row in csv.reader(stream, delimiter=input_delimiter)]
  header = rows[0]
  rows = rows[1:]
  rows = sorted(rows, key=key)
  ret = "
".join([
    output_delimiter.join(header),
    "
".join([
      output_delimiter.join(row) for row in rows
    ])
  ])
  return ret

# Avec une chaîne
DATA = """Date;Code INSEE région;TMin (°C);TMax (°C);TMoy (°C)
2017-01-13;52;2.75;9.4;6.08
2017-02-07;52;6.0;12.75;9.38
2017-10-01;52;14.25;18.25;16.25
2017-10-09;52;11.25;17.55;14.4
2017-10-17;52;10.25;24.0;17.12
2017-05-19;52;6.45;15.45;10.95
2017-08-30;52;14.75;19.15;16.95
2017-09-03;52;10.5;19.0;14.75
2017-09-08;52;14.0;19.7;16.85
2017-09-12;52;10.3;19.85;15.08
2017-12-05;52;4.55;9.15;6.85
2017-01-07;52;-4.8;4.3;-0.25
2017-11-27;52;0.55;12.15;6.35"""

# Tri sur la colonne 0, délimiteur d'entrée ";", délimiteur de sortie "	"
print("Version avec une chaîne")
STREAM = io.StringIO(DATA)
print(sort_csv(STREAM))

# Tri sur la colonne 2. Comme ce sont des entiers on ne veut pas trier selon
# l'ordre lexicographique et on ne peut donc pas utiliser itemgetter(2)
print("Tri selon la colonne 2")
STREAM = io.StringIO(DATA)
print(sort_csv(STREAM, key=lambda row: float(row[2])))

# Avec un fichier
try:
  with open("toto.csv") as f:
    print(sort_csv(f))
except Exception as e:
  print(e, file=sys.stderr)

Ce qui donne à l'exécution :

Version avec une chaîneDate;Code INSEE région;TMin (°C);TMax (°C);TMoy (°C)2017-01-07;52;-4.8;4.3;-0.252017-01-13;52;2.75;9.4;6.082017-02-07;52;6.0;12.75;9.382017-05-19;52;6.45;15.45;10.952017-08-30;52;14.75;19.15;16.952017-09-03;52;10.5;19.0;14.752017-09-08;52;14.0;19.7;16.852017-09-12;52;10.3;19.85;15.082017-10-01;52;14.25;18.25;16.252017-10-09;52;11.25;17.55;14.42017-10-17;52;10.25;24.0;17.122017-11-27;52;0.55;12.15;6.352017-12-05;52;4.55;9.15;6.85Tri selon la colonne 2Date;Code INSEE région;TMin (°C);TMax (°C);TMoy (°C)2017-01-07;52;-4.8;4.3;-0.252017-11-27;52;0.55;12.15;6.352017-01-13;52;2.75;9.4;6.082017-12-05;52;4.55;9.15;6.852017-02-07;52;6.0;12.75;9.382017-05-19;52;6.45;15.45;10.952017-10-17;52;10.25;24.0;17.122017-09-12;52;10.3;19.85;15.082017-09-03;52;10.5;19.0;14.752017-10-09;52;11.25;17.55;14.42017-09-08;52;14.0;19.7;16.852017-10-01;52;14.25;18.25;16.252017-08-30;52;14.75;19.15;16.95

Bonne chance

Tri tableau csv

2 réponses

Discussions similaires

Newsletters