Importation / Gestion de GROS fichier CSV

Xtoons64 Messages postés 4 Statut Membre -  
yg_be Messages postés 24281 Date d'inscription   Statut Contributeur Dernière intervention   -
Bonjour,

Je dispose de 7 gros fichiers CSV allant de 1.2 Go à 35 Go
Dans chaque fichier CSV, je souhaiterais récupérer seulement les informations dont j'ai besoin.

Actuellement je me suis fait un script qui me permet de traiter 25000 lignes / jour, j'ai tout simplement split un des fichiers, mais c'est beaucoup trop long comme méthode.


J'ai essayé d'importer mon fichier CSV brutalement dans une BDD mysql en boostant au maximum des performances, mais ça ne passe pas. Et j'ai retenté l'opération avec des fichiers de 50 Mo ( split ), rien n'a faire, que ce soit en local ou sur mon dédié, il ne veut pas traité les informations ( à titre informatif, j'ai bien remplie avec les bonnes valeurs les prérequis )


J'ai du coups plusieurs questions:

Existe t'il un logiciel qui me permettrait de visualiser le fichier, et de par exemple supprimer les colonne que je n'ai pas besoin ( en vue de minimiser la taille du fichier final ) ?

Avez vous une idée pour importer mes fichiers CSV vers une base de donnée en vue de les modifier ?

Ou tout autres idées pour que je puisse traiter mes fichiers ?

En vous remerciant.
Si vous avez des questions, n'hésitez pas :)

Au plaisir.
A voir également:

2 réponses

jee pee Messages postés 42434 Date d'inscription   Statut Modérateur Dernière intervention   9 754
 
Bonjour,

Quelques pistes qu'il te faudrait développer :
- utiliser powerquery avec excel pour simplifier le csv, voir : https://forums.commentcamarche.net/forum/affich-36718337-ouvrir-un-csv-trop-volumineux-faire-des-requetes

- ce que je tenterais c'est un script python qui lit le fichier .csv, en constitue un autre en ne reprenant que les données/colonnes utiles et éventuellement en constituant de nouveaux sous fichiers comportant des blocs de lignes pour avoir des fichiers moins volumineux à traiter. Avec python on pourrait même aller plus loin, faire l'insertion directement dans la bdd mysql.
0
yg_be Messages postés 24281 Date d'inscription   Statut Contributeur Dernière intervention   Ambassadeur 1 585
 
bonjour,
que est le résultat espéré? des fichiers avec uniquement les données utiles? ces données dans une base de données?

"il ne veut pas traité les informations": message d'erreur?

que fait précisément le script trop lent? quel langage?
0