Faire un boucle sur des sous parties d'un dataframe python
Résolu/Fermé
nab3
-
7 avril 2021 à 11:42
mamiemando Messages postés 33459 Date d'inscription jeudi 12 mai 2005 Statut Modérateur Dernière intervention 8 janvier 2025 - 7 avril 2021 à 12:21
mamiemando Messages postés 33459 Date d'inscription jeudi 12 mai 2005 Statut Modérateur Dernière intervention 8 janvier 2025 - 7 avril 2021 à 12:21
A voir également:
- Faire un boucle sur des sous parties d'un dataframe python
- Creer un groupe whatsapp a partir d'un autre groupe - Guide
- Citizen code python avis - Accueil - Outils
- Trouver la position d'un élément dans une liste python ✓ - Forum Python
- Comment faire une recherche à partir d'une photo - Guide
2 réponses
jee pee
Messages postés
40634
Date d'inscription
mercredi 2 mai 2007
Statut
Modérateur
Dernière intervention
8 janvier 2025
9 479
Modifié le 7 avril 2021 à 12:09
Modifié le 7 avril 2021 à 12:09
Bonjour,
Tu pourrais mettre en œuvre 2 boucles,
la premiere sur la liste globale avec un indice qui avance par pas de 1008 : 0,1008,2016 ...
la seconde qui qui traite 1008 enregistrements à partir de l'indice de la première boucle
avec un soucis à traiter : 43200 n'est pas un multiple de 1008
Tu pourrais mettre en œuvre 2 boucles,
la premiere sur la liste globale avec un indice qui avance par pas de 1008 : 0,1008,2016 ...
la seconde qui qui traite 1008 enregistrements à partir de l'indice de la première boucle
avec un soucis à traiter : 43200 n'est pas un multiple de 1008
mamiemando
Messages postés
33459
Date d'inscription
jeudi 12 mai 2005
Statut
Modérateur
Dernière intervention
8 janvier 2025
7 813
Modifié le 7 avril 2021 à 12:21
Modifié le 7 avril 2021 à 12:21
Bonjour,
Tu peux appliquer la méthode proposée dans cette discussion :
Note qu'il n'est pas nécessaire de ce demander si la taille de la dataframe de départ est un multiple de la taille du batch.
Bonne chance
Tu peux appliquer la méthode proposée dans cette discussion :
import numpy as np import pandas as pd # Create a dataframe of size 10 test = pd.Series(np.random.rand(10)) print(test) # Process rows by batch of size 3 n = 3 for (g, df) in test.groupby(np.arange(len(test)) // n): print(df.shape) print(df)
Note qu'il n'est pas nécessaire de ce demander si la taille de la dataframe de départ est un multiple de la taille du batch.
Bonne chance