Remplacement de catégories par leurs pourcentages
Bonjour,
J'ai un dataframe de cette sorte, et j'aimerai remplacer les catégories des variables "variable_1" et "variable_2" par leurs pourcentages par rapport à la variable "fraude". J'aimerais donc avoir dans "variable_1" 50 a la place de "cat_1", 0 à la place de "cat_2" et 50 à la place de "cat_3" .
import io
import pandas as pd
import numpy as np
csv = io.StringIO("""fraude,variable_1,variable_2
1,cat_1,f
0,cat_1,f
0,cat_2,h
0,cat_2,f
1,cat_3,f
1,cat_1,h
0,cat_2,h
0,cat_3,h
1,cat_3,h
1,cat_3,f
0,cat_1,h
1,cat_1,f""")
df = pd.read_csv(csv)
df
Windows / Chrome 103.0.0.0
J'ai testé cette commande, mais ce n'est pas ce que je voulais, ça serait top si quelqu'un a une piste :
df["variable_1"] = (df["variable_1"].value_counts(dropna = False) / len(df[df["fraude"] == 1])) *100
A voir également:
- Remplacement de catégories par leurs pourcentages
- Remplacement coco - Accueil - Réseaux sociaux
- Coco.fr remplacement - Accueil - Réseaux sociaux
- Remplacer disque dur par ssd - Guide
- Coco chat remplacement ✓ - Forum Réseaux sociaux
- Ajoutez à la liste de contacts ana le goff, inscrite le 27 novembre 2015, dans la catégorie i. puis triez les contacts en les classant : par ordre alphabétique de leur nom de famille (critère principal), puis par date du plus récent au plus ancien (critère secondaire). quel mot apparaît à la verticale dans la colonne "catégorie" entre les lignes 200 et 209 (en-tête compris) ? ✓ - Forum Word