Simplifier base de données sommes condi
Résolu
TOT127
Messages postés
898
Date d'inscription
Statut
Membre
Dernière intervention
-
TOT127 Messages postés 898 Date d'inscription Statut Membre Dernière intervention -
TOT127 Messages postés 898 Date d'inscription Statut Membre Dernière intervention -
Bonjour à tous,
Je remercie par avance car si je réussis à faire ma base de données, c'est grâce à commentçamarche.net et à ses membres non seulement super aidant mais super compétents. Voilà, ça, je mets en gras.
Maintenant je passe à mes prb lol.
Je fais une base de données, qui est comme suit:
Chaque ligne est un cas de financement:
Nom1 v1....donateurA valeur A...vn
Nom1 v1...donateurB valeurB...vn
Nom1 v1...donateurB valeurC...vn
Nom2 v1...donateurA valeurA...vn
Nom2 v1...donateurB valeurB...vn
Nom3 v1...donateurA valeur.....vn
En gros, la plupart des variables sont les mêmes au sein d'une même série de lignes avec le même nom. Chaque nom a des donateurs différents, d'où le nombre de lignes (la base original fait 470.897 lignes, j'ai viré sur stata)..
Les variables qui changent sont relatives au donateur.
Une des variables, qui change à chaque ligne, est la somme reçue.
Impossible de faire des régressions avec ça.
J'aimerais donc:
-> Sommer par ligne les valeurs, en gardant les autres variables qui changent pas (je vire ce qui change, on s'en fou, genre numéro d'opération etc)
-> Savoir s'il y a moyen, sans se prendre la tête de fou, de faire une case pourcentage, en reprenant les infos d'une colonne.
Nous avons ça:
A .........B..............C....................D
nom1....donateur...Somme....1sidonateur=top100
nom1....donateur...Somme....1sidonateur=top100
nom1....donateur...Somme....1sidonateur=top100
rajouter une case, dans la ligne (seule ligne par nom, cette fois, avec ceci):
% du total de la somme C:C qui vient d'un top100 (D=1)
Enfin, c'est possible, 1) je sais pas le faire lol 2) j'ai peur d'y repasser 10jours :'(
J'aimerais limiter la perte de l'information, très riche, sur les donateurs. Si vous êtes élu, que 80% de vos sous viennent des 4 plus grandes compagnies nationales dans le pétrole, faut pas s'étonne de vos votes ensuite. Si vos donateur sont des entreprises du top 700-1000, de secteurs de haute technologie, c'est autre chose. Et ce qu'on fait ici, c'est des études de vote ^^
Disons que, ma base de base, pour les recoupements (tabstat by(nom) stat(sum), sur stata, c'est el top. Pour les régressions, c'est à chier.
Quelle méthode privilégier pour ça ?
merci beaucoup
#encoreunroman!
t
(ps: si vous connaissez des formations excel on line, je prends)
Je remercie par avance car si je réussis à faire ma base de données, c'est grâce à commentçamarche.net et à ses membres non seulement super aidant mais super compétents. Voilà, ça, je mets en gras.
Maintenant je passe à mes prb lol.
Je fais une base de données, qui est comme suit:
Chaque ligne est un cas de financement:
Nom1 v1....donateurA valeur A...vn
Nom1 v1...donateurB valeurB...vn
Nom1 v1...donateurB valeurC...vn
Nom2 v1...donateurA valeurA...vn
Nom2 v1...donateurB valeurB...vn
Nom3 v1...donateurA valeur.....vn
En gros, la plupart des variables sont les mêmes au sein d'une même série de lignes avec le même nom. Chaque nom a des donateurs différents, d'où le nombre de lignes (la base original fait 470.897 lignes, j'ai viré sur stata)..
Les variables qui changent sont relatives au donateur.
Une des variables, qui change à chaque ligne, est la somme reçue.
Impossible de faire des régressions avec ça.
J'aimerais donc:
-> Sommer par ligne les valeurs, en gardant les autres variables qui changent pas (je vire ce qui change, on s'en fou, genre numéro d'opération etc)
-> Savoir s'il y a moyen, sans se prendre la tête de fou, de faire une case pourcentage, en reprenant les infos d'une colonne.
Nous avons ça:
A .........B..............C....................D
nom1....donateur...Somme....1sidonateur=top100
nom1....donateur...Somme....1sidonateur=top100
nom1....donateur...Somme....1sidonateur=top100
rajouter une case, dans la ligne (seule ligne par nom, cette fois, avec ceci):
% du total de la somme C:C qui vient d'un top100 (D=1)
Enfin, c'est possible, 1) je sais pas le faire lol 2) j'ai peur d'y repasser 10jours :'(
J'aimerais limiter la perte de l'information, très riche, sur les donateurs. Si vous êtes élu, que 80% de vos sous viennent des 4 plus grandes compagnies nationales dans le pétrole, faut pas s'étonne de vos votes ensuite. Si vos donateur sont des entreprises du top 700-1000, de secteurs de haute technologie, c'est autre chose. Et ce qu'on fait ici, c'est des études de vote ^^
Disons que, ma base de base, pour les recoupements (tabstat by(nom) stat(sum), sur stata, c'est el top. Pour les régressions, c'est à chier.
Quelle méthode privilégier pour ça ?
merci beaucoup
#encoreunroman!
t
(ps: si vous connaissez des formations excel on line, je prends)
A voir également:
- Simplifier base de données sommes condi
- Fuite données maif - Guide
- Base de registre - Guide
- Supprimer les données de navigation - Guide
- Tnt base de données vide - Forum TNT / Satellite / Réception
- Formules mathématiques de base - Télécharger - Études & Formations
4 réponses
Bonjour T.
Au risque de me répéter, un court fichier vaut mieux qu'un long laïus ...
Nous voulons bien sacrifier un certain temps à chercher la solution du problème que tu poses ; mais tu dois faire en sorte que nous n'ayons pas à perdre du temps à essayer de reconstituer le tableau que tu nous décris (avec une louable bonne volonté mais sans grande efficacité).
Au risque de me répéter, un court fichier vaut mieux qu'un long laïus ...
Nous voulons bien sacrifier un certain temps à chercher la solution du problème que tu poses ; mais tu dois faire en sorte que nous n'ayons pas à perdre du temps à essayer de reconstituer le tableau que tu nous décris (avec une louable bonne volonté mais sans grande efficacité).
Si tes données sont confidentielles, tu les remplaces par des données bidon,
dans une copie de ton fichier.
TOT127
Messages postés
898
Date d'inscription
Statut
Membre
Dernière intervention
96
st vrai, j'ai essayé mais.. on comprend rien. VOici le fichier: http://www.cjoint.com/c/FFrhyMct3xX En gris clair des variables que je vais virer (elles changent à chaque ligne et s'informent sur rien)
Bonjour TOT127.
Je pense que le Tableau Croisé Dynamique est juste ce qu'il te faut !
https://www.cjoint.com/c/FFrm2DTdjeN
Je pense que le Tableau Croisé Dynamique est juste ce qu'il te faut !
https://www.cjoint.com/c/FFrm2DTdjeN
en effet, c'est ce qu'il faut ! en plus, c'est facile à faire. Juste est-ce qu'il y a moyen de garder les informations en français (AR, RS, SA, qui sont des régions) ? Car le tableau met des numéros au lieu de juste écrire, par exemple, "AR" (toutes les lignes du même nom ont la même info, "AR"). On peut faire ça ?
Bonjour,
pour compléter la réponse de raymond par un clic-droit sur les étiquettes tu as Trier... et Filtrer...
Tu peux ainsi avoir un Top10 (ou Top100) trié par importance de %
https://www.cjoint.com/c/FFsxgCu0OYv
eric
pour compléter la réponse de raymond par un clic-droit sur les étiquettes tu as Trier... et Filtrer...
Tu peux ainsi avoir un Top10 (ou Top100) trié par importance de %
https://www.cjoint.com/c/FFsxgCu0OYv
eric