Simplifier base de données sommes condi

Résolu/Fermé
TOT127 Messages postés 898 Date d'inscription mercredi 8 avril 2009 Statut Membre Dernière intervention 7 août 2018 - Modifié par TOT127 le 16/06/2016 à 21:58
TOT127 Messages postés 898 Date d'inscription mercredi 8 avril 2009 Statut Membre Dernière intervention 7 août 2018 - 20 juin 2016 à 11:19
Bonjour à tous,
Je remercie par avance car si je réussis à faire ma base de données, c'est grâce à commentçamarche.net et à ses membres non seulement super aidant mais super compétents. Voilà, ça, je mets en gras.


Maintenant je passe à mes prb lol.

Je fais une base de données, qui est comme suit:
Chaque ligne est un cas de financement:

Nom1 v1....donateurA valeur A...vn
Nom1 v1...donateurB valeurB...vn
Nom1 v1...donateurB valeurC...vn
Nom2 v1...donateurA valeurA...vn
Nom2 v1...donateurB valeurB...vn
Nom3 v1...donateurA valeur.....vn

En gros, la plupart des variables sont les mêmes au sein d'une même série de lignes avec le même nom. Chaque nom a des donateurs différents, d'où le nombre de lignes (la base original fait 470.897 lignes, j'ai viré sur stata)..
Les variables qui changent sont relatives au donateur.
Une des variables, qui change à chaque ligne, est la somme reçue.

Impossible de faire des régressions avec ça.


J'aimerais donc:
-> Sommer par ligne les valeurs, en gardant les autres variables qui changent pas (je vire ce qui change, on s'en fou, genre numéro d'opération etc)
-> Savoir s'il y a moyen, sans se prendre la tête de fou, de faire une case pourcentage, en reprenant les infos d'une colonne.
Nous avons ça:
A .........B..............C....................D
nom1....donateur...Somme....1sidonateur=top100
nom1....donateur...Somme....1sidonateur=top100
nom1....donateur...Somme....1sidonateur=top100

rajouter une case, dans la ligne (seule ligne par nom, cette fois, avec ceci):
% du total de la somme C:C qui vient d'un top100 (D=1)

Enfin, c'est possible, 1) je sais pas le faire lol 2) j'ai peur d'y repasser 10jours :'(
J'aimerais limiter la perte de l'information, très riche, sur les donateurs. Si vous êtes élu, que 80% de vos sous viennent des 4 plus grandes compagnies nationales dans le pétrole, faut pas s'étonne de vos votes ensuite. Si vos donateur sont des entreprises du top 700-1000, de secteurs de haute technologie, c'est autre chose. Et ce qu'on fait ici, c'est des études de vote ^^

Disons que, ma base de base, pour les recoupements (tabstat by(nom) stat(sum), sur stata, c'est el top. Pour les régressions, c'est à chier.

Quelle méthode privilégier pour ça ?


merci beaucoup
#encoreunroman!

t



(ps: si vous connaissez des formations excel on line, je prends)

4 réponses

Raymond PENTIER Messages postés 58814 Date d'inscription lundi 13 août 2007 Statut Contributeur Dernière intervention 15 janvier 2025 17 266
17 juin 2016 à 01:24
Bonjour T.

Au risque de me répéter, un court fichier vaut mieux qu'un long laïus ...

Nous voulons bien sacrifier un certain temps à chercher la solution du problème que tu poses ; mais tu dois faire en sorte que nous n'ayons pas à perdre du temps à essayer de reconstituer le tableau que tu nous décris (avec une louable bonne volonté mais sans grande efficacité).
Si tes données sont confidentielles, tu les remplaces par des données bidon, 
dans une copie de ton fichier.
1
TOT127 Messages postés 898 Date d'inscription mercredi 8 avril 2009 Statut Membre Dernière intervention 7 août 2018 96
17 juin 2016 à 09:25
st vrai, j'ai essayé mais.. on comprend rien. VOici le fichier: http://www.cjoint.com/c/FFrhyMct3xX En gris clair des variables que je vais virer (elles changent à chaque ligne et s'informent sur rien)
0
Raymond PENTIER Messages postés 58814 Date d'inscription lundi 13 août 2007 Statut Contributeur Dernière intervention 15 janvier 2025 17 266
17 juin 2016 à 14:54
Bonjour TOT127.

Je pense que le Tableau Croisé Dynamique est juste ce qu'il te faut !
https://www.cjoint.com/c/FFrm2DTdjeN
1
TOT127 Messages postés 898 Date d'inscription mercredi 8 avril 2009 Statut Membre Dernière intervention 7 août 2018 96
18 juin 2016 à 11:59
en effet, c'est ce qu'il faut ! en plus, c'est facile à faire. Juste est-ce qu'il y a moyen de garder les informations en français (AR, RS, SA, qui sont des régions) ? Car le tableau met des numéros au lieu de juste écrire, par exemple, "AR" (toutes les lignes du même nom ont la même info, "AR"). On peut faire ça ?
0
MasterofTutos Messages postés 3 Date d'inscription samedi 18 juin 2016 Statut Membre Dernière intervention 20 juin 2016 1
18 juin 2016 à 12:02
1
TOT127 Messages postés 898 Date d'inscription mercredi 8 avril 2009 Statut Membre Dernière intervention 7 août 2018 96
18 juin 2016 à 15:26
donc je rajoute des colonnes au tableau dynamique avec des cellules type F = E
0
eriiic Messages postés 24603 Date d'inscription mardi 11 septembre 2007 Statut Contributeur Dernière intervention 15 décembre 2024 7 250
19 juin 2016 à 01:08
Bonjour,

pour compléter la réponse de raymond par un clic-droit sur les étiquettes tu as Trier... et Filtrer...
Tu peux ainsi avoir un Top10 (ou Top100) trié par importance de %
https://www.cjoint.com/c/FFsxgCu0OYv
eric
1
TOT127 Messages postés 898 Date d'inscription mercredi 8 avril 2009 Statut Membre Dernière intervention 7 août 2018 96
19 juin 2016 à 18:04
salut ! merci à tous, je fais ça en ce moment même :)
0
TOT127 Messages postés 898 Date d'inscription mercredi 8 avril 2009 Statut Membre Dernière intervention 7 août 2018 96
20 juin 2016 à 11:19
bonjour, j'ai des erreurs #DIV/0! dans mon TCD alors que normalement il devrait faire le calcul, il n'y a pas de valeurs manquantes dans la base de données, à quoi est-ce du ? (je demande au TCD de faire des moyennes, toujours)
0