SAS imputation de revenus
RiceKrispies
Messages postés
1
Date d'inscription
Statut
Membre
Dernière intervention
-
RiceKrispies -
RiceKrispies -
Bonjour,
Je dois imputer ma variable revenus où il y a environ 10 % de données manquantes. Je sais que je dois m'aider des variables : l'age, le sexe, la situation pro, la PCS, la PCS du chef de ménage, niveau d'étude, le nombre d'adulte par ménage.
Une fois le modèle créé et les valeurs prédites je dois tester la qualité du modèle, comparer les valeurs prédites aux anciennes (on accepte une marge de 100 à 200 euros) puis regarder dans 2 ou 3 sous groupes de population pour voir si le pouvoir prédictif est bon.
Je ne sais pas du tout faire sa, je ne sais même pas s'il y a des hypothèses à vérifier avant de commencer, pourriez vous m'aider? Je suis un peu perdue...
J'ai tenté ca :
proc glm data=sirs.test;
model L5_euros = A4 B1 niv_etude niv_etude_chef min_01 sitpr sitpr_chef natio PCS / solution;
OUTPUT out=sirs.imput
p= L5_euros_bis;
run;
quit;
data sirs.test;
merge sirs.test sirs.imput(keep= L5_euros_bis);
if L5_euros = . then L5_euros_imp= L5_euros_bis;
else L5_euros_imp = L5_euros;
run;
mais le résultat est catastrophique, de plus il y a surement de l'interaction entre mes variables explicatives!
Je dois imputer ma variable revenus où il y a environ 10 % de données manquantes. Je sais que je dois m'aider des variables : l'age, le sexe, la situation pro, la PCS, la PCS du chef de ménage, niveau d'étude, le nombre d'adulte par ménage.
Une fois le modèle créé et les valeurs prédites je dois tester la qualité du modèle, comparer les valeurs prédites aux anciennes (on accepte une marge de 100 à 200 euros) puis regarder dans 2 ou 3 sous groupes de population pour voir si le pouvoir prédictif est bon.
Je ne sais pas du tout faire sa, je ne sais même pas s'il y a des hypothèses à vérifier avant de commencer, pourriez vous m'aider? Je suis un peu perdue...
J'ai tenté ca :
proc glm data=sirs.test;
model L5_euros = A4 B1 niv_etude niv_etude_chef min_01 sitpr sitpr_chef natio PCS / solution;
OUTPUT out=sirs.imput
p= L5_euros_bis;
run;
quit;
data sirs.test;
merge sirs.test sirs.imput(keep= L5_euros_bis);
if L5_euros = . then L5_euros_imp= L5_euros_bis;
else L5_euros_imp = L5_euros;
run;
mais le résultat est catastrophique, de plus il y a surement de l'interaction entre mes variables explicatives!