SAS imputation de revenus

Fermé
RiceKrispies Messages postés 1 Date d'inscription mercredi 24 novembre 2010 Statut Membre Dernière intervention 24 novembre 2010 - 24 nov. 2010 à 13:10
 RiceKrispies - 25 nov. 2010 à 13:48
Bonjour,

Je dois imputer ma variable revenus où il y a environ 10 % de données manquantes. Je sais que je dois m'aider des variables : l'age, le sexe, la situation pro, la PCS, la PCS du chef de ménage, niveau d'étude, le nombre d'adulte par ménage.
Une fois le modèle créé et les valeurs prédites je dois tester la qualité du modèle, comparer les valeurs prédites aux anciennes (on accepte une marge de 100 à 200 euros) puis regarder dans 2 ou 3 sous groupes de population pour voir si le pouvoir prédictif est bon.
Je ne sais pas du tout faire sa, je ne sais même pas s'il y a des hypothèses à vérifier avant de commencer, pourriez vous m'aider? Je suis un peu perdue...

J'ai tenté ca :

proc glm data=sirs.test;
model L5_euros = A4 B1 niv_etude niv_etude_chef min_01 sitpr sitpr_chef natio PCS / solution;
OUTPUT out=sirs.imput
p= L5_euros_bis;
run;
quit;
data sirs.test;
merge sirs.test sirs.imput(keep= L5_euros_bis);
if L5_euros = . then L5_euros_imp= L5_euros_bis;
else L5_euros_imp = L5_euros;
run;

mais le résultat est catastrophique, de plus il y a surement de l'interaction entre mes variables explicatives!

1 réponse

RiceKrispies
25 nov. 2010 à 13:48
J'ai aussi trouvé la PROC MI mais je ne comprends pas bien ce qu'elle fait, personne ne peut m'aider?
0