Analyse en composante principale

Fermé
amihud Messages postés 2 Date d'inscription vendredi 1 mai 2009 Statut Membre Dernière intervention 2 mai 2009 - 1 mai 2009 à 22:30
 tbastien - 13 avril 2011 à 14:56
Bonjour,
je suis entrain de travailler sur mon mémoire de fin d'étude en finance . j'utilise l'analyse en composante principale sur e views mais j'ai pas compris la méthode et comment faire pour introduire les variables ,je travaille sur quatre variables avec 48 observations mensuelles pour chacune des variables,est ce que quelqu'un peut m'aider svp je suis assez stréssée.merci d'avance.
A voir également:

6 réponses

quendistu Messages postés 507 Date d'inscription lundi 3 novembre 2008 Statut Membre Dernière intervention 4 juin 2009 87
6 mai 2009 à 16:50
Les eigen values (valeurs propres) et la eigen vectors matrix (matrice des vecteurs propres) sont des données de sortie et non d'entrée de la méthode. Autrement dit ce sont les résultats. Seuls sont à saisir ou à injecter les variables. Le logiciel vous demande peut-être un paramétrge : affichage des n premiers vecteurs propres (n ne pouvant être qu'inférieur ou égal à 4, puisque vous n'avez que 4 variables).

Plus généralement le but de l'analyse de données en composantes principales normées est de visualiser sous le meilleur prisme possible les relations supposées linéaires entre les différentes variables (vos 4 variables) d'un phénomème observé, données recueillies sur un certain nombre d'échantillons, expériences, individus, occurences,.. etc. du phénomène

Ce prisme est l'angle d'observation optimal pour relater le phénomène observé. Il s'agit en fait ici d'un hyper angle, compte tenu de notre capacité à considérer un angle en trois dimensions seulement alors que l'espace du phénomène observé est de dimension N, N étant le nombre de variables.

Par exemple si je prends un groupe de 100 décès, avec 5 variables :
Taille
Poids
Fumeur ou non
décès par Cancer du poumon
boit de l'Alcool ou pas

La méthode consiste concrètement à :

- déterminer la corrélation entre les variables 2 à 2 : on se doûte qu'on va trouver : une corrélation élevée entre F et C et entre T et P ; on obtient une matrice de corrélation de 5 x 5.

- déterminer les vecteurs propres (le prisme d'observation) par diagonalisation de la matrice de corrélation : ces vecteurs représentent les groupes de variables étant fortement corrélées : 1 premier vecteur propre va être taille poids ; un second fumeur et décès par cancer du poumon ; la méthode permet de voir que T et P sont a peu près la même information ; idem F et C ; que A est indépendant des deux autres axes ;

- visualiser les variables de chaque échantillon en les passant ai travers de la matrice des vecteurs propres :
autrement dit pour représenter ces 100 personnes on pourra les disposer autour de trois axes au lieu de cinq, les 2 axes restant étant de la poussière (en terme d'information) par rapport au 3 axes principaux.

Bien sûr j'ai pris un exemple simplissime et j'ai imaginé et caricaturé les résultats pour faciliter la compréhension.

Cordialement,
Bonjour,

Je travaille en ce moment sur statistica pour des exos en cours et j'ai un peu de mal. Je voudrais donc vous poser la question, avec beaucoup d'espoir !

1. tableau de 20 observations et 5 variables

Une des observations influe beaucoup trop sur le reste (contribution absolue largement trop élevée), je la supprime donc de l'analyse en faisant un clic droit "exclude".

Ensuite, je souhaite la réincorporer au graphique comme observation supplémentaire mais n'entrant pas dans le calcul. C'est là que je ne comprend pas pourquoi dès que j'ajoute cette observation supplémentaire tous les autres points sont déplacés.

Pour rajouter un individu supplémentaire j'ai ajouté une variable "actif" puis spécifié sa valeur à 1 sauf mon observation supplémentaire. J'ai ensuite sélection la variable active et entré le code des individus actifs à "1".
Bonjour,

Est ce que tu utilises l'ACP à la française de STATISTICA ?
Est ce que tu es certains que lors de l'analyse initiale, l'observation avait été exclue ?
N'hésite pas à utiliser l'aide en ligne de STATISTICA ou à te rendre sur le site web www.statsoft.fr pour plus d'infos.
Thomas
quendistu Messages postés 507 Date d'inscription lundi 3 novembre 2008 Statut Membre Dernière intervention 4 juin 2009 87
1 mai 2009 à 22:47
J'ai utilisé cette méthode pour identifier les paramètres influents d'un processus industriel dans le but d'améliorer l'aspect de pièces visibles pour un constructeur automobile.

C'était il y a une vingtaine d'années dans le cadre d'un stage en entreprise dans ma formation d'ingénieur.

J'ai fait un programme en turbo-pascal, fait les expériences, reporté les résultats, identifié les paramètres significatifs influents, puis modifié ces paramètres sur la machine de production.

Si je peux vous aider ...
amihud Messages postés 2 Date d'inscription vendredi 1 mai 2009 Statut Membre Dernière intervention 2 mai 2009
2 mai 2009 à 12:57
bonjour,
le travail se fait sur eviews ,lorsque j'utilise cette methide sur eviews une fenetre s'ouvre contenant
GENRATED OUTPUT VARIABLES
component series( à detreminer)
vector of eigenvalues(à déterminer)
matrix of eigenvalues(à déterminer)
si j'introduis les 4 variables dans les component series je ne sais pas quoi introduire dans vector of eigenvalues et matrix of eigenvalues.Si vous pouvez m'aider.merci d'avance.
0

Vous n’avez pas trouvé la réponse que vous recherchez ?

Posez votre question
Sur ce site (http://123soft.franceserv.com/) tu trouveras une explication détaillée de l'ACP dans l'onglet Logiciels.

L'auteur du site propose même un logiciel gratuit faisant l'ACP. Il suffit de le contacter. Bon courage
l'adresse exacte c'est : http://123soft.franceserv.com/analyse-en-composante-principale.html