Tp

Fermé
lidia - 5 juin 2009 à 01:39
 Utilisateur anonyme - 5 juin 2009 à 01:42
slt,

jai un tp en ADD
Analyse en Composantes Principales (ACP)


1 Description des donn´ees
On dispose, pour 15 villes de France, des moyennes mensuelles de temp´eratures calcul´ees sur 30 ans
(de 1931 `a 1960). Ces donn´ees sont rassembl´ees dans le tableau 1 qui croise les 15 villes (lignes) et
les 12 mois de l’ann´ee (colonnes). Dans ce tableau :
- les 2 derni`eres lignes repr´esentent la moyenne (arrondie au dixi`eme pr`es pour les 12 premi`eres
variables) et l’´ecart-type des variables,
- les 4 derni`eres colonnes repr´esentent respectivement pour chaque ville, la latitude, la longitude1,
la moyenne annuelle de la temp´erature et l’amplitude maximale de temp´erature sur l’ann´ee2.
Toutes ces donn´ees sont regroup´ees dans le fichier “temperFR.sba” qui se trouve sur la partition
\\educ1\public (disque X) dans le r´epertoire 4INFO-A2C.
2 Travail `a effectuer
Le but de l’´etude est de comparer les temp´eratures mensuelles des diff´erentes villes. L’ACP sur ce
tableau devra pr´eciser les points suivants. Il s’agit en autre de
- r´ealiser une typologie des villes (i.e. celles qui se ressemblent et celles qui diff`erent du point de
vue des temp´eratures mensuelles),
- proposer un bilan des liaisons entre les variables et, dans la mesure du possible, r´esumer (approximativement)
l’ensemble des variables par un petit nombre de variables synth´etiques (i.e.
non pas extraites du tableau mais les combinant),
- ´etudier si les ressemblances ou les dissemblances correspondent `a des proximit´es (ou des ´eloignements)
g´eographiques.
1. D´ecrire les individus et les variables (on pr´ecisera leur nombre). Comment sont caract´eris´es les
individus ?
1exprim´ees en degr´es (elles sont n´egatives `a l’ouest du m´eridien de Greenwich)
2amplitude = moyenne mensuelle maximale - moyenne mensuelle minimale
Module A2C-1 1 TP 1 : ACP
4INFO - Ann´ee 2006/2007
jan f´ev mar avr mai juin juil aoˆut sep oct nov d´ec lat long moy ampl
Bordeaux 5.6 6.6 10.3 12.8 15.8 19.3 20.9 21.0 18.6 13.8 9.1 6.2 44.5 -0.34 13.3 15.4
Brest 6.1 5.8 7.8 9.2 11.6 14.4 15.6 16.0 14.7 12.0 9.0 7.0 48.2 -4.29 10.8 10.2
Clermont-Ferrand 2.6 3.7 7.5 10.3 13.8 17.3 19.4 19.1 16.2 11.2 6.6 3.6 45.5 3.05 10.9 16.8
Grenoble 1.5 3.2 7.7 10.6 14.5 17.8 20.1 19.5 16.7 11.4 6.5 2.3 45.1 5.43 11.0 18.6
Lille 2.4 2.9 6.0 8.9 12.4 15.3 17.1 17.1 14.7 10.4 6.1 3.5 50.4 3.04 9.7 14.7
Lyon 2.1 3.3 7.7 10.9 14.9 18.5 20.7 20.1 16.9 11.4 6.7 3.1 45.5 4.51 11.4 18.6
Marseille 5.5 6.6 10.0 13.0 16.8 20.8 23.3 22.8 19.9 15.0 10.2 6.9 43.2 5.24 14.2 17.8
Montpellier 5.6 6.7 9.9 12.8 16.2 20.1 22.7 22.3 19.3 14.6 10.0 6.5 43.4 3.53 13.9 17.1
Nantes 5.0 5.3 8.4 10.8 13.9 17.2 18.8 18.6 16.4 12.2 8.2 5.5 47.1 -1.33 11.7 13.8
Nice 7.5 8.5 10.8 13.3 16.7 20.1 22.7 22.5 20.3 16.0 11.5 8.2 43.4 7.15 14.8 15.2
Paris 3.4 4.1 7.6 10.7 14.3 17.5 19.1 18.7 16.0 11.4 7.1 4.3 48.5 2.20 11.2 15.7
Rennes 4.8 5.3 7.9 10.1 13.1 16.2 17.9 17.8 15.7 11.6 7.8 5.4 48.1 -1.41 11.1 13.1
Strasbourg 0.4 1.5 5.6 9.8 14.0 17.2 19.0 18.3 15.1 9.5 4.9 1.3 48.4 7.45 9.7 18.6
Toulouse 4.7 5.6 9.2 11.6 14.9 18.7 20.9 20.9 18.3 13.3 8.6 5.5 43.4 1.26 12.7 16.2
Vichy 2.4 3.4 7.1 9.9 13.6 17.1 19.3 18.8 16.0 11.0 6.6 3.4 46.1 3.26 10.7 16.9
Moyenne 4.0 4.8 8.2 11.0 14.4 17.8 19.8 19.6 17.0 12.3 7.9 4.9 46.0 2.58 11.8 15.9
´Ecart-type 1.94 1.81 1.48 1.37 1.45 1.73 2.06 1.94 1.79 1.77 1.74 1.89 2.22 3.21 1.55 2.25
Tab. 1 – Tableau des donn´ees correspondant au fichier “temperFR.sba”
2. Dans une ACP,
(a) Comment mesure t-on la dissemblance entre les individus ?
(b) Le nuage est toujours centr´e. Pourquoi ? Quel est l’effet de ce centrage sur l’analyse du
nuage des individus ? Quel type de liaisons value t-on dans le nuage des variables ?
3. Montrer que si on ne r´eduit pas les variables alors on accorde aux variables un poids ´egal `a leur
´ecart-type. La liste des ´ecart-types permet-elle, `a priori, de pr´evoir une diff´erence significative
entre une ACP norm´ee et une ACP non norm´ee ?
4. On effectue une ACP norm´ee du tableau en consid´erant,
- les 12 premi`eres colonnes du tableau comme variables actives,
- les 4 derni`eres colonnes comme variables illustratives,
- les 15 premi`eres lignes du tableau comme individus actifs.
(a) Analyser,
. les statistiques descriptives de chacune des 16 variables.
. la matrice des corr´elations : quelles sont les variables les plus corr´el´ees ?
. les valeurs propres : quel est le pourcentage d’inertie expliqu´ee par le premier axe ? Le
second ? Combien d’axes peut-on conserver ?
(b) Copier les r´esultats obtenus dans un fichier et imprimer ce fichier. ´Editer le rapport du
premier plan factoriel pour chacun des nuages et de la repr´esentation simultan´ee des deux
nuages engendr´ee par les deux premiers axes.
5. (a) Quelle est la premi`ere composante principale ? ´Etudier la repr´esentation des individus
sur le premier axe. Quels sont les points dont la contribution au premier axe est la plus
Module A2C-1 2 TP 1 : ACP
4INFO - Ann´ee 2006/2007
grande ? Quelles sont leurs coordonn´ees ? Comparer les r´esultats avec l’interpr´etation de
la premi`ere composante principale obtenue ?
(b) Reprendre le travail de la question pr´ec´edente avec la seconde composante principale et le
second axe factoriel.
(c) Donner une interpr´etation globale du premier cercle des corr´elations (prendre en compte
l’apport des variables illustratives). Effectuer une typologie des 15 villes `a partir de la
repr´esentation simultan´ee.
6. Effectuer une ACP non norm´ee du tableau et comparer les r´esultats obtenus avec l’ACP norm´ee.
Module A2C-1 3 TP 1 : ACP

1 réponse

Utilisateur anonyme
5 juin 2009 à 01:42
http://www.commentcamarche.net/forum/affich 12732085 tp#1
0