Part-AD-MMD-mars-2018-cor[2171]

Telechargé par Chadha Mhalla
ANALYSE DES DONNEES (Correction Partiel)
Master M1 MMD - MA, 19 mars 2018
Calculatrice autoris´
ee, documents autoris´
es : 2 feuilles recto-verso.
Barˆeme approximatif : 10 points pour chacun des deux exercices.
Exercice 1
On consid`
ere un nuage N, constitu´
e de nindividus (xi)1in, chaque individu a un poids
pi>0. On a pvariables d’o`
u un tableau Xde format n×p, on note Yle tableau centr´
e et rle
rang de Y.
Les r´
esultats de l’ACP de N, l’espace p´
etant muni de la m´
etrique M=Ipet nde la
m´
etrique Dp, sont not´
es comme suit :
- le α`
eme vecteur axial factoriel (pour le nuage des individus) est not´
euα,
- la α`
eme valeur propre est not´
ee λα,
- la α`
eme composante principale du nuage des individus est not´
ee ψα,
- pour tout λα,0, vα=ψα
λα,
avec α∈ {1,...,p}.
On note 1nle vecteur de ndont toutes les composantes sont ´
egales `
a 1.
1. D´
ecomposition de Y
(a) Montrer que
p
X
α=1
uαu0
α=Ip.
Indication : on pourra calculer, pour tout 1 βp, (
p
X
α=1
uαu0
α)uβ, puis conclure.
solution
Puisque la famille (uα)1αpest une famille orthonormale de p, on a u0
αuβ=0 si
α,βet u0
αuβ=1 si α=β. On en d´
eduit que
(
p
X
α=1
uαu0
α)uβ=
p
X
α=1
uαu0
αuβ,
=uβ.
De plus comme la famille (uα)1αpest une base, on en conclut que
p
X
α=1
uαu0
α=Ip.
(b) En d´
eduire que
Y=
r
X
α=1
pλαvαu0
α.
solution
Puisque Yest de rang r, les rpremi`
eres valeurs propres sont non nulles, on peut donc
d´
efinir les vecteurs vαpour tout 1 αr. Le calcul donne
r
X
α=1
pλαvαu0
α=
r
X
α=1
ψαu0
α,
=
r
X
α=1
Yuαu0
α,
=
p
X
α=1
Yuαu0
α,car Yuα=0 si α > r
=Y.
(c) R´
eciproquement, en remplac¸ant rpar un entier naturel qr, on consid`
ere un tableau
Td´
efini par
T=
q
X
α=1
aαwαt0
α,
o`
u
les r´
eels aαforment une suite d´
ecroissante : a1a2≥ ··· ≥ aq>0.
la famille (tα)1αqest une famille orthonormale de p.
la famille (wα)1αqest une famille Dp-orthonormale de vect(1n).
On eectue l’ ACP du tableau T, l’espace p´
etant muni de la m´
etrique M=Ipet
nde la m´
etrique Dp.
i. Calculer T0Dp1n. En d´
eduire que le tableau Test centr´
e.
solution On commence par montrer que le tableau Test centr´
e, en eet
T0Dp1n=
q
X
α=1
aαtαw0
αDp1n=0,
car la famille (wα)1αqest une famille orthonormale de vect(1n).
On en d´
eduit que le produit scalaire de tj, 1 jp, avec 1nest nul pour la
m´
etrique Dpsoit
n
X
i=1
pitj
i=0
ce qui correspond `
a la moyenne de tj. Ainsi toutes les variables sont centr´
ees.
ii. Montrer que les r´
eels aαsont les valeurs propres non nulles, que pour tout 1
αq,tαest un axe factoriel associ´
e`
a la valeur propre aαet que la composante
principale associ´
ee `
atαest aαwα.
solution
La matrice de variance est alors
V=T0DpT,
=
q
X
α=1
aαtαw0
αDp
q
X
β=1
aβwβt0
β
=
q
X
α=1
aαtαDpt0
α.
On a pour 1 αq
Vtα=aαtα
On compl`
ete la famille (tα)1αqen une base orthonormale de p(tα)1αp, on a
pour tout r+1αp
Vtα=0
On en d´
eduit que les r´
eels aαsont les valeurs propres non nulles, que pour tout
1αq,tαest un axe factoriel associ´
e`
a la valeur propre aα.
Enfin
ψα=T tα=aαwα.
2. Approximation de Ypar une matrice de rang inf´
erieur `
arSoit qun entier inf´
erieur
`
ar, on consid`
ere le tableau Yavec les qpremiers termes de la somme
Y=
q
X
α=1
pλαvαu0
α(1).
(a) D´
eterminer le noyau de Y, ker Y, puis en d´
eduire le rang de Y.
solution
Soit uker Y, alors
Yu=0,
soit q
X
α=1
pλαvαu0
αu=0.
ou encore q
X
α=1
pλα<uα,u>vα=0.
comme la famille (vα)αest libre, et que les qpremi`
eres valeurs propres sont non
nulles, on en d´
eduit que
uvect(u1,··· ,uq).
R´
eciproquement tout vecteur de vect(u1,··· ,uq)est dans ker Ydonc
ker Y=vect(u1,··· ,uq).
On en d´
eduit que le rang de Yest p(pq)=q.
(b) La matrice Ycomporte n×ptermes, combien de termes sont ils n´
ecessaires pour
construire la matrice Y`
a partir de l’´
equation (1). solution La matrice Yn´
ecessite
q(n+p+1) termes au lieu des np termes de Y.
3. Qualit´
e de l’approximation
(a) L’espace p´
etant muni de la m´
etrique M=Ipet nde la m´
etrique Dp, calculer
l’inertie totale du nuage associ´
ee au tableau Ynot´
ee I
Ten fonction des valeurs
propres (λα)1αq.
solution
On a
I
T=T r((Y)0Y),
=T r(
q
X
α=1
λαuαu0
α),
=
q
X
α=1
λαT r(u0
αuα),car T r(AB)=T r(BA),
=
q
X
α=1
λα.
(b) On d´
efinit la qualit´
e de l’approximation par
τq=I
T
IT
.
Calculer τqen fonction des valeurs propres (λα)1αp. Que repr´
esente τqpour l’ACP
du tableau Y?
solution
On a
τq=Pq
α=1λα
Pr
α=1λα
.
Il s’agit du taux d’inertie expliqu´
e par l’espace g´
en´
er´
e par les qpremiers axes vecto-
riels.
Exercice 2
On consid`
ere le tableau de donn´
ees, not´
eX, qui est d´
efini par :
X=
1 1 3
5 1 1
111
1 3 1
o`
u la i`
eme ligne d´
esigne l’individu xiet la j`
eme colonne d´
esigne la variable xj.
Chaque individu poss`
ede un poids ´
egal `
a 1/4. On consid`
ere les r´
esultats de l’ACP du tableau X
lorsque 4est muni de la m´
etrique identit´
e.
1. D´
eterminer le tableau centr´
eY.
solution
On a
Y=
1 0 2
3 0 0
12 0
1 2 2
2. Calculer Vet montrer que 1 et 3 sont les seules valeurs propres de V.
solution
On a
V=
3 0 0
0 2 1
0 1 2
Le polynˆ
ome caract´
eristique donne (3 λ)2(1 λ), donc 1 et 3 sont les seules valeurs
propres.
3. Montrer que u1=
1
0
0
est un vecteur propre de Vque l’on utilisera comme axe facto-
riel.
D´
eterminer les autres axes factoriels en choisissant des vecteurs dont la seconde coor-
donn´
ee est positive.
solution On a Vu1=3u1. Par calcul, on obtient u2=1
2
0
1
1
et u3=1
2
0
1
1
.
4. Calculer les trois composantes principales , not´
ee ψ1,ψ2et ψ3en fonction des variables
initiales y1,y2et y3.
solution
ψ1=Yu1=y1,ψ2=y2+y3
2et ψ3=y2y3
2.
5. Repr´
esenter les quatres individus dans le plan factoriel constitu´
e des deux premiers axes.
solution
1
2
3
4
6. Calculer la contribution relative de chaque individu `
a l’inertie du premier axe.
solution CT R1(y1)=1/41
3=1/12, CT R1(y2)=1/49
3=3/4, CT R1(y3)=1/12 et
CT R1(y4)=1/12.
7. Repr´
esenter les 3 variables dans le plan factoriel constitu´
e des deux premiers axes.
x
y
z
8. D´
eterminer la qualit´
e de la repr´
esentation de toutes les variables sur le plan factoriel 1-2
constitu´
e des deux premiers axes factoriels.
solution QLT (y1)=1, QLT (y2)=1/4 et QLT (y3)=1/4
1 / 5 100%

Part-AD-MMD-mars-2018-cor[2171]

Telechargé par Chadha Mhalla
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !