Part-AD-MMD-mars-2018-cor[2171]

Telechargé par Chadha Mhalla

Téléchargement

ANALYSE DES DONNEES (Correction Partiel)

Master M1 MMD - MA, 19 mars 2018

Calculatrice autoris´

ee, documents autoris´

es : 2 feuilles recto-verso.

Barˆeme approximatif : 10 points pour chacun des deux exercices.

Exercice 1

On consid`

ere un nuage N, constitu´

e de nindividus (xi)1≤i≤n, chaque individu a un poids

pi>0. On a pvariables d’o`

u un tableau Xde format n×p, on note Yle tableau centr´

e et rle

rang de Y.

Les r´

esultats de l’ACP de N, l’espace p´

etant muni de la m´

etrique M=Ipet nde la

m´

etrique Dp, sont not´

es comme suit :

- le α`

eme vecteur axial factoriel (pour le nuage des individus) est not´

euα,

- la α`

eme valeur propre est not´

ee λα,

- la α`

eme composante principale du nuage des individus est not´

ee ψα,

- pour tout λα,0, vα=ψα

√λα,

avec α∈ {1,...,p}.

On note 1nle vecteur de ndont toutes les composantes sont ´

egales `

a 1.

1. D´

ecomposition de Y

(a) Montrer que

α=1

uαu0

α=Ip.

Indication : on pourra calculer, pour tout 1 ≤β≤p, (

α=1

uαu0

α)uβ, puis conclure.

solution

Puisque la famille (uα)1α≤pest une famille orthonormale de p, on a u0

αuβ=0 si

α,βet u0

αuβ=1 si α=β. On en d´

eduit que

(

α=1

uαu0

α)uβ=

α=1

uαu0

αuβ,

=uβ.

De plus comme la famille (uα)1α≤pest une base, on en conclut que

α=1

uαu0

α=Ip.

(b) En d´

eduire que

α=1

pλαvαu0

α.

solution

Puisque Yest de rang r, les rpremi`

eres valeurs propres sont non nulles, on peut donc

d´

eﬁnir les vecteurs vαpour tout 1 ≤α≤r. Le calcul donne

α=1

pλαvαu0

α=

α=1

ψαu0

α,

α=1

Yuαu0

α,

α=1

Yuαu0

α,car Yuα=0 si α > r

=Y.

eciproquement, en remplac¸ant rpar un entier naturel q≤r, on consid`

ere un tableau

Td´

eﬁni par

α=1

√aαwαt0

α,

— les r´

eels aαforment une suite d´

ecroissante : a1≥a2≥ ··· ≥ aq>0.

— la famille (tα)1≤α≤qest une famille orthonormale de p.

— la famille (wα)1≤α≤qest une famille Dp-orthonormale de vect(1n)⊥.

On eﬀectue l’ ACP du tableau T, l’espace p´

etant muni de la m´

etrique M=Ipet

nde la m´

etrique Dp.

i. Calculer T0Dp1n. En d´

eduire que le tableau Test centr´

solution On commence par montrer que le tableau Test centr´

e, en eﬀet

T0Dp1n=

α=1

√aαtαw0

αDp1n=0,

car la famille (wα)1≤α≤qest une famille orthonormale de vect(1n)⊥.

On en d´

eduit que le produit scalaire de tj, 1 ≤j≤p, avec 1nest nul pour la

m´

etrique Dpsoit

i=1

pitj

i=0

ce qui correspond `

a la moyenne de tj. Ainsi toutes les variables sont centr´

ees.

ii. Montrer que les r´

eels aαsont les valeurs propres non nulles, que pour tout 1 ≤

α≤q,tαest un axe factoriel associ´

a la valeur propre aαet que la composante

principale associ´

ee `

atαest √aαwα.

solution

La matrice de variance est alors

V=T0DpT,

α=1

√aαtαw0

αDp

β=1

√aβwβt0

α=1

aαtαDpt0

α.

On a pour 1 ≤α≤q

Vtα=aαtα

On compl`

ete la famille (tα)1≤α≤qen une base orthonormale de p(tα)1≤α≤p, on a

pour tout r+1≤α≤p

Vtα=0

On en d´

eduit que les r´

eels aαsont les valeurs propres non nulles, que pour tout

1≤α≤q,tαest un axe factoriel associ´

a la valeur propre aα.

Enﬁn

ψα=T tα=√aαwα.

2. Approximation de Ypar une matrice de rang inf´

erieur `

arSoit qun entier inf´

erieur

ar, on consid`

ere le tableau Y∗avec les qpremiers termes de la somme

Y∗=

α=1

pλαvαu0

α(1).

(a) D´

eterminer le noyau de Y∗, ker Y∗, puis en d´

eduire le rang de Y∗.

solution

Soit u∈ker Y∗, alors

Y∗u=0,

soit q

α=1

pλαvαu0

αu=0.

ou encore q

α=1

pλα<uα,u>vα=0.

comme la famille (vα)αest libre, et que les qpremi`

eres valeurs propres sont non

nulles, on en d´

eduit que

u∈vect(u1,··· ,uq)⊥.

R´

eciproquement tout vecteur de vect(u1,··· ,uq)⊥est dans ker Y∗donc

ker Y∗=vect(u1,··· ,uq)⊥.

On en d´

eduit que le rang de Y∗est p−(p−q)=q.

(b) La matrice Ycomporte n×ptermes, combien de termes sont ils n´

ecessaires pour

construire la matrice Y∗`

a partir de l’´

equation (1). solution La matrice Y∗n´

ecessite

q(n+p+1) termes au lieu des np termes de Y.

3. Qualit´

e de l’approximation

(a) L’espace p´

etant muni de la m´

etrique M=Ipet nde la m´

etrique Dp, calculer

l’inertie totale du nuage associ´

ee au tableau Y∗not´

ee I∗

Ten fonction des valeurs

propres (λα)1≤α≤q.

solution

On a

I∗

T=T r((Y∗)0Y∗),

=T r(

α=1

λαuαu0

α),

α=1

λαT r(u0

αuα),car T r(AB)=T r(BA),

α=1

λα.

(b) On d´

eﬁnit la qualit´

e de l’approximation par

τq=I∗

Calculer τqen fonction des valeurs propres (λα)1≤α≤p. Que repr´

esente τqpour l’ACP

du tableau Y?

solution

On a

τq=Pq

α=1λα

Il s’agit du taux d’inertie expliqu´

e par l’espace g´

en´

er´

e par les qpremiers axes vecto-

riels.

Exercice 2

On consid`

ere le tableau de donn´

ees, not´

eX, qui est d´

eﬁni par :







1 1 −3

5 1 −1

1−1−1

1 3 1







u la i`

eme ligne d´

esigne l’individu xiet la j`

eme colonne d´

esigne la variable xj.

Chaque individu poss`

ede un poids ´

egal `

a 1/4. On consid`

ere les r´

esultats de l’ACP du tableau X

lorsque 4est muni de la m´

etrique identit´

1. D´

eterminer le tableau centr´

eY.

solution

On a







−1 0 −2

3 0 0

−1−2 0

−1 2 2







2. Calculer Vet montrer que 1 et 3 sont les seules valeurs propres de V.

solution

On a

V=





3 0 0

0 2 1

0 1 2







Le polynˆ

ome caract´

eristique donne (3 −λ)2(1 −λ), donc 1 et 3 sont les seules valeurs

propres.

3. Montrer que u1=











est un vecteur propre de Vque l’on utilisera comme axe facto-

riel.

D´

eterminer les autres axes factoriels en choisissant des vecteurs dont la seconde coor-

donn´

ee est positive.

solution On a Vu1=3u1. Par calcul, on obtient u2=1

√2













et u3=1

√2







−1







4. Calculer les trois composantes principales , not´

ee ψ1,ψ2et ψ3en fonction des variables

initiales y1,y2et y3.

solution

ψ1=Yu1=y1,ψ2=y2+y3

√2et ψ3=y2−y3

√2.

5. Repr´

esenter les quatres individus dans le plan factoriel constitu´

e des deux premiers axes.

solution

6. Calculer la contribution relative de chaque individu `

a l’inertie du premier axe.

solution CT R1(y1)=1/41

3=1/12, CT R1(y2)=1/49

3=3/4, CT R1(y3)=1/12 et

CT R1(y4)=1/12.

7. Repr´

esenter les 3 variables dans le plan factoriel constitu´

e des deux premiers axes.

8. D´

eterminer la qualit´

e de la repr´

esentation de toutes les variables sur le plan factoriel 1-2

constitu´

e des deux premiers axes factoriels.

solution QLT (y1)=1, QLT (y2)=1/4 et QLT (y3)=1/4

1 / 5 100%

Documents connexes

Correction BTS 2003 groupement B

Vocabulario básico del idioma Francés.

Cours3

FRANCÉS • En las páginas 6 y 7 del libro del alumno hay un

logique-mathematique-serie-d-exercices-4

francés - Gobierno de Canarias

Tema 2. El nacimiento de Europa

Why We should Use the Gridshell structures -spanish-converted

Equations différentielles

EXERCICES D`APPLICATION A. Dans le texte suivant

una mirada interdisciplinaria del desorrollo

Chapitre2

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d''utilisation

Part-AD-MMD-mars-2018-cor[2171]

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Part-AD-MMD-mars-2018-cor[2171]

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib