Régression linéaire et non linéaire

Téléchargement

Mark Asch

Septembre 2010

TADE - EDSS, UPJV 2010-11

1 Régression linéaire

1.1 La droite de moindres carrés

Le problème suivant est souvent rencontré dans tous les domaines où des

mathématiques sont appliquées. Pour des points discrets ti(souvent des instants

de temps), des observations bid’un phénomène quelconque sont faites, et les

résultats sont enrégistrés comme un ensemble de couples

D={(t1, b1),(t2, b2), ..., (tm, bm)}.

Sur la base des ces observations, le problème est de faire des estimations ou des

prévisions aux points (instants) ˆ

tdiﬀérents des ti.L’approche classique est alors

de trouver l’équation de la courbe

y=f(t)

qui est ajustée au mieux aux points dans Daﬁn de pouvoir ensuite estimer le

phénomène selon ˆy=f(ˆ

t).

Commençons par ajuster une ligne droite aux points dans D.Une fois que

nous avons compris ceci, il est relativement facile d’ajuster les données avec des

lignes courbes. La stratégie est de déterminer les coeﬃcients, αet β, de la droite

f(t) = α+βt

qui s’ajuste au mieux aux points (ti, bi)dans le sens où la somme des erreurs ver-

ticales (nous supposons ici que les instants sont connus sans erreurs) 1, 2, ...m

est minimale.

Si nous déﬁnissons les erruers comme

i=|f(ti)−bi|=|α+βti−bi|

alors le but est : trouver les valeurs de αet βqui minimisent

i=1

2

Selon la théorie d’optimisation, la valeur minimale se trouve par la résolution

des équations pour les points stationnaires,

∂E

∂α = 0 ,∂E

∂β = 0.

Nous calculons aisement,

i=1

(α+βti−bi) = 0

i=1

(α+βti−bi)ti= 0,

qui peut être réecrit en termes des deux inconnus,

i=1

1!α+ m

i=1

ti!β=

i=1

ti!α+ m

i=1

i!β=

i=1

tibi.

Ce système est équivalent à l’équation matricielle,

ATAx =ATb, (1)

avec

A=





1t1

1t2

1tm







, b =











et x=α

β.

Le système (1) est le système d’équations normales associé au système Ax =b.

Le produit,

ATA=1 1 · · · 1

t1t2· · · tm





1t1

1t2

1tm







=mPm

i=1 ti

i=1 tiPm

i=1 t2

i.

Vu que les tisont supposés distincts, le système admet une solution unique

donnée par

x=ATA−1ATb

et l’erreur totale par m

i=1

2

i= (Ax −b)T(Ax −b).

Nous résumons dans un théorème.

Pour A∈Rm×net b∈Rm,soit =(x) = Ax −b. Le problème général de

moindres carrés est de trouver le vecteur xqui minimise la quantité

i=1

2

i=T= (Ax −b)T(Ax −b).

Tout vecteur qui fournit une valeur minimale s’appele une solution de moindres

carrés. L’ensemble de toutes les solutions de moindres carrés est précisément

l’ensemble de solutions du système des équations normales, ATAx =ATb. Il

existe une solution de moindres carrés unique, donnée par x=ATA−1ATb,

si et seulement si le rank(A) = n. Si Ax =best consistente, alors la solution de

Ax =best la même que celle de moindres carrés.

1.2 La courbe de moindres carrés

Le problème est ici de trouver un polynôme de degré donné,

p(t) = α0+α1t+α2t2+· · · +αn−1tn−1

qui se rapproche autant que possible, dans le sens des moindres carrés, à un

ensemble de mesures

D={(t1, b1),(t2, b2), ..., (tm, bm)},

où les tisont distincts et n≤m. Le but, de nouveau, est de minimiser la somme

de carrés, m

i=1

2

i=1

(p(ti)−bi)2= (Ax −b)T(Ax −b).,

où

A=





1t1t2

1· · · tn−1

1t2t2

2· · · tn−1

.· · · .

1tmt2

m· · · tn−1







, b =











et x=





α0

α1

αn−1







Le polynome de moindres carrés est unique parce que Am×nest une matrice de

Vandermonde avec n≤m, et donc rank(A) = n.

1.3 Résolution numérique des équations normales

– instabilités d’une résolution directe par élimination de Gauss et même par

factorisation de Cholesky

– QR (Householder) et SVD factorisations pour la résolution des équations

normales

– Matlab anti-slash opérateur

– SVD plus robuste que Householder, mais beaucoup plus cher

La solution de norme minimale à

Ax =b

est donnée par

x=A+b,

où la pseudoinverse de la matrice Ade dimension m×n, avec m > n, est déﬁnie

par

A+=ATA−1AT.

La factorisation SVD de Aest

A=UΣVT

où Uest une matrice orthogonale m×m,Vest une matrice orthogonale n×n

et Σest une matrice diagonale de dimension m×navec

σij =(0 pour i6=j,

σipour i=j

et σisont les valeurs singulières de A. Finalement le pseudoinverse est aussi

donnée par

A+=VΣ+UT.

La factorisation QR de Aest

A=QR

0

où Qest une matrice orthogonale de dimension m×m, et Rest une matrice

triangulaire supérieure de dimension n×n. Finalement le pseudoinverse est aussi

donnée par

A+=R−1QT

où Q1est la partition m×nde Qtelle que

A=QR

0= [Q1Q2]R

0=Q1R.

2 Régression non linéaire

2.1 La méthode de Gauss-Newton

Dans les problèmes de moindres carrés non linéaires, la fonction à minimiser

prend en général la forme

g(x) = 1

i=1

gi(x)2.

Pour appliquer la méthode de Newton à la minimisation de g(x),on doit calculer

le Hessien de g, qui dans ce cas précis prend une forme particulière. D’une part,

la gradient de gest

∇g(x) =

i=1

∇gi(x)gi(x)

et le Hessien de gest donné par

∇2g(x) =

i=1

∇gi(x)∇gi(x)T+

i=1

gi(x)∇2gi(x).

Si l’on se place près de l’optimum, où on supposera que les gi(x)sont petits, le

deuxième terme peut alors être négligé. La matrice obtenue

H(x) =

i=1

∇gi(x)∇gi(x)T

est semi-déﬁnie positive et la plupart du temps, avec mn, elle est déﬁnie

positive. La méthode obtenue de la méthode de Newton en ramplacant ∇2g(x)

par H(x)est la méthode de Gauss-Newton :











x0donn´e,

Hk=Pm

i=1 ∇gi(xk)∇gi(xk)T,

xk+1 =xk−H−1

k∇g(xk).

Pour l’ajustement de données (ti, yi), soit la fonction résiduelle

ri(x) = yi−f(t, xi), i = 1, ..., m

où xest un vecteur de paramètres inconnus, fest une fonction non linéaire

connue. Nous voulons minimiser

φ(x) = 1

2rT(x)r(x).

Son gradient est

∇φ(x) = JT(x)r(x)

1 / 8 100%

Documents connexes

pour les classes élémentaires

quadrilatere 04

TD6

SEMAINE DU 1er AU 2 SEPTEMBRE

4 Regression linéaire et moindres carrés

Devoir maison - Collège Henry Dunant d`Aumale

Évaluation Diagnostique Mathématiques Secondaire

format PDF

Liste des livres FRANCAISx

Activité 5 en cycle 3

II. Les Matrices

D t-1

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d'utilisation

Régression linéaire et non linéaire

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Régression linéaire et non linéaire

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib