Exemple sur données avec modèle théorique connu et régresseurs corrélés..................................................... 293
3.3. Conditions d'utilisation de la régression, les diagnostics........................................................... 295
3.3.1. Modèle Inadapté..................................................................................................................................... 296
3.3.2. L’influence de certaines données, les données atypiques -Outliers-....................................................... 296
3.3.3. Corrélation et colinéarité entre les régresseurs ....................................................................................... 297
4. VALIDATION D’UNE REGRESSION .......................................................................................................... 298
4.1. Introduction................................................................................................................................. 298
4.1.1. Modèle et notations................................................................................................................................. 298
4.1.2. Problèmes à étudier................................................................................................................................. 299
4.2. Vérification des suppositions de base sur les erreurs ................................................................. 299
4.2.1. Espérance nulle....................................................................................................................................... 299
4.2.2. Indépendance.......................................................................................................................................... 299
Cas particulier où les observations sont apparentées (cas des chroniques) :...................................................... 300
4.2.3. Egalité des variances (homoscédasticité)................................................................................................ 301
4.2.4. Normalité des erreurs.............................................................................................................................. 303
4.2.5. Exemple.................................................................................................................................................. 303
Modèle .............................................................................................................................................................. 303
Dessin des résidus contre les 4 régresseurs (avec SAS/INSIGHT) ................................................................... 304
Test d’homoscédasticité et tracé du QQ-PLOT avec PROC REG. ................................................................... 306
4.3. Influence d'observations.............................................................................................................. 307
4.3.1. Hat matrice et leverages.......................................................................................................................... 307
4.3.2. Résidus studentisés internes.................................................................................................................... 309
4.3.3. Résidus studentisés externes................................................................................................................... 309
4.3.4. Mesure globale de l'influence sur le vecteur des coefficients: Distance de COOK................................ 309
4.3.5. Influence sur chacun des coefficients : DFBETAS................................................................................. 310
4.3.6. Précision des estimateurs : COVRATIO ................................................................................................ 310
4.3.7. Influence sur la valeur ajustée: DFFITS ................................................................................................. 310
4.3.8. Coefficient global PRESS....................................................................................................................... 311
4.3.9. Comment obtenir les mesures d’influence dans SAS ............................................................................. 311
Dans PROC REG.............................................................................................................................................. 311
Dans SAS/INSIGHT......................................................................................................................................... 312
4.3.10. Tableau récapitulatif.......................................................................................................................... 312
4.3.11. Exemple............................................................................................................................................. 314
4.4. Colinéarité des régresseurs......................................................................................................... 318
4.4.1. Méthodes basées sur l'étude de la matrice X'X....................................................................................... 319
Etude de la matrice de corrélation des régresseurs............................................................................................ 320
4.4.2. Variance Inflation Factor........................................................................................................................ 320
4.4.3. Condition index et variance proportion .................................................................................................. 321
Les indices de colinéarité.................................................................................................................................. 322
4.4.4. Remèdes en cas de multi-colinéarité....................................................................................................... 323
4.4.5. Exemple.................................................................................................................................................. 324
Regression RIDGE............................................................................................................................................ 325
4.5. Choix des régresseurs ................................................................................................................. 326
4.5.1. Utilisation des sommes de carrés............................................................................................................ 326
Rappel sur les somme de carrés apportés par un régresseur.............................................................................. 327
Tests des apports à SSModèle d’une variable ....................................................................................................... 327
Exemple d’élimination progressive................................................................................................................... 328
4.5.2. Différentes méthodes basées sur les sommes de carrés .......................................................................... 330
Méthode FORWARD (ascendante)................................................................................................................... 330
Méthode BACKWARD (descendante) ............................................................................................................. 331
Méthode STEPWISE (progressive)................................................................................................................... 331
Exemples de sélection STEPWISE................................................................................................................... 332
4.5.3. Amélioration de R² ................................................................................................................................. 334
Maximum R 2 Improvement (MAXR)............................................................................................................... 334
Minimum R 2 Improvement (MINR)................................................................................................................. 335
4.5.4. Autres méthodes basées sur R² : RSQUARE et ADJRSQ...................................................................... 335
4.5.5. Coefficient CP de Mallows..................................................................................................................... 335
Sélection suivant le coefficient CP.................................................................................................................... 336
Utilisation du coefficient CP dans une sélection de régresseurs........................................................................ 336
4.5.6. Critères AIC et BIC................................................................................................................................ 336
4.5.7. Exemple de sélection RSQUARE........................................................................................................... 337
CONCLUSION.................................................................................................................................................. 339
ANNEXES..................................................................................................................................................... 341
ANNEXE 1......................................................................................................................................................... 342
© Revue MODULAD, 2006 - 222- Numéro 35