Maths 4: Probabilité et Statistiques (2010/2011) Zendagui Dr Djawad ZENDAGUI Maths 4 : Probabilités et Statistiques Maître de conférences Département de Génie Civil - Faculté des Sciences de l’IngénieurUniversité Aboubekr Belkaid Tlemcen BP 230 (13000) Tel/Fax : 043 28 56 85 Email : [email protected] Sciences et Technologie 2ème année Semestriel UEM3 Méthodologie Dr Djawad ZENDAGUI 45 heures 1h30 /semaine Cours 1h30 /semaine TD 4 Intitulé du domaine Année Annuel ou semestriel Unité d’enseignement Chargé du module Volume horaire global Nombre de crédits Docteur d’Etat en Génie Civil Certificate of Graduate Studies in Engineering and Construction Management Magister en Génie Civil (2*EMD+CC)/3 Notation EMD= Epreuve de moyenne durée CC= Contrôle continu=N1+N2+N3+N4+N5 •N1, N2 et N3: Notes de 03 interrogations écrites de 10min max sur 04 points chacun •N4: Note de présence sur 04 points •N5: Note d’assiduité sur 04 points Ingénieur d'Etat en Travaux Publics Ecole Nationale Polytechnique d’Alger (ENP) Université Missouri Rolla (UMR) Juillet 2006 Juin 2003 Ecole Nationale Polytechnique d’Alger (ENP) Ecole Nationale des Travaux Publics d’Alger (ENTP) Juillet 1996 Juin 1992 Algérie USA Algérie Algérie 1 Objectifs du cours 2 Partie A Introduction générale et organisation du cours Partie B Traitement statistique de l’information Le cours a pour but d’initier les étudiants aux principes de base de la probabilité et statistique. Chapitre1 Chapitre2 à Chapitre 5 Partie C Traitement probabiliste de l’information l information Chapitre6 à Chapitre 9 Support pédagogique Il est mis à la disposition des étudiants un support pédagogique sur papier du cours et des Travaux Dirigés (TD). Plateforme Elearn de l’université (elearn.univ-tlemcen.dz). 4 3 Maths 4: Probabilité et Statistiques (2008/2009) Zendagui Chapitre 1: Introduction générale et organisation du cours L’incertain est-il notre quotidien???? Chapitre 1 Introduction g générale et organisation g du cours Ce qui est sûr, c’est que rien n’est sûr 5 6 1 Chapitre 1: Introduction générale et organisation du cours Chapitre 1: Probabilité et Statistiques : Introduction générale et organisation du cours La conception d’un système donné nécessite trois étapes : Outils au service de l’engineering 1. La compréhension du système : quelle est sa fonction Place du cours dans votre futur métier 2 La modélisation du système : quel est le modèle à 2. développer pour décrire ce système avec l’identification de l’input et l’output de ce modèle - Analyse des données - Prédictions - Simulations (processus stochastiques) - Décisions (probabilités d’occurrence et risque) -… 3. Le recours aux données : l’utilisation de données nécessaires pour l’utilisation du modèle. Ces données sont l’input du modèle. 7 Chapitre 1: Introduction générale et organisation du cours 8 Chapitre 1: Introduction générale et organisation du cours Etape 2 Considérons un exemple très simple…… Essayons maintenant de voir comment modéliser ce ressort. L’input du modèle est: •La force agissante, dans notre cas F •Le ou les caractéristiques q du ressort, dans notre cas K •L’output du modèle est par exemple la déformation du ressort, dans notre cas X. Une relation toute simple a été mise en place (modèle mathématique). Etape 1 Nul besoin de montrer le fonctionnement d’un ressort dans un système mécanique (suspension de voiture,…) Chapitre 1: F = K .X X= 9 Introduction générale et organisation du cours Chapitre 1: F K 10 Introduction générale et organisation du cours Pourquoi ? Etape 3 Donc en se basant sur ce modèle mathématique, il est possible de connaître la déformation du ressort connaissant F et K 1. Le premier problème qui se pose est tout d’abord: Est ce que le modèle mis en place est "exact" ? En fait fait, il est possible de dire que la connaissance de l’output (Déformation du ressort) est acquise. 2. Le deuxième problème auquel on est confronté est la validité de l’information de l’Input. En d’autres termes peut-on dire avec certitude dire que les valeurs de F et K sont exactes et connues Est-ce vrai ? NON 11 12 2 Chapitre 1: Introduction générale et organisation du cours Chapitre 1: Introduction générale et organisation du cours Un autre exemple mais celui là est dramatique 13 Un petit exemple Chapitre 1: Introduction générale et organisation du cours 14 Chapitre 1: La statistique est un ensemble de méthodes permettant: Introduction générale et organisation du cours Les outils de la statistique et de la probabilité permettent de répondre à la question suivante: 9de recueillir des données “brutes”; 9de présenter, résumer ces données; 9de tirer des conclusions sur la population étudiée (sa structure, sa composition), d’aider à la prise de décision; en présence de données dépendant du temps, de faire de la prévision. Comment déterminer la valeur de l’Output si l’Input et/ou le modèle mathématique du phénomène étudié ne sont pas connus 15 Maths 4: Probabilité et Statistiques (2008/2009) Zendagui 16 Maths 4: Probabilité et Statistiques (2008/2009) Zendagui Partie B Traitement statistique de l’information Fin du Chapitre 1 Chapitre 2 Introduction g générale et organisation g du cours Collecte des données 17 18 3 Chapitre 2: Collecte des données Chapitre 2: Collecte des données •Population ou unité statistique et/ou échantillon •Individu •Caractère •Modalitéss -Population: Employés d’une usine -Individu: Un employé de cette usine -Caractère: Salaire -Modalités: 10000DA, 20000DA, 25000DA -Population: Ressorts -Individu: Un ressort parmi ces ressort -Caractère: Rigidité K -Modalités: K ∈ [10,20] N / m 19 Chapitre 2: Collecte des données Chapitre 2: Caractère On souhaite connaitre l’état des maisons exprimée par des nombres (ex: une taille) Exprimée par une description naturelle du langage (ex: une couleur) Collecte des données Exemple: Quantitatif Qualitatif 20 Choix entre les trois types de caractère Réel Discret 21 Chapitre 2: Collecte des données 22 Chapitre 2: Collecte des données -Population: Maisons (100) -Population: Maisons (100) -Individu: Une maison parmi ces 100 maisons -Individu: Une maison parmi ces 100 maisons -Caractère: L’état de la maison -Caractère: Nombre de pièces -Modalités: Petite, moyenne, grande -Modalités: 1, 2, 3, 4, 5 Caractère qualitatif Caractère quantitatif discret 23 24 4 Chapitre 2: Collecte des données Chapitre 2: -Population: Maisons (100) -Individu: Une maison parmi ces 100 maisons -Caractère: Surface (notée S) -Modalités: S∈[60, 200] m² Collecte des données Une compagnie achète 10 000 ampoules électriques d’un fabricant qui affirme que ses ampoules fonctionnent durant au moins 1 000 heures (1 mois et 11 jours, sans arrêt). Cette compagnie vérifie 15 ampoules et, suite à ces résultats doit décider si elle garde ou non les 10 000 ampoules. g p Identifier la population, l’individu, le caractère et les modalités Caractère quantitatif continu 25 Chapitre 2: Collecte des données 26 Chapitre 2: Une compagnie achète 10 000 ampoules électriques d’un fabricant qui affirme que ses ampoules fonctionnent durant au moins 1 000 heures (1 mois et 11 jours, sans arrêt). Cette compagnie vérifie 15 ampoules et, suite à ces résultats doit décider si elle garde ou non les 10 000 ampoules. Population p : l’ensemble des 10 000 ampoules p achetées. Échantillon : les 15 ampoules vérifiées. Individu : une ampoule parmi les 15 Caractère : durée de fonctionnement de l’ampoule Modalités : Durée en heures Variable statistique (VS) continue Chapitre 2: Population l’ensemble des 10 000 ampoules achetées. les 15 ampoules vérifiées. vérifiées Échantillon : Individu : une ampoule parmi les 15 Caractère : l’état de l’ampoule la durée de fonctionnement de l’ampoule Modalités : Bon ou mauvais Durée en heures l’ensemble des 10 000 ampoules achetées. Échantillon : les 15 ampoules vérifiées. Individu : une ampoule parmi les 15 C Caractère è : l’ét t de l’état d l’l’ampoule l Modalités : Bon ou mauvais 27 28 Chapitre 2: Un même individu peut il avoir plusieurs caractères???? Oui : : Caractère qualitatif Collecte des données Population Collecte des données Collecte des données Par rapport à un caractère un individu peut il avoir plusieurs modalités???? Non 29 30 5 Chapitre 2: Collecte des données Chapitre 2: Collecte des données Les notes des étudiants •Classification des données 8,75 6,00 3,75 11,25 11,50 7,00 11,75 8,75 16,25 12,00 10,50 15,25 12,50 4,00 16,00 7,50 9,00 11,00 5,50 9,00 9,25 0,00 8,75 10,75 15,25 11,50 10,75 5,25 11,50 9,25 10,50 11,00 4,75 13,25 11,50 12,00 9 00 9,50 9,00 9 50 13 13,25 25 15,25 15 25 8,00 8 00 12,25 12 25 14,75 15,50 10,50 10,25 13,50 9,50 6,50 1,25 14,75 16,50 11,75 5,75 6,50 2,00 14,00 13,50 11,00 10,75 6,50 7,00 8,75 7,75 16,75 11,50 •Visualisation graphique •Quantification à l'aide de paramètres statistiques 11,75 12,50 13,50 6,50 9,75 12,00 10 75 10,75 5,00 4,50 9,50 8,50 10,50 11,00 8,00 7,00 9,75 12,00 7 25 7,25 5,50 7,50 0,00 10,25 5,00 6,75 7,50 9,50 7,75 8,50 13,00 10,75 12,75 12,00 7,00 9,50 14,75 6,00 15,25 9,00 4,25 7,00 9 50 7,50 9,50 7 50 10,25 10 25 9,50 5,50 5,75 16,25 6,50 17,75 15,50 10,75 4,50 12,75 10,00 2,75 31 Chapitre 2: Collecte des données Chapitre 2: Les notes des étudiants 8,75 6,00 3,75 11,25 11,50 7,00 11,75 8,75 16,25 12,00 10,50 15,25 12,50 4,00 16,00 7,50 9,00 11,00 5,50 9,00 9,25 0,00 8,75 10,75 15,25 11,50 10,75 5,25 11,50 9,25 10,50 11,00 4,75 13,25 11,50 12,00 9 00 9,50 9,00 9 50 13 13,25 25 15,25 15 25 8,00 8 00 12,25 12 25 14,75 15,50 10,50 10,25 13,50 9,50 6,50 1,25 14,75 16,50 11,75 5,75 6,50 2,00 14,00 13,50 11,00 10,75 6,50 7,00 8,75 7,75 16,75 11,50 Population Individu Caractère Modalités Chapitre 2: : : : : 11,75 12,50 13,50 6,50 9,75 12,00 10 75 10,75 5,00 4,50 9,50 8,50 10,50 11,00 8,00 7,00 9,75 12,00 7 25 7,25 5,50 7,50 0,00 10,25 5,00 6,75 7,50 9,50 7,75 8,50 13,00 10,75 12,75 12,00 7,00 9,50 14,75 6,00 15,25 9,00 4,25 7,00 9 50 7,50 9,50 7 50 10,25 10 25 9,50 5,50 5,75 16,25 6,50 17,75 15,50 10,75 4,50 12,75 10,00 2,75 l’ensemble des étudiants (121) un étudiant parmi les 121. la note de l’examen les valeurs de la note [0,20] 32 Collecte des données Soit P une population formée de n individus (xi, i=1,..n). Soit C un caractère ayant k modalités c1, c2,…,ck . Ce caractère peut être qualitative quantitative (discret ou qualitative, continu) Remarquez que n≠k Pourquoi???? 33 Collecte des données 34 Chapitre 2: Collecte des données Le résultat obtenu est la série statistique La collecte de l’information relative au caractère C auprès de la population P consiste i t à observer b pour chaque h individu de P la modalité qui lui correspond. 35 L’individu n°1 identifié par x1 présente une modalité parmi les k modalités (avec par exemple k=10). Les autres individus vont avoir les modalités suivantes: x1 = c3 x2 = c10 x3 = c3 . . . xn = c8 36 6 Chapitre 2: Collecte des données Chapitre 2: Le traitement de cette information élémentaire consiste à dénombrer pour chaque modalité cj, le nombre d’individus de la population P nj qui présentent cette modalité. Collecte des données Notion de fréquence Le nombre nj est dit effectif ou fréquence absolue de la modalité ci. Il est clair que : j =k n = ∑ nj La di L distribution ib i statistique i i est d donc fformée é par les couples (c , n ) j j Le nombre fj est dit fréquence de la modalité cj. j =k j = 1,2,..., k 37 Chapitre 2: Collecte des données Quantitatif Exprimée par une description naturelle du langage (ex: une couleur) j = n ∑f j j =1 n j =1 38 Collecte des données Jours du mois de Janvier Population Climat Caractère Ensoleillé, pluvieux, orageux Modalité exprimée par des nombres (ex: une taille) n=31. k=3 modalités c1=Ensoleillé c2=Pluvieux c3=Orageux Réel Discret k modalités c1, c2,…,ck Chapitre 2: f Chapitre 2: Caractère ou variable statistique Qualitatif j =1 Remarquez que n≠k 39 Collecte des données Chapitre 2: 41 Série statistique Tableau statistique 40 Collecte des données 42 7 Chapitre 2: Collecte des données Chapitre 2: Les 10 séismes recensés durant une année au niveau d’une région Population Intensité Caractère Intensité I à XII Modalité Collecte des données Série statistique n=10. k=12 modalités c1=1 c2=2 c12=12 43 Chapitre 2: Collecte des données 44 Chapitre 2: Collecte des données Les 10 séismes recensés durant une année au niveau d’une région Population Magnitude de Richter Caractère Valeur de la Magnitude Modalité L valeurs Les l de d la l magnitude it d sontt réels é l n=10. k=???? Comment construire le tableau statistique??? Tableau statistique Chapitre 2: 45 Collecte des données 46 Chapitre 2: Collecte des données Série statistique Du moment que le caractère est quantitatif continu alors ll’idée idée consiste à établir des classes et ce pour mettre en place le tableau statistique 47 48 8 Chapitre 2: Collecte des données Chapitre 2: Collecte des données Est-ce qu’il y a un seul tableau statistique ? NON 49 Chapitre 2: Collecte des données 50 Chapitre 2: Collecte des données Donc •Pour un pas de 1 on a 7 classes •Pour un pas de 1.5 on a 5 classes •Pour un pas de 3 on a 3 classes Questions : •Est-ce que le choix du pas a une importance dans le traitement des données ? •Quel pas choisir ? Cette question peut être posée autrement •Quel est le nombre de classes que l’on doit choisir 51 Chapitre 2: Collecte des données 52 Chapitre 2: Collecte des données Soit k le nombre de classes k = 2.54 n 3 k (Sturge) k (Yule)-k (Sturge) 2 10 0 1 0 0 -1 0 53 Nbre classe (Yule)-Nb bre classe (Sturge) YULE k = 1+ 3.3 log10 (n ) k (Yule) Nombre de e classes STURGE 4 20 400 800 Nombre d'individus 1200 54 9 Chapitre 2: Collecte des données Maths 4: Probabilité et Statistiques (2008/2009) Zendagui k = 1 + 3.3 log10 (10 ) = 4.3 Fin du Chapitre 2 k =5 Collecte des données 55 Maths 4: Probabilité et Statistiques (2008/2009) Zendagui 56 Chapitre 3: Distribution statistique à un caractère Chapitre 3 Distribution statistique à un caractère •Classification des données 3.1 Description graphique •Visualisation graphique 3.2 Description numérique 3.2.1 Caractéristique de tendance centrale •Quantification à l'aide de paramètres statistiques 3.2.2 Caractéristique de dispersion 3.3 Caractéristiques de formes 57 Chapitre 3: Distribution statistique à un caractère 3.1 Description graphique 3.1.1 Variable quantitative continue 58 Chapitre 3: Distribution statistique à un caractère Histogramme Longueur (m) 10,00 9,00 8,00 La série statistique 7,00 6,00 5,00 4,00 3,00 2,00 1,00 0,00 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Poutre Exploitation difficile 59 60 10 Chapitre 3: Distribution statistique à un caractère Chapitre 3: Distribution statistique à un caractère Histogramme Histogramme 12 10,00 9,00 10 8 Lo ongueur (m) 7,00 6,00 5,00 , 4,00 6 4 3,00 2 0 1,00 1 11 21 31 41 51 61 71 81 91 101 111 121 131 141 151 161 171 181 191 201 211 221 231 241 251 261 271 281 291 301 311 321 331 341 351 361 371 381 391 401 411 421 431 441 451 461 471 481 491 501 511 521 531 541 551 561 571 581 591 2,00 Poutre 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 0,00 Avec un nombre d’individu qui avoisine les 600 individus, l’exploitation Poutre L’Exploitation devient plus difficile si le nombre d’individu augmente Chapitre 3: devient pratiquement impossible 61 Dans le présent cas de 15 à 62 62 Distribution statistique à un caractère Chapitre 3: k (Yule)-k (Sturge) 2 10 1 0 0 Distribution statistique à un caractère 7 6 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 3 k (Sturge) Nombre e de classes k (Yule) Nbre classe (Yule)-Nb bre classe (Sturge) 4 20 Nombre de e classes Longu ueur (m) 8,00 Nombre d'individu -1 0 400 800 Nombre d'individus 1200 63 Chapitre 3: Distribution statistique à un caractère Établissement du tableau (ou distribution) statistique 64 Chapitre 3: Distribution statistique à un caractère n = 15 k = 1 + 3.3 log10 (15) = 4.88 k =5 Pas = P = Pas Vmax = 8.9 m Vmax − Vmin k 8.9 − 1.5 = 1.48 m 5 Pas = 1.50 m Vmin = 1.50 m 65 66 11 Chapitre 3: Distribution statistique à un caractère Chapitre 3: Distribution statistique à un caractère 0.4 0.4 Fréquence 0.3 0.2 0.2 0.2 0.133 0.1 0.07 . 0.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 X (m) 6.0 6.5 7.0 7.5 8.0 8.5 9.0 67 Chapitre 3: Distribution statistique à un caractère 68 Chapitre 3: Distribution statistique à un caractère 69 Chapitre 3: Distribution statistique à un caractère 70 Chapitre 3: 71 9.5 Distribution statistique à un caractère 72 12 Chapitre 3: Distribution statistique à un caractère Chapitre 3: Distribution statistique à un caractère Fré équence Symétrique Modalité 73 Chapitre 3: Distribution statistique à un caractère 74 Chapitre 3: Asymétrique Distribution statistique à un caractère Fré équence Fré équence Tendance à gauche Modalité Modalité 75 Chapitre 3: Distribution statistique à un caractère 76 Chapitre 3: Fré équence Fré équence Tendance à droite Modalité Distribution statistique à un caractère Tendance unimodale Modalité 77 78 13 Distribution statistique à un caractère Chapitre 3: Aplatie Fré équence Fré équence Chapitre 3: Modalité Distribution statistique à un caractère Uniforme Modalité 79 Chapitre 3: Distribution statistique à un caractère 80 Chapitre 3: Quel est le nombre d’individus ayant une valeur (modalité) inférieure à une certaine valeur (par exemple 6) Distribution statistique à un caractère Il suffit pour cela de sommer le nombre de séismes dont la magnitude est inférieure à 6. Ce nombre divisé p par le nombre d’individus de la population s’appelle Fréquence cumulée. Fonction cumulative 81 Chapitre 3: Distribution statistique à un caractère 82 Chapitre 3: Pour chaque valeur, il existe une fréquence cumulée. Distribution statistique à un caractère Le tracé des couples (valeur,fréquence cumulée) donne ce qu’on appelle la Fonction cumulative. 83 84 14 Chapitre 3: Distribution statistique à un caractère Chapitre 3: Distribution statistique à un caractère Question : Déterminer le nombre de séismes dont la magnitude est inférieure à 4.5. Déterminer le nombre de séismes dont la magnitude est inférieure à 6.0. 8 sur 10 soit 0.80 ou 80% 5 sur 10 soit 0.50 ou 50% 85 Chapitre 3: Distribution statistique à un caractère 86 Chapitre 3: Distribution statistique à un caractère Question : Déterminer le nombre de séismes dont la magnitude est inférieure à 5.0. 7 sur 10 soit 0.70 ou 70% Soit 0.60 ou 60% 7 sur 10 soit 0.70 ou 70% 87 Chapitre 3: Distribution statistique à un caractère 3.1 Description graphique 3.1.2 Variable quantitative discrète 88 Chapitre 3: Distribution statistique à un caractère La distribution statistique La série statistique 89 90 15 Chapitre 3: Intensité (Modalité) Effectif Fréquence de la modalité Fréquence cumulée 1 1 0.1 0.1 2 2 0.2 0.3 3 0 0 0.3 4 1 0.1 0.4 5 2 02 0.2 06 0.6 6 2 0.2 0.8 7 1 0.1 0.9 8 1 0.1 1 9 0 0 1 10 0 0 1 11 0 0 1 12 0 0 1 10 1 1 0 6 7 8 9 10 11 12 Représentation par bâtonnet 91 Chapitre 3: 1 0.6 0.50 0.4 04 0.4 0.30 0.3 0.3 0.1 0.0 Intensité 93 Chapitre 3: Distribution statistique à un caractère 3.1 Description graphique 3.1.3 Variable qualitative 1 Fonction cumulative 0.70 0.10 1 0.8 0.6 0.2 1 0.9 0.90 0.8 1 Ce nombre divisé par le nombre d’individus de la population s’appelle Fréquence cumulée. 1 1.0 3 Le nombre de séismes dont l’intensité est inférieure à 5. Distribution statistique à un caractère 2 Distribution statistique à un caractère Fréquen nce cumulée Chapitre 3: 92 12 5 11 4 Intensité du séisme (Modalité) 10 3 9 2 7 1 6 0 5 Effe ectif 2 Distribution statistique à un caractère 8 Distribution statistique à un caractère 4 Chapitre 3: 94 Chapitre 3: Distribution statistique à un caractère Ensoleillé 9 29% Pluvieux 15 48% Orageux 7 23% Représentation par diagramme Représentation Diagrammes circulaires 95 96 16 Chapitre 2: Collecte des données Chapitre 3: Distribution statistique à un caractère Les notes des étudiants 40 35 30 25 Est-ce la description graphique est suffisante ? 20 15 10 5 0 1.25 3.75 6.25 8.75 11.25 13.75 16.25 18.75 97 Chapitre 3: Distribution statistique à un caractère 98 Chapitre 3: Distribution statistique à un caractère 3.2 Description numérique 3.2.1 Caractéristique de tendance centrale Exemple: X=F/K Les modèles mathématiques nécessitent l’introduction d’une valeur et non l’appréciation sur la variation des modalités F: Force (mesurée en Newton) et K: Raideur: Connue=10 N/cm F: Force (mesurée en Newton) 10 10.3 22.1 23 26 15.2 12.3 18 18.3 14.5 99 Chapitre 3: Distribution statistique à un caractère 100 Chapitre 3: Distribution statistique à un caractère k = 1 + 3.3 log10 (10 ) = 4.33 n = 10 Force Individus (Modalité) N 1 10 2 10.3 3 22.1 4 23 5 26 6 15.2 7 12.3 8 18 9 18.3 10 14.5 k =5 Vmin = 10 N Vmax = 26 N 26 − 10 = 3 .2 N 5 Pas = 4 N Pas = 101 102 17 Chapitre 3: Distribution statistique à un caractère Chapitre 3: Distribution statistique à un caractère 40 35 Fréque ence (%) 30 25 20 15 10 5 0 10 12 14 16 18 20 22 24 26 28 30 Force (N) 103 Chapitre 3: Distribution statistique à un caractère 104 Chapitre 3: Distribution statistique à un caractère 10 valeurs de F sont observées. Que recherche le concepteur Question: •Réduire un ensemble de données •Conserver une partie de l'information Quelle valeur de F doit-on utiliser dans l’équation l équation X=F/K Résumer l'ensemble des valeurs par une seule valeur Parfois c’est difficile à accepter La plus petite ? La plus grande? La plus significative 105 Chapitre 3: Distribution statistique à un caractère 106 Chapitre 3: Distribution statistique à un caractère Caractéristique de tendance centrale (paramètres de position) Choisir •Série statistique q •Tableau statistique 1. Mode 2. Médiane Caractéristique de tendance centrale 3. Moyenne (s) Elle décrit l’ordre de grandeur des valeurs et aussi la valeur centrale autour de laquelle se regroupent les observations. 4. Quantile 107 108 18 Chapitre 3: Distribution statistique à un caractère Chapitre 3: Distribution statistique à un caractère Variable qualitative Mode Le mode, noté Mo, est la modalité qui admet la plus grande fréquence : Il est parfaitement défini pour une variable qualitative ou une variable quantitative discrète. Pour une variable quantitative continue nous parlons de classe modale : c'est la classe dont la densité de fréquence est maximum. Mo= Pluvieux 109 Chapitre 3: Distribution statistique à un caractère 110 Chapitre 3: Variable quantitative discrète Distribution statistique à un caractère Variable quantitative continue 40.00 0.4 35.00 Fréquence Frréquence (%) 0.3 0.3 30.00 25.00 20.00 15.00 0.2 0.2 0.2 0.15 0.15 01 0.1 10.00 0.0 5.00 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0 8.5 9.0 9.5 Magnitude de Richter 0.00 0 1 2 3 4 5 Nombre de pièces dans une maison 6 7 Milieu de la classe dont la fréquence est la plus grande Mo=6.75 Mo=3 pièces 111 Chapitre 3: Distribution statistique à un caractère 112 Chapitre 3: Variable quantitative continue 0.4 0.4 0.3 0.2 0.2 0.3 0.3 Fréquence 0.3 Fréquence Distribution statistique à un caractère Variable quantitative continue 0.2 0.15 0.15 01 0.1 0.2 0.2 0.2 0.15 0.15 01 0.1 0.0 0.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0 8.5 9.0 9.5 1.5 Magnitude de Richter 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0 8.5 9.0 9.5 Magnitude de Richter Milieu de la classe dont la fréquence est la plus grande Mo=6.75 Milieu de la classe dont la fréquence est la plus grande Mo=6.75 113 114 19 Chapitre 3: Distribution statistique à un caractère Chapitre 3: Variable quantitative continue Distribution statistique à un caractère 40 35 0.4 Fréquence Fréquence (%) 30 0.3 0.3 0.25 0.25 25 20 15 10 0.2 5 0 0.1 01 0.1 0.1 10 12 14 16 18 20 F Force (N) 22 24 26 28 40 30 35 Fréquence (%) 30 0.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0 8.5 9.0 9.5 Magnitude de Richter 25 20 15 10 Mo=6.75 Mode 5 0 Le même résultat a été obtenu pourtant les deux distributions ne sont pas identiques 10 12 14 16 18 20 22 24 26 28 Chapitre 3: 30 Force (N) 115 Distribution statistique à un caractère 116 Chapitre 3: Distribution statistique à un caractère 0.4 0.3 Fréquence 0.3 0.2 0.2 0.2 0.15 0.15 01 0.1 0.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0 8.5 9.0 9.5 Magnitude de Richter 117 Chapitre 3: Distribution statistique à un caractère 118 Chapitre 3: Distribution statistique à un caractère Mode 40 0.4 35 0.3 0.25 30 Fréquence (%) Fréquence 0.3 0.25 0.2 0.1 01 0.1 0.1 25 20 15 10 5 0.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0 8.5 9.0 0 9.5 Magnitude de Richter 10 12 14 16 18 20 Force (N) 22 24 26 28 30 F=12 N 119 X=12/10=1.2cm 120 20 Chapitre 3: Distribution statistique à un caractère Chapitre 3: Médiane Distribution statistique à un caractère Quantitative discret La médiane Me est telle que l'effectif des observations dont les modalités sont inférieures à Me est égal à l'effectif des observations dont les modalités sont supérieures à Me. Utilise la notion de fonction cumulative 121 Chapitre 3: Distribution statistique à un caractère 122 Chapitre 3: Distribution statistique à un caractère Fréquence (%) Quantitative continue 100 95 90 85 80 75 70 65 60 55 50 45 40 35 30 25 20 15 10 5 0 100 90 70 50 30 0 10 12 14 16 18 20 Force (N) 22 24 26 28 30 F=18 N X=18/10=1.8cm 123 Chapitre 3: Distribution statistique à un caractère Chapitre 3: Distribution statistique à un caractère Fréquence (%) Médiane Avantage: •simple à calculer •Prend en compte p une p partie des valeurs Inconvénient: ne tient pas compte de la distribution des modalités supérieures à la médiane 100 95 90 85 80 75 70 65 60 55 50 45 40 35 30 25 20 15 10 5 0 100 90 70 50 30 0 10 125 124 12 14 16 18 20 Force (N) 22 24 26 28 30 126 21 Distribution statistique à un caractère Fréquence (%) Chapitre 3: 100 95 90 85 80 75 70 65 60 55 50 45 40 35 30 25 20 15 10 5 0 Chapitre 3: Distribution statistique à un caractère Valeur de tendance centrale 100 Médiane=18 N Mode=12 Mode 12 Nm 70 60 50 30 0 10 12 14 16 18 20 Force (N) 22 24 26 28 30 127 Chapitre 3: Distribution statistique à un caractère 128 Chapitre 3: Distribution statistique à un caractère Quantile Quantile Le quantile α est la valeur Pα qui laisse α% des observations endessous et (1−α)% des observations obse at o s au au-dessus dessus d d’elle. e e α% Les deux “quartiles” les plus importants sont P25 (qui laisse 25 % des observations en-dessous) et P75. Pα 129 Chapitre 3: Distribution statistique à un caractère 130 Chapitre 3: Moyenne (s) Distribution statistique à un caractère Moyenne arithmétique dite par abréviation MOYENNE Individus La moyenne ne se définit que pour une variable statistique p q quantitative. q 131 Force (Modalité) N 1 10 2 10.3 3 22.1 4 23 5 26 6 15.2 7 12.3 8 18 9 18.3 10 14.5 10 ∑ Fi 10 ⎛ 1 ⎞ = ∑ ⎜ Fi ⎟ 10 i =1 ⎝ 10 ⎠ = 16.97 N F= i =1 132 22 Chapitre 3: Distribution statistique à un caractère Limites des classes (N) j =1 j=2 j =3 j=4 j =5 F fj Chapitre 3: Distribution statistique à un caractère f j Fj Limite inf Limite sup j Centre de classe (N) Effectif Fréquence (%) 10 14 12 3 30 3.6 14 18 16 2 20 3.2 18 22 20 2 20 4 22 26 24 2 20 4.8 26 30 28 1 10 2.8 Série statistique: Moyenne arithmétique=16.97 N q Tableau statistique: Moyenne y arithmétique=18.40 q N DIFFERENCE ????????????? 5 F = ∑ f j Fj j =1 = (3.6 + 3.2 + 4 + 4.8 + 2.8) = 18.4 N 133 Chapitre 3: Distribution statistique à un caractère 134 Chapitre 3: Distribution statistique à un caractère Valeur de tendance centrale Existe-t-il une seule moyenne [ ⎛ R FR = ⎜⎜ ∑ f j (F j ) ⎝ j =1 j =k F = 18.4 N F = 16.97 N Chapitre 3: [ [ ] 136 Chapitre 3: R=1----Æ Moyenne arithmétique Distribution statistique à un caractère R=0----Æ Moyenne géométrique 1 1 ⎞ ⎟ ⎟ ⎠ ⎞ ⎟ ⎟ ⎠ ⎠ 135 Distribution statistique à un caractère ⎛ j =k 1 F1 = ⎜⎜ ∑ f j (F j ) ⎝ j =1 ⎛ j=k F1 = ⎜⎜ ∑ f j F j ⎝ j =1 ]⎞⎟⎟ 1 R [ ⎛ 0 F0 = ⎜⎜ ∑ f j (F j ) ⎝ j =1 j =k ] ]⎞⎟⎟ 1 0 ⎠ j =k log(F0 ) = ∑ f j log(F j ) 137 j =1 138 23 Chapitre 3: Distribution statistique à un caractère Chapitre 3: R=-1----Æ Moyenne harmonique [ ⎛ j =k −1 F−1 = ⎜⎜ ∑ f j (F j ) ⎝ j =1 F−1 = ] ⎞ ⎟ ⎟ ⎠ R=2----Æ Moyenne quadratique 1 −1 ⎡ 1⎤ ⎢fj ⎥ ∑ j =1 ⎣ ⎢ F j ⎦⎥ j =k 18.40 14.06 ∑ [ f (F ) ] 2 j j =1 Chapitre 3: Distribution statistique à un caractère Démontrer que j =k ∑ [ f (F 20.26 j =1 18.00 j =k j j ] −F) =0 [ j =1 j =k [ 2 = ∑ f j (F j − a ) Chapitre 3: R=-2 R=-1 Moyenne R=0 R=1 R=2 R=3 Mode Médiane ] φ (a ) = ∑ f j (F j − F ) + (F − a ) 15 02 15.02 12.00 R=-3 j 140 Etude comparative entres les moyennes et la moyenne réelle obtenue directement du tableau brut 17.29 ⎠ 139 Quelle moyenne choisir???? 16.97 ]⎞⎟⎟ 1 2 j =k F2 = Distribution statistique à un caractère 19.39 [ ⎛ 2 F2 = ⎜⎜ ∑ f j (F j ) ⎝ j =1 j =k 1 Chapitre 3: 16.13 Distribution statistique à un caractère j =1 141 Distribution statistique à un caractère Chapitre 3: 2 2 ] 142 Distribution statistique à un caractère On souhaite donner un prix: Meilleur classe Est-ce la réduction d’un ensemble de valeurs à un seule valeur est une étape suffisante Critère de classement: Moyenne •Réduire un ensemble de données Pour faire simple, on suppose que deux classes sont candidates pour ce prix et que chacune des deux classes est composée de 10 élèves •Conserver une partie de l'information 143 144 24 Chapitre 3: Distribution statistique à un caractère Chapitre 3: Question Est-ce que les caractéristiques de tendance centrale sont suffisantes pour identifier une valeur de F à utiliser 12 13 08 07 11 09 10,5 9,5 10 10 Tableau n°1 CLASSE –A- 17 13 03 07 19 18 01 Distribution statistique à un caractère 02 16 04 Tableau n°2 n 2 CLASSE –BLes deux tableaux présentent la même moyenne arithmétique=16.97 N MOYENNE=10 Qui mérite de recevoir le prix? ??? 145 Chapitre 3: Distribution statistique à un caractère 146 Chapitre 3: Distribution statistique à un caractère 3.2 Description numérique Question: Est-ce que les deux tableaux sont identiques 3.2.2 Caractéristique de dispersion Caractéristique de dispersion Choisir Trouver une valeur qui reflète •Série statistique au mieux q •Tableau statistique La dispersion des valeurs de notre échantillon 1. Etendue 2. L’intervalle inter-quartiles Valeur de dispersion 3. Ecart moyen 4. Ecart type 147 Chapitre 3: Distribution statistique à un caractère 148 Chapitre 3: Distribution statistique à un caractère Caractéristiques de dispersion Tableau n°1 Mesurer la différence qui existe entre la valeur max et min ETENDUE Tableau n°1 35 30 25 20 ETENDUE=20.35-11.2=9.15 N 15 Tableau n°2 10 5 Tableau 2 Tableau 1 Moyenne ETENDUE=26-10=16.0 N Tableau n°2 149 150 25 Chapitre 3: Distribution statistique à un caractère Chapitre 3: Caractéristiques de dispersion Distribution statistique à un caractère Tableau n°1 Moyenne= 16.97 N et ETENDUE=20.35-11.2=9.15 N ETENDUE (Tableau 1)= 9.15 N ETENDUE (Tableau 2)= 16.0 N Tableau n°2 ETENDUE (Tableau 2)>ETENDUE (Tableau 1) Moyenne= 16.97 N et ETENDUE=26-10=16.0 N C’est logique mais attention cette valeur peut vous fausser l’interprétation car elle se base sur les valeurs extrêmes Tableau n°3 Moyenne= 16.97 N et ETENDUE=26-10=16.0 N 151 Chapitre 3: Distribution statistique à un caractère Tableau n°1 152 Chapitre 3: Moyenne= 16.97 N et ETENDUE=20.35-11.2=9.15 N Distribution statistique à un caractère Tableau n°2 35 35 30 30 25 25 20 20 15 15 10 10 5 5 Moyenne= 16.97 N et ETENDUE=26-10=16.0 N 153 Chapitre 3: Distribution statistique à un caractère Tableau n°3 154 Chapitre 3: Distribution statistique à un caractère Moyenne= 16.97 N et ETENDUE=26-10=16.0 N 35 Tableau 1 35 30 30 Tableau 2 Tableau 3 25 25 20 20 15 10 15 5 10 5 155 156 26 Chapitre 3: Distribution statistique à un caractère Chapitre 3: Caractéristiques de dispersion Mesurer la dispersion des valeurs par rapport à la moyenne Estimer la différence entre les valeurs observées Et 15 30 45 60 75 90 P75=80 0 P25=37.5 Fréquence e 1.00 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50 0.45 0.40 0.35 0.30 0.25 0.20 0.15 0.10 0.05 0.00 Caractéristiques de dispersion H = P75 − P25 L’intervalle inter-quartiles Distribution statistique à un caractère Chapitre 3: 105 120 135 150 la moyenne 157 Distribution statistique à un caractère Chapitre 3: 158 Distribution statistique à un caractère Valeur de dispersion Cette valeur DOIT être très petite 35 30 25 20 F = 16,97 1 2 3 4 5 6 7 8 9 V = (F1 − F ) + (F2 − F ) + ... + (F10 − F ) 10 15 5 V = (F1 + F2 + ... + F10 − 10 F ) F10=14,50 10 F1=10 F1 − F V = (10 F − 10 F ) = 0 F5 − F 159 Chapitre 3: Distribution statistique à un caractère 160 Chapitre 3: Distribution statistique à un caractère Valeur de dispersion Valeur de dispersion Cette valeur DOIT être très petite V = F1 − F + F2 − F + ... + F10 − F V = (F1 − F ) + (F2 − F ) + ... + (F10 − F ) = 0 Cette valeur permet d’estimer la différence Or cette valeur est en fait nulle et ne peut donc mesurer la dispersion La valeur absolue est une fonction mathématique difficilement dérivable Autre méthode 161 162 27 Chapitre 3: Distribution statistique à un caractère Chapitre 3: Distribution statistique à un caractère Valeur de dispersion Valeur de dispersion V = (F1 − F ) + (F2 − F ) + ... + (F10 − F ) 2 2 Mesurer la dispersion des valeurs par rapport à la moyenne 2 V = ∑ (Fi − F ) et R pair 10 Cette valeur est toujours positif et permet d’estimer la différence entre les valeurs observées et leur moyenne R i =1 163 Chapitre 3: 164 Distribution statistique à un caractère Série statistique Chapitre 3: Distribution statistique à un caractère Série statistique Tableau statistique Moyenne Variance j =k F = ∑ f j Fj Fi i =1 n F =∑ (σ F ) 2 j =1 Écart moyen = ∑[f j =k ⎡1 ⎤ EM F = ∑ ⎢ Fi − F ⎥ i =1 ⎣ n ⎦ 10 Tableau statistique EM F j =1 j ⎡ (Fi − F )2 ⎤ = ∑⎢ ⎥ i =1 ⎢ n ⎥⎦ ⎣ F −F ] (σ F )2 = ∑ [ f j (F j − F )2 ] j =k j =1 Ecart type σF j 165 Chapitre 3: 166 Distribution statistique à un caractère Série statistique Chapitre 3: Distribution statistique à un caractère Tableau statistique Exercice: Déterminer l’Ecart Moyen et l’Ecart type Différence d’ordre R Limites des classes (N) ⎛ i =n ⎡ 1 R⎤⎞ VR = ⎜⎜ ∑ ⎢ (Fi − F ) ⎥ ⎟⎟ ⎦⎠ ⎝ i =1 ⎣ n 1 R [ ⎛ j =k R VR = ⎜⎜ ∑ f j (F j − F ) ⎝ j =1 ] ⎞ ⎟ ⎟ ⎠ 167 1 R Limite inf Limite sup Centre de classe (N) Effectif Fréquence (%) 10 14 12 3 30 14 18 16 2 20 18 22 20 2 20 22 26 24 2 20 26 30 28 1 10 168 28 Chapitre 3: Distribution statistique à un caractère Chapitre 3: Distribution statistique à un caractère 169 Chapitre 3: Distribution statistique à un caractère 170 Chapitre 3: Distribution statistique à un caractère 171 Chapitre 3: Distribution statistique à un caractère 172 Chapitre 3: Distribution statistique à un caractère j =k V = ∑ f j F j − F = 4 .8 N j =1 j =k ∑ [ f (F j =1 j j ] −F) =0 Ecart Moyen= 4.8 N 173 174 29 Chapitre 3: Distribution statistique à un caractère Chapitre 3: Distribution statistique à un caractère 175 Chapitre 3: Distribution statistique à un caractère Chapitre 3: (σ ) j =k Distribution statistique à un caractère 3.3 Caractéristiques de formes Tableau n°1 2 176 1. Coefficient de variation = ∑ f j (F j − F ) = 6.28 N ² 2 2. Coefficient de symétrie 3. Coefficient d’aplatissement j =1 Tableau n°2 n 2 (σ ) 2 j =k Coefficient de variation (noté CV)=Ecart type / Moyenne = ∑ f j (F j − F ) = 29.44 N ² 2 j =1 177 Chapitre 3: Distribution statistique à un caractère 178 Chapitre 3: Distribution statistique à un caractère Coefficient de symétrie (Cœfficient of Skewness) 1 (Fi − F ) η =∑ (σ F )3 i =1 n 3 i =n j =k η = ∑ fj j =1 179 (F −F) 3 j (σ F )3 180 30 Chapitre 3: Distribution statistique à un caractère Chapitre 3: Distribution statistique à un caractère Coefficient d’aplatissement (Cœfficient of Kurtosis) généralement comparé à la valeur de 3 qui est celui de la distribution Coefficient de symétrie (Cœfficient of Skewness) 1 (Fi − F ) κ =∑ (σ F )4 i =1 n 4 i =n j =k κ = ∑ fj (F −F) 4 j (σ F )4 j =1 182 181 Chapitre 3: Distribution statistique à un caractère Chapitre 3: Coefficient d’aplatissement (Cœfficient of Kurtosis) généralement comparé à la valeur de 3 qui celle d’une distribution normale Distribution statistique à un caractère Exemple: κ − 3 = −0,5 < 0 183 Chapitre 3: Distribution statistique à un caractère 184 Chapitre 2: Collecte des données Les notes des étudiants Exemple: La distribution normale est symétrique 40 35 30 25 20 15 10 5 0 κ −3 = 2 > 0 1.25 185 3.75 6.25 8.75 11.25 13.75 16.25 18.75 186 31 Maths 4: Probabilité et Statistiques (2008/2009) Zendagui Maths 4: Probabilité et Statistiques (2008/2009) Zendagui Chapitre 4 Distribution statistique à deux caractères Fin du Chapitre 3 Distribution statistique à un caractère 4.1 Introduction 3.1 Description graphique 4.2 Description numérique 3.2 Description numérique 4.3 Principe de la méthode des moindres carrées "Least Square method » 3.2.1 Caractéristique de tendance centrale 4.4 Covariance 3.2.2 Caractéristique de dispersion 3.3 Caractéristiques de formes 187 Chapitre 4: Distribution statistique à deux caractères 188 Chapitre 4: Distribution statistique à deux caractères 4.1 Introduction Caractère ou variable statistique Un même individu peut il avoir plusieurs caractères???? Oui Quantitatif Qualitatif exprimée par des nombres (ex: une taille) Exprimée par une description naturelle du langage (ex: Individu Maison Caractère 1 Surface habitable (notée X) Caractère 2 Surface non habitable ((notée Y)) Surface non habitable: Le jardin et autres… Réel Discret une couleur) Ce qui est recherché c’est k modalités c1, c2,…,ck Chapitre 4: De possibles relations entre le caractère 1 et le caractère 2. 189 Distribution statistique à deux caractères Chapitre 4: 190 Distribution statistique à deux caractères 80 Maison X (m²) Y (m²) 200,1 75,3 2 121,3 41,2 3 160,7 40,2 4 112,3 13,2 65 60 55 Y (m²) 1 75 70 50 45 40 35 5 190 12 6 120,5 40 7 160 60 25 8 185 25 20 9 126,3 32,1 10 142,8 35,3 30 15 10 110 120 130 140 150 160 170 180 190 200 210 X (m²) 191 192 32 Chapitre 4: Distribution statistique à deux caractères 200.1 La distribution des valeurs (X et Y) 75 75.3 60 160 70 65 185 35.3 32.1 30 15 13.2 110 120 130 140 150 160 X (m²) 170 180 35.3 32.1 41.2 40 13.2 30 12 10 160 160.7 35 190 20 45 40 25 112.3 25 40.2 60 142.8 160.7 40.2 50 126.3 35 Y (m²) 41.2 41 2 40 40 142.8 1 120.5 121.3 126..3 45 25 120.5 121.3 60 55 50 75.3 12 55 112.3 60 Y (m²) Voilà ce que prévoit les codes de l’urbanisme (Y=0.30*X) 65 185 80 200.1 Distribution statistique à deux caractères 190 Chapitre 4: 190 200 110 210 120 130 140 150 160 X (m²) 170 180 190 200 210 193 Chapitre 4: Distribution statistique à deux caractères 194 Chapitre 4: Distribution statistique à deux caractères 4.2 Description numérique Tableau statistique Individu X Y 1 x1 y1 2 .. . x2 .. . y2 .. . e .. . n xe .. . xn ye .. . yn Classe Y (1) [CY1, CY2[ Classe X Y1 Yj YK (1) [CX1, CX2[ . . . X1 n11 n1j n1k (i) [CXi, CXi+1[ . . . Xi ni1 nij nik [CXm, CXm+1[ Xm nm1 nmj nmk (m) Il est possible de passer de la série statistique vers le tableau statistique n11: l’ensemble des individus ayant la modalité X1 de X et Y1 de Y i =m j =k n = ∑ ∑ nij Comment? i =1 j =1 195 Chapitre 4: Distribution statistique à deux caractères Chapitre 4: Classe Y (1) [CY1, CY2[ (k) (j) ... [CYj, CYj+1[ … [CYk, CYk+1[ Y1 Yj YK (1) [CX1, CX2[ . . . X1 f11 f1j f1k (i) [CXi, CXi+1[ . . . Xi fi1 fij fik [CXm, CXm+1[ Xm fm1 fmj fmk (m) e= n X=∑ e =1 f11: Fréquence des individus ayant la modalité x1 de X et y1 de Y f ij = σX = nij n 197 196 Distribution statistique à deux caractères Tableau statistique Classe X (k) (j) ... [CYj, CYj+1[ … [CYk, CYk+1[ xn n Individu X Y 1 x1 y1 2 .. . x2 .. . y2 .. . e .. . n xe ... xn ye ... yn e=n Y =∑ e =1 ( ) 2⎤ ⎡1 ∑ ⎢ xi − X ⎥ e =1 ⎣ n ⎦ e=n σY = ( yn n ) 2⎤ ⎡1 ∑ ⎢ yi − Y ⎥ e =1 ⎣ n ⎦ e= n 198 33 Chapitre 4: Distribution statistique à deux caractères Chapitre 4: Distribution statistique à deux caractères Fréquence marginale Y1 X1 Yj YK f11 … f1j f1k f1. fi1 fij fik fj. fm1 fmj fmk fm. f.1 f.j f.k . . . Xi .. . Xm Fréquence conditionnelle Répond à la question suivante: Quelle la fréquence des individus ayant la modalité x1 de X sachant que Y=y1 i =m f.1 = ∑ f i1 f.1: Fréquence des individus ayant la modalité y1 de Y i =1 199 Chapitre 4: Distribution statistique à deux caractères Y1 X1 f11 … Yj YK f1j f1k . . . Xi fi1 fij fik .. . Xm fm1 fmj fmk f.1 f.j f.k 200 Chapitre 4: Distribution statistique à deux caractères Y1 f1. X1 … f11 . . . fj. Xi fi1 .. . fm. Xm fm1 f.1 201 Chapitre 4: Distribution statistique à deux caractères 202 Chapitre 4: Distribution statistique à deux caractères •4.3 Principe de la méthode des moindres carrées "Least Square method » n11 f11 n = i=mn = i =m11 f.1 ∑ n ∑ ni1 i1 i =1 i =1 n 203 204 34 Distribution statistique à deux caractères 80 75 70 65 60 55 50 45 40 35 30 25 20 15 10 Chapitre 4: Y (m²) Y (m²) Chapitre 4: Distribution statistique à deux caractères 80 75 70 65 60 55 50 45 40 35 30 25 20 15 10 110 110 120 130 140 150 160 X (m²) 170 180 190 200 210 120 130 140 150 160 X (m²) 170 180 190 200 210 206 Y (m²) Chapitre 4: Distribution statistique à deux caractères Chapitre 4: Distribution statistique à deux caractères Problème étudié: Chercher une relation de corrélation entre deux variables statistiques X et Y. 80 75 70 65 60 55 50 45 40 35 30 25 20 15 10 Quelles sont nos données: On connaît l’ensemble des couples (xi,yi) i=1,..,n Comment faire: Utiliser la méthode des moindres carrés 110 120 130 140 150 160 X (m²) 170 180 190 200 210 207 Chapitre 4: Distribution statistique à deux caractères 208 Chapitre 4: Distribution statistique à deux caractères En considérant une régression linéaire: La méthode des moindre carrés vous permet d’écrire la relation: 80 75 70 65 60 Y (m²) 55 50 (xi , yˆi ) y=ax+b (xi , y i ) Et de ce fait vous permet de déterminer les coefficients a et b (la démonstration sera donnée au niveau du cours) 45 40 35 30 25 20 15 10 110 120 130 140 150 eri = yi − yˆi 160 X (m²) 170 180 190 200 210 Soit très petite 209 Une corrélation n’a de valeurs que s’il y’a détermination du coefficient de corrélation 210 35 Chapitre 4: Distribution statistique à deux caractères Maths 4: Probabilité et Statistiques (2008/2009) Zendagui •4.4 Covariance ( i=m j =k )( Cov ( X , Y ) = ∑ ∑ f ij xi − X y j − Y i =1 j =1 i =n ) Fin du Chapitre 4 Distribution statistique à deux caractères 4.1 Introduction 4.2 Description numérique ( )( 1 Cov ( X , Y ) = ∑ xi − X yi − Y i =1 n ) 4.3 Principe de la méthode des moindres carrées "Least Square method » 4.4 Covariance 211 Maths 4: Probabilité et Statistiques (2008/2009) Zendagui 212 Maths 4: Probabilité et Statistiques (2008/2009) Zendagui Partie C Traitement probabiliste de l’information Chapitre 6 Théorie de la probabilité Chapitre 5 Distribution statistique à plusieurs caractères 6.1 Espace de probabilité 6 2 Axiome de probabilité 6.2 6.3 Propriétés des évènements 6.4 Quelques notions supplémentaires 213 Chapitre 6: 6.1 Théorie de la probabilité Chapitre 6: Espace de probabilité On lance un dé , l’ensemble de tous les résultats possibles est identifié par Ω = {1, 2, 3, 4, 5, 6} Un résultat possible de ll’expérience expérience est noté ω. ω Ainsi, ω אΩ D’autres exemples: On lance une pièce: Durée de vie d’une pièce 214 Ω = {P,F} Ω = [0,+∞[ 215 Théorie de la probabilité Une expérience aléatoire se décrit mathématiquement par la donnée d’un espace Ω dont les points notés ω sont les résultats possibles de l’expérience, ainsi que d’une probabilité P sur Ω. Un événement A lié à l’expérience Ω est représenté par une partie de Ω noté A. Chaque événement possède une probabilité P[A] qui est un nombre compris entre 0 et 1. 216 36 Chapitre 6: Théorie de la probabilité Chapitre 6: 6.2 Par exemple, considérons le jeu de dé: Théorie de la probabilité Axiome de probabilité 0≤P[A] ≤1 Un événement A peut décrit comme suit: • Obtenir un nombre pair • Obtenir 4 1.Soit un évènement A alors A chaque évènement correspond une probabilité notée P[A] 3.Si A et B sont deux évènements mutuellement exclusive alors 2.P[Ω]=1= événement certain P[A]: Probabilité d’avoir l’évènement A (Ω, A, P) espace de probabilité P[AUB]=P[A]+P[B] 217 Chapitre 6: 6.3 Théorie de la probabilité 218 Chapitre 6: Propriétés des évènements Soit A et B deux évènements qui ne sont nécessairement mutuellement exclusive alors Théorie de la probabilité 6.4 Quelques notions supplémentaires -1- Probabilité conditionnelle : Probabilité d’avoir l’évènement A sachant que l’évènement B s’est produit Ne pas confondre entre évènements mutuellement exclusive et indépendants Voilà un petit exemple en statistique P[A∪B]=P[A]+P[B]-P[A∩B] Population: Individu : Caractères: Modalités : Maisons (20) Une maison parmi les 20 X (Surface habitable), Y (Surface non habitable) Valeurs de X et Y P[A / B ] = P[A ∩ B ] P[B ] 219 Chapitre 6: Théorie de la probabilité 220 Chapitre 6: -2- Théorie de la probabilité Théorème de la probabilité Totale Je l’appelle le théorème de la Vie Y1 Y2 Y3 X1 f11=0.05 f12=0.05 f13=0.3 f1. =0.4 X2 f21=0.3 f22=0.1 f23=0.2 f2. =0.6 f.1=0.35 f.2=0.15 f.3=0.5 Considérons Bi (i=1,…,n) évènements ME et CE alors: f11 0.05 = = 0.143 f.1 0.35 221 222 37 Chapitre 6: -3- Théorie de la probabilité Maths 4: Probabilité et Statistiques (2008/2009) Zendagui Théorème de Bayes Fin du Chapitre 6 P [B / Ai ]P [ Ai ] P [ Ai / B ] = ∑ P [B / Ak ]P [ Ak ] Théorie de la probabilité 6.1 Espace de probabilité 6 2 Axiome de probabilité 6.2 k 6.3 Propriétés des évènements 6.4 Quelques notions supplémentaires 223 Maths 4: Probabilité et Statistiques (2008/2009) Zendagui 224 Chapitre 7: 7.1 Chapitre 7 Variable aléatoire Définitions Une variable aléatoire est une fonction qui à chaque évènement élémentaire d’une expérience aléatoire associe un nombre réel ou entier. Variable aléatoire 7.1 Définitions 7.2 Variable aléatoire discrète Soit X une variable aléatoire et k un réel ou entier, l’évènement noté (X = k) est l’antécédent de k par la fonction 7.3 Variable aléatoire continue 7.4 Caractéristiques de tendance centrale 7.5 Caractéristiques de dispersion X : c’est l’ensemble de tous les événements élémentaires dont l’image par X est égale à k. 225 Chapitre 7: 7.2 Variable aléatoire 226 Chapitre 7: Variable aléatoire Variable aléatoire discrète Les évènement A et B sont k est un nombre entier •Mutuellement exclusive(ME) •Collectivement exhaustive (CE) Soit une épreuve qui ne comporte que deux résultats possibles, incompatibles. Exemples: •Arrivée d’un avion: •Pièce de monnaie: Pourquoi??? A l’heure ou non Pile ou face Car: Si l’évènement A se produit alors l’évènement B ne peut pas se produire et inversement ÆME A évènement décrit par: L’avion arrive à l’heure B évènement décrit par: L’avion n’arrive pas à l’heure prévue Car on ne peut avoir que les évènements A ou B. On ne peut avoir un autre évènement ÆCE 227 228 38 Chapitre 7: Variable aléatoire Chapitre 7: On note PX(x) la loi de probabilité de la variable aléatoire X. Cette dernière peut prendre deux valeurs: La probabilité de réalisation de l’événement A est p La probabilité de réalisation de l’événement B est q x=1 x 1 ou x x=0 0 Alors p+q=1 La fonction PX(x), dite Fonction de Probabilité de masse (FPM) dépend de x: Dans le cas d’une pièce de monnaie p=0.5 q=0.5 229 Chapitre 7: Variable aléatoire A évènement décrit par B évènement décrit par Variable aléatoire PX(x=1) écrite aussi PX(x) est la probabilité pour que l’évènement x=1 se réalise 230 Chapitre 7: Variable aléatoire Considérons une VA X qui peut prendre plusieurs valeurs xi, (i=1,…,n) x=1 x=0 PX(x1)+PX(x2)+…+PX(xn)=1 Du moment que les deux évènements A et B sont ME et CE alors PX(x1)+PX(x2)+…+P )+ +PX(xn)=1 n ∑ P (x ) = 1 P[A]+P[B]=1 PX(1)+PX(0)=1 i =1 X i 0 ≤ PX ( xi ) ≤ 1 ∀xi 231 Chapitre 7: Variable aléatoire 232 Chapitre 7: Variable aléatoire Fonction de répartition ou Cumulative Distribution Functions 233 234 39 Chapitre 7: Variable aléatoire Chapitre 7: Variable aléatoire Quelques exemples de loi de probabilité de VA discrète VA de BERNOULLI Une variable aléatoire qui prend comme valeur seulement 0 et 1 est appelé une variable indicatrice, ou une variable aléatoire de Bernoulli, ou un essai de Bernoulli Soit X une VA discrète de type Bernoulli ⎧ p PX ( x) = ⎨ ⎩q = 1 − p x =1 x=0 235 Chapitre 7: Variable aléatoire 236 Chapitre 7: Variable aléatoire Ce qui est recherché c’est la loi de probabilité de la VAD Y. Loi binomiale Soit X la VAD qui décrit l’arrivée ou non d’un avion à l’heure P ( y) Y Considérons uniquement 3 avions (donc 3 essais). X suit une loi de type Bernoulli car on a soit succès ou échec. On ss’intéresse intéresse maintenant non pas à un seul avion mais à plusieurs (m et m>1). Il est introduit une nouvelle VAD Y qui décrit le nombre d’avions qui arrivent à l’heure (succès). En fait c’est comme si une pièce de monnaie est jeté m fois. Si le résultat de l’essai est Pile c’est un succès et si le résultat de l’essai est Face c’est un échec 237 Chapitre 7: Variable aléatoire 0 ≤ PY ( yi ) ≤ 1 Les évènements Y=0, Y=1, Y=2, Y=3 sont des évènements ME et CE 238 Variable aléatoire PY ( y ) = Cny p y (1 − p ) ∑ P (y ) =1 i =1 0 succès donc tous les avions n’arrivent pas à l’heure 1 succès donc sur les trois avions un seul va arriver à l’heure 2 succès donc sur les trois avions deux vont arriver à l’heure 3 succès donc les trois avions vont arriver à l’heure Chapitre 7: 4 Y Quelles sont les possibilités. Y=0,, 1,, 2,, 3. n− y i Du moment qu’il y a indépendance entre les trois essais alors PY (0) = q.q.q = q 3 = (1 − p ) 3 y = 0,1,2,..., n Cny = n! y!(n − y )! PY (3) = p. p. p = p 3 PY (1) = ?? 239 240 40 Chapitre 7: 7.3 Variable aléatoire Variable aléatoire continue 0 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 10 11 11 12 Chapitre 7: Variable aléatoire k est un nombre réel Centre de classe Fréquence (%) 0,5 2 1,5 3 2,5 4 3,5 10 4,5 13 55 5,5 18 6,5 14 7,5 13 8,5 12 9,5 6 10,5 4 11,5 1 0 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 10 11 11 12 Centre de classe Fréquence (%) 0,5 2 1,5 3 2,5 4 3,5 10 4,5 13 55 5,5 18 6,5 14 7,5 13 8,5 12 9,5 6 10,5 4 11,5 1 0 2 2 4 4 6 6 8 8 10 10 12 Centre de classe Fréquence (%) 1 5 3 14 5 31 7 27 9 18 11 5 241 Chapitre 7: 0 2 2 4 4 6 6 8 8 10 10 12 Variable aléatoire 242 Chapitre 7: 0 2 2 4 4 6 6 8 8 10 10 12 Centre de classe Fréquence (%) 1 5 3 14 5 31 7 27 9 18 11 5 Variable aléatoire Centre de classe Fréquence (%) 1 5 3 14 5 31 7 27 9 18 11 5 0 4 4 8 8 12 Centre de classe Fréquence (%) 2 19 6 58 10 23 243 Chapitre 7: 0 4 4 8 8 12 Variable aléatoire 244 Chapitre 7: Variable aléatoire Centre de classe Fréquence (%) 2 19 6 58 10 23 245 246 41 Chapitre 7: Variable aléatoire Chapitre 7: Variable aléatoire 247 Chapitre 7: Variable aléatoire 248 Chapitre 7: Variable aléatoire Surface=2 X 2.5=5 249 Chapitre 7: Variable aléatoire 250 Chapitre 7: Variable aléatoire Fréquence des individus ayant des modalités comprises entre 0 et 4 Surface=4 X 4.75=19 251 252 42 Chapitre 7: Variable aléatoire Chapitre 7: Variable aléatoire Fréquence des individus ayant des modalités comprises entre 0 et 4 Surface=4 X 4.75=19 = 253 Chapitre 7: f X (x ) Variable aléatoire 254 Chapitre 7: Fonction de densité de probabilité de la VA X Variable aléatoire Conditions f X ( x )dx = P[ x ≤ X ≤ x + dx] Surface de la courbe f X (x ) entre x et x + dx 255 Chapitre 7: Variable aléatoire FX (x ) 256 Chapitre 7: Variable aléatoire 1 seul essai Fonction de distribution cumulative de la VA X Succès FX (− ∞ ) = 0 Echec Loi de Bernoulli FX (+ ∞ ) = 1 p ⎧ PX ( x) = ⎨ ⎩q = 1 − p 257 x =1 x=0 258 43 Chapitre 7: Variable aléatoire Chapitre 7: Variable aléatoire n essais Loi binomiale Succès Echec Succès p X ( x ) = Cnx p x (1 − p ) n− x Echec x = 0,1,2,..., n avecCnx = n! x!(n − x )! 259 Chapitre 7: Variable aléatoire 260 Chapitre 7: Variable aléatoire p X (x ) = (λt )x e − λt x = 0,1,2,..., ∞ x! 261 Chapitre 7: Variable aléatoire 262 Chapitre 7: Variable aléatoire La probabilité de ne pas avoir de séismes durant le laps de temps t est égale à PX (0) Donc le premier succès p X (x ) = (λt )x e − λt x = 0,1,2,..., ∞ x! 1 − FT (t ) = p X (0 ) = 263 (λt )0 e − λt 0! 264 44 Chapitre 7: Variable aléatoire Chapitre 7: Variable aléatoire e − λt = 1 − FT (t ) FT (t ) = 1 − e − λt f T (t ) = λe − λt 265 Chapitre 7: Variable aléatoire 266 266 Chapitre 7: Le nombre de météores dans un intervalle de 30 secondes est de 1.81. Supposez que l’apparition des météores est aléatoire et indépendante ( λt )0 e − λt −λt PX (0 ) = =e 0! Quelle est la probabilité de ne pas avoir de météores dans un intervalle d’une minute? PX Variable aléatoire PX (0 ) = e −3.62 ( λt )x e − λt (x ) = x = 0,1,2,..., ∞ x! 267 Chapitre 7: Variable aléatoire 268 Chapitre 7: Variable aléatoire Le nombre moyen de collisions se produisant en semaine pendant les mois d'été à une intersection particulière est de 2.00. Supposez que les conditions de la distribution de Poisson sont satisfaites. 1.2 1 a) Quelle est la probabilité de ne pas avoir de collisions en une semaine particulière ? b) Quelle est la probabilité qu'il y aura exactement une collision en semaine ? c) Quelle est la probabilité d’avoir exactement deux collisions en semaine ? d) Quelle est la probabilité de trouver pas plus de deux collisions en semaine ? x − λt 0.8 0.6 0.4 PX (x ) = 0.2 0 1 2 3 4 5 6 7 8 9 10 11 (λt ) e x! x = 0,1,2,..., ∞ λ = 2 / semaine 12 269 270 45 Chapitre 7: Variable aléatoire Chapitre 7: Quelle est la probabilité de ne pas avoir de collision en une semaine particulière ? ( λt )0 e − λt PX (0) = Variable aléatoire Quelle est la probabilité qu'il y aura exactement une collision en semaine ? PX (0 ) = e − λt PX 0! ( λt )1 e − λt (1) = PX (1) = e − λ λ 1! PX (0) = e −2*1 PX (1) = e −2*1 2 PX (0 ) = 0.135 PX (1) = 0.271 271 Chapitre 7: Variable aléatoire 272 Chapitre 7: Quelle est la probabilité qu'il y aura exactement deux collisions en semaine ? Variable aléatoire Quelle est la probabilité de trouver pas plus de deux collisions en semaine ? Soit F l’évènement décrit pas: Pas plus de deux collisions en semaine PX (2 ) = (λt )2 e −λt PX (2 ) = 2! −λ e λ 2 2 Ce qui est recherché c’est la probabilité de F Soit A l’évènement décrit pas: Soit B l’évènement décrit pas : Soit C l’évènement décrit pas: PX (2 ) = 0.271 0 collision en une semaine 1 collision en une semaine 2 collisions en une semaine Pas plus de deux collisions en semaine cela veut dire 0 ou 1 ou 2 collisions par semaine F = AUBUC P[F] =P[AUBUC] Les évènements A, B et C sont ME donc: P[F] =P[A]+P[B]+P[C] 273 Chapitre 7: Variable aléatoire 274 Chapitre 7: Variable aléatoire Quelle est la probabilité de trouver plus de deux collisions en semaine ? P[ F ] = PX (0 ) + PX (1) + PX (2 ) Soit F l’évènement décrit pas: Pas plus de deux collisions en semaine Soit FC l’évènement décrit pas: plus de deux collisions en semaine P[ F ] = 0.135 + 0.271 + 0.271 Les évènement F et FC sont complémentaires P[ F ] = 0.677 P[FC]=1-P[F]=1-0.677=0.323 275 276 46 Chapitre 7: Variable aléatoire Chapitre 7: Variable aléatoire 7.4 7.5 Quelle est la probabilité qu'il y aura exactement deux collisions en deux semaine ? Caractéristiques de tendance centrale Caractéristiques de dispersion VA discrète En statistique X ( λt )2 e − λt PX (2 ) = Variable statistique: Intensité d’un séisme t=2 2! PX (2 ) = 0.147 277 Chapitre 7: Variable aléatoire 278 Chapitre 7: Variable aléatoire X VAD Intensité d’un séisme PX ( x = 1) ≡ f1 12 X = ∑ fi X i X La moyenne est notée en statistique E[X ] Espérance mathématique de la VA D X i La moyenne est notée en probabilité 12 X = ∑ fi X i i σ X2 = ∑ f i (X i − X ) 12 E[X ] = 2 i =∞ ∑ P (x )x i = −∞ 279 X i i 280 i Chapitre 7: Variable aléatoire Chapitre 7: Variable aléatoire σ X2 = ∑ f i (X i − X ) 12 Loi de Bernoulli p ⎧ PX ( x) = ⎨ ⎩q = 1 − p La variance est notée en statistique x =1 σ La variance est notée en probabilité x=0 σ X2 = E [X ] = p E [X ] = 0.5 si p = q = 0.5 281 i 2 X X Variance de VA D E [X ] = ∑ PX (xi )xi = p *1 + q * 0 2 i =∞ ∑ P (x )(x − E[X ]) i = −∞ 2 X i i 282 47 Chapitre 7: Variable aléatoire Chapitre 7: Loi de Bernoulli x =1 x=0 p ⎧ PX ( x) = ⎨ ⎩q = 1 − p E [X ] = p Caractéristiques de tendance centrale Caractéristiques de dispersion VA continue 0.4 0.3 σ = ∑ PX ( xi )( xi − p ) = p(1 − p ) + q(0 − p ) 2 2 Fréquencee 0.3 2 2 X Variable aléatoire 7.4 7.5 σ X2 = p(1 − p )2 + (1 − p ) p 2 = (1 − p ) p(1 − p + p ) 0.2 0.2 0.2 0.30/1.5 0.15 0.20/1.5 0.1 0.15 0.20/1.5 0.15/1.5 0.15/1.5 = (1 − p ) p = qp 0.0 1.5 2.0 2.5 3.0 3.5 4.0 Chapitre 7: Variable aléatoire 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0 8.5 Magnitude de Richter 283 Chapitre 7: 9.0 9.5 284 Variable aléatoire 0.4 0.2 0.3 Frééquence Fréqu uence/1.5 0.3 0.130.2 0.2 0.13 0.2 01 0.1 0 10.15 0.1 0.15 0.1 0.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0 8.5 9.0 9.5 Magnitude de Richter 285 Chapitre 7: Variable aléatoire Chapitre 7: Moyenne arithmétique dite par abréviation MOYENNE Individus 10 2 10.3 3 22.1 4 23 5 26 6 15.2 7 12.3 8 18 9 18.3 10 14.5 10 ∑ Fi Variable aléatoire Limites des classes (N) Force (Modalité) N 1 286 ⎛1 ⎞ F = i =1 = ∑ ⎜ Fi ⎟ 10 i =1 ⎝ 10 ⎠ = 16.97 N 10 Limite sup Centr e de class e (N) Effectif Fréquence (%) 10 14 12 3 30 3.6 14 18 16 2 20 3.2 18 22 20 2 20 4 22 26 24 2 20 4.8 26 30 28 1 10 2.8 Limi te inf f k Fk 5 F = ∑ f k Fk k =1 = (3.6 + 3.2 + 4 + 4.8 + 2.8) 287 = 18.4 N 288 48 Chapitre 7: Variable aléatoire Chapitre 7: [ k F = ∑ f j Fj V = ∑ f k Fk − F j =1 E [F ] = ∫ ∞ −∞ Variable aléatoire ( f F ( f )df ) f E [F ] = ∫ ff F ( f )df ∞ ] ∞ EM X = ∫ x − E[ X ] f X ( x )dx −∞ E [X ] = ∫ xf X ( x )dx ∞ −∞ −∞ σ X2 = ∫ ∞ −∞ (x − E[ X ])2 f X (x )dx 289 Chapitre 7: Variable aléatoire 290 Chapitre 7: Variable aléatoire f T (t ) = λe − λt E [T ] = ∫ tfT (t )dt = σ T2 = ∫ +∞ 0 +∞ 1 0 λ (t − E[T ])2 fT (t )dt = Calculer l’espérance mathématique de la VA X E [X ] = ∫ xf X ( x )dx ∞ −∞ 1 λ2 291 Chapitre 7: Variable aléatoire 292 Chapitre 7: Variable aléatoire E [a ] = a E [aX ] = aE [X ] E[aX + b] = aE[X ] + b σ X2 = ∫ ∞ −∞ (x − E[ X ])2 f X (x )dx = E [( X − E[ X ])2 ] [ ] = E X 2 − (E [X ]) 2 293 294 49 Chapitre 7: Variable aléatoire Distribution normale ou gaussienne, N (m, σ ) X Chapitre 7: Variable aléatoire 295 Chapitre 7: Variable aléatoire [ 296 Chapitre 7: E[X ] = m Variable aléatoire ] E ( X − E [ X ]) = σ 2 2 U= [ N (m, σ ) X U= X −m N (0,1) U σ X −m σ E [U ] = 0 fU (u ) = ] E (U − E [U ]) = 1 2 1 (2π ) 12 ⎡ u2 ⎤ exp ⎢− 2 ⎥ ⎣ 2σ ⎦ −∞ < u < ∞ 297 Chapitre 7: Variable aléatoire 298 Maths 4: Probabilité et Statistiques (2008/2009) Fin du Chapitre 7 FU (α ) = 1 (2π )1 2 Zendagui Variable aléatoire α ⎡ u2 ⎤ ∫−∞exp⎢⎣− 2σ 2 ⎥⎦ du 7.1 Définitions 7.2 Variable aléatoire discrète 7.3 Variable aléatoire continue 7.4 Caractéristiques de tendance centrale FU (− α ) = 1 − FU (α ) 7.5 Caractéristiques de dispersion 299 300 50 Maths 4: Probabilité et Statistiques (2008/2009) Chapitre 8 8.1 8.2 Zendagui Chapitre 8: Vecteurs aléatoires Vecteurs aléatoires En engineering, il est souvent souhaitable de relier deux ou plusieurs ou variables aléatoires P Pression, i ttempératures. é t Vecteurs aléatoires discrets Vecteurs aléatoires continues 301 Chapitre 8: 8.1 Vecteurs aléatoires 302 Chapitre 8: Vecteurs aléatoires discrets 8.1 Vecteurs aléatoires Vecteurs aléatoires discrets JPMF: Joint Probability Mass Function FDPC: Fonction de distribution de probabilité conjointe Fonction de distribution marginale 303 Chapitre 8: Vecteurs aléatoires 304 Chapitre 8: 8.2 Vecteurs aléatoires Vecteurs aléatoires continues f X ( x )dx = P[ x ≤ X ≤ x + dx] Fonction de distribution cumulative conjointe f XY ( x, y )dxdy = P[( x ≤ X ≤ x + dx ) ∩ ( y ≤ Y ≤ y + dy )] fY ( y )dy = P[ y ≤ Y ≤ y + dy ] Indépendance f X ( x ) fY ( y )dxdy = P[(x ≤ X ≤ x + dx )]P[( y ≤ Y ≤ y + dy )] f XY ( x, y ) 305 (FDPC) 306 51 Chapitre 8: Vecteurs aléatoires Chapitre 8: Vecteurs aléatoires 307 Chapitre 8: Vecteurs aléatoires 308 Chapitre 8: Vecteurs aléatoires Deux personnes pensent se rencontrer entre 9h00 et 10h00. Chaque personne ne peut attendre plus de 10 minutes. C'est-àdire qu’au-delà de 10 minutes elle partira si la deuxième personne ne vient pas. On suppose les deux personnes peuvent arriver à n’importe quel moment entre 9h00 et 10h00 et que leurs temps d’arrivée ne sont pas connus. X décrite dé i par : le l nombre b de d minutes i é lé écoulé jusqu’à l’arrivée de la personne A Y décrite par : le nombre de minutes écoulé jusqu’à l’arrivée de la personne B 309 Chapitre 8: Vecteurs aléatoires ⎧ 1 ⎪ f X (x ) = ⎨ b − a ⎪⎩ 0 310 Chapitre 8: Vecteurs aléatoires a≤ x≤b elsewhere 311 312 52 Chapitre 8: Vecteurs aléatoires Chapitre 8: Vecteurs aléatoires Question : Il est recherché la probabilité pour que les deux personnes se rencontrent entre 9h00 et 10h00. 313 Chapitre 8: Vecteurs aléatoires 314 Chapitre 8: Vecteurs aléatoires Exemple: Fiabilité d’un système Probabilité que les deux personnes se rencontrent= P[ X −Y ≤ 10] Y: Résistance X: Action VA VA pr = P[Y ≤ X ] Probabilité de rupture 315 Chapitre 8: Vecteurs aléatoires 316 Chapitre 8: Vecteurs aléatoires Distribution conditionnelle Y≤X 317 318 53 Chapitre 8: Vecteurs aléatoires Chapitre 8: Vecteurs aléatoires 319 Chapitre 8: Vecteurs aléatoires 320 Chapitre 8: Vecteurs aléatoires n voitures qui arrivent au niveau d’une intersection. X VA : Nombre de voitures qui tournent vers l’Est Y VA : Nombre de voitures qui tournent vers l’Ouest NORD OUEST EST 321 Chapitre 8: Vecteurs aléatoires Probabilité[Voiture tourne vers l’Est]=p X Probabilité[Voiture tourne vers l’Ouest]=q Y 322 Chapitre 8: Vecteurs aléatoires Sur les n voitures, on sait que déjà y voitures ont pris la direction de l’Ouest (à gauche). Donc il reste uniquement (n-y) qui doivent soit tourner à gauche (Est) soit se diriger vers le Nord. Probabilité[Voiture tourne vers le Nord]=r=1-p-q Loi binomiale: Tournez vers l’Ouest ou non 323 324 54 Maths 4: Probabilité et Statistiques (2008/2009) Fin du Chapitre 8 8.1 8.2 Zendagui Maths 4: Probabilité et Statistiques Vecteurs aléatoires (2008/2009) Chapitre 9 Vecteurs aléatoires discrets Vecteurs aléatoires continues 9.1 92 9.2 9.3 9.4 Zendagui Transformation d’une Variable Aléatoire Objectifs Méth d générale Méthode é é l Application pour le cas d’une fonction linéaire Fonctions à deux Variables aléatoires 325 Chapitre 9: 9.1 Transformation d’une Variable 326 Chapitre 9: Transformation d’une Variable Objectifs H C Soit C le coût de construction d’un mur VA notée X VA notée Y Y = a + bX C1: coût des matériaux (DA) C2: coût de la Main d’œuvre (DA/Heure) f X (x ) C=C1+ C2*H H: Nombre d’heures de travail fY ( y ) C=10.000+100*100 Fonction de densité de probabilité de la VA X f X ( x )dx = P[ x ≤ X ≤ x + dx] Fonction de densité de probabilité de la VA X fY ( y )dy = P[ y ≤ Y ≤ y + dy ] C=20.000 DA 327 Chapitre 9: Transformation d’une Variable Si la loi de probabilité de la VA X est connue alors comment déterminer la loi de probabilité de Y f X (x ) Y = a + bX 328 Chapitre 9: 9.2 Transformation d’une Variable Méthode générale fY ( y ) Y = g(X ) 329 330 55 Chapitre 9: Transformation d’une Variable Chapitre 9: 9.3 Transformation d’une Variable Application pour le cas d’une fonction linéaire 331 Chapitre 9: Transformation d’une Variable 332 Chapitre 9: Transformation d’une Variable FX ( x ) = P[X ≤ x ] Y y y − a⎤ ⎡ ⎛ y−a⎞ FY ( y ) = P ⎢ X ≤ = F ⎜ ⎟ X b ⎥⎦ ⎣ ⎝ b ⎠ dF ( y ) fY ( y ) = Y dy 1 ⎛ y−a⎞ fY ( y ) = f X ⎜ ⎟ b ⎝ b ⎠ Y>yy Y≤y x=(y-a)/b FY ( y ) = P[Y ≤ y ] X y − a⎤ ⎡ FY ( y ) = P ⎢ X ≤ b ⎥⎦ ⎣ 333 Chapitre 9: Transformation d’une Variable 334 Chapitre 9: Transformation d’une Variable y − a⎤ y − a⎤ ⎡ ⎡ FY ( y ) = P ⎢ X > = 1 − P⎢ X ≤ ⎥ b ⎦ b ⎥⎦ ⎣ ⎣ y −a⎤ ⎡ ⎛ y−a⎞ = 1 − FX ⎜ FY ( y ) = 1 − P ⎢ X ≤ ⎟ ⎥ b ⎦ ⎣ ⎝ b ⎠ y Y>y Y≤y x=(y-a)/b FY ( y ) = P[Y ≤ y ] fY ( y ) = X y − a⎤ ⎡ FY ( y ) = P ⎢ X > b ⎥⎦ ⎣ 335 fY ( y ) = − dFY ( y ) dy 1 ⎛ y−a⎞ fX ⎜ ⎟ b ⎝ b ⎠ 336 56 Chapitre 9: Transformation d’une Variable fY ( y ) = Chapitre 9: 1 ⎛ y−a⎞ fX ⎜ ⎟ b ⎝ b ⎠ 1 ⎛ y−a⎞ fX ⎜ ⎟ b ⎝ b ⎠ 337 Transformation d’une Variable 338 Chapitre 9: 339 Chapitre 9: Transformation d’une Variable 1 ⎛ y−a⎞ fX ⎜ ⎟ b ⎝ b ⎠ fY ( y ) = − fY ( y ) = Chapitre 9: Transformation d’une Variable 341 Transformation d’une Variable 340 Chapitre 9: Transformation d’une Variable 342 57 Chapitre 9: 9.4 Transformation d’une Variable Chapitre 9: Transformation d’une Variable Fonctions à deux Variables aléatoires Soit X1 et X2 deux variables aléatoires définies soit pat leurs PDF ou leur JPDF f X 1 ( x1 ) f X 2 ( x2 ) f X 1 X 2 ( x1 , x2 ) Y = X1 + X 2 fY ( y ) FY ( y ) 343 Chapitre 9: Transformation d’une Variable 344 Chapitre 9: Transformation d’une Variable Si X1 et X2 sont indépendant 345 Chapitre 9: Transformation d’une Variable 346 Chapitre 9: Transformation d’une Variable Arrêt de bus A Arrêt de bus B Maison Université X: VA temps d’attente au niveau de l’arrêt de bus A f X ( x ) = λ e − λx Y: VA temps d’attente au niveau de l’arrêt de bus B f Y ( y ) = β e − βy 347 T = X +Y 348 58 Chapitre 9: Transformation d’une Variable Chapitre 9: Transformation d’une Variable Y = X1 + X 2 FT (t ) = ?????????? T = X +Y fT (t ) = ∞ ∫ f (t − y ) f ( y )dy X Y −∞ 349 Chapitre 9: Transformation d’une Variable fT (t ) = 350 Chapitre 9: Transformation d’une Variable ∞ ∫ f (t − y ) f ( y )dy X −∞ f X ( x ) = λ e − λx x≥0 ∞ fT (t ) = ∫ λe −λ (t − y ) βe − βy dy Y f Y ( y ) = β e − βy y≥0 f X (t − y ) = λe − λ (t − y ) y≥0 −∞ t−y≥0 0≤ y≤t t−y≥0 t fT (t ) = ∫ λe −λ (t − y )βe − βy dy 0 351 Chapitre 9: Transformation d’une Variable 352 Chapitre 9: Transformation d’une Variable f X ( x ) = λ e − λx λβ − βt −λt (e − e ) fT (t ) = λ−β t≥0 fT (t ) = 353 f Y ( y ) = β e − βy λβ − βt −λt (e − e ) λ−β 354 59 Chapitre 9: Transformation d’une Variable Maths 4: Probabilité et Statistiques (2008/2009) Zendagui 2.5 2 Fin Chapitre 9 1.5 9.1 9.2 93 9.3 9.4 1 Transformation d’une Variable Aléatoire Objectifs Méthode générale Application pour le cas d’une fonction linéaire Fonctions à deux Variables aléatoires 0.5 0 0 0.5 1 1.5 2 2.5 355 Maths 4: Probabilité et Statistiques (2008/2009) 356 Zendagui Fin du cours 357 60