MTH2302 Probabilités et méthodes statistiques Distributions continues - ch06-ch07 HMGB 1-37 distribution uniforme distribution exponentielle distribution normale (gaussienne) approximation: binomiale avec normale combinaisons de variables gaussiennes théorème Central-Limite distribution log normale distribution bi normale 38-42 HORS PROGRAMME • distribution gamma • distribution Weibull Bernard CLÉMENT, PhD 1 STATISTICA variables aléatoires : classification COMPTAGE DISCRÈTES MESURAGE CONTINUES distributions distributions binomiale uniforme Poisson géométrique exponentielle normale 18 distributions disponibles Log normale Hypergéométrique Gamma binomiale négative Bernard CLÉMENT, PhD Weibull hors programme 2 MTH2302 Probabilités et méthodes statistiques distribution UNIFORME 0 si fX ( x ) = 1 / ( b – a ) si Répartition F densité f x ≤ a ou x≥b 0 a ≤ x ≤ b a b X si x < a si a ≤ x ≤ b si x > b 0 (x–a)/(b–a) 1 FX ( x ) = 0 Variance = Var (X) = ( b – a )2 / 12 Moyenne = E (X) = ( a + b ) / 2 Xp = Quantile d’ordre p (0 < p < 1) : Xp = a + p (b – a) 120 Exemple : simulation 11% 100 de 1000 nombres 11% 10% 10% 11% 10% 10% 9% 9% 8% avec la fonction Statistica : Rnd(x) loi uniforme sur (0, x) No of obs sur l’intervalle (0, 1) 80 60 40 20 0 0.0009 0.2007 0.1008 0.4004 0.3005 0.6001 0.5002 0.7998 0.6999 0.9995 0.8997 UNIF 3 Bernard CLÉMENT, PhD MTH2302 Probabilités et méthodes statistiques distribution EXPONENTIELLE : T ~ Exp (λ ) Lien entre la loi exponentielle et le processus de Poisson X nombre de réalisations processus de Poisson d’intensité λ (fenêtre longueur 1) X ~ Po (λ) λ = nombre moyen de réalisations par unité de temps (espace) P( X = x) = λ x exp (- λ ) / x ! x = 0, 1, 2, 3, … Y = nombre de réalisations processus de Poisson dans une fenêtre de longueur t alors Y ~ Po (λt ) T = temps d’attente avant la prochaine réalisation après une réalisation v.a sur (o, ∞ ) P( T > t ) = P[ Y = 0 sur ( 0, t) ] = P( Y = 0 ) = exp (- λt ) alors T suit loi exponentielle de paramètre λ fonction de répartition de T fonction de densité de T T ~ Exp (λ ) FT ( t ) = 1 - P ( T > t ) = 0 si t < 0 = 1 - exp (- λt ) si t ≥ 0 fT (t) = (𝒅𝒅/𝒅𝒅𝒅𝒅) FT (t) = 0 si t < 0 = λ exp (- λt ) moyenne de T Bernard CLÉMENT, PhD E(T) = 1/ λ Écart type de T si t ≥ 0 ET(T) = 1/ λ MTH2302 Probabilités et méthodes statistiques 4 distribution EXPONENTIELLE : θ = 1/ λ autre paramétrisation fT (t ) = 0 si t < 0 = (1/ θ ) exp (- t / θ ) moyenne de T = E(T) = θ écart type de T = ET(X) = θ t p : quantile d’ordre p tp T ~ Exp (λ ) si t ≥ 0 P (T < t p ) = p 0<p<1 = - θ ln ( 1 – p ) Comment savoir si un si modèle exponentiel s’applique? - vérification visuelle avec un graphique quantile-quantile - test d’ajustement 4 exemples d’applications la loi exponentielle pages suivantes Bernard CLÉMENT, PhD MTH2302 Probabilités et méthodes statistiques 5 exemple 1 : calcul de probabilités avec une loi exponentielle composant électronique utilisé dans la protection des lignes à haute tension. essais ont montré que le taux de défaillance est décrit par une loi de Poisson avec λ = 10 - 5 par heure (moyenne = 105 heures) Quelle est la probabilité que le composant tombe en panne avant : 1 an / 5 ans / 10 ans ? 1 an = 365 * 24 = 8760 heures Solution 5 ans = 5 * 365 *24 = 43800 heures 10 ans = 10 * 365 * 24 = 87600 heures T durée de vie du composant avant la première panne P( T ≤ 1 an ) = P( T ≤ 8760 ) = 1 – exp( - 10- 5 * 8760 ) = 1- exp (- 0,0876) = 0,084 P( T ≤ 5 ans ) = P( T ≤ 43800 ) =1 – exp( - 10- 5 *43800 ) = 1- exp (- 0,438) = 0,355 P( T ≤10 ans ) = P( T ≤ 87600 ) =1 – exp( - 10- 5 *87600 ) = 1- exp (- 0,876) = 0,583 Bernard CLÉMENT, PhD MTH2302 Probabilités et méthodes statistiques 6 exemple 2 : les données proviennent-elles d’ une distribution exponentielle? données xi : 27 - 879 – 132 - 290 - 94 - 78 - 88 - 80 - 404 - 82 - 386 – 321 - 3 - 5 – 124 données ordre x( i ) : 3 – 5 – 27 – 78 – 80 - 82 – 88 – 94 – 124 - 132 – 290 – 321 – 386 - 404 - 879 méthode: graphique quantile (données) vs quantile (distribution choisie) ici : distribution exponentielle diagramme quantile-quantile procédure : disponible dans STATISTICA 1- ordonner les observations x ( 1 ) ≤ x ( 2 ) ≤ …. ≤ x ( n ) 2- calculer pi = i / ( n + 1 ) i = 1, 2,…, n 3- calculer xpi = F-1 (pi ) = quantile distribution de la distribution choisie F = fonction répartition - ici distribution exponentielle (x ( i ) , xpi ) 4- droite de moindres carrés passant par graphique Quantile-Quantile avec une loi exponentielle 0,01 0,25 0,50 0,75 0,90 0,95 1000 900 alignement des points : 800 Observed Value 700 600 indication que 500 400 distribution exponentielle est acceptable 300 200 100 0 -100 -0,5 0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 Theoretical Quantile Bernard CLÉMENT, PhD MTH2302 Probabilités et méthodes statistiques 7 exemple 3 - comparaison de 2 procédés Procédé taux de défaillance (heure) coût opér. ($) A 0,005 C B 0,003 kC (k > 1) garantie (h) pénalité (t<400) 400 D 400 D Quel procédé choisir ? pour quelle valeur de k on choisira B (A) ? Solution : les coûts d’opération et de garantie des procédés CA = C + D si t ≤ 400 et CA = C si t > 400 CB = k C + D si t ≤ 400 et CB = k C si t > 400 coût moyen de A : E(CA ) = (C+D)* P(T ≤ 400) + C * P( T > 400) = C + D*( 1 – exp (- 400*0,005)) = C + 0,865 D coût moyen de B : E(CB ) = (k C+D)* P(T ≤ 400) + k D* P( T > 400) = k C + D*( 1 – exp (- 400*0,003)) = k C + 0,699 D E(C A ) = E(C B ) si C + 0,865D = k C + 0,699D si k = k * = 1 + 0,166(D/C) Si k < k* choisir le procédé B : son coût moyen est plus petit que celui de A Si k = k* les deux procédés ont des coûts moyens égaux : A ou B Si k > k* choisir le procédé A car son coût moyen est plus petit que B Bernard CLÉMENT, PhD MTH2302 Probabilités et méthodes statistiques 8 exemple 4 : circuit électronique de 6 puces + 15 diodes + 20 condensateurs + 25 résistances placés en série. La fiabilité des composants suivent une loi exponentielle avec les taux de défaillance (λ) λ (défaillances heure) défaillances (an = 24x 365) 175,2 x 10- 7 puces 6 0,02 x 10- 7 diodes 15 1,90 x 10- 7 16644 x 10- 7 condensateurs 20 0,50 x 10- 7 13140 x 10- 7 résistances 25 0,80 x 10- 7 7008 x 10- 7 Déterminer la fonction de fiabilité du système et faire son graphique. composant nombre solution le circuit fonctionne si tous les composants sont opérants La probabilité que le circuit soit opérant jusqu’au temps t est : P ( T > t ) = P ( T1 > t ) * P ( T2 > t ) * . . . * P ( T n > t ) = exp ( – λ 1t ) * exp ( – λ 2 t ) * . . . * exp (- λ n t ) = exp [ ( - ∑ λ i ) t ] Le taux de défaillance (heure) du circuit est ∑ λ i = ( 6* 0,02 + 15 * 1,90 + 20 * 1,50 + 25 * 0,80 ) x 10 7 = 78,62 x 10 7 annuellement - taux de défaillance = 24* 365 * 78,62 x 10 7 = 0,688711 Bernard CLÉMENT, PhD MTH2302 Probabilités et méthodes statistiques 9 Exemple 4 (suite) : la fonction de fiabilité (annuelle) du circuit FT ( t ) = exp ( - 0,688711* t ) 1.2 1.0 FT 0.8 0.6 0.4 0.2 0.0 0 Bernard CLÉMENT, PhD 0.5 1 1.5 2 2.5 3 MTH2302 Probabilités et méthodes statistiques 3.5 4 t (an) 10 Distribution normale aussi appelée distribution gaussienne courbe en cloche : distribution la plus importante raison : vient du fait que cette v. a. est très souvent observée à cause du résultat : si plusieurs facteurs distincts et indépendants influencent l’issue d’un processus chacun avec sa loi propre, alors la résultante (somme) tend vers une distribution normale Exemples - somme de v.a uniformes - somme de v.a exponentielles - sommes de v.a Binomiales - sommes de v.a Poisson - sommes de v.a de lois diverses autre rôle : approximer autres distributions Bernard CLÉMENT, PhD MTH2302 Probabilités et méthodes statistiques 11 distribution normale Scatterplot (chap05.sta 10v*1000c) 0.14 0.12 densité en forme de cloche 0.10 X ~ N ( μ ,σ2 ) 0.08 GAUSS Notation : paramètres μ (mu) : moyenne centre de la distribution σ (sigma) > 0 : écart type évasement de la distribution Densité σ 0.06 0.04 0.02 0.00 -0.02 -2 0 2 4 6 8 μ 12 14 16 18 20 22 24 26 U 1 _ exp (- ( x – μ )2 / 2 σ2 ) f (x) = 10 √ _∞ <x<∞ σ 2π x Répartition FX (x) = P (X ≤ x) = Intégration numérique seulement Moyenne (X) = E(X) = μ Bernard CLÉMENT, PhD -∞ 1 exp (- ( t – μ )2 / 2 σ2 σ√ 2π Variance (X) = σ2 ) dt approximation plus loin Écart type (X) = ET(X) = σ MTH2302 Probabilités et méthodes statistiques 12 Exemples de distributions normales densité répartition ou cumulative Bernard CLÉMENT, PhD MTH2302 Probabilités et méthodes statistiques 13 Z ~ N ( μ = 0, σ2 = 1) normale centrée réduite : Densité f(z)= 1 √2π exp (- z 2 / 2 ) -∞<z<∞ z Ф (z) = P ( Z ≤ z ) = Répartition Φ (- z) = 1 - Φ (z) 1 exp ( - t 2 / 2 √2π )dt -∞ Approximation de la fonction Φ ( z ) (peut remplacer la table) Φ (z) ≈ 1/ [ 1 + exp ( -1,5976 z - 0,0706 z3 ) ] Approximation de la fonction inverse Φ-1 ( p ) si 0.5 ≤ p < 1 a = ( - 2ln ( 1-p)) 0 . 5 b= 2,30753 - 0,27061a 1 + 0,99229a + 0,04481a2 Φ -1 ( p ) = a - b si 0 < p ≤ 0.5 Φ -1 ( p ) = - Φ -1 ( 1 - p ) 14 Bernard CLÉMENT, PhD MTH2302 Probabilités et méthodes statistiques Table fonction Φ normale centrée réduite N(0,1) Φ (- z) = 1 - Φ (z) Bernard CLÉMENT, PhD 15 Quantile normale centrée réduite Z ~ N ( 0, 1) Probability Density Function Probability Distribution Function y=normal(x;0;1) p=inormal(x;0;1) 1.0 0.6 0.5 0.8 0.4 0.6 0.3 0.4 0.2 0.2 0.1 0.0 0.0 -3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3 Percentile (quantile) d’ordre p (0 < p < 1) de Z noté zp : solution de Ф (zp) = p zp = Φ -1(p) Quantiles souvent employés p 0,001 0,005 0,01 0,025 0,05 0,10 0,90 0,95 0,975 0,99 0,995 0,999 z p - 3,09 -2,576 -2,326 -1,96 -1,645 -1,282 1,282 1,645 1,96 2,326 2,576 3,09 Bernard CLÉMENT, PhD MTH2302 Probabilités et méthodes statistiques 16 Transformation : de N ( μ, σ 2 ) à Si X ~ N ( μ , σ 2 ) alors Z=( X–μ )/ σ est une v.a normale centrée réduite X ~N(μ,σ2) : X p = μ + σ Zp Évaluation N ( 0 , 1) Z ~ N ( μ = 0 , σ2 = 1) Xp quantile d’ordre p (0 < p < 1) où Z p quantile d’ordre p loi N (0,1) Ф( - z ) = 1 - Ф ( z ) P ( a < X < b ) = Ф[( b – μ ) / σ)] - Φ[( a – μ ) / σ)] P ( | X | ≤ a ) = 2 Φ[( a – μ ) / σ)] - 1 X dans ( μ - σ, μ + σ) probabilité = 0.683 X dans ( μ - 2σ, μ + 2σ) probabilité = 0.955 X dans ( μ - 3σ, μ + 3σ) probabilité = 0.997 Exemple : X ~ N ( μ = 50 , σ2 = 16 ) (a) P ( X ≤ 55 ) = Φ [ ( 55 - 50 ) / 4) ] = Φ (1,25) = 0,8925 (b) P ( X > 48 ) = 1- P ( X < 48) = 1 - Φ [ ( 48 - 50 ) / 4 ] = 1 - Φ ( - 0,5 ) = 1 - ( 1 - Φ (0,5) ) = Φ (0,5) = 0,6915 Bernard CLÉMENT, PhD MTH2302 Probabilités et méthodes statistiques 17 distribution normale? - méthodes pour répondre Pourquoi? nombreuses procédures statistiques reposent sur l’hypothèse que la variable de réponse Y du processus étudié est normale Méthodes pour vérifier la normalité 1. histogrammes : au moins 50 observations 2. comparaisons : effectifs dans xbar ± s , xbar ± 2s , xbar ± 3s 3. diagramme quantile-quantile : valable même pour moins de 50 obs. procédure : disponible dans STATISTICA 1- ordonner les observations x 2- calculer p i = i / ( n + 1 ) (1) ≤ x ( 2 ) ≤ …. ≤ x ( n ) i = 1, 2,…, n 3- calculer z p i = Φ -1 ( p i ) : quantile d’une loi gaussienne 4- droite de moindres carrés passant par ( x ( i ) , zpi ) 4. tests d’ajustement : Khi-deux, Shapiro-Wilk chapitre 11 tests d’hypothèses méthodes 1-2-3 : jugement visuel Bernard CLÉMENT, PhD méthode 4 : calcul MTH2302 Probabilités et méthodes statistiques 18 Exemple graphique quantile-quantile Exemple 1: n = 12 X = 104 - 97- 83 – 113 – 107 – 119 - 161- 123 – 129 -134 – 124 - 146 quantile – quantile distribution normale normal probability plot Distribution: Normal X-ex5.8 = 120+22.4366*x 0.05 0.10 0.25 Normal Probability Plot of X-ex5.8 (chap05-V5.sta 21v*1000c) 2.0 0.50 0.75 0.90 0.95 170 1.5 160 1.0 Expected Normal Value 150 Observed Value 140 130 120 110 100 0.5 0.0 -0.5 -1.0 90 -1.5 80 70 -2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0 -2.0 70 80 Theoretical Quantile 100 110 120 130 140 150 160 170 Observed Value différence : inversion Bernard CLÉMENT, PhD 90 axe vertical axe horizontal MTH2302 Probabilités et méthodes statistiques 19 Exemple graphique quantile-quantile Exemple 2 : n = 100 - données simulées N ( mu=50, sigma=0,5) 51,00 - 50,37- ...- 50,05 - 49,50 0.01 0.05 0.25 0.50 0.90 0.75 0.99 52.0 51.5 51.0 50.5 50.0 Observed Value 49.5 49.0 48.5 -3 -2 -1 0 1 2 3 Theoretical Quantile Bernard CLÉMENT, PhD MTH2302 Probabilités et méthodes statistiques 20 Exemple 3 : production composants caractéristique qualité X doit avoir une valeur nominale de 3,500 = µ procédé de fabrication est sujet à variations - par expérience écart type σ (sigma) = 0,01 - valeur nominale µ peut se dérégler (usure, … ) ± 1,5*σ autour de 3,500 - limites XL = ? XU = ? telles que : Prob (XL ≤ X ≤ XU) = 0,995 X XL Δ = ± 1,5* σ = ± 0,015 3,500 3,485 ≤ µ≤ XU 3,515 QUESTIONS (a) déterminer les valeurs XL et XU de X qui engloberaient disons 99,5% de la production? (b) une client exige des composants situés dans l’intervalle de tolérance (spécifications) 3,500 ± 0,030 ( 3,47 ≤ X ≤ 3,53 ). On ne peut pas régler la valeur nominale mieux qu’en (a). Quelle devrait être la valeur de σ pour que 99,5% de la production soit dans l’intervalle de tolérance désiré? Bernard CLÉMENT, PhD MTH2302 Probabilités et méthodes statistiques 21 Exemple 3 : suite - solution (a) Posons Δ = - 0,015 P ( XL ≤ X ≤ XU ) = 0,995 XL = ? XU = ? P [ ( XL - 3,485 ) / 0,01 ≤ (X – 3,485 ) / 0.01 ≤ ( XU – 3,485 ) / 0,01] = 0,995 P [ ( XL - 3,485 ) / 0,01 ≤ Z ≤ ( XU – 3,485 ) / 0,01] = 0,995 P [ ZL ≤ Z ≤ ZU ] = 0.995 Z suit loi N ( 0,1) 0.45 table N(0,1) 0.40 ZL = -2,81 = (XL - 3,485) / 0,01 0.35 0.30 0.25 XL = 3,485 -2,81*0,01 = 3,4569 0.20 gauss-std ZU = 2,81 = (XU – 3,485) / 0,01 0,995 0,0025 0.15 0.10 0.05 XU = 3,485+2,81*0,01 = 3,5138 0.00 -0.05 ZL= - 2,81 Bernard CLÉMENT, PhD 0 MTH2302 Probabilités et méthodes statistiques ZU = 2,81 22 Δ Exemple 3 : suite (a) σ = 0.01 μ XL XU__ Δ = -1,5* σ -0,0075 3,485 3,4569 3,5138 Δ = 1,5* σ 0,0075 3,515 3,4869 3,5431 Δ =0 si on pose 0 3,500 3,4719 3,5281 XL = 3,4569 et XU = 3,5431 on aura toujours P( XL ≤ X ≤ XL ) = 0,995 quel que soit μ (b) On veut que X ne soit jamais inférieur à 3,47 (avec probabilité 0,0025) et ne soit jamais supérieur à 3,53 (avec probabilité de 0,0025). Quelle doit être la valeur de σ? Si Δ = 0 ( μ = 3,500 ) la condition est satisfaite. Voir tableau. Si Δ = ± 0,015 la condition n’est pas satisfaite avec σ = 0,01 On veut P ( 3,47 ≤ X ≤ 3,53 ) = 0,995 pour 3,485 ≤ μ ≤ 3,515 et une valeur de σ à déterminer. Si μ = 3,485 P [( 3,47 – 3,485) / σ ≤ (X – 3,485) / σ ≤ (3,53 – 3,485) / σ ] = 0.995 P ( - 0,015 / σ ≤ Z ≤ 0,045 / σ ) = 0,995 Ф( 0,045 / σ ) - Ф( - 0,015 / σ ) = 0.995 Mais σ ≤ 0,01 donc 0,045 / σ > 4,5 et Φ ( 0,045 / σ ) ≈ Φ (4,5) = 1 1 - Φ ( - 0,015 / σ ) = 0,995 donne σ = 0,015 / 2,575 = 0,0058 Si μ = 3,515 on obtient aussi σ = 0,0058 Bernard CLÉMENT, PhD MTH2302 Probabilités et méthodes statistiques 23 Approximation binomiale avec normale rappel: masse binomiale est en forme de cloche approximation binomiale avec normale Bar/Column Plot (ch4-V5.sta 10v*101c) Bar/Column Plot (ch4-V5.sta 10v*101c) Bar/Column Plot (ch3.sta 10v*31c) 0.20 0.16 0.18 0.18 0.14 0.16 n = 30 θ = 0,3 0.14 0.12 0.10 n = 30 0.16 0.12 n = 30 0.10 θ = 0,9 0.12 θ = 0,5 0.08 0.08 0.14 0.10 0.08 0.06 0.06 0.06 0.04 0.04 0.02 0.02 0.04 0.02 BINOM-3 0.00 3 1 0.00 1 BINOM-2 0.00 5 7 9 11 13 15 17 19 21 23 25 27 3 5 7 9 11 13 15 17 19 21 23 25 27 29 29 binom 0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 Bar/Column Plot (ch4-V5.sta 10v*101c) Bar/Column Plot (ch4-V5.sta 10v*101c) n = 100 0.09 0.08 0.14 n = 100 0.08 θ = 0,3 0.07 Bar/Column Plot (ch4-V5.sta 10v*101c) 0.09 0.10 θ = 0,5 0.07 0.06 n = 100 0.12 θ = 0,9 0.10 0.06 0.08 0.05 0.05 0.04 0.06 0.04 0.03 0.03 0.04 0.02 0.02 0.01 0.01 BINOM-4 0.00 1 8 15 22 29 36 43 50 Bernard CLÉMENT, PhD 57 64 71 78 85 92 99 0.02 0.00 BINOM-5 1 9 17 25 33 41 49 57 65 73 81 89 97 BINOM-6 0.00 1 9 MTH2302 Probabilités et méthodes statistiques 17 25 33 41 49 57 65 73 81 89 97 24 Approximation binomiale avec normale Une variable X binomiale ( n, θ) est discrète : x = 0, 1, 2, 3,…., n Une variable Y normale « équivalente » a pour paramètres: μ = nθ et σ2 = n θ ( 1 – θ ) Condition : faut que n soit « assez grand » : n θ ( 1 – θ ) > 5 θ 0,05 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 0,95 n 105 50 32 24 21 20 21 24 32 50 105 Formules d’approximation : σ = [n θ ( 1 – θ )]0,5 et μ = n θ Binomiale Gaussienne Évaluation avec Φ_______________ PB ( X = x) PG ( x- 0,5 ≤ X ≤ x+ 0.5) Ф[ (x + 0,5 - μ)/σ ] - Φ [ (x - 0,5 - μ)/σ ] PB( X ≤ x) PG ( X ≤ x+0,5) Φ [ (x + 0,5 - μ )/σ ] PB( a ≤ X ≤ b ) PG (a - 0,5 ≤ X ≤ b + 0,5) Φ [(b + 0,5 - μ) /σ ] - Φ [(a - 0,5 - μ) /σ ] ± 0,5 : correction de continuité Exemple : loi binomiale (n=100, θ = 0,4) nθ = 40 et nθ(1 - θ ) = 24 = 4,902 P(X = 35) ≈ Ф[ (35 + 0,5 - 40) / 4,90] - Φ[ (35 - 0,5 - 40) / 4,90] ≈ Φ( - 0,92 ) - Φ( - 1,12 ) = 0,1788 - 0,1314 = 0,0474 P( 22 < X ≤ 30 ) = P(23 ≤ X ≤ 30) ≈ Φ[( 30 + 0,5 - 40) / 4,90] - Φ [(23 - 0,5) / 4,90 ] = Φ(-1,94) - Φ(-3,57) = 0,0262 - 0,0002 = 0,0260 Bernard CLÉMENT, PhD MTH2302 Probabilités et méthodes statistiques 25 Combinaison linéaire de variables normales RÉSULTAT Soient X X i~ 1 , X 2,, ….. , X n des v. a indépendantes N ( μ i , σi2 ) Soient a0, a1, a 2,, …. , an des constantes. n Posons Y = a0 + ∑ ai Xi i=1 une combinaison linéaire des Xi alors Y ~ N ( μY , μ Y = a0 + ∑a i μ i Bernard CLÉMENT, PhD σY 2 ) où σY2 = ∑ a i2 σi2 MTH2302 Probabilités et méthodes statistiques 26 Exemple 1 : X1 ~ N ( mu = 2, var = 9) Calculer : (a) P( X1- X2 > 1.5) (c) P( X1 + X2 ≤ 1) X2 ~ N ( mu = 1, var = 16) (b) P(X1 > X2) (d) P( 2X1 + X2 > 6) Solution (a) X1 - X2 ~ N (mu =2 -1 = 1, var = 9+16 = 25) P(X1 - X2 > 1.5) = 1 - P(X1-X2< 1.5) = 1- Φ ((1,5 -1) / 5) = 1- Φ( 0,1 ) = 1 - 0,5398 = 0,4602 (b) P(X1 > X2) = P( X1- X2 > 0) = 1 - Φ((0 - 1) / 5) = 1- Φ(-0,2) = 0,5793 (c) X1 + X2 ~ N (mu = 2+1 = 3, var = 9 + 16 = 25) P( X1 + X2 ≤ 1) = Φ((1 - 3) / 5) = Φ(-0,40) = 0,3446 (d) 2X1 + X2 ~ N ( mu = 2*2+1 = 5, var = 4*9+16 = 52) P(2X1+X2 > 6) = 1 - Φ((6 - 5) / 520.5 ) = 1 - Φ(0,14) = 0,44443 Bernard CLÉMENT, PhD MTH2302 Probabilités et méthodes statistiques 27 Exemple 2 insertion d’une tige dans un cylindre évidé X 1 ~ N ( μ1 = 1,005 , σ1 = 0,003 ) : diamètre intérieur cylindre X 2 ~ N ( μ 2 = 1 , σ2 = 0,002 ) : diamètre extérieur tige Quelle est la probabilité de faire l’insertion tige dans cylindre? Solution W= X 1– X 2 loi N ( 0,005, σ W = √13 * 0.001 = 0,0036 ) P ( W > 0) = 1 - P ( W < 0 ) = 1 - Φ [ ( 0 - 0,005) / 0,0036 ] = 1 - Φ ( -1,39 ) = 0,92 ou 92% quoi faire pour augmenter la probabilité à 0,99 ? réponse : Bernard CLÉMENT, PhD réduire σ1 ou σ2 (page suivante) MTH2302 Probabilités et méthodes statistiques 28 Exemple 3 (suite) insertion d’une tige dans un cylindre X 1 ~ N ( μ1 =1,005 , σ 1 = ? ) : diamètre intérieur cylindre X 2 ~ N ( μ 2 =1 , σ2 = 0,002 ) : diamètre extérieur tige Valeur de σ1 pour faire l’insertion avec probabilité 0,99 ? Solution : N ( 0,005, σ W ) W = X 1– X 2 on veut P ( W > 0) = 0,99 suit loi P ( W < 0 ) = 0,01 = 1 - P [( 0- 0,005) / σ W ] (0 - 0,005) / σ W = Z 0.01 = - 2,33 (table) - 0,005 / σ W = - 2,33 σ W = 0,00215 σ W = 0,00215 = (σ12 + 0.002 2 )0.5 σ 1 = 0,0028 29 Bernard CLÉMENT, PhD MTH2302 Probabilités et méthodes statistiques Théorème Central-Limite Théorème Central Limite (TCL) X1 , X2 , …, Xn suite de variables aléatoires indépendantes telles que E(Xi) = µi alors si n est « grand » (1) Z = ( ∑ Xi Cas particulier - Var(Xi) = σi2 i = 1 ,2, …, n (n ≥ 30 généralement suffisant) ∑ µi ) / ( ∑ σi2 )0,5 ~ N(0 , 1) approximativement application au processus d’échantillonnage X1 , X2 , …, Xn une suite de variables aléatoires indépendantes, identiquement distribuées avec E(Xi) = µ alors si n est « grand » (2) (𝟑𝟑) (4) Y = ∑ Xi ~ Var(Xi) = σ2 i = 1 ,2, …, n (n ≥ 30 généralement suffisant) N(µY , σY2 ) avec 𝐗𝐗𝐗𝐗𝐗𝐗𝐗𝐗 = ∑ Xi / n ~ µY = n µ σY2 = n σ2 N(µ , σ2 /n) [ (∑ Xi / n) - µ ) / (σ/ 𝐧𝐧 ) ~ N(0 , 1) Bernard CLÉMENT, PhD 30 MTH2302 Probabilités et méthodes statistiques Théorème Central-Limite Exemple : 50 nombres Xi au hasard dans intervalle [ 0, 1 ] Prob ( ∑ Xi ≥ 28 ) = ? réponse = 0,0708 Exemple : échantillon de 9 bouteilles dont le volume a pour moyenne de 750 ml et un écart-type de 15 ml. Prob ( Xbar ≤ 745) = ? Bernard CLÉMENT, PhD réponse = 0,1587 MTH2302 Probabilités et méthodes statistiques 31 distribution lognormale X suit distribution lognormale de paramètres µ et σ si Y = ln(X) suit une distribution normale N(µ , σ2) µ et σ : pas la moyenne et l’écart-type de X mais µ = E(X) = moyenne de Y = ln(X) σ = ET(Y) = écart-type de Y = ln(X) fonction densité fonction répartition Fx(x) = Prob (X ≤ x ) = Prob ( ln(X) ≤ lnx ) = Φ [ (ln(x) - µ )/ σ) ] moyenne = médiane = mode = variance = 32 Bernard CLÉMENT, PhD MTH2302 Probabilités et méthodes statistiques distribution lognormale Exemple: X distance (m) entre 2 véhicules consécutifs sur une autoroute distribution de X : lognormale paramètres µ = 0,5 σ = 0,8 Questions a) Prob (X ≥ 3) = ? = Prob (lnX ≥ ln3) = Prob( (lnX - 0,5) / 0,8 ≥ (ln3 – 0,5) / 0,8) ) = Prob ( Z ≥ ( (1,099 - 0,5) / 0,8) ) avec Z ~ N(0,1) = 1 – P( Z ≤ 0, 75) = 1 - Φ (0,75) = 1 - 0,773 = 0,227 b) moyenne de X = ? moyenne de X = exp( 0,5 + (0,8)2 (1/2) ) = 1,36 (formule p.32) c) écart-type de X = ? Bernard CLÉMENT, PhD réponse : 0,97 MTH2302 Probabilités et méthodes statistiques 33 propriétés distribution lognormale Bernard CLÉMENT, PhD 34 DISTRIBUTION BI-NORMALE: distribution normale en 2 dimensions Un vecteur de 2 variables aléatoires (X1, X2)’ suit une distribution normale en 2 dimensions (bi normale) si leur densité conjointe est définie par Bernard CLÉMENT, PhD 35 DISTRIBUTION BI-NORMALE: distribution normale en 2 dimensions Si ρ = 0, alors les variables X1 et X2 sont indépendantes. Ce résultat constitue une exception 2 variables à corrélation nulle ne sont pas nécessairement indépendantes PROPRIÉTES Bernard CLÉMENT, PhD 36 DISTRIBUTION BI-NORMALE: distribution normale en 2 dimensions EXEMPLE On suppose que les notes au cours de probabilités (X1) et de résistance des matériaux (X2) pour un groupe d’étudiants est un vecteur aléatoire (X1 , X2) suit une distribution bi normale avec les paramètres (μ1, μ2) = (80, 75) (σ1, σ2) = (2, 3) ρ = 0,7 Si un étudiant a obtenu 82 en probabilités, quelle est la probabilité qu’il obtienne un meilleur résultat en résistance des matériaux? RÉPONSE : 0,011 Bernard CLÉMENT, PhD 37 distribution gamma : Γ(c, λ) fX (x) = [ 1/ Γ(c) ] λc x c – 1 e - λ x Γ (Gamma) est la fonction Gamma c > 0 est le paramètre de forme λ > 0 est le paramètre d’échelle Moyenne E (X) = c / λ Variance Var (X) = c / λ 2 loi gamma avec c = 2 et lambda = 1 fonction répartition 1.0 1.0 0.8 0.8 0.6 0.6 0.4 0.4 0.2 0.2 0.0 x >0 0.0 0 Bernard CLÉMENT, PhD 2 4 6 8 10 0 2 4 6 MTH2302 Probabilités et méthodes statistiques 8 10 38 distribution gamma : Γ(c, λ) c = 0,5 c=1 exponentielle c = 1,5 c=2 λ=1 Bernard CLÉMENT, PhD λ=2 λ=4 39 Distribution Gamma : relation avec processus Poisson Résultat (généralisation résultat de la page 4 où n = 1) X un processus de Poisson d’intensité λ λ réalisations en moyenne par unité de temps Y le nombre de réalisations du processus durant t unités de temps Y suit une loi de Poisson de paramètre λt T le temps d’attente jusqu’à la n-ième réalisation T suit une loi Gamma de paramètres α = n et θ = 1 / λ distribution Khi-deux : cas particulier Gamma Si λ = 0,5 et c=k/2 où k est un entier : la loi porte le nom du khi-deux. employée Bernard CLÉMENT, PhD chapitres 9 - 10 - 11 - 12 40 distribution Weibull : W (c, λ) c paramètre de forme λ paramètre d’échelle - 1 exp [- ( x / λ)c ] densité f ( x ) = (c / λ) (x /λ ) c répartition F ( x) = 1 – exp [ - (x / λ) c ] quantile d’ ordre p : fiabilité x>0 x p = ln [ ln (1 / (1-p) ) ] 0<p<1 c = 1 : distribution exponentielle densité répartition Weibull 1.0 1.2 c = 2, λ =1 0.8 1.0 0.8 λ =1 β =c 0.6 0.6 0.4 0.4 0.2 0.2 0.0 0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4 1.6 1.8 2.0 Bernard CLÉMENT, PhD 0.2 0.4 0.6 0.8 1.0 1.2 1.4 1.6 1.8 2.0 41 Exemple : X = 525 – 880 – 1200 – 1600 – 1980 – 2420 - 3294 distribution Weibull ? examen avec graphique quantile - quantile graphique quantile - quantile Q uantile-Q uantile Plot of X-ex5.24 chap05.sta 24v*1000c) Distribution: Weibull(1) alignement X-ex5.24 = 649.8774+1139.6854*x 0.01 0.25 0.50 0.75 des points : 0.90 4000 indication 3500 loi 3000 Weibull 2500 semble 2000 acceptable 1500 Observed Value 1000 500 0 -0.2 0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4 1.6 1.8 2.0 2.2 2.4 2.6 Theoretical Quantile Bernard CLÉMENT, PhD 42