INTRODUCTION Vocabulaire statistique L ’opérateur somme VOCABULAIRE STATISTIQUE Population statistique : Une population statistique est l'ensemble sur lequel on effectue des observations. Individu (ou unités statistiques) : Les individus sont les éléments de la population statistique étudiée. Caractère statistique ou variable statistique : C'est ce qui est observé ou mesuré sur les individus d'une population statistique. 1 Saïd Chermak pour infomaths.com INTRODUCTION Vocabulaire statistique L ’opérateur somme VARIABLES QUANTITATIVES Variable quantitative : Une variable statistique est quantitative si ses valeurs sont des nombres exprimant une quantité, sur lesquels les opérations arithmétiques (somme, etc...) ont un sens. Variable quantitative discrète: Variable quantitative continue: Une variable quantitative est discrète si elle ne peut prendre que des valeurs isolées, généralement entières. 2 Saïd Chermak pour infomaths.com Une variable quantitative est continue si ses valeurs peuvent être n'importe lesquelles d'un intervalle réel. INTRODUCTION Vocabulaire statistique L ’opérateur somme VARIABLES QUALITATIVES Variable qualitative : Une variable statistique est qualitative si ses valeurs, ou modalités, s'expriment de façon littérale ou par un codage sur lequel les opérations arithmétiques telles que moyenne, somme, ... , n'ont pas de sens. Variable qualitative nominale : Variable qualitative ordinale : C'est une variable qualitative dont les modalités ne sont pas ordonnées. C'est une variable qualitative dont les modalités sont naturellement ordonnées 3 Saïd Chermak pour infomaths.com INTRODUCTION Vocabulaire statistique L ’opérateur somme (1) UN OUTIL : L ’OPERATEUR SOMME Σ DEFINITION: p et q étant 2 entiers relatifs q ∑x i= p i = x p + x p +1 + ...... + xq q REMARQUE 1: i est une variable muette Saïd Chermak i j= p j h= p h n Quand il n’y a pas d’ambiguïté sur le domaine de variation de i, celui-ci peut être omis 4 q ∑ x =∑ x =∑ x i= p REMARQUE 2: q pour infomaths.com ∑x = ∑x = ∑x i =1 i i i i INTRODUCTION Vocabulaire statistique L ’opérateur somme (2) UN OUTIL : L ’OPERATEUR SOMME Σ ∑ ka PROPRIETE 1: i i q ∑ ka i i= p = k ∑ ai i q = ka p + ka p +1 + ...... + kaq = k ( a p + a p +1 + ...... + aq ) = k ∑ ai i i i i q ∑(a + b ) = (a i= p PROPRIETE 3 : i= p ∑(a + b ) = ∑ a + ∑b PROPRIETE 2: i i i i p i + bp ) + ( a p +1 + bp +1 ) + ..... + ( aq + bq ) ∑ k (a + b ) = k∑ a + k∑b i i i i q q i= p i= p = ( a p + a p +1 + ..... + aq ) + ( bp + bp +1 + ..... + bq ) = ∑ ai + ∑ bi i PROPRIETE 4 : n i n ∑ k = nk i =1 + k4+244 ..... +3k = nk ∑ k = k14 i =1 PROPRIETE 5: q n ∑ k = ( q − p + 1) k i= p 5 Saïd Chermak pour infomaths.com i Tableaux et graphiques 6 Saïd Chermak pour infomaths.com TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue (1) VARIABLES QUALITATIVES NOMINALES Noms M. Alberro M. Hondarrague Mme Claverotte Melle Lopez M. Paulien M. Guillou M. Lahitette Mme Vigouroux Melle Maleig M. Duclos M. Carricaburu Mme Vidal …. 7 Couleur des yeux Vert Noir Noir Noisette Bleu Noir Noisette Noir Bleu Vert Bleu Noir …. Saïd Chermak pour infomaths.com Modalités Effectifs Fréquences Bleu 60 0,200 Noir 160 0,533 Noisette 40 0,133 Vert 40 0,133 Total : 300 1 % 20,0 53,3 13,3 13,3 100 Modalités Effectifs Fréquences % f1×100 modalité 1 n1 f1= n1/n … … … f i ×100 modalité i ni fi= ni/n … … … f k ×100 modalité k nk fk= nk/n Total : 100 ∑ n i = n ∑ f i =1 TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue (2) VARIABLES QUALITATIVES NOMINALES Modalités Effectifs Fréquences Bleu 60 0.200 Noir 160 0,533 Noisette 40 0,133 Vert 40 0,133 Total : 300 1 Diagramme circulaire ou camembert Vert 13% Bleu 20% % 20,0 53,3 13,3 13,3 100 Diagramme en barres 180 160 160 140 Noisette 13% 120 100 80 60 60 40 Noir 54% 8 Saïd Chermak pour infomaths.com 40 40 Noisette Vert 20 0 Bleu Noir TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue VARIABLES QUALITATIVES ORDINALES 130 personnes ont été interrogées sur leur addiction au chocolat Les modalités sont présentées dans l’ordre Modalités Effectifs = Nombre de personnes Pas du tout (A) 10 Un peu (B) 25 Beaucoup (C) 40 Passionnément (D) 32 A la folie (E) 23 45 40 40 35 32 30 25 23 25 20 15 10 10 5 0 9 Saïd Chermak A B pour infomaths.com C D E TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue (1) VARIABLES QUANTITATIVES DISCRETES EFFECTIFS ET FREQUENCES Nombre de produits Nombre de Nombre de clients financiers produits financiers Bredat 2 0 103 Gauguet 3 1 115 Leremboure 0 2 95 Coustere 0 3 35 Lalisou 1 4 10 Aussagne 0 5 2 Vittorello 1 Diaz 0 Valeurs de Effectifs Fréquences % Etcheverry 2 la variable Bernadet 4 f1×100 x1 n1 f1= n1/n Miramon 1 Jaime 3 … … … Dartus 2 f i ×100 xi ni fi= ni/n Domege 0 … … … Train 0 f k ×100 xk nk fk= nk/n Piquemal 1 Total : 100 ni = n f i =1 Laffargue 2 pour infomaths.com …… Saïd Chermak……. 10 Clients ∑ ∑ TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrète (2) VARIABLES QUANTITATIVES DISCRETES REPRESENTATION GRAPHIQUE DES EFFECTIFS ET FREQUENCES Nbre de produits financiers xi 0 1 2 3 4 5 Effectif ni 103 115 95 35 10 2 Fréquence fi 0,286 0,319 0,264 0,097 0,028 0,006 Diagramme en bâtons 140 120 100 80 60 40 20 0 11 Saïd Chermak 1 2 pour0 infomaths.com 3 4 5 6 Quantitative continue TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue (3) VARIABLES QUANTITATIVES DISCRETES EFFECTIFS ET FREQUENCES CUMULES Effectifs cumulés croissants: Nombre d'individus pour lesquels la variable est inférieure ou égale à xi. Résultat de l'addition, de proche en proche, des effectifs d'une distribution observée en commençant par le 1er. Effectifs cumulés décroissants: Nombre d'individus pour lesquels la variable est supérieure ou égale à xi. Résultat de l'addition, de proche en proche, des effectifs d'une distribution observée en commençant par le dernier. 12 Saïd Chermak pour infomaths.com Nbre Nombre de Effectifs cumulés Effectifs cumulés produits Clients croissants décroissants financiers 0 103 103 360 1 115 257 218 2 95 142 313 3 35 47 348 4 10 12 358 5 2 2 360 Total : 360 Valeurs de la Effectif Effectifs cumulés Effectifs cumulés variable croissants décroissants xi ni Ni N’i x1 n1 N1= n1 N’1= nk+ ….+ n1= n x2 n2 N2= n1+ n2 N’2= nk+ ….+ n2 x3 n3 N3= n1+ n2+ n3 N’3= nk+ ….+ n3 … … …. …. xk-1 nk-1 Nk-1= n1+ ….+ nk-1 N’k-1= nk+ nk-1 xk nk Nk= n1+ ….+ nk= n N’k= nk Total : n TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue (4) VARIABLES QUANTITATIVES DISCRETES EFFECTIFS ET FREQUENCES CUMULES Nombre de Nombre de produits clients financiers xi ni 0 103 1 115 2 95 3 35 4 10 5 2 Total : 360 Effectifs cumulés croissants Ni 103 218 313 348 358 360 Effectifs Fréquences cumulés décroissants N’i fi 360 0,2861 257 0,3194 142 0,2639 47 0,0972 12 0,0278 2 0,0056 1 Fréquences Fréquences cumulées cumulées croissantes décroissantes Fi F’i 0,2861 1 0,6055 0,7139 0,8694 0,3945 0,9666 0,1306 0,9944 0,0334 1 0,0056 Il y a 313 clients possédant un nombre de produits financiers inférieur ou égal à 2 Il y a 47 clients possédant un nombre de pro. fin. supérieur ou égal à 3 La proportion de clients possédant un nombre de pro. fin. inférieur ou égal à 4 est de 99,44% La proportion de clients possédant un nombre de pro. fin. supérieur ou égal à 1 est de 71,39% 13 Saïd Chermak pour infomaths.com TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue (5) VARIABLES QUANTITATIVES DISCRETES COURBES CUMULATIVES x ni Ni 0 103 103 1 1 115 218 2 2 95 313 3 3 35 348 4 4 10 358 5 5 2 360 −∞ 0 +∞ xi N(x) 0 103 218 313 348 358 360 N’i 360 257 142 47 12 2 400 N ’(x) 350 360 300 257 250 142 200 47 150 12 100 2 50 0 0 -2 -1 0 1 2 3 4 5 6 On appelle courbe cumulative croissante le tracé de la fonction N (ou F pour les fréquences) qui à tout réel x associe N( x ) = nombre d'observations inférieur ou égal à x. On appelle courbe cumulative décroissante le tracé de la fonction N' (ou F’ pour les fréquences) qui a tout réel x associe N'( x ) = nombre d'observations supérieur strictement à x. Les courbes cumulatives N(x) et N’(x) sont symétriques par rapport à n/2 : N(x) + N’(x) = n cumulatives F’(x) sont symétriques par rapport à 0,5 : F(x) + F’(x) = 1 Chermak F(x) pour etinfomaths.com 14 Les courbesSaïd TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue (1) VARIABLES QUANTITATIVES CONTINUES Variable observée: augmentation moyenne mensuelle du salaire, en €, des employés d’une multinationale au cours de l’année 2005. Augmentation Effectif 18 4 2 34 21 9 36 8 9 12 38 11 25 34 0 37 16 33 19 18 10 27 43 1 2 22 6 31 15 …. 35 2 22 28 30 39 42 33 2 …. 0 41 26 5 1 11 42 4 21 …. 4 16 11 5 8 0 1 4 0 …. Remarque1 : la variable augmentation moyenne mensuelle peut être considérée comme continue. En arrondissant à l’euro, on l’a discrétisée. Une augmentation de 10 € est en fait une augmentation comprise entre 9,5 € et 10,5 €. Remarque2 : Une variable continue ne prend pas des valeurs isolées, mais des valeurs appartenant à des intervalles. C'est pourquoi, au lieu de définir des effectifs par valeurs, on définira des effectifs par intervalles, appelés classes. Remarque3 : Une variable discrète comportant trop de valeurs est Chermak pour infomaths.com 15 aussi traitéeSaïd comme une variable continue. (€) 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 ….. Total 257 318 255 307 308 159 140 84 72 55 22 13 9 7 8 21 6 2 …. 2125 TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue (2) VARIABLES QUANTITATIVES CONTINUES Augmentation (€) [0 – 3[ [3 – 5[ [5 – 10[ [10 – 20[ [20 – 30[ [30 – 50[ Effectifs 830 615 510 92 63 15 Classes [e 1 – e 2[ [e 2 – e 3[ …. [e k – e k+1[ Effectifs n1 n2 …. nk Remarque 1: Le choix des classes et arbitraire, mais elles doivent être contigües et recouvrir l’ensemble des valeurs. Remarque 2: Il est préférable de prendre des classes d’amplitudes égales. Remarque 3: Il ne faut prendre ni trop ni trop peu de classes. Remarque 4: Le choix et le nombre de classes influent sur les représentations graphiques. 16 Saïd Chermak pour infomaths.com TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue (3) VARIABLES QUANTITATIVES CONTINUES REPRESENTATION GRAPHIQUE DES EFFECTIFS ET FREQUENCES Classes [0 – 3[ [3 – 5[ [5 – 10[ [10 – 20 [ [20 – 30[ [30 – 50[ Effectifs 830 615 510 92 63 15 effectif 900 800 700 600 500 400 300 200 100 50 30 300 250 HISTOGRAMME 200 150 100 50 50 30 0 3 17 [0 – 3[ [3 – 5[ [5 – 10[ [10 – 20 [ [20 – 30[ [30 – 50[ Effectifs Amplitude Effectifs ni ai rectifiés ni /ai 830 3 276,7 615 2 307,5 510 5 102,0 92 10 9,2 63 10 6,3 15 20 0,75 Saïd Chermak pour infomaths.com Effectif rectifié 350 0 Classes 3 0 0 TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue (4) VARIABLES QUANTITATIVES CONTINUES REPRESENTATION GRAPHIQUE DES EFFECTIFS ET FREQUENCES Classes [0 – 3[ [3 – 5[ [5 – 10[ [10 – 20[ [20 – 30[ [30 – 50[ Effectifs Amplitude Effectifs ni ai rectifiés ni /ai 830 3 276,7 615 2 307,5 510 5 102,0 92 10 9,2 63 10 6,3 15 20 0,75 Effectif rectifié 350 300 250 HISTOGRAMME 200 150 100 50 50 30 3 0 0 La surface = ai × (ni/ai) est de 830 unités La surface = ai × (ni/ai) est de 615 unités Dans un histogramme, ce sont les surfaces des rectangles (ce que l’œil voit), qui sont proportionnelles aux effectifs, et non les hauteurs de ces rectangles Remarque: Le tracé de l’histogramme des fréquences est identique. Il suffit de porter en ordonnées la Chermak fréquence rectifiée di = fi/ai, appelée densité. Saïd pour infomaths.com 18 TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue (5) VARIABLES QUANTITATIVES CONTINUES EFFECTIFS ET FREQUENCES CUMULES Classes Variable observée: augmentation moyenne mensuelle du salaire, en €, des employés d’une multinationale au cours de l’année 2005. [ei – ei+1[ [0 – 3[ [3-5[ [ 5 - 10 [ [10 - 20 [ [20 - 30 [ [30 – 50[ Total : Effectifs Effectifs Effectifs Fréquences Fréquences cumulés cumulés cumulées cumulées croissants décroissants croissantes décroissantes ni Ni N’i Fi F’i 830 830 2125 0,391 1,000 615 1445 1295 0,680 0,609 510 1955 680 0,920 0,320 92 2047 170 0,963 0,080 63 2110 78 0,993 0,037 15 2125 15 1,000 0,007 2125 Il y a 1445 employés dont l’augmentation est strictement inférieure à 5 Il y a 170 employés dont l’augmentation est supérieure ou égale à 10 Combien y-a-t-il d’employés dont l’augmentation est inférieure à 17 ? 19 Saïd Chermak pour infomaths.com TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue (6) VARIABLES QUANTITATIVES CONTINUES COURBES CUMULATIVES x −∞ [ei – ei+1[ 0 3 5 Fi [0-3[ 0,391 [3-5[ 0,680 [ 5 - 10 [ 0,920 10 [10 - 20 [ 0,963 20 [20 - 30 [ 0,993 [30 - 50 [ 1,000 30 50 +∞ F(x) F’ ?0 i 1,000 ? 0,391 0,609 ? 0,680 0,320 0,920 0,080 0,963 0,037 0,993 0,007 1 F’i 1,000 0,609 0,320 0,080 0,037 0,007 F’(x) ? 1 l’intérieur A 1 ? 0,9 0,609 de chaque Fi 0,8 classe, on fait 0,320 l’hypothèse 0,080 que la 0,037 répartition est 0,007 uniforme 0,7 F’i 0,6 0,5 0,4 0,3 0,2 0 0,1 0 -10 0 10 20 30 40 50 60 On appelle courbe cumulative croissante le tracé de la fonction F (N pour les effectifs) qui à tout réel x associe F( x ) = nombre d'observations inférieur ou égal à x. On appelle courbe cumulative décroissante le tracé de la fonction F’ (N’ pour les effectifs) qui a tout réel Remarque: Pour une variable continue, il est indifférent de dire « inférieur ou égal » ou x associe F’( x ) = nombre d'observations supérieur strictement à x. « strictement inférieur ». Il en est de même pour « supérieur ou égal » ou « strictement supérieur ». Les courbes cumulatives F(x) et F’(x) sont symétriques par rapport à 0,5 : F(x) + F’(x) = 1 Il n’y a aucune chance qu’une observation tombe sur une borne. C’est l’imprécision de Chermak pour infomaths.com 20 l’instrumentSaïd de mesure et un mauvais choix des bornes qui pourrait conduire à ce résultat. TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue (7) VARIABLES QUANTITATIVES CONTINUES COURBES CUMULATIVES Quelle est la proportion p d’employés dont l’augmentation est inférieure à 17 € ? x [ei – ei+1[ Fi F(x) 0 0 [0-3[ 0,391 1 0,950,9 0,391 3 [3-5[ 0,8 0,680 0,7 0,680 5 [ 5 - 10 [ 0,6 0,5 0,920 0,4 10 0,920 p 17 [10 - 20 [ 0,963 0,963 20 [20 - 30 [ 0,993 30 0,993 [30 - 50 [ 1 50 1 17 - 10 20 - 10 21 = p - 0,92 0,963-0,920 Saïd Chermak 0,3 0,2 0,1 0 -10 0 10 D'où p = 0,92 + pour infomaths.com 20 17 30 40 50 60 17 − 10 ( 0,963 − 0,920 ) ≈ 95% 20 − 10 TABLEAUX ET GRAPHIQUES RESUME VARIABLE QUALITATIVE VARIABLE QUANTITATIVE Nominale Discrète Ordinale Effectifs ou Fréquences Diagramme en barres Diagramme circulaire 22 Diagramme en barres Modalités dans l ’ordre Saïd Chermak pour infomaths.com Continue Effectifs ou Fréquences Diagramme en bâtons Histogramme Courbes cumulatives des effectifs ou des fréquences PARAMETRES STATISTIQUES 23 Saïd Chermak pour infomaths.com PARAMETRES STATISTIQUES Les représentations graphiques ont permis une première synthèse visuelle de la distribution des observations Un paramètre statistique permet de résumer par une seule quantité numérique une information contenue dans une distribution d’observations. ! Les paramètres statistiques ne concernent que les variables quantitatives Variable 3000 3000 2500 2500 2500 2000 2000 Tendance centrale 1500 1000 500 500 0 N° individu Saïd Chermak 100 % - A % Position A% 1500 1000 0 24 Variable Variable 3000 2000 Dispersion 1500 1000 500 0 0 0 pour infomaths.com N° individu 0 N° individu PARAMETRES STATISTIQUES Position Tendance centrale Dispersion (1) PARAMETRES DE TENDANCE CENTRALE LE MODE Une distribution est unimodale si elle présente un maximum marqué, et pas d'autres maxima relatifs. La lecture s’effectue sur le diagramme en bâtons ou l'histogramme. 100 90 140 80 120 70 100 60 80 50 60 40 30 40 20 20 10 0 0 0 1 2 3 4 5 6 Mode 900 1400 Mode 1900 2400 2900 3500 Classe modale Le mode correspond à l'abscisse du maximum, c.à.d. la valeur la plus fréquente 25 Saïd Chermak pour infomaths.com ou plus... PARAMETRES STATISTIQUES Position Tendance centrale Dispersion (2) PARAMETRES DE TENDANCE CENTRALE LE MODE Si la distribution présente 2 ou plus maxima relatifs, on dit qu'elle est bimodale ou plurimodale. La population est composée de plusieurs sous-populations ayant des caractéristiques de tendance centrale différentes. 90 80 140 70 120 60 100 50 80 40 60 30 40 20 20 10 0 0 0 1 2 Mode 1 26 3 Saïd Chermak 4 5 Mode 2 6 pour infomaths.com 900 1400 1900 2400 Mode 1 2900 3500 4000 4500 Mode 2 ou plus... PARAMETRES STATISTIQUES Position Tendance centrale Dispersion (3) PARAMETRES DE TENDANCE CENTRALE LA MEDIANE Les valeurs observées doivent être rangées par ordre croissant. La médiane M est la valeur du milieu de la série d’observations, c.à.d. telle qu'il y ait autant d'observations "au-dessous" que "au-dessus". Nombre impair d’observations 3 4 4 4 valeurs 27 5 6 M Saïd Chermak 8 8 9 10 4 valeurs Nombre pair d’observations 3 4 4 4 valeurs 5 6 8 8 4 valeurs Intervalle médian M = milieu = 5,5 pour infomaths.com 9 PARAMETRES STATISTIQUES Position Tendance centrale Dispersion (4) PARAMETRES DE TENDANCE CENTRALE LA MEDIANE à partir d’une distribution discrète xi M -2 28 -1 ni F(x) Fi 0 103 0,286 0 1 115 0,606 0,286 2 95 0,869 3 35 0,967 4 10 0,994 5 2 1 0,606 0,5 0,869 Intervalle médian M = milieu = 1,5 0,967 0,994 1 1 1 0,5 0,5 0 0 1 2 3 M Saïd Chermak 4 5 6 pour infomaths.com -2 -1 0 0 xi ni Fi 0 103 0,286 1 77 0,500 2 95 0,764 3 35 0,861 4 10 0,889 5 40 1 1 2 3 Intervalle médian M = milieu = 1,5 F(x) 0 0,286 0,500 0,5 0,764 0,861 0,889 1 4 5 6 PARAMETRES STATISTIQUES Position Tendance centrale Dispersion (5) PARAMETRES DE TENDANCE CENTRALE LA MEDIANE à partir d’une distribution continue x [ei – ei+1[ Fi F(x) 0 0 [0-3[ 3 M 5 0,391 [3-5[ [ 5 - 10 [ 10 [10 - 20 [ 20 [20 - 30 [ 30 [30 - 50 [ 50 M-3 5-3 29 = 0,391 0,680 0,5 0,680 0,920 0,920 0,963 0,963 0,993 0,993 1 1 0,5-0,391 0,680-0,391 Saïd Chermak pour infomaths.com 1 0,9 0,8 0,7 0,6 0,5 0,5 0,4 0,3 0,2 0,1 0 -10 0 3,2210 M D'où M = 3 + 20 30 40 50 60 0,5 − 0,391 ( 5 − 3) ≈ 3, 22 0,680 − 0,391 PARAMETRES STATISTIQUES Tendance centrale Position Dispersion (6) PARAMETRES DE TENDANCE CENTRALE LA MOYENNE ARITHMETIQUE La moyenne arithmétique est notée x Série brute x1, x2, … , xn Série groupée 30 1 n x = ∑ xi n i=1 Valeurs de Effectifs Fréquences la variable x1 n1 f1= n1/n … … … xi ni fi= ni/n … … … xk nk fk= nk/n Saïd Chermak pour infomaths.com 1 k x = ∑ ni xi n i=1 k nixi k =∑ =∑ fi x i i=1 n i=1 PARAMETRES STATISTIQUES Tendance centrale Position Dispersion (7) PARAMETRES DE TENDANCE CENTRALE LA MOYENNE ARITHMETIQUE Série classée Classes Effectifs Fréquences Centres de classe x 1= ( e 1 + e 2)/2 [e1 – e2[ n1 f1 x 2= ( e 2 + e 3)/2 [e2 – e3[ n2 f2 …. …. …. …. x k= ( e k + e k+1)/2 [ek – ek+1[ nk fk k 1 k x = ∑ n i x i = ∑ fi x i n i=1 i=1 31 Saïd Chermak pour infomaths.com PARAMETRES STATISTIQUES Position Tendance centrale Dispersion (8) PARAMETRES DE TENDANCE CENTRALE LA MOYENNE ARITHMETIQUE Comment faire la moyenne de plusieurs populations ? Population P2 Population P1 Effectif n2 Moyenne x 2 Effectif n1 Moyenne x1 Population P = P1 U P2 Effectif Moyenne n = n1+ n2 x? k nixi nx +n x x= 1 1 2 2 =∑ n i=1 n 32 Saïd Chermak pour infomaths.com Moyenne globale = moyenne des moyennes PARAMETRES STATISTIQUES Tendance centrale Position Dispersion (9) PARAMETRES DE TENDANCE CENTRALE PROPRIETES GENERALES z=ax+b y=ax x P (x) = moyenne, médiane, mode 33 P (y) = a P (x) Saïd Chermak pour infomaths.com P (z) = a P (x) + b PARAMETRES STATISTIQUES Tendance centrale Position Dispersion (10) PARAMETRES DE TENDANCE CENTRALE MOYENNES GEOMETRIQUE ET HARMONIQUE Moyenne géométrique G= n x1n1 x 2n 2 .....x kn k Utilisée dans le cas de phénomènes multiplicatifs (taux de croissance moyen) Moyenne harmonique H= n k n i ∑x i=1 34 i Utilisée dans le cas où l’on combine 2 variables sous forme de rapport (pièces/heure, km/litre,…) Saïd Chermak pour infomaths.com PARAMETRES STATISTIQUES Tendance centrale Position Dispersion (1) PARAMETRES DE POSITION LES FRACTILES OU QUANTILES On appelle fractiles ou quantiles d'ordre k les (k-1) valeurs qui divisent les observations en k parties d'effectifs égaux. 1 médiane M qui divise les observations en 2 parties égales 3 quartiles Q1, Q2, Q3 qui divisent les observations en 4 parties égales 9 déciles D1, D2, …, D9 qui divisent les observations en 10 parties égales 99 centiles C1, C2, …, C99 qui divisent les observations en 100 parties égales 35 Saïd Chermak pour infomaths.com PARAMETRES STATISTIQUES Position Tendance centrale Dispersion (2) PARAMETRES DE POSITION LES FRACTILES OU QUANTILES Quartiles, déciles, centiles s’obtiennent de la même façon que la médiane. Variable continue Variable discrète 1 0,9 1 0,9 0,8 0,75 0,7 0,75 0,6 0,5 0,5 0,5 0,4 0,3 0,2 0,2 -2 -1 0,1 0 0 0 1 D2 M 36 2 3 4 5 6 Q3 Saïd Chermak pour infomaths.com -10 0 10 MQ3D 9 20 30 40 50 60 PARAMETRES STATISTIQUES Tendance centrale Position Dispersion (3) PARAMETRES DE POSITION PROPRIETES GENERALES z=ax+b 100 % - A % y=ax 100 % - A % x A% 100 % - A % A% A% Q (x) = quantile 37 Q (y) = a Q (x) Saïd Chermak pour infomaths.com Q (z) = a Q (x) + b PARAMETRES STATISTIQUES Tendance centrale Position Dispersion (1) PARAMETRES DE DISPERSION Etendue : R = xmax - xmin Intervalle interquartile : IQ = Q3 - Q1 Variance : Série brute : 1 n 2 V = ∑ ( xi - x ) n i=1 Série groupée ou classée : k 1 k 2 2 V = ∑ n i ( x i - x ) = ∑ fi ( x i - x ) n i=1 i=1 1 k V = ∑ n i x i2 − x 2 = Moyenne des carrés - Carré de la moyenne n i=1 Ecart-type : 38 σ= V Saïd Chermak pour infomaths.com PARAMETRES STATISTIQUES Position Tendance centrale Dispersion (2) PARAMETRES DE DISPERSION Comment faire la variance de plusieurs populations ? Population P2 Population P1 Effectif n2 Moyenne x 2 Variance V2 Effectif n1 Moyenne x1 Variance V1 Population P = P1 U P2 Effectif Moyenne Variance n = n1+ n2 x V? 2 1 k 1 k V = ∑ n i Vi + ∑ n i ( x i -x ) n i=1 n i=1 39 Saïd Chermakglobale pour infomaths.com Variance = Moyenne des variances + Variance des moyennes PARAMETRES STATISTIQUES Tendance centrale Position Dispersion (3) PARAMETRES DE DISPERSION PROPRIETES GENERALES z=ax+b y=ax x P (x) = étendue, écart-type, P (y) = a P (x) intervalle interquartile Saïd Chermak pour infomaths.com 40 P (z) = a P (x)