Généralités sur les statistiques Définition de la statistique Définition : La statistique désigne à la fois un ensemble de données et l’ensemble des activités consistant à collecter ces données, à les traiter et à les interpréter. Domaine d’application : démographie, contrôles de qualité, études de marché, sciences expérimentales. Les types des statistiques Statistiques descriptive ou déductive Statistiques inférentielle ou inductive Le traitement des données, pour en dégager un certain nombre de renseignements qualitatifs ou quantitatifs à des fins de comparaison. Consiste à extrapoler à partir d’un échantillon de la population à étudier, le comportement de la population dans son ensemble. Vocabulaire des statistiques descriptives Population Individus Les éléments de population.(unités statistiques) L’ensemble sur lequel porte L’activité statistique. Caractère Les caractéristiques étudiées la Qualitatif Quantitatif Une variable dont les valeurs ne sont pas mesurables (ce ne sont pas des nombres). Une variable dont les valeurs sont mesurables ou repérables par des nombres réels. Exp : couleur, sexe. Exp : Taille, poids. Caractère Quantitatif Valeurs xi Discret Continu Classes [ai, ai+1[ Une petite quantité des données Une grande quantité des données Effectif de la valeur xi Effectif de [ai, ai+1[ : Amplitude : a= ai- ai+1 Effectif cumulé en xi Effectif cumulé en ai Le nombre de valeurs prises dans l’intervalle ] −∞, ai] = Effectif total = Effectif total = Fréquence de la valeur xi Fréquence de [ai, ai+1[ = = Fréquence cumulée en xi Fréquence cumulée en ai = Mr. ZEROUKI = 1 Représentation graphique Continu Discret Diagramme en bâton Des effectifs Histogramme Des fréquences Constitué d'une suite de segments verticaux d'abscisses xi dont la longueur est proportionnelle à l'effectif (resp. la fréquence) de xi. ni ai égales ai pas égales On met ni ou fi sur l’axe des ordonnées. On met mi effectif corrigé sur l’axe des ordonnées. ni ou fi ou mi ou fi = xi ]ai , ai+1[ Polygone Des effectifs Polygone Des fréquences Des effectifs est obtenu à partir du diagramme en bâtons des effectifs (resp. des fréquences) en joignant par un segment les sommets des bâtons. Des fréquences est obtenu en joignant dans l'histogramme de cette distribution les milieux des côtés horizontaux supérieurs. ni ni ou ou fi fi xi [ai , ai+1[ Polygone Des effectifs cumulés Polygone Des fréquences cumulées Des fréquences cumulées La représentation graphique de la fonction définie sur chaque classe : est obtenu à partir du diagramme en bâtons des effectifs cumulés (resp. des fréquences cumulées) en joignant par un segment les sommets des bâtons. ni cum ( )= − − ni cum ou ou fi cum fi cum xi Mr. ZEROUKI + [ai , ai+1[ 2 La moyenne Continu Discret = = = = Centre de la classe [ai , ai+1[ : = Le mode et la classe modale Discret (le mode) Mo Paramètres de position La valeur xi qui a une fréquence est maximale Continu (classe modale) La classe qui a un rapport fréquence/longueur maximal ( ⁄ ) Calculer la valeur modale Mo de la classe modale 1 3 Centre de la classe modale + = Méthode numérique = 2 Méthode des diagonales (graphique) + ( ( − − )+( ) − ) : Le plus petit caractère de la classe médiane. Si les classes sont inégales, on calcule Mo avec les effectifs corrigés : G = , = , = Mo Les quartiles Q1, Q2, Q3 Qui correspondent aux fréquences cumulées 25, 50, et 75%. Ils partagent l’ensemble des observations en 3 parties de même effectif. 25% des valeurs prises par la série sont inférieures à Q1 ; 25% des valeurs prises par la série sont supérieures à Q3 ; ( ) = (25%), ( = ) = (50%), ( ) = (75%) Q2 est la médiane Me (50%); Q3 − Q1 est l’intervalle interquartile, il contient 50% des valeurs de la série. = La médiane Me Une valeur du caractère qui partage la population en deux parties de même effectif (50%). Discret ( )= ( ): (Fonction cumulative) La proportion des individus dont les caractères est inférieure ou égale à la médiane. Mr. ZEROUKI Continu ( )= Déterminer La classe médiane avec puis en utilisant la méthode d’interpolation linéaire − − = ( ( )− ( ) )− ( ) 3 Ecart moyen Pour évaluer la dispersion autour de la moyenne, on détermine les écarts entre cette moyenne et les diverses valeurs de la variable. Continu Discret ( = − )= ( − ) ( = − )= ( − ) Paramètres de dispersion La variance v Un indicateur de la dispersion d’une série par rapport à sa moyenne. Le défaut de l'écart-moyen est de donner la même importance à toutes les valeurs. Or, on a constaté qu'on obtient une meilleure mesure de la dispersion si on accorde plus de poids aux valeurs de la variable qui s'éloignent plus de la valeur moyenne. Au lieu de considérer les écarts, on considère les carrés des écarts. Plus l'écart est grand, plus son carré augmente. Continu Discret = ( − ) = ( − ) ( = − ) = ( − ) Ecart type =√ - Si l’écart-type est faible, cela signifie que les valeurs sont assez concentrées autour de la moyenne. - Si l’écart-type est élevé, cela veut dire au contraire que les valeurs sont plus dispersées autour de la moyenne. Coefficient de variation Cv = = Ou ( %) = Il pourrait cependant être utile de comparer des distributions issues d'échelles de grandeurs différentes ou d'unités de mesure différentes Dans ce cas, on peut utiliser un coefficient de variation qui permet de ramener la valeur de n'importe quelle dispersion sur une même échelle. Etendue et Etendue interquartile Etendue e La différence entre la plus grande et la plus petite des valeurs prises : = Mr. ZEROUKI − Etendue interquartile EIQ La différence entre les quartiles Q0,75 et Q0,25 = , − , 4