Telechargé par Marzak Zerouki

résumé stat L2 S3 2015-2016 zerouki chapitre I

publicité
Généralités sur les statistiques
Définition de la statistique
Définition : La statistique désigne à la fois un ensemble de données et l’ensemble des activités consistant à
collecter ces données, à les traiter et à les interpréter.
Domaine d’application : démographie, contrôles de qualité, études de marché, sciences expérimentales.
Les types des statistiques
Statistiques descriptive ou déductive
Statistiques inférentielle ou inductive
Le traitement des données, pour en dégager un
certain nombre de renseignements qualitatifs
ou quantitatifs à des fins de comparaison.
Consiste à extrapoler à partir d’un échantillon
de la population à étudier, le comportement de
la population dans son ensemble.
Vocabulaire des statistiques descriptives
Population
Individus
Les éléments de
population.(unités
statistiques)
L’ensemble sur lequel
porte
L’activité
statistique.
Caractère
Les caractéristiques étudiées
la
Qualitatif
Quantitatif
Une variable dont les
valeurs ne sont pas
mesurables (ce ne sont
pas des nombres).
Une variable dont les
valeurs sont mesurables
ou repérables par des
nombres réels.
Exp : couleur, sexe.
Exp : Taille, poids.
Caractère Quantitatif
Valeurs xi
Discret
Continu
Classes [ai, ai+1[
Une petite quantité des données
Une grande quantité des données
Effectif de la valeur xi
Effectif de [ai, ai+1[ :
Amplitude : a= ai- ai+1
Effectif cumulé en xi
Effectif cumulé en ai
Le nombre de valeurs prises dans
l’intervalle ] −∞, ai]
=
Effectif total
=
Effectif total
=
Fréquence de la valeur xi
Fréquence de [ai, ai+1[
=
=
Fréquence cumulée en xi
Fréquence cumulée en ai
=
Mr. ZEROUKI
=
1
Représentation graphique
Continu
Discret
Diagramme en bâton
Des effectifs
Histogramme
Des fréquences
Constitué d'une suite de segments verticaux d'abscisses
xi dont la longueur est proportionnelle à l'effectif (resp.
la fréquence) de xi.
ni
ai égales
ai pas égales
On met ni ou fi sur
l’axe des ordonnées.
On met mi effectif
corrigé sur l’axe
des ordonnées.
ni
ou
fi
ou
mi
ou
fi
=
xi
]ai , ai+1[
Polygone
Des effectifs
Polygone
Des fréquences
Des effectifs
est obtenu à partir du diagramme en bâtons des effectifs
(resp. des fréquences) en joignant par un segment les
sommets des bâtons.
Des fréquences
est obtenu en joignant dans l'histogramme de cette
distribution les milieux des côtés horizontaux
supérieurs.
ni
ni
ou
ou
fi
fi
xi
[ai , ai+1[
Polygone
Des effectifs
cumulés
Polygone
Des fréquences cumulées
Des fréquences
cumulées
La représentation graphique de la fonction définie sur
chaque classe :
est obtenu à partir du diagramme en bâtons des effectifs
cumulés (resp. des fréquences cumulées) en joignant
par un segment les sommets des bâtons.
ni cum
( )=
−
−
ni cum
ou
ou
fi cum
fi cum
xi
Mr. ZEROUKI
+
[ai , ai+1[
2
La moyenne
Continu
Discret
=
=
=
=
Centre de la classe [ai ,
ai+1[ :
=
Le mode et la classe modale
Discret (le mode) Mo
Paramètres de position
La valeur xi qui a une fréquence est maximale
Continu (classe modale)
La classe qui a un rapport fréquence/longueur
maximal ( ⁄ )
Calculer la valeur modale Mo de la classe modale
1
3
Centre de la classe modale
+
=
Méthode numérique
=
2
Méthode des diagonales
(graphique)
+
(
(
−
−
)+(
)
−
)
: Le plus petit caractère de la classe
médiane.
Si les classes sont inégales, on calcule Mo
avec les effectifs corrigés :
G
=
,
=
,
=
Mo
Les quartiles Q1, Q2, Q3
Qui correspondent aux fréquences cumulées 25, 50, et 75%. Ils
partagent l’ensemble des observations en 3 parties de même effectif.
 25% des valeurs prises par la
série sont inférieures à Q1 ;
 25% des valeurs prises par la
série sont supérieures à Q3 ;
(
) = (25%),
(
=
) = (50%),
(
) = (75%)
 Q2 est la médiane Me (50%);
 Q3 − Q1 est l’intervalle
interquartile, il contient 50% des
valeurs de la série.
=
La médiane Me
Une valeur du caractère qui partage la population en deux parties de même effectif (50%).
Discret
(
)=
( ): (Fonction cumulative) La proportion
des individus dont les caractères est inférieure
ou égale à la médiane.
Mr. ZEROUKI
Continu
( )=
Déterminer La classe médiane avec
puis en utilisant la méthode d’interpolation linéaire
−
−
=
(
(
)− ( )
)− ( )
3
Ecart moyen
Pour évaluer la dispersion autour de la moyenne, on
détermine les écarts entre cette moyenne et les diverses
valeurs de la variable.
Continu
Discret
(
=
− )=
(
− )
(
=
− )=
(
− )
Paramètres de dispersion
La variance v
Un indicateur de la dispersion d’une série par rapport à sa moyenne.
Le défaut de l'écart-moyen est de donner la même importance à toutes les valeurs. Or, on a constaté qu'on obtient
une meilleure mesure de la dispersion si on accorde plus de poids aux valeurs de la variable qui s'éloignent plus
de la valeur moyenne. Au lieu de considérer les écarts, on considère les carrés des écarts. Plus l'écart est grand,
plus son carré augmente.
Continu
Discret
=
(
− ) =
(
− )
(
=
− ) =
(
− )
Ecart type
=√
- Si l’écart-type est faible, cela signifie que les valeurs sont
assez concentrées autour de la moyenne.
- Si l’écart-type est élevé, cela veut dire au contraire que les
valeurs sont plus dispersées autour de la moyenne.
Coefficient de variation Cv
=
=
Ou
(
%) =
Il pourrait cependant être utile de comparer des distributions issues d'échelles de grandeurs différentes ou
d'unités de mesure différentes Dans ce cas, on peut utiliser un coefficient de variation qui permet de
ramener la valeur de n'importe quelle dispersion sur une même échelle.
Etendue et Etendue interquartile
Etendue e
La différence entre la plus grande et la plus
petite des valeurs prises :
=
Mr. ZEROUKI
−
Etendue interquartile EIQ
La différence entre les quartiles Q0,75 et Q0,25
=
,
−
,
4
Téléchargement