2016-2017 Sciences Analytiques
STATISTIQUE DESCRIPTIVE
– UE :8
Semaine : n°1 (du 05/09/2016 au
09/09/2016)
Date : 09/09/2016
Heure : de 8h30 à
10h30 Professeur : Pr. M. Lemdani
Binôme : n°19 Correcteur :
Suite et fin du cours du 08/09/2016
I) MOYENNE ET VARIANCE
VOIR COURS DU 08/09/2016
II) MEDIANE ET QUARTILES
A) La médiane
B) Les Quartiles
III) NOTION DE DISTRIBUTION D'UNE VARIABLE
A) Dispersion et densité de probabilité
B) Détermination de la forme de la distribution
C) Rappel sur l'estimation
D) Rappel sur les décimales
E) La Normalité
1) TABLE de la loi normale
2) Valeurs importantes
3) Log-normalité
IV) ECHANTILLONAGE
A) Échantillonnage en moyenne
B) Ecart-type de la moyenne
1/11
2016-2017 Sciences Analytiques
II) MEDIANE ET QUARTILES
Il s'agit d'un alternatif à l'utilisation de l'écart type et de la moyenne. Toutefois l'utilisation de ces deux
dernières est privilégiées, il existe cependant des situations où l'utilisation de la moyenne et de l'écart-
type n'est pas adaptées.
La moyenne permettant de mesurer la tendance centrale
L'écart-type permettant de mesurer la dispersion
A) La médiane
La médiane : est l'observation centrale. C'est la valeur telle que l'on a 50% des observations
Avant ET Après.
Pour la trouver il suffit de ranger les valeurs par ordre croissant.
Exemple :
X1 la plus petite observation (et non la première mesuré dans le temps!), X2 la deuxième plus
grande, etc...
Calcul la médiane : en fonction d'un nombre d'observation pair ou impair ?
Exemple :
Si on a 5 observations, la 3ème est la médiane (on en a 2 avant et 2 après)
Si on a 4 observations, c'est la moyenne de la 2ème et de la 3ème valeurs
Pour les fans de formules :
Me = (n+1) / 2
Sachant que n est le nombre d'observation
2/11
2016-2017 Sciences Analytiques
La médiane est donc une mesure alternative à la moyenne de tendance centrale. Toutefois, la médiane et
la moyenne peuvent se confondre : si les observations sont bien symétriques la valeur centrale est à la
fois la médiane et la moyenne. Mais si la dispersion est asymétrique, la moyenne et la médiane
s'éloigneront.
B) Les Quartiles
Même principe, on a la valeur minimale et la valeur max , et la valeur médiane.
Nous nous intéressons ici à une mesure de la dispersion.
L'écart type décrivant la dispersion autour de la moyenne, ici le quartile illustre la dispersion autour de
la médiane.
L'idée est de rester sur ce principe de partage de l'échantillon.
Avec la médiane on a coupé l'échantillon en 2. Pour le quartile nous le coupons donc en 4.
Les Quartiles : les valeur a partir de laquelle on a
-le quart d'observation le plus faible : Q1, le premier quartile
-le quart d'observation le plus fort : Q3, le troisième quartile
Si nous nous situons entre Q1 et Q3, nous avons la moitié des observations qui sont ni trop petites ni trop
grande. Cet espace est appelé l'intervalle inter-quartile.
Calcul des Quartiles :
On peut très bien le faire « à la main », ranger les observations et se placer au quart. Ou sinon utiliser la
formule.
Formules :
Q1 = (n+1) / 4 Q3 = ¾ (n+1)
Avec n le nombre d'observation
Ces paramètres sont intéressants à calculer mais nous utiliserons le plus souvent la moyenne et l'écart-
type, sauf si ces deux paramètres ne sont pas pertinent.
3/11
2016-2017 Sciences Analytiques
III) NOTION DE DISTRIBUTION D'UNE VARIABLE
La distribution de la variable est une notion qui va être exhaustive en terme de caractérisation de la
variable.
Si on reprend l'exemple du titrage, et que l'on trouve une moyenne des variables observées de 8 mL, on
ne sait pas si nos valeurs sont systématiquement entre 7,95 et 8,05 ou entre 7 et 9.
La moyenne et l'écart-type ne suffisent pas à décrire l'ensemble des données.
Nous avons besoin de décrire la distribution pour être complet.
A) Dispersion et densité de probabilité
Avec ces 2 séries d'observations :
À travers ce dessin est-ce que le fait de donner la moyenne, l'écart-type suffit à avoir une vue d'ensemble
des observations ?
Echantillon 1 : la moyenne et le point d équilibre c'est x1.
Echantillon 2 : si on regarde les 5 observation, dans les 3, il y en a 2 qui sont très grandes. La moyenne
peut être placé au même endroit.
-Dans les 2 séries on a la même moyenne. Mais une moyenne identique ne signifie pas pour que l'on ait
le même genre de valeurs.
Dans le premier échantillon nos valeurs sont uniformes, alors que dans le deuxième échantillon, on voit
que beaucoup d'observations sont très éloignées.
-De même au niveau de l'écart-type. Si on calcul l'écart type on aurait a peu près la même valeur dans les
deux échantillons.
Ce qui montre bien que la moyenne et de l'écart-type ne nous donne pas une connaissance complète des
observations.
Rappel : la moyenne donne la tendance centrale (au niveau de quelle valeur je me trouve) : l'écart-type
donne la dispersion (de combien je me dispersion, mais on ne sait pas de comment je me disperse, c'est à
dire plus/moins à gauche ou à droite).
B) Détermination de la forme de la distribution
Pour être complet en terme d'informations de l'échantillon, il faut prendre l'ensemble des données et
utiliser une représentation graphique qui rend compte de la répartition et distribution des données.
On utilisera un histogramme.
L'histogramme décrit parfaitement la densité au niveau de l'échantillon.
Exemple : 50 déterminations à deux décimales près du pH d'une solution tampon ont fourni les résultats suivants
4/11
2016-2017 Sciences Analytiques
Valeurs 5,12 5,13 5,14 5,15 5,16 5,17 5,18
Fréquence 3 5 9 13 11 7 2
Nous notons une forme d'erreur aléatoire au niveau de l'imprécision.
Cette imprécision est telle plus à droite ou à gauche ?
Quelle est la forme de répartition qui permet de penser la former de l'erreur ?
Nous pouvons y répondre en dessinant l'histogramme de ce tableau.
C) Rappel sur l'estimation (différence entre moyenne de l'échantillon et de
la population)
Il s'agit ici d'une solution tampon. C'est à dire qu'elle a une valeur bien précise pour son pH.
Toutes les valeurs relevées sont en réalité des mesures et non pas le réel pH (théorique).
Quand on calcul la moyenne et l'écart-type des 50 valeurs :
x(moy) =5,1506 et s(écart-type) =0,015174
Si on refait une deuxième série de 50 observations, la moyenne et l'écart-type ne seront pas égales aux
valeurs précédentes.
C'est à dire que « x » et « s », sont la moyenne et l'écart-type des 50 observations, c'est à dire de
l'échantillon.
La vraie valeur du pH , c'est la moyenne de la population « μ » .
-Lorsque l'on effectue un dosage on essaie de se rapprocher de la moyenne mais de la VRAIE
moyenne c'est à dire de la POPULATION (avec lettre GRECQUES « μ »).
Même chose pour l'écart type en POPULATION «σ » .
5/11
1 / 11 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !