09 09 16 8h30 10h30 statdescriptive lemdani

Téléchargement

2016-2017 Sciences Analytiques

STATISTIQUE DESCRIPTIVE

– UE :8

Semaine : n°1 (du 05/09/2016 au

09/09/2016)

Date : 09/09/2016

Heure : de 8h30 à

10h30 Professeur : Pr. M. Lemdani

Binôme : n°19 Correcteur :

Suite et fin du cours du 08/09/2016

I) MOYENNE ET VARIANCE

VOIR COURS DU 08/09/2016

II) MEDIANE ET QUARTILES

A) La médiane

B) Les Quartiles

III) NOTION DE DISTRIBUTION D'UNE VARIABLE

A) Dispersion et densité de probabilité

B) Détermination de la forme de la distribution

C) Rappel sur l'estimation

D) Rappel sur les décimales

E) La Normalité

1) TABLE de la loi normale

2) Valeurs importantes

3) Log-normalité

IV) ECHANTILLONAGE

A) Échantillonnage en moyenne

B) Ecart-type de la moyenne

1/11

2016-2017 Sciences Analytiques

II) MEDIANE ET QUARTILES

Il s'agit d'un alternatif à l'utilisation de l'écart type et de la moyenne. Toutefois l'utilisation de ces deux

dernières est privilégiées, il existe cependant des situations où l'utilisation de la moyenne et de l'écart-

type n'est pas adaptées.

La moyenne permettant de mesurer la tendance centrale

L'écart-type permettant de mesurer la dispersion

A) La médiane

La médiane : est l'observation centrale. C'est la valeur telle que l'on a 50% des observations

Avant ET Après.

Pour la trouver il suffit de ranger les valeurs par ordre croissant.

Exemple :

X1 la plus petite observation (et non la première mesuré dans le temps!), X2 la deuxième plus

grande, etc...

Calcul la médiane : en fonction d'un nombre d'observation pair ou impair ?

Exemple :

Si on a 5 observations, la 3ème est la médiane (on en a 2 avant et 2 après)

Si on a 4 observations, c'est la moyenne de la 2ème et de la 3ème valeurs

Pour les fans de formules :

Me = (n+1) / 2

Sachant que n est le nombre d'observation

2/11

2016-2017 Sciences Analytiques

La médiane est donc une mesure alternative à la moyenne de tendance centrale. Toutefois, la médiane et

la moyenne peuvent se confondre : si les observations sont bien symétriques la valeur centrale est à la

fois la médiane et la moyenne. Mais si la dispersion est asymétrique, la moyenne et la médiane

s'éloigneront.

B) Les Quartiles

Même principe, on a la valeur minimale et la valeur max , et la valeur médiane.

Nous nous intéressons ici à une mesure de la dispersion.

L'écart type décrivant la dispersion autour de la moyenne, ici le quartile illustre la dispersion autour de

la médiane.

L'idée est de rester sur ce principe de partage de l'échantillon.

Avec la médiane on a coupé l'échantillon en 2. Pour le quartile nous le coupons donc en 4.

Les Quartiles : les valeur a partir de laquelle on a

-le quart d'observation le plus faible : Q1, le premier quartile

-le quart d'observation le plus fort : Q3, le troisième quartile

Si nous nous situons entre Q1 et Q3, nous avons la moitié des observations qui sont ni trop petites ni trop

grande. Cet espace est appelé l'intervalle inter-quartile.

Calcul des Quartiles :

On peut très bien le faire « à la main », ranger les observations et se placer au quart. Ou sinon utiliser la

formule.

Formules :

Q1 = (n+1) / 4 Q3 = ¾ (n+1)

Avec n le nombre d'observation

Ces paramètres sont intéressants à calculer mais nous utiliserons le plus souvent la moyenne et l'écart-

type, sauf si ces deux paramètres ne sont pas pertinent.

3/11

2016-2017 Sciences Analytiques

III) NOTION DE DISTRIBUTION D'UNE VARIABLE

La distribution de la variable est une notion qui va être exhaustive en terme de caractérisation de la

variable.

Si on reprend l'exemple du titrage, et que l'on trouve une moyenne des variables observées de 8 mL, on

ne sait pas si nos valeurs sont systématiquement entre 7,95 et 8,05 ou entre 7 et 9.

La moyenne et l'écart-type ne suffisent pas à décrire l'ensemble des données.

Nous avons besoin de décrire la distribution pour être complet.

A) Dispersion et densité de probabilité

Avec ces 2 séries d'observations :

À travers ce dessin est-ce que le fait de donner la moyenne, l'écart-type suffit à avoir une vue d'ensemble

des observations ?

Echantillon 1 : la moyenne et le point d équilibre c'est x1.

Echantillon 2 : si on regarde les 5 observation, dans les 3, il y en a 2 qui sont très grandes. La moyenne

peut être placé au même endroit.

-Dans les 2 séries on a la même moyenne. Mais une moyenne identique ne signifie pas pour que l'on ait

le même genre de valeurs.

Dans le premier échantillon nos valeurs sont uniformes, alors que dans le deuxième échantillon, on voit

que beaucoup d'observations sont très éloignées.

-De même au niveau de l'écart-type. Si on calcul l'écart type on aurait a peu près la même valeur dans les

deux échantillons.

Ce qui montre bien que la moyenne et de l'écart-type ne nous donne pas une connaissance complète des

observations.

Rappel : la moyenne donne la tendance centrale (au niveau de quelle valeur je me trouve) : l'écart-type

donne la dispersion (de combien je me dispersion, mais on ne sait pas de comment je me disperse, c'est à

dire plus/moins à gauche ou à droite).

B) Détermination de la forme de la distribution

Pour être complet en terme d'informations de l'échantillon, il faut prendre l'ensemble des données et

utiliser une représentation graphique qui rend compte de la répartition et distribution des données.

On utilisera un histogramme.

L'histogramme décrit parfaitement la densité au niveau de l'échantillon.

Exemple : 50 déterminations à deux décimales près du pH d'une solution tampon ont fourni les résultats suivants

4/11

2016-2017 Sciences Analytiques

Valeurs 5,12 5,13 5,14 5,15 5,16 5,17 5,18

Fréquence 3 5 9 13 11 7 2

Nous notons une forme d'erreur aléatoire au niveau de l'imprécision.

Cette imprécision est telle plus à droite ou à gauche ?

Quelle est la forme de répartition qui permet de penser la former de l'erreur ?

Nous pouvons y répondre en dessinant l'histogramme de ce tableau.

C) Rappel sur l'estimation (différence entre moyenne de l'échantillon et de

la population)

Il s'agit ici d'une solution tampon. C'est à dire qu'elle a une valeur bien précise pour son pH.

Toutes les valeurs relevées sont en réalité des mesures et non pas le réel pH (théorique).

Quand on calcul la moyenne et l'écart-type des 50 valeurs :

x(moy) =5,1506 et s(écart-type) =0,015174

Si on refait une deuxième série de 50 observations, la moyenne et l'écart-type ne seront pas égales aux

valeurs précédentes.

C'est à dire que « x » et « s », sont la moyenne et l'écart-type des 50 observations, c'est à dire de

l'échantillon.

La vraie valeur du pH , c'est la moyenne de la population « μ » .

-Lorsque l'on effectue un dosage on essaie de se rapprocher de la moyenne mais de la VRAIE

moyenne c'est à dire de la POPULATION (avec lettre GRECQUES « μ »).

–Même chose pour l'écart type en POPULATION «σ » .

5/11

1 / 11 100%

Documents connexes

Statistiques

RTF - Census at School Canada

Chapitre IV : Statistiques Extrait du programme : I. Diagrammes en

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d''utilisation

09 09 16 8h30 10h30 statdescriptive lemdani

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

09 09 16 8h30 10h30 statdescriptive lemdani

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib