TSTMG Statistiques a deux variables Cours et TD

Telechargé par sedmorabet
TSTMG
Statistiques
Cours
S. MORABET
1
I. Statistiques à une variable
Médiane et écart interquartile
Considérons une série statistique ordonnée.
Définitions
Le digramme en boite d’une série statistique est un
diagramme regroupant les quartiles, la médiane et
les valeurs extrêmes d’une série statistique.
Moyenne et écart-type
Soit la série statistique donnée par le tableau ci-
contre :
Définition
La moyenne de cette série est le réel :  
L’écart-type d’une série statistique est un nombre positif noté : qui mesure la dispersion des
valeurs autour de la moyenne. Ce nombre peut être obtenu avec la calculatrice.
Les paramètres d’une série statistique à connaitre sont :
Paramètres dépendants des valeurs
extrêmes :
Paramètres indépendants des valeurs
extrêmes
La moyenne : 
L’écart-type :
L’intervalle
La médiane : Me
Les quartiles Q1 et Q3
L’intervalle interquartile : [Q1 ; Q3 ]
Exemple
Un maire a mené une étude statistique auprès des habitants de sa ville. Il a interrogé 1 600
personnes âgées de 18 ans à 59 ans afin de connaitre le nombre de jours pendant lesquels elles sont
parties en vacances durant lannée 2016. Les résultats sont donnés dans le tableau ci-dessous.
Valeur
…..
Total
Effectif
…...
N
La médiane d’une série statistique est :
La valeur centrale lorsque leffectif total de la série est impair ;
La demi-somme des deux valeurs centrales lorsque leffectif total de la série est pair.
Le rang du premier quartile Q de cette série statistique est le plus petit entier
supérieur ou égal à 25 % de leffectif total N.
Le rang du troisième quartile Q3 de cette série est le plus petit entier supérieur ou
égal à 75 % de leffectif total N.
L’écart interquartile est la différence Q3 Q1
TSTMG
Statistiques
Cours
S. MORABET
2
Nombre de jours
0
2
5
6
7
8
10
13
14
15
16
18
21
28
31
35
Effectif
328
20
41
99
128
132
142
42
194
237
118
58
27
14
12
8
1. Déterminer la médiane, les premiers et troisième quartiles de cette série. Interpréter ces
résultats.
2. Calculer (à 0,1 près) le nombre moyen de jours durant lesquels une personne de ce groupe est
partie en vacances au cours de l’année 2016.
3. Quel est 0,1 près) l’écart-type de cette série.
II. Statistiques à deux variables
Définition
Cette série est définie alors par le tableau ci-
contre
Dans un repère du plan, les points M1(x1, y1) ;
M2(x2, y2) ; …. ; Mn(xn, yn) constituent ce qu’on
appelle le nuage de points de cette série.
Nuage de points
Une série statistique double (xi ; yi) se représente
par un nuage de points Mi(xi ; yi).
Le point moyen du nuage est le point G(
x ;
y ) ;
L’abscisse est la moyenne de la série (xi) :
  
Et l’ordonnée est la moyenne de la série (yi) :
  
Quand on étudie deux caractères statistiques sur une même population, on obtient une
série statistique à deux variables. Si les valeurs prises par le premier caractère sont : x1,
x2,…., xn et celles prises par le second caractère sont notées : y1, y2, ….., yn
TSTMG
Statistiques
Cours
S. MORABET
3
Exemple :
On considère deux séries de notes
obtenues par des élèves de
TSTMG, respectivement au baccalauréat
et à un concours.
1. Représenter sur le repère ci-contre
le nuage des points de ces deux
séries.
2. Calculer et représenter le point
moyen.
Ajustement affine
Définition
On a deux méthodes pour déterminer la droite d’ajustement affine ou droite de régression :
Une méthode graphique, en traçant une droite au plus près possible des points du nuage.
La méthode des moindres carrés. Les coefficients de l’équation de cette droite s’obtiennent
avec la calculatrice ou le tableur.
Notes xi obtenues au baccalauréat
7
8
11
13
16
Notes yi obtenues au concours
8
9
11
12
13
Lorsque les points du nuage statistique à deux variables sont sensiblement alignés, on
peut construire une droite passant au plus près de ces points. On dit que cette droite
réalise un ajustement affine du nuage de points.
TSTMG
Statistiques
Cours
S. MORABET
4
Méthodes des moindres carrés
Définition
Les coefficients a et b de léquation de la droite de
régression sont données par la calculatrice.
Pour tracer cette droite on utilisera deux points dont le point moyen qui se trouve sur cette droite et
un deuxième dont on calculera les coordonnées à partir de l’équation.
On donne ci-dessous un rappel du mode opératoire pour les deux marques de calculatrices.
Situation réelle : Représenter et analyser un nuage de points
On présente ci-dessous la fréquentation de lhôtellerie de tourisme en France, en millions de nuitées.
2005
2006
2007
2008
2009
2010
2011
Rang de l’année i
1
2
3
4
5
6
7
Nombre total de
nuitées xi
192.7
191.9
198.9
197.6
188.0
192.2
198.4
Dont étrangers yi
70.5
68.8
72.4
71.1
63.2
64.9
66.5
1. Construire le nuage de points Mi(xi ; yi) dans un repère commençant en (187 ; 62) et avec 1 cm
pour 1 million. Placer le point moyen G.
2. Quelle serait la forme du nuage si chaque année la proportion des étrangers était constante ?
Argumenter.
Dans le plan muni d’un repère orthonormé, on
considère un nuage de n points de coordonnées
(xi; yi).
La droite D d’équation y = ax+b est appelée
droite de régression de y en x de la série
statistique si et seulement si la quanti
suivante est minimale :

 
TSTMG
Statistiques
TD
S. Morabet
1
Exercice 1 : statistique à une variable
Partie 1 : Etude des machines Trefiable
Pour l’étude du nombre d’interventions sur les machines
Trefiable, on dispose uniquement du diagramme en boite à
moustache donné ci-contre.
Recopier et compléter les phrases suivantes en justifiant
les réponses.
1. Environ…………% des machines Trefiable
nécessitent un nombre d’interventions inférieur ou égal à 9.
2. Environ 25 % des machines Trefiable nécessitent un nombre d’interventions au moins égal à
………….
Partie 2 : Etude des machines Cessolid
On étudie maintenant le nombre d’interventions sur les machines Cessolid.
Le tableau statistique a été réalisé sur tableur.
Dans la cellule B14, on saisit la formule
1. Quelle est la valeur affichée dans la cellule B14 ?
2. Quelle formule peut-on saisir dans la cellule C3 pour obtenir, par
recopie vers le bas, les effectifs cumulés croissants ?
3. Compléter la colonne C du tableau ci-dessus.
4. Déterminer la médiane et les quartiles de cette série.
5. Sur le graphique de la partie 1, représenter le diagramme en boite de la série du nombre
d’interventions sur les machines Cessolid.
6. Calculer la moyenne et l’écart-type de cette série.
7. L’affirmation suivante est-elle vraie ? Justifier la réponse.
« Il y a autant de machines de chaque marque nécessitant un nombre d’interventions inférieur ou égal
à 6 ».
Exercice 2 : Statistiques à deux variables
Décider de la pertinence d’un
ajustement affine
Le tableau ci-contre donne le nombre de factures établies par une petite entreprise durant les années
de 2011 à 2016.
1. Représenter le nuage de points de la série (xi ; yi) dans un repère orthogonal d’unités :
1 cm pour une année d’abscisses ;
2 cm pour dix unités en ordonnées, en commençant la graduation à 70.
2. Expliquer pourquoi ce nuage de points permet d’envisager un ajustement affine.
3. On décide d’ajuster le nuage de points à l’aide de droite (d) d’équation : y = -3,2x + 122
4. Représenter la droite (d) dans le repère précédent.
5. Estimer graphiquement le nombre de factures que l’entreprise établira durant l’année 2023.
Année
2011
2012
2013
2014
2015
2016
Rang de l’année xi
1
2
3
4
5
6
Nombre de factures
119
115
112
110
107
102
1 / 13 100%

TSTMG Statistiques a deux variables Cours et TD

Telechargé par sedmorabet
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !