Module : STATISTIQUE (1 année)

publicité
ESCE-Lyon
Méthodes Quantitatives
Module : STATISTIQUE (1e année)
Document de travail 2013-2014
par R. Chapelon, chargé de cours et de TD
RC-2013
Reproduction interdite
1/64
ESCE-Lyon
Méthodes Quantitatives
Présentation
Ce document est composé de trois parties :
- la première constituée de formulaires-résumés du programme, (pages 3 à 22)
- la seconde d’exercices, (pages 23 à 51)
- la troisième de tables et documents annexes, (pages 52 à 59).
Introduction
Faire de la statistique, c'
est :
- collecter des données,
- traiter ces données pour en rendre possible l'
exploitation (statistique descriptive),
- interpréter ces données en utilisant la théorie des probabilités (statistique inférentielle).
Si, à l’origine, la statistique portait surtout sur des recensements de population, elle est aujourd’hui
utilisée dans de nombreux domaines :
- production (contrôles statistiques de processus, de normes, de qualité,…),
- économie (prévision de taux, d'
indices, de risques,…)
- finance (investissement, cours boursiers, rendements…)
- assurance (prévision de risque, calcul de rente,…)
- marketing (activité commerciale, stratégie commerciale, …)
- démographie, science physique, biologie, médecine, sondage d'
opinion, etc
En statistique descriptive, on se contente de décrire une population ou un échantillon extrait de cette
population en les résumant à l'
aide de grandeurs comme la moyenne, la médiane, l'
écart type, la
fréquence, la corrélation, la concentration,…(statistique descriptive à une variable)
On peut aussi analyser plusieurs variables. Chaque variable prise séparément peut s’étudier comme
ci-dessus. On peut aussi les étudier simultanément en cherchant l’existence d’une liaison entre ces
deux variables (voire plusieurs). Ces notions seront précisées par la suite.
En statistique inférentielle, on utilise la théorie statistique pour évaluer, à partir de données sur un
échantillon, certaines grandeurs dans une population dont l'
échantillon est issu en précisant la
fiabilité des résultats obtenus.
Bibliographie
•
•
•
•
•
Statistiques descriptives de Bernard Py (Edition 2007-Economica)
Exercices corrigés de statistique descriptive de Bernard Py (Edition 1999-Economica)
Statistiques descriptives de Bernard Grais (Edition 2003-Dunod)
Méthodes statistiques de Bernard Grais (Edition 2003-Dunod)
Statistiques pour l'
économie et la gestion de Anderson, Sweeney, Williams, traduit par
Claire Borsenberger (3e édition 2010-De Boeck, éditeur)
RC-2013
Reproduction interdite
2/64
Partie 1 : formulaires-résumés
Chapitre I – Statistique descriptive à une variable
A-Paramètres de position
• Le mode Mo ou dominante est la valeur la plus fréquente : elle correspond à un maximum pour les
effectifs ni. Il s'
exprime avec l'
unité de la variable.
Attention ! Le mode n’est pas nécessairement unique (série bi ou multi-modale)
Pour une variable statistique continue, on détermine la classe modale [xi ; xi+1[ qui correspond à la
plus grande valeur ni/ai.
Si l’on veut donner une valeur, en supposant que les valeurs sont équiréparties dans les classes, on
peut estimer le mode par :
ni / ai − ni −1 / ai −1
Mo = xi + ai×
avec
(ni / ai − ni −1 / ai −1 ) + (ni / ai − ni +1 / ai +1 )
[xi ; xi+1[ la classe modale qui correspond donc à la plus grande valeur ni/ai,
ni, l’effectif de la classe modale, ni–1, l’effectif de la classe précédente, ni+1, l’effectif de la
classe suivante,
ai, l’amplitude de la classe modale, ai–1, l’amplitude de la classe précédente, ai+1, l’amplitude
de la classe suivante.
ni xi
• Calcul de la moyenne arithmétique : x =
i
.
n
Remplacer xi par ci le centre des classes si la variable est continue.
Changement affine de variable : si l’on pose Xi = αxi + β, alors X = α x + β.
• Calcul de la moyenne géométrique : g = (x
n1
1
n2
2
x ...x
• Calcul de la moyenne harmonique h définie par :
• Calcul de la moyenne quadratique : q =
nk
k
)
1
n
1
=
h
ou g = x1f1 x 2f 2 ...x nf n
ni ×
i
1
xi
n
ni xi2
i
n
.
• Ces moyennes respectent toujours l’ordre : h ≤ g ≤ x ≤ q.
• La médiane Me est une valeur qui partage la série en deux parties de même effectif : la moitié des
valeurs sont au-dessus de la médiane et l’autre moitié en dessous.
On commencera toujours par classer les valeurs de la variable par ordre croissant.
La médiane s'
exprime avec l'
unité de la variable.
n +1
- Cas d'
une série avec un effectif n impair : Me est la valeur de la série qui est classée
.
2
- Cas d'
une série avec un effectif n pair : on prend couramment comme médiane Me la moyenne
n
n+2
arithmétique entre les deux valeurs de la série qui sont classées
et
.
2
2
RC-2013
Reproduction interdite
3/64
- Pour une variable continue dont les valeurs sont données par classes, (l'
effectif est alors
souvent important), on recherche tout d'
abord la classe médiane : c'
est la classe qui contient la
n
valeur de la variable classée , que n soit pair ou impair.
2
Si l’on veut donner une valeur, en supposant que les valeurs sont équiréparties dans les classes,
n
− N i −1
2
avec :
on peut estimer la médiane par : Me = xi + ai×
ni
xi la borne de gauche de la classe médiane, ai l'
amplitude de la classe médiane,
Ni – 1 l'
effectif cumulé croissant de la classe qui précède la classe médiane,
ni l'
effectif de la classe médiane.
n
− N i −1
• Calcul du 1er quartile : Q1 = xi + ai× 4
avec
ni
xi la borne de gauche de la classe de Q1, ai l'
amplitude de la classe de Q1,
Ni – 1 l'
effectif cumulé croissant de la classe qui précède la classe de Q1,
ni l'
effectif de la classe de Q1.
Ce calcul suppose que les valeurs sont équiréparties dans les classes.
3n
− N i −1
4
• Calcul du 3e quartile : Q3 = xi + ai×
avec
ni
xi la borne de gauche de la classe de Q3, ai l'
amplitude de la classe de Q3,
effectif cumulé croissant de la classe qui précède la classe de Q3,
Ni – 1 l'
ni l'
effectif de la classe de Q3.
Ce calcul suppose que les valeurs sont équiréparties dans les classes.
• Le calcul des déciles, des centiles et de tous les fractiles se fait sur le même principe en supposant
toujours que les valeurs sont équiréparties dans les classes.
B-Paramètres de dispersion
• Calcul de l’écart moyen arithmétique par rapport à la moyenne arithmétique : em =
ni xi − x
i
n
Remplacer xi par ci le centre des classes si la variable est continue.
• Calcul de la variance : S2 =
ni ( xi − x) 2
i
n
ou S2 =
ni xi2
i
n
()
− x
2
ou S2 =
()
f i xi2 – x
i
2
Remplacer xi par ci le centre des classes si la variable est continue.
La variance s’exprime avec le carré de l’unité de la variable.
On utilise aussi sa racine carrée positive S qui s’exprime avec l’unité de la variable.
S est la moyenne quadratique des écarts de la variable par rapport à la moyenne arithmétique.
S s’appelle aussi écart quadratique moyen.
Changement affine de variable : si l’on pose Xi = αxi + β, alors S2(X) = α2 S2(x) et S(X) = |α|.S(x).
• Coefficient de variation : S / x et interquartile relatif : (Q3 – Q1)/Q2.
RC-2013
Reproduction interdite
4/64
C-Courbe de Lorenz et indice de concentration de Gini
L'
indice de concentration est un indice qui concerne certaines distributions tels que les celles des
salaires, des revenus, des entreprises suivant leur taille, des surfaces des exploitations agricoles, des
factures au sein d'
une entreprise, etc… Les variables sont positives.
1. Courbe de concentration dite de Lorenz
On considère une série positive de variable discrète (xi ; ni) avec k valeurs ou de variable continue la
série ([xi, xi+1[ ; ni) définie par k classes.
On calcule successivement :
n
• pour i = 1 à k, fi = i les fréquences relatives à la valeur xi ou à la classe [xi, xi+1[,
n
• pour i = 1 à k, Fi les fréquences cumulées croissantes,
• pour i = 1 à k, les produits Si = nixi pour les variables discrètes ou Si = nici avec ci le
centre de la classe [xi, xi+1[ pour les variables définies par classes.,
Si représente la masse totale des valeurs de la variable pour la modalité (ou la classe i),
• pour i = 1 à k, les cumuls des Si que nous noterons Si cum,
On note S le dernier cumul qui est la somme de toutes les valeurs Si,
S cum
• pour i = 1 à k, les quotients : qi = i
.
S
(qi représente la proportion cumulée de la somme totale des i premières valeurs classées par
rapport à somme totale de toutes les valeurs de la variable)
Dans un repère orthonormé, on porte alors les k points de coordonnées (Fi, qi).
Il y a autant de points que de classes. Le dernier point est toujours le point (1 ; 1).
On rajoute le point origine O(0 ; 0).
La courbe de concentration est la ligne polygonale joignant l'origine O et les k points.
Cette courbe est située dans le carré formé par les points O(0 ; 0), I(1 ; 0), J(1 ; 1) et K(0 ; 1).
Elle est toujours en dessous de la diagonale [OJ] qui s'
appelle “la courbe d'équi-répartition”
La surface comprise entre la diagonale (OJ) et la courbe de concentration s'
appelle la surface de
concentration.
2. Indice de concentration dit de Gini
L'
indice de concentration est défini comme le quotient de l'
aire de la surface de concentration par
l'
aire du triangle (OIJ). L'
aire de ce triangle vaut toujours 0,5 en unités d'
aire.
Autrement dit, l'indice de concentration est le double de l'aire de la surface de concentration
exprimée en unités d'aire.
Il vaut mieux, en général, calculer l'
aire “sous la courbe”, puis en déduire l'
aire de la surface de
k
(q i −1 + q i ) × f i
concentration puis l'
indice de Gini :
=
avec k le nombre de valeurs ou de
2
i =1
classes. L’indice de Gini s’exprime alors par : IG = 1 – 2 .
RC-2013
Reproduction interdite
5/64
Chapitre II - Statistique descriptive à deux variables
Effectifs marginaux :
• Effectif marginal relatif à xi : ni• =
ni j
j
• Effectif marginal relatif à yj : n•j =
ni j
i
Covariance :
• Pour une série double de la forme (xi , yi) : cov(x,y) =
i
• Pour une série double de la forme (xi , yi ; ni) : cov(x,y) =
xi yi
– x.y .
n
ni x i y i
i
– x. y .
n
ni j x i y j
• Pour une série double de la forme (xi , yi ; nij) : cov(x,y) =
i
j
– x. y .
n
Important :
- si le signe de la covariance est positif, les variables varient dans le même sens,
- si le signe de la covariance est négatif, les variables varient en sens contraire.
Droites de régression :
• Première droite de régression ou droite de régression de y en x notée Dy/x
cov(x, y)
• Equation : y = ax + b avec a =
et b = y – a x .
S 2 (x)
• Dy/x passe par le point moyen G( x , y )
• La variable x s'
appelle dans ce cas la variable explicative et y la variable expliquée.
• Interprétation des coefficients de la première droite de régression
b est bien sûr la valeur de la variable expliquée y quand la variable explicative x est nulle.
a exprime l'
augmentation de la variable expliquée y quand la variable expliquée x augmente
d'
une unité.
• Deuxième droite de régression ou droite de régression de x en y notée Dx/y
cov( x, y )
• Equation : x = a’y + b’ avec : a’ =
et b’ = x – a’ y .
S 2 ( y)
• Dx/y passe par le point moyen G( x , y )
• La variable x est la variable expliquée et y est la variable explicative.
Coefficient de corrélation :
• Coefficient de corrélation linéaire d’une série à 2 variables : r(x,y) =
cov( x , y )
. ( – 1 ≤ r ≤ 1)
S(x).S(y)
• Si l’on pose Xi = αxi + β, et Yj = α’yj + β’, r(X,Y) = ± r(x,y) (+ si αα’ > 0; – si αα’ < 0).
• Si r est voisin de 1 ou de – 1 (0,87 ≤ |r| ≤ 1) on parle de forte corrélation linéaire.
RC-2013
Reproduction interdite
6/64
o Plus r est proche de –1 ou de +1, plus la liaison entre x et y est forte.
o L’usage des droites de régression est alors fiable.
o Les deux droites de régression forment un angle qui est petit.
Coefficient de détermination :
• Coefficient de détermination : r2 =
[cov ( x, y)]2
2
2
S ( x ) × S ( y)
. (0 ≤ r2 ≤ 1)
• Il représente le pourcentage de la variance de y expliquée par la variable x mais aussi le
pourcentage de la variance de x expliquée par la variable y : on parle de pourcentage de la
variance expliquée par la régression. r2 varie entre 0 et 1 (ou 0 et 100%).
On dit parfois pour simplifier que r2 donne le pourcentage des individus concernés par la
corrélation linéaire si elle existe (impropre).
RC-2013
Reproduction interdite
7/64
Chapitre III – Indices élémentaires et composes
A-Indices élémentaires
On suppose connues les valeurs d’une variable x : x(0) à la date 0 et x(t) à la date t.
x(t )
.
Le coefficient multiplicateur CM t / 0 (x) s’exprime par : CM t / 0 (x) =
x ( 0)
L'
indice It/0(x) à la date t, par rapport à la date 0 (dite date de référence ou de base) de la variable
x(t )
x est défini par : I t / 0 ( x) = 100 ×
= 100× CM t / 0 (x).
x ( 0)
Quand on se limite à l’étude d’une variable, on omet souvent de noter x dans l'
indice quand il n’y
a pas d’ambigüité : I t / 0 et CM t / 0 .
A la date t = 0, l'
indice est égal à 100 par définition : 100 est l'
indice de base à la date 0.
On peut avoir t ≥ 0, mais aussi t ≤ 0.
Plus généralement, si t1 et t2 sont deux dates avec t1 ≤ t2 ou t1 ≥ t2 :
x(t 2 )
x(t )
CM t2 / t1 =
et I t2 / t1 = 100× 2 .
x(t1 )
x(t1 )
A retenir :
• Une série d’indice dans une base donnée est proportionnelle à la série des valeurs de la
variable.
• Deux séries d'
indices ayant des dates de base différentes sont proportionnelles.
• Un indice I strictement supérieur à 100 indique une augmentation par rapport à l'
année de
base égale à (I – 100)%,
• Un indice I strictement inférieur à 100 indique une diminution par rapport à l'
année de base
égale à (100 – I)%,
Propriété des indices élémentaires
Réversibilité
On remarque : CM t1 / t2 = 1/ CM t2 / t1 . D’où : I t1 / t2 /100 =
10 000
1
ou I t1 / t2 =
.
I t2 / t1 / 100
I t2 / t1
Transitivité (on dit aussi circularité ou transférabilité)
C'
est une formule de changement de date de base : t1, t2 et t3 sont trois dates.
On remarque : CM t3 / t2 × CM t2 / t1 = CM t3 / t1 i.e.: [ I t3 / t2 /100] × [ I t21 / t1 /100] = I t3 / t1 /100.
Ce qui peut aussi s'
écrire : I t3 / t2 =
I t3 / t1
I t2 / t1
×100. On rappelle aussi :
I t3 / t1
I t2 / t1
=
x(t 3 )
.
x(t 2 )
Multiplication
On suppose connues les valeurs de deux variables x et y :
x(0) et y(0) à la date 0 et x(t) et y(t) à la date t.
On peut ainsi calculer un indice de base 100 à la date 0 pour chacune des variables.
Si on pose, pour toute date t, z(t) = x(t)×y(t), alors : CM t2 / t1 (z) = CM t2 / t1 (x)× CM t2 / t1 (y).
On a donc : I t2 / t1 ( z ) = [ I t2 / t1 ( x) × I t2 / t1 ( y ) ]/100
RC-2013
Reproduction interdite
8/64
Cas particulier fondamental : valeur = prix unitaire × quantité.
On en déduit donc :
Indice élémentaire valeur = (Indice élémentaire prix × Indice élémentaire quantité) /100
B-Indices synthétiques ou composés
Un indice synthétique (ou composé) porte sur plusieurs variables et permet d'
évaluer l’évolution
globale de ces variables entre deux dates données.
1. Notations
On suppose que l'
on s'
intéresse à k produits. Pour i variant de 1 à k :
- le prix du produit numéro i est noté p0,i à la date 0 et pt,i à la date t,
- la quantité de produit numéro i est noté q0,i à la date 0 et qt,i à la date t.
i=k
i =1
i=k
i =1
p0,i × q0,i représente la valeur totale des k produits à la date 0. Notation allégée :
pt ,i × qt ,i représente la valeur totale des k produits à la date t. Notation allégée
p0 × q0
pt × qt
2. Indice des valeurs globales (dit aussi indice élémentaire moyen des valeurs ou des dépenses)
pt × qt
Indice des valeurs globales (V) =
× 100
p0 × q0
Propriétés :
Cet indice est possède les propriétés de réversibilité et de transférabilité (circularité).
3. Indices synthétiques des prix
Un indice de prix se détermine avec des quantités fixes.
pt q 0
Indice des prix de Laspeyres t/0(p) =
×100
p0 q 0
Indice des prix de Paasche
Indice des prix de Fisher
t/0(p)
t/0(p)
pt qt
=
p 0 qt
=
t/0
×100
( p) ×
t/0
( p)
4. Indices synthétiques des quantités (on dit aussi des volumes)
Un indice de quantités (ou de volumes) se détermine avec des prix fixes.
p 0 qt
Indice des quantités de Laspeyres t/0(q) =
×100
p0 q0
Indice des quantités de Paasche
Indice des quantités de Fisher
t/0(q)
t/0(q)
=
=
pt qt
pt q 0
t/0
×100
(q) ×
t/0
(q)
5. Propriétés :
Les indices de Laspeyres et Paasche ne sont pas réversibles mais ceux de Fisher le sont.
1
1
et
.
0/t(p)/100 =
0/t(q)/100 =
t / 0 ( p ) / 100
t / 0 ( q ) / 100
RC-2013
Reproduction interdite
9/64
On a cependant les relations :
- pour les prix :
0/t(p)/100
=
1
et
t / 0 ( p ) / 100
0/t(p)/100
=
1
t / 0 ( p ) / 100
=
1
t / 0 ( q ) / 100
0/t(q)/100
=
1
.
t / 0 ( q ) / 100
- pour les quantités :
0/t(q)/100
et
Aucun des trois indices ci-dessus ne possède la propriété de circularité.
Cette propriété est cependant approximativement vérifiée mais sur le long terme les erreurs
peuvent être importantes.
6. Relations entre les indices de Laspeyres, Paasche, Fisher et celui des valeurs :
Ces relations permettent de décomposer l’évolution des valeurs :
I1/0(v) = t/0(p) × t/0(q)/100 = t/0(p) × t/0(q)/100 = t/0(p) × t/0(q)/100.
RC-2013
Reproduction interdite
10/64
Chapitre IV – Variables aléatoires discrètes
1. Loi et fonction de répartition d’une variable aléatoire discrète X
Pour démontrer qu’un tableau de distribution représente une loi de probabilité d'
une variable
discrète finie, il suffit de vérifier les deux conditions : les probabilités sont toutes comprises entre
0 et 1 et leur somme vaut 1.
La fonction de répartition de la variable aléatoire X est notée FX et est définie par :
pour tout réel x, FX(x) = P[X ≤ x].
2. Variables aléatoires indépendantes
Deux variables aléatoires X et Y définies sur le même univers sont indépendantes si, pour tous
réels x et y, on a : P(X ≤ x ∩ Y ≤ y) = P(X ≤ x)×P(Y ≤ y).
Autrement dit, les événements X ≤ x et Y ≤ y sont toujours indépendants.
3. Espérance mathématique, variance et écart type d’une variable aléatoire X discrète
x.P(X = x) =
Espérance mathématique : E(X) =
x ∈ X( (
Variance : V(X) =
x∈ X (
(x-E(X)) 2 .PX (x) =
)
x.PX (x) .
x ∈ X( (
x∈ X (
x 2 PX (x) – (E(X))2.
)
Dans la pratique, on utilise la 2e formule dite de Huygens.
x 2 .PX ( x) peut se noter E(X2).
x∈ X ( )
Ecart type : σ(X) = V ( X )
Propriétés de E(X) et V(X)
α et β sont des réels quelconques, X et Y des variables aléatoires, discrètes ou non.
Propriétés vraies sans conditions :
E(X + Y) = E(X) + E(Y) et E(X – Y) = E(X) – E(Y).
E(αX) = αE(X) ; E(αX + β) = αE(X) + β.
E(αX + βY) = α.E(X) + β.E(Y).
V(α X + β) = α² V(X) ; en particulier : V(α.X) = α².V(X).
V(αX + βY) = V(Z) = α².V(X) + β².V(Y) + 2α.β.cov(X,Y).
Propriétés vraies seulement pour des variables X et Y indépendantes :
E(XY) = E(X).E(Y).
V(X + Y) = V(X) + V(Y) et V(X – Y) = V(X) + V(Y).
Bien remarquer que X + Y et X – Y ont la même variance dans ce cas et le même écart type.
V(αX + βY) = V(Z) = α².V(X) + β².V(Y).
Cov(X,Y) = 0 La réciproque est fausse
4. Epreuve et variable de Bernoulli
On appelle épreuve de Bernoulli toute épreuve aléatoire conduisant à deux issues seulement,
l’une appelée “succès” et l’autre “échec” (la somme de leurs probabilités est égale à 1).
Une variable de Bernoulli est une variable aléatoire qui ne peut prendre que deux valeurs 0 et 1.
Le résultat de l’épreuve que l’on code 1 est le succès, celui que l’on code 0 est l'
échec.
p représente la probabilité d’un succès au cours d’une épreuve, q = 1 – p celle d’un échec.
RC-2013
Reproduction interdite
11/64
X(Ω)
0
1
PX(x)
1–p
p
On note : (X) = (1; p) ou e(p) ; p est le paramètre de cette loi (0 < p < 1).
Espérance mathématique : E(X) = p,
Variance : V(X) = p(1 – p) ; écart type (X) =
p( 1 − p) .
5. Schéma binomial et variable binomiale
On appelle schéma binomial de paramètres n et p toute expérience aléatoire consistant à répéter
n fois de façon indépendante une épreuve de Bernoulli de paramètre p.
n est la longueur du schéma de Bernoulli (n ∈ *)
p est la probabilité d’un succès au cours d’une épreuve.
Sur un schéma binomial de longueur n, soit X est le nombre de succès en n épreuves.
X est un entier naturel compris entre 0 et n qui dépend des résultats aléatoires des n épreuves :
c’est une variable aléatoire discrète.
X s’appelle une variable aléatoire binomiale ou encore on dit que X suit une loi binomiale de
paramètres (n, p). On note : (X) = (n ; p).
L’ensemble des valeurs prises par X est alors : X(Ω
Ω) = {0 ; 1 ; 2 ; …, n}.
La loi de X est définie par : pour tout naturel k de X(Ω
Ω), P(X = k) =
n
k
=
n
k
p k (1 − p ) n − k .
n!
avec : n ! = n×(n – 1)× …× 3×2×1.
k !×(n − k )!
Reconnaître une loi binomiale.
Pour démonter qu’une variable aléatoire X suit une loi binomiale, on procèdera de la manière
suivante :
a) On commence par définir une épreuve qui doit être répétée un certain nombre de fois (n).
b) Chaque épreuve doit conduire à deux résultats seulement (succès-échec):
On notera : p la probabilité d'
un succès en une épreuve,
q = 1 – p la probabilité d'
un échec en une épreuve.
c) On vérifiera l’indépendance des épreuves.
Soit les épreuves sont effectuées avec remise,
n
Soit elles sont effectuées sans remise avec un taux de sondage
inférieur à 0,1,
N
(On admet alors que les n épreuves peuvent être assimilées à des épreuves indépendantes.)
d) On note X le nombre de succès réalisés parmi ces n épreuves :
X suit alors une loi Binomiale de paramètre n et p : (n, p).
Espérance mathématique : E(X) = np,
Variance : V(X) = np(1 – p) ; écart type (X) =
np( 1 − p) .
Somme de variables aléatoires binomiales indépendantes
Si X1 et X2 sont deux variables aléatoires indépendantes qui suivent toutes deux des lois
binomiales de même paramètre p, (n1 ; p) et (n2 ; p) sur le même univers, alors X1 + X2 suit
une loi binomiale (n1 + n2 ; p). On peut généraliser à plusieurs variables.
RC-2013
Reproduction interdite
12/64
6. Variable de Poisson
Situations où l’on peut rencontrer au moins de façon approchée une loi de Poisson
Dans la pratique la variable de Poisson est utilisée pour modéliser ( = approcher) des variables
statistiques dont quelques exemples sont donnés ci-après.
• Nombre de véhicules franchissant un poste de péage pendant une période de durée D fixée.
• Nombre d’appels reçus par un standard téléphonique pendant une période de durée D fixée.
• Nombre de fautes de frappes par page dans un livre.
• Nombre d’accidents sur une portion d'
autoroute par semaine.
• Nombre de naissances dans une petite commune par année.
• Nombre de décès par suicide.
• Le nombre d'
atomes désintégrés par unité de temps.
Définition d’une variable de Poisson
Une variable de Poisson a un paramètre noté m (ou λ) avec m > 0 (son espérance).
Une variable aléatoire X prend comme valeur tout entier positif ou nul i.e. X(Ω) =
mk
sorte que sa loi soit définie par : P(X = k) = e – m .
pour tout k entier , k ≥ 0.
k!
, de telle
Rappel : e ≈ 2,71828. (base de l’exponentielle)
Espérance mathématique : E(X) = m,
Variance : V(X) = m ; écart type (X) =
m.
Critères pour reconnaître si une variable statistique discrète peut être modélisée par une
variable de Poisson (A utiliser si demandés)
Critère 1 : la moyenne de l’échantillon et sa variance sont sensiblement égales.
On prend pour m une valeur voisine de x .
Critère 2 :
Notons ni est l’effectif de la valeur xi, ni-1 l’effectif précédent.
ni
1
par
est sensiblement constant, on peut envisager la modélisation par
ni −1
xi
une loi de Poisson avec m valeur approchée de la constante. (On peut remplacer les effectifs par
les fréquences)
Si le quotient de
Critère 3 : test de Khi 2 dans le cas d’une variable discrète.
Somme de variables aléatoires indépendantes de Poisson
La somme de deux variables aléatoires indépendantes suivant chacune une loi de Poisson suit
une loi de Poisson (stabilité) :
Si (X1) = (m1) et (X2) = (m2) alors (X1 + X2) = (m1 + m2) .
7. Approximations d’une loi binomiale par une loi de Poisson.
Une loi binomiale de paramètre n et p peut être approximée par une loi de Poisson de paramètre
m = n.p si les deux conditions suivantes sont réalisées :
n est assez grand (à partir de 30) et p ≤ 0,1 (ou p ≥ 0,9).
On écrit : (n; p) ≈ (np)
RC-2013
Reproduction interdite
13/64
8. Approximation d’une loi binomiale par une loi normale
Critère 1 :
Une loi binomiale de paramètre n et p peut être approximée par une loi normale avec les
paramètres m = n.p et σ = npq si les deux conditions suivantes sont réalisées :
n est assez grand (à partir de 30) et p compris entre 0,4 et 0,6.
Critère 2 :
On peut aussi utiliser l'
approximation dès que n > 30 et n.p > 18.
On écrit :
(n, p) ≈
(np;
np(1 − p ) )
Ne pas oublier la correction de continuité !
9. Approximation d’une loi de Poisson par une loi normale
Les tables de Poisson généralement publiées concernent un paramètre m inférieur (ou égal) à 18.
Lorsque la moyenne m est supérieure à 18, on utilise une approximation de la loi de Poisson par
une loi normale. Les deux paramètres de la loi normale sont obtenus en fonction de la valeur de
m qui est le paramètre de la loi de Poisson.
On rappelle que pour une loi de Poisson m est en même temps la moyenne et la variance :
m = moyenne = variance pour une loi de Poisson.
Ainsi, les paramètres de la loi normale approchant une loi
(m) ≈
(m;
(m) seront m et
m.
m)
Ne pas oublier la correction de continuité !
RC-2013
Reproduction interdite
14/64
Chapitre V – Variables aléatoires normales
1. Variables normales (ou gaussiennes).
Définition
On dit qu'
une variable aléatoire X est normale (ou gaussienne) si :
- l’ensemble des valeurs prises est : X(Ω) = .
- Sur , la fonction de densité f est définie par : f(x) =
1
1 x−m
exp −
2
2
2
.
m et σ sont les paramètres de cette loi normale : m est un réel et σ un réel strictement positif.
On dit : X suit une loi normale de paramètres m et σ. On résume : (X) = (m ; σ).
L’espérance de X est m : E(X) = m. C’est aussi le mode et la médiane.
L’écart type de X est σ : σ(X) = σ : la variance de X est alors σ2 : V(X) = σ2.
Allure des courbes de densité f des lois normales
0,6
0,5
C1
0,4
C0
0,3
C3
0,2
C2
0,1
0
-3
-2
-1
0
1
2
3
4
5
C0 (en noir) est la courbe de la loi normale
(0 ; 1).
C1 (en bleu) est la courbe de la loi normale
(m ; σ) avec m > 0, et σ < 1. (Ici m = 1 et σ = 0,7)
C2 (en rouge) est la courbe de la loi normale
C3 (en vert) est la courbe de la loi normale
(m ; σ) avec m > 0, et σ > 1. (Ici m = 1 et σ = 1,2)
(m ; σ) avec m < 0, et σ = 1. (Ici m = – 1 et σ = 1)
2. Cas particulier
Le cas particulier le plus simple est obtenu si m = 0 et σ = 1. La variable est souvent notée T.
La variable normale est alors qualifiée de centrée (car m = 0) réduite (car σ = 1).
On dit que T suit une loi normale de paramètres (0 ; 1). On note : T suit (0 ; 1).
L’espérance de T est m = 0 : E(T) = 0. C’est aussi le mode et la médiane.
L’écart type de T est σ = 1: σ(T) = 1. La variance de T est alors σ2 = 1: V(T) = 1.
Sa densité est souvent notée ϕ (phi minuscule).
RC-2013
Reproduction interdite
15/64
1
1
exp − x 2 , pour tout x réel.
2
2
Sur , la fonction de densité ϕ s'écrit alors : ϕ(x) =
La fonction de répartition est notée φ (phi majuscule) ou Π (pi majuscule) : on utilisera φ.
Elle n’a pas d’écriture simple mais une écriture sous forme d’intégrale :
pour t réel, φ(t) =
t
−∞
ϕ( x) dx .
Elle est définie comme toutes les fonctions de répartition par : φ(t) = P(T ≤ t) pour tout t réel.
Elle représente l'
aire sous la courbe de ϕ.
Fonction de densité ϕ d'une variable T normale
(0;1)
0,5
0,4
0,3
0,2
0,1
0
-3
-2
-1
0
1
2
3
Graphiquement, avec cette courbe, une probabilité représente une aire.
3. Dans la pratique
Tous les problèmes concernant une variable normale X qui suit une loi normale
ramènent à un problème de loi normale (0 ; 1).
Définition : T =
X −m
(m ; σ) se
est dite variable centrée (à cause de – m) réduite (à cause de /σ) de X.
T est parfois notée X*.
On peut démontrer : si X suit
(m ; σ) et si on pose T =
X −m
, alors T suit
(0 ; 1).
T est une variable gaussienne centrée réduite.
T permet de résoudre tous les problèmes concernant X.
Dans la pratique, on utilisera la table de la fonction de répartition φ de cette variable
aléatoire T normale centrée réduite.
• Propriété 1 : φ(0) = 0,5 ; si t > 0, φ(t) > 0,5 ; si t < 0, φ(t) < 0,5.
Réciproquement, si φ(t) > 0,5, on peut dire t > 0, si φ(t) < 0,5, on peut dire t < 0.
Si T suit (0 ; 1), alors pour tout réel t,
• Propriété 2 : P(T ≤ – t) = 1 – P(T ≤ t), i.e. φ(– t) = 1 – φ(t).
• Propriété 3 : P(– t < T ≤ t) = 2φ(t) – 1.
RC-2013
Reproduction interdite
16/64
(m ; σ), alors :
4. Valeurs remarquables : si X suit
P(m – σ < X < m + σ) ≈ 0,68.
P(m – 1,645σ < X < m + 1,645σ) ≈ 0,90.
P(m – 1,96σ < X < m + 1,96σ) ≈ 0,95 ou à peu près : P(m – 2σ < X < m + 2σ) ≈ 0,95.
P(m – 3σ < X < m + 3σ) ≈ 0,997.
5. Sommes de variables aléatoires normales. Affine d'une normale.
Si X1 et X2 sont deux variables aléatoires indépendantes qui suivent des lois normales
(m2 ; σ2) alors :
• X1 + X2 suit une loi
(m1 + m2 ;
2
1
+
2
2
(m1 ; σ1) et
).
Ce théorème s'
étend à plusieurs variables normales indépendantes.
• X1 – X2 suit une loi
(m1 – m2 ;
2
1
+
2
2
). Attention aux signes !
En outre, si X est une variable aléatoire normale (m ; σ) et si Y = αX + β avec α ≠ 0, alors Y est
encore normale et suit (αm + β ; |α|σ). Y est dite affine d'
une normale.
6. Une variable statistique peut-elle être modélisée par une loi normale ?
Critère 1 : l’histogramme présente une symétrie. C'
est une méthode visuelle.
Critère 2 : moyenne, médiane et mode sont à peu près égaux. C'
est une méthode paramétrique.
Critère 3 : le graphique sur papier gausso-arithmétique (droite de Henri) : c'
est une méthode graphique que nous allons développer ci-dessous.
On commence par déterminer pour chaque classe les fréquences cumulées croissantes.
Sur une feuille de papier gausso-arithmétique, on porte autant de points qu'
il y a de classes,
exceptée la dernière classe qui n'
est pas représentée. Chaque point a :
- pour abscisse : la borne supérieure de la classe,
- pour ordonnée : la fréquence relative cumulée de la classe (= fonction de répartition).
La dernière classe n'
est pas concernée car la fréquence relative cumulée de cette classe est 100%
qui ne figure pas sur l'
axe des ordonnées (valeur rejetée à l'
infini, comme 0%).
Si les points sont sensiblement alignés, on peut considérer que la variable statistique suit
approximativement une loi normale.
Critère 4 : le test du khi 2. Méthode calculatoire. Voir formulaire 6.
RC-2013
Reproduction interdite
17/64
Chapitre VI –Test du Khi2
(Ajustement à une loi normale ou de Poisson)
Test d'
ajustement à une loi normale
Objectif : on dispose d'
une série statistique portant sur une variable numérique X donnée par classes
(continue ou discrète regroupée) et portant sur un échantillon de taille n tiré au hasard dans une
population Ω de taille N. On suppose qu'
on a réalisé des tests élémentaires permettant d'
envisager
un ajustement par une loi normale (symétrie de l'
histogramme ; moyenne ≈ médiane ≈ mode ; droite
ajustement à une loi normale de la variable X.
de Henri). On souhaite confirmer par un test du χ2 l'
On respectera scrupuleusement les étapes suivantes :
1. On vérifie que l'
échantillon est indépendant (tirages des unités avec remise) ou peut être
considéré comme tel si n/N < 0,1.
écart type S à partir de l'
échantillon, appelés moyenne et écart type
2. On calcule la moyenne x et l'
empiriques, avec les formules habituelles (Chapitre I).
On pose alors m = x et σ = S, en arrondissant éventuellement ces valeurs.
m et σ seront les paramètres de la loi normale que l'
on va tester.
3. On vérifie que la première classe est illimitée à gauche et que la dernière classe est illimitée à
droite. Si ce n'
est pas le cas :
3.1. on remplace la première classe du type [x1 ; x2[ par la classe ]– ∞ ; x2[.
3.2. on remplace la dernière classe du type [xk – 1 ; xk[ par la classe [xk–1 ; + ∞[.
4. On définit les deux hypothèses entre lesquelles on devra choisir :
4.1. Hypothèse nulle H0 :
4.2. Hypothèse alternative :
(m ; ). (X suit une loi normale de paramètres m et σ)
(X) =
(X) ≠
(m ; ).
hypothèse H0 : il est souvent imposé par l'
énoncé.
5. On choisit un risque α de rejeter à tort l'
Il est fréquemment de 5% ou 10% mais, plus généralement, il est compris entre 0,1% et 10%.
6. On exprime la “règle de décision” qui permettra de conclure en fin d'
étude :
2
2
6.1. Si χ calculé est inférieur à χ théorique alors on ne rejette pas l’hypothèse H0 au seuil α.
6.2. Si χ2 calculé est strictement supérieur à χ2 théorique alors on rejette l’hypothèse H0 avec un
risque de le faire à tort égal à α.
7. Détermination du χ2 calculé : χ2 cal =
i
(ni − n. pi ) 2
. (Justifications des calculs en tableau).
n. pi
7.1. On calcule les probabilités théoriques pi à 10–4 près en principe. (1 colonne dans tableau)
X −m
On utilise la loi de Gauss centrée réduite avec le changement de variable : T =
.
σ
7.2.
7.3.
7.4.
7.5.
On procèdera comme dans le chapitre V.
On vérifie que la somme des pi est égale à 1.
On calcule les effectifs théoriques : npi, n étant l’effectif total de la série et pi la probabilité
théorique de la classe i. (1 colonne dans tableau).
On vérifie que la somme des npi est égale à n.
On fait un regroupement de classes si l'
un des effectifs théoriques npi n'
atteint pas 5.
7.6. On calcule les écarts au sens du χ2 :
RC-2013
(ni − n. pi ) 2
à 10–3 près. (1 colonne dans tableau)
n. pi
Reproduction interdite
18/64
7.7. On détermine la valeur de “χ2 calculé” sur la distribution après regroupement éventuel des
(ni − n. pi ) 2
2
classes si c’est le cas : c'
est la somme de la dernière colonne : χ cal =
.
n. pi
i
8. Recherche du χ2 théorique
8.1. On détermine lu nombre ν (lettre grecque nu) de degrés de liberté de la loi du χ2 :
ν = (nombre de classes après regroupement – nombre de paramètres estimés de la loi – 1)
Pour une loi normale le nombre de paramètres estimés de la loi = 2 sauf mention contraire.
8.2. Sur la table de χ2, on détermine la valeur du χ2 théorique à ne pas dépasser à l'
intersection
de la ligne de ν et de la colonne de α (le risque défini ci-dessus)
9. On prend la décision et on conclut (choix entre les deux hypothèses).
Test d'
ajustement à une loi de Poisson
Objectif : on dispose d'
une série statistique portant sur une variable numérique X discrète donnée
ponctuellement et portant sur un échantillon de taille n tiré au hasard dans une population Ω de
taille N.
On suppose qu'
on a réalisé des tests élémentaires permettant d'
envisager un ajustement par une loi
de Poisson (moyenne ≈ variance ; quotient des fréquences).
On souhaite confirmer par un test du χ2 l'
ajustement à une loi de Poisson de la variable X.
Les étapes du test à respecter scrupuleusement sont sensiblement les mêmes que pour une loi
normale.
Voici la liste exhaustive des différences :
• Etape 2 : on calcule la moyenne x à partir de l'
échantillon, appelée moyenne empirique avec les
formules habituelles (Chapitre I). On pose alors m = x , en arrondissant éventuellement.
m sera le paramètre de la loi de Poisson que l'
on va tester.
• Etape 3 : on remplace la dernière modalité X = xk par X ≥ xk.
• Etape 4 : (X) = (m) au lieu de (X) = (m ; ).
• Etape 7.1.: on calcule les probabilités théoriques pi en utilisant la formule de la loi de Poisson ou
la table sans avoir besoin d'
un changement de variable.
• La dernière probabilité théorique, P(X ≥ xk), se déduit par complément à 1 de toutes les
précédentes.
• Etape 8.1.: pour une loi de Poisson, le nombre de paramètres estimés de la loi = 1 sauf mention
contraire.
Toutes les autres étapes sont identiques à celles de la loi normale.
RC-2013
Reproduction interdite
19/64
Chapitre VII – Notions d'échantillonnage
On utilise que des échantillons indépendants ou assimilés à un indépendant (n/N < 0,1).
Dans une population Ω dite population-mère de taille N, on a défini une variable aléatoire X
attachée à chaque individu ω dont la loi et les caractéristiques (moyenne, variance, écart type
essentiellement) sont connues ou non. De la population, on extrait un échantillon de taille n :
pour l'
individu i de cet échantillon, on note Xi la variable aléatoire du type X qui lui est associée.
On code cet échantillon (X1, X2, …Xn) : cet échantillon est alors appelé échantillon aléatoire (EA).
1. Notations : (Ech = échantillon VA = variable aléatoire ; vo = valeur observée ou empirique)
taille
Population
N
Ech aléatoire (EA)
n
Ech observé (EO)
n
variable
X
Xi (VA)
xi (vo)
moyenne
M
m ou x (vo)
variance
V ou σ2
X n (VA)
S n2 (VA)
S n'2 (VA)
S’2 (vo)
fn (VA)
f (vo)
variance corrigée
p
fréquence
S2 (vo)
2. Variables aléatoires sur échantillon aléatoire (= statistique)
X + X 2 + ... X n
1 n
• Moyenne aléatoire dans un EA : X n = 1
Xi .
=
n
n i =1
avec : E( X n ) = M et V( X n ) =
σ2
n
.
• Variance aléatoire dans un EA : S n2 =
1
n
• Ecart type aléatoire dans un EA : S n =
n
i =1
X i2 – ( X n )2 avec : E( S n2 ) =
n −1 2
σ.
n
S n2 .
n
S n2 avec : E( S n'2 ) = σ2.
n −1
n
• Variance empirique dans un échantillon observé : S '2 =
S2.
n −1
Yn
• Fréquence aléatoire dans en EA : fn =
avec Yn variable binomiale de paramètres (n ; p).
n
p (1 − p )
avec : E(fn) = p et V(fn) =
.
n
• Variance aléatoire corrigée dans un EA : S n'2 =
3. Echantillonnage : lois d’échantillonnage
Situation : on suppose qu’on dispose d’informations sur la population (M, σ ou p).
Ces lois permettent de construire des intervalles de prédiction pour la moyenne ou la fréquence dans
un échantillon. (Hors programme pour l’écart type).
3.1. Pour une moyenne. Premier cas.
La variable X suit une loi
(M, σ). M et σ sont supposés connus : X n ➥
(M ;
σ
n
).
3.2. Pour une moyenne. Deuxième cas.
RC-2013
Reproduction interdite
20/64
On ne connaît pas la loi de X, M et σ sont supposés connus et n > 30.
Le théorème de la limite centrée permet de conclure : X n ➥
(M ;
σ
n
) (loi approchée).
3.3. Pour une moyenne. Deuxième cas.
On ne connaît pas la loi de X, M est connu mais σ ne l’est pas. On suppose n > 30.
Xn −M
Sn
n −1
➥
(0; 1).
3.4. Pour une fréquence : p est connu, pour n > 50, fn ➥
(p ;
p(1 − p)
).
n
4. Estimation
Situation : on suppose qu’on dispose d’informations sur un échantillon ( x , s ou f).
On cherche alors à estimer les paramètres dans la population M, σ ou p.
On peut donner des estimations ponctuelles ou des intervalles de confiance pour ces paramètres.
5. Estimateurs
Toute variable aléatoire fonction des n variables (X1, X2, …Xn) peut être un estimateur.
Un estimateur peut avoir un biais : c'
est l'
écart entre l'
espérance de l'
estimateur et le paramètre que
l’on veut estimer. Si le biais est nul, l'
estimateur est dit sans biais.
On souhaite aussi que la probabilité que l'
estimateur soit voisin du paramètre soit forte. Pour cela, il
suffit, pour un estimateur sans biais, que sa variance tende vers 0 quand n tend vers l'
infini.
On parle alors d'
estimateur convergent en probabilité.
On retiendra donc : les estimateurs utilisés doivent être sans biais et convergents.
On dit alors qu'
ils sont corrects.
Exemples fondamentaux :
∧
• M = X n : la moyenne aléatoire, est un estimateur sans biais et convergent de M.
∧
• V = S n'2 : la variance aléatoire corrigée, est un estimateur sans biais et convergent de σ2.
•
∧
p = fn : la fréquence aléatoire, un estimateur sans biais et convergent de p.
6. Estimations ponctuelles des paramètres d'une population à partir d'un échantillon observé
• Estimation ponctuelle de M : c'
est x , la moyenne empirique de l'
échantillon.
2
2
• Estimation ponctuelle de σ : c'
est S’ , la variance empirique corrigée de l'
échantillon,
• Estimation ponctuelle de p : c'
est f, la fréquence empirique de l'
échantillon.
7. Estimation par intervalle de confiance
Pour une moyenne : premier cas
On suppose σ connu avec X ➥
(M, σ) ou la loi de X inconnue mais n > 30.
Intervalle de confiance pour M au niveau de confiance 1 – α :
[x– t
RC-2013
σ
n
; x –t
σ
n
] avec t défini par P(– t ≤ T ≤ t) = 1 – α où T ➥
Reproduction interdite
(0, 1).
21/64
Pour une moyenne : deuxième cas
On suppose σ inconnu avec X ➥ (M, σ) ou la loi de X inconnue mais n > 30.
Intervalle de confiance pour M au niveau de confiance 1 – α :
S
S
; x –t
] avec t défini par P(– t ≤ T ≤ t) = 1 – α où T ➥
[x– t
n −1
n −1
(0, 1).
Pour une fréquence.
On suppose : n > 50.
Intervalle de confiance pour p au niveau de confiance 1 – α :
f −t
f (1 − f )
; f +t
n −1
f (1 − f )
n −1
avec t défini par P(– t ≤ T ≤ t) = 1 – α où T ➥
(0, 1).
Valeurs courantes de t
RC-2013
risque α
0,01
0,05
0,10
confiance (1 – α)
0,99
0,95
0,90
t
2,275
1,96
1,645
Reproduction interdite
22/64
Partie 2 : exercices
Chapitre I - Exercices sur la statistique descriptive à une variable
Exercice 1-1 (Polycop Paris)
Données ponctuelles : degré de satisfaction (note de 1 à 7) des clients d'
une agence vis-à-vis de leur
conseiller financier :
5
7
6
5
6
5
7
7
6
7
5
6
6
6
4
5
3
6
6
6
4
7
7
7
7
6
7
6
7
7
5
5
6
4
6
5
5
5
7
7
6
6
7
6
6
5
6
4
3
7
7
7
6
6
6
7
6
6
5
6
1. Définir la population, l’échantillon, l'
unité statistique, la variable et sa nature.
2. Construire le tableau de distribution (variable discrète) :
xi
ni
Total
n=
Exercice 1-2 (d'
après polycop Paris)
Données ponctuelles : durée (en jours) des audits de fin d’année d’une petite société :
12 14 19 18 15 15 18 17 20 27
22 23 22 21 33 28 14 18 16 13
1. Définir la population, l’échantillon, l'
unité statistique, la variable et sa nature.
2. Construire le tableau de distribution (variable continue) : choisir 5 puis 6 classes de même
amplitude.
Durée x Effectifs
Durée x Effectifs
≤x<
≤x<
≤x<
≤x<
≤x<
≤x<
≤x<
≤x<
≤x<
≤x<
≤x<
3. Calculer la moyenne arithmétique en utilisant chacun des trois tableaux. Commenter.
Exercice 1-3 (d'
après polycop Paris)
Durée d'
intervention en heures d’une société pour la réparation d'
appareils ménagers (échantillon).
Durée
Interventions
0
35
1
70
2
66
3
44
4
22
5
10
6
2
7
1
1. Définir la population, l’échantillon, l'
unité statistique, la variable et sa nature.
2. Déterminer le mode, la médiane et la moyenne arithmétique de cette série.
RC-2013
Reproduction interdite
23/64
Exercice 1-4 (Polycop Paris)
Distribution d'
un extrait de pièces métalliques selon leur diamètre (en mm).
Indice : i = n° classe
i=1
i=2
i=3
i=4
i=5
i=6
i=7
i=8
Variable xi
x < 97.5
97.5 ≤ x < 100[
100 ≤ x < 102.5
102.5 ≤ x < 105
105 ≤ x < 107.5
107.5 ≤ x < 110
110 ≤ x < 112.5
x ≥ 112.5
Effectif ni
22
31
39
53
55
46
33
21
1. Définir la population, l’échantillon, l'
unité statistique, la variable et sa nature.
2. Déterminer le mode, la médiane et la moyenne arithmétique de cette série.
Exercice 1-5
Le tableau donné ci-après indique la répartition des notes pour un partiel concernant 35 étudiants.
Note xi
Effectif ni
6
3
7
5
8
3
9 10 11 12 13 14
4 5 7 5 2 1
1. Préciser la population étudiée, la variable et sa nature.
2. Déterminer l’effectif total n de la série, les effectifs cumulés croissants et décroissants, les
fréquences, les fréquences cumulées croissantes et décroissantes. (Ces fréquences seront
données en % à 0,1% près.)
3. Construire les polygones des fréquences et des fréquences cumulées.
4. Déterminer à 10–3 près la médiane de cette série, la moyenne arithmétique, puis l’écart moyen
arithmétique par rapport à la moyenne arithmétique et l'
écart-type.
Exercice 1-6
Le tableau décrit l’évolution en pourcentage du chiffre d’affaires (CA) d’une entreprise d’une année
sur l’autre sur une période de 10 ans.
% d’augmentation xi
4
25 18 10
5
Nombre d’années ni
1
3
2
3
1
1.
2.
3.
4.
5.
Préciser la population étudiée, la variable et sa nature.
Préciser le coefficient multiplicateur CM1 d'
une année où le CA a augmenté de 4%.
Déterminer le coefficient multiplicateur global CMG sur l'
ensemble des 10 ans.
Quel est le pourcentage d’évolution à 0,01% près du CA sur les 10 ans ?
Le coefficient multiplicateur moyen annuel CMMA au cours des 10 années est défini par
l'
égalité CMMA10 = CMG : c’est le CM que l’on utiliserait 10 fois de suite pour obtenir la même
évolution des CA au bout de 10 ans. Déterminer ce coefficient multiplicateur moyen annuel.
6. Montrer que CMMA = (CM 1 ) 1 × (CM 2 )
f
f2
×…× (CM k ) k où fi est la fréquence de CMi.
f
C'
est la moyenne géométrique des 10 coefficients multiplicateurs annuels.
7. Quel est le pourcentage moyen d’évolution du CA à 0,01% près sur une année ?
Comparer sa valeur avec celle de la moyenne arithmétique de la série.
RC-2013
Reproduction interdite
24/64
Exercice 1-7
Pendant une période d'
un an, un voyageur de commerce a été amené à échanger régulièrement une
somme S exprimée en euros contre des dollars à un cours qui varie selon les périodes.
1. Il a d’abord réalisé un échange au cours c1 = 0,80 € le $ puis un second au cours c2 = 0,70 €.
1.1. Exprimer en fonction de S le nombre de dollars reçus lors du 1er puis du 2e échange.
1.2. Exprimer en fonction de S le nombre total de dollars reçus lors des 2 échanges.
1.3. Quel est le cours moyen cm du dollar en euros à 0,0001 € près au cours de ces 2 échanges ?
1.4. Montrer que l’inverse de cm est la moyenne arithmétique des inverses de c1 et c2.
Cette moyenne cm ainsi calculée est la moyenne harmonique de c1 et c2.
Comparer avec la moyenne arithmétique de c1 et c2.
2. Le tableau décrit le nombre de fois où la même somme S en euros a été échangée contre des
dollars au cours indiqué.
Cours ci du dollar en euros 0,80 0,75 0,70 0,78
Nombre ni d’échanges
3
2
4
1
2.1. Préciser la population étudiée, la variable et sa nature.
2.2. Exprimer en fonction de S le nombre total de dollars reçus lors des 10 échanges.
2.3. Quel est le cours moyen du dollar en euros à 0,0001 € près sur les 10 échanges ?
Montrer que :
1
=
cm
i
ni
/ n. (cm ainsi calculé est la moyenne harmonique de la série)
ci
2.4. Comparer sa valeur avec celle de la moyenne arithmétique de la série.
Exercice 1-8
Le tableau donné ci-après indique le montant des impôts locaux payés en 2008 par les contribuables
d’une commune rurale.
Montant de l’impôt en euros
de 0 € inclus à 80 € exclu
de 80 € inclus à 200 € exclu
de 200 € inclus à 300 € exclu
de 300 € inclus à 360 € exclu
de 360 € inclus à 440 € exclu
de 440 € inclus à 540 € exclu
de 540 € inclus à 680 € exclu
Ménages concernés
210
429
542
590
196
110
63
1. Préciser la population étudiée, la variable et sa nature.
2. Déterminer les effectifs cumulés croissants et décroissants.
3. Quel est, à 0,1 % près le pourcentage de contribuables payant au moins 200 € mais moins de
440 € d’impôt ?
4. Construire les polygones cumulatifs en choisissant comme unités 1 cm pour 40 € sur le 1er axe
et 1 cm pour un effectif de 200 sur le 2e axe.
5. En déduire graphiquement la valeur de la médiane.
6. Construire l’histogramme de la série.
On prendra : 1 cm pour 40 € sur le 1er axe et 4,5 mm comme hauteur du plus petit rectangle.
7. Déterminer, à un euro près :
7.1. la médiane, les 1er et 3e quartiles, les 1er et 9e déciles,
RC-2013
Reproduction interdite
25/64
7.2. l’étendue, l’interquartile et l’interdécile,
7.3. la moyenne x et l’écart-type S.
8. Déterminer, à 1 % près le pourcentage de contribuables dont le montant de l’impôt se situe entre
x – S et x + S.
Exercice 1-9
Le tableau ci-après indique la distance parcourue (en milliers de kilomètres) par 200 taxis avant leur
mise à la réforme.
Classes
ni
[75 ; 85[
10
[85 ; 90[
18
[90 ; 95[
28
[95 ; 100[
36
[100 ; 105[
50
[105 ; 110[
32
[110 ; 115[
14
[115 ; 125[
12
1. Préciser la population étudiée, la variable et sa nature.
2. xi désigne le centre d’une classe, on effectue un changement de variable: Xi = (xi – 102,5)/5.
Déterminer la moyenne arithmétique et l’écart-type de la série (Xi ; ni) puis la moyenne
arithmétique et l’écart-type de la série (xi ; ni) à un kilomètre près.
Exercice 1-10
1.
2.
3.
4.
5.
6.
Le tableau n°1 présente la répartition des salaires mensuels en centaines d’euros des 200
personnes employées par l’entreprise EXPEDITO spécialisée dans l’expédition de colis.
Les calculs dans les questions 1 à 3 seront présentés en tableau ; tous les détails sont demandés ;
on rappellera les formules utilisées.
Déterminer les effectifs cumulés croissants et décroissants (en tableau).
Construire :
2.1. les polygones des effectifs cumulés croissants et décroissants. Unités : 1 cm pour 200 € sur
le 1er axe et 1 cm pour 20 personnes sur le 2e.
2.2. l’histogramme. Unités : sur le premier axe, 1 cm pour 200 € et sur le deuxième axe, on
choisira 6 cm de hauteur pour le rectangle dont la base est l’intervalle [14 ; 20[.
Calculer, à 0,01 € près, la dominante, la moyenne arithmétique, la médiane, l’interquartile et
l’écart-type.
Le tableau n°2 présente la répartition des salaires mensuels en centaines d’euros des 300
personnes employées par l’entreprise RAPIDO spécialisée également dans l’expédition de colis.
Déterminer, à 0,01 € près, la dominante, la moyenne arithmétique, la médiane, l’interquartile et
l’écart-type.
Comparer et commenter les paramètres calculés pour les entreprises EXPEDITO et RAPIDO.
Facultatif. Le tableau 3 présente pour le groupe de 130 employés chargés dans l’entreprise
RAPIDO de trier des paquets (1000 chacun).
RC-2013
Reproduction interdite
26/64
Ils ont des débits différents exprimés en paquets par minute.
On demande, à 0,01 près, quel est le débit moyen par employé dans ce groupe : on justifiera la
démarche et on précisera si cette moyenne est du type arithmétique, géométrique ou
harmonique.
Tableau 1
Tableau 2
Tableau 3
Salaires Effectifs
[6 ; 10[
40
[10 ; 14[
52
[14 ; 20[
72
[20 ; 28[
24
[28 ; 38[
12
Nombre
Débit d’employés
30
23
28
35
26
57
24
15
Salaires Effectifs
[6 ; 10[
52
[10 ; 14[
67
[14 ; 20[
102
[20 ; 28[
56
[28 ; 38[
23
Exercice 1-11
Le tableau ci-dessous indique dans un échantillon de 100 ménages la répartition suivant le nombre
d'
enfants. Construire la courbe de concentration et déterminer le coefficient de Gini. Commenter.
Nombre d'
enfants
Nombre de ménages
0
42
1
18
2
33
3
5
4
1
5
1
Exercice 1-12
D'
après l'
INSEE, en 1986, la répartition en pourcentage des agents de l'
état (hommes) selon le
montant de leur salaire annuel net, en unités monétaires, était résumée dans le tableau ci-après :
Salaire
30-60
60-70
70-80
80-90
90-100
100-110
1.
2.
3.
4.
5.
6.
%
4,5
9,8
19,0
12,6
10,8
11,0
Salaire
110-120
120-140
140-180
180-260
260-400
%
11,2
8,2
8,4
4,0
0,5
Construire l'
histogramme de la série.
Déterminer le mode.et la médiane. Interpréter
Déterminer la fonction de répartition et la représenter.
Déterminer l'
intervalle interquartile et le rapport interdécile. Interpréter.
Construire la courbe de Lorentz (courbe de concentration) des salaires des hommes.
Déterminer le coefficient de Gini. Commenter.
Exercice 1-13
Le tableau ci-dessous décrit la répartition des 94 550 surfaces agricoles d'
un pays d'
Amérique du
Sud (Colonnes 1 et 2).
Les effectifs ont été arrondis à 20 près pour alléger les calculs.
1. Construire la courbe de concentration de Lorenz.
2. Calculer l'
indice de Gini pour la série portant sur la répartition des surfaces agricoles.
RC-2013
Reproduction interdite
27/64
Etendues des exploitations xi Effectifs ni
moins de 1 ha
14900
de 1 à moins de 2 ha
8200
de 2 à moins de 5 ha
14200
de 5 à moins de 10 ha
14400
de 10 à moins de 20 ha
19400
de 20 à moins de 30 ha
10600
de 30 à moins de 50 ha
8300
de 50 à moins de 80 ha
3200
de 80 à moins de 100 ha
650
100 ha et plus
700
Totaux
94550
RC-2013
fi
Reproduction interdite
Fi
Centres ci
Si
qi
28/64
Chapitre II - Exercices sur la statistique descriptive à deux variables
Exercice 2-1
On a soumis 8 élèves d’une classe d’un établissement d’enseignement technique à un test d’habileté
(noté x sur 10). Pour chacun de ces élèves, on a relevé le temps y (compté en heures) de fabrication
en atelier d’une pièce de moteur. Les résultats sont consignés dans le tableau ci-après.
Elève 1 2 3 4 5 6 7 8
xi
2 1 3 3 5 6 7 5
yi
7 6 5 4 3 3 2 2
1. Représenter, dans un repère orthogonal, le nuage statistique de la série double (xi , yi).
Pour les calculs qui suivent (questions 2 et 3), on détaillera les calculs en tableau.
2. Déterminer à 10 – 2 près le coefficient de corrélation linéaire r(x,y) de la série (xi , yi).
Est-il satisfaisant pour envisager un ajustement affine ?
3. Déterminer à 10 – 2 près le coefficient de détermination de la série (xi , yi). Interpréter.
4. Déterminer une équation cartésienne de la première et de la deuxième droites de régression
notées respectivement Dy/x et Dx/y.
5. Construire sur le dessin la première droite de régression.
6. Quelle est la signification concrète des coefficients a et b dans l’équation y = ax + b de Dy/x ?
7. On veut estimer le temps y pour un élève dont la note x au test est 6,5.
7.1. Quelle droite faut-il utiliser? Estimer y.
7.2. Quelle estimation de y obtient-on si la note est 10 ? Commenter.
8. On veut estimer la note x d’un élève dont le temps y est 3,5.
Quelle droite faut-il utiliser ? Estimer x à 0,1 près.
Exercice 2-2
Un technicien doit étudier la résistance à la traction de tiges d'
acier en fonction de la teneur en
carbone de l'
acier. Ses travaux portent sur douze tiges d'
acier de même longueur et de même
section. Il dispose de la teneur en carbone de ces tiges et il mesure leur résistance à la traction.
Les résultats des douze expériences sont consignés dans le tableau ci-après dans lequel :
- x désigne le pourcentage de carbone contenu dans l’acier,
- y désigne la résistance à la traction exprimée avec comme unité le mégapascal (MPa).
Expériences
1
2
3
4
5
6
7
8
9
10
11
12
RC-2013
x
0,10
0,30
0,15
0,60
0,70
0,20
0,30
0,15
0,55
0,60
0,20
0,40
Reproduction interdite
y
358
522
400
849
885
434
568
387
783
822
411
610
29/64
1.
2.
3.
4.
Construire le nuage de points : peut-on envisager une liaison affine entre x et y ?
Confirmer la réponse précédente en cherchant le coefficient de corrélation linéaire.
Quelle est la variable explicative ? la variable expliquée ?
Déterminer une équation de la première droite de régression D y/x.
On donnera les coefficients avec quatre chiffres significatifs.
Exercice 2-3
Cas particulier de série double : série chronologique (la première variable est le temps).
Le tableau ci-après indique le chiffre d’affaires en millions d'
euros d’une entreprise sur 8 années.
Pour simplifier, on numérote les années en appelant, par exemple, 2002, l’année 1 (ligne xi).
Année 2002 2003 2004 2005 2006 2007 2008 2009
xi
1
2
3
4
5
6
7
8
yi
4,5 6,5 6,8 7,8 9,3 10,5 12,2 12,8
1. Déterminer les moyennes arithmétiques x et y , les variances S2(x) et S2(y) et la covariance
cov(x,y) de la série (xi , yi).
2. Déterminer à 10 – 2 près le coefficient de corrélation linéaire r(x,y) de la série (xi , yi).
Est-il satisfaisant pour envisager un ajustement affine ?
3. Déterminer une équation de la première droite de régression Dy/x en donnant les coefficients avec
trois chiffres significatifs.
4. Si la tendance se confirme, que peut-on prévoir comme chiffre d’affaires en l’an 2011 à 0,1
million d’euros près ?
5. Si la tendance se confirme, déterminer l’année où le chiffre d’affaires dépassera pour la première
fois 20 millions d'
euros.
Exercice 2-4
La pollution par le dioxyde de soufre et le dioxyde d’azote dans une ville de la région PACA est
donnée par le tableau suivant : L’unité utilisée est le microgramme par mètre cube d’air.
L’année 1 est l’année 2002.
Année : ti
Teneur en soufre : Si
Teneur en azote : Ni
1 2 3 4 5 6 7 8
24 23 20 21 18 19 17 17
50 49 50 48 48 47 42 39
Partie A
1. Déterminer le coefficient de corrélation linéaire de la série double (Si , Ni) à l0–3 près.
2. Si l’on admet que le coefficient de corrélation linéaire r n’est satisfaisant que si r ≥ 0,9, peuton accepter le modèle affine entre S et N ?
Partie B
3. Déterminer les coefficients de corrélation linéaire des séries chronologiques (ti , Si) et (ti , Ni).
4. Si l’on admet que le coefficient de corrélation linéaire r n’est satisfaisant que si r ≥ 0,9, peuton accepter le modèle affine comme relation entre S et t ? entre N et t ?
5. Déterminer dans le (ou les) cas favorable de la question 5 une équation de la première droite de
régression des séries (ti , Si) et (ti , Ni). (On donnera les résultats avec trois chiffres significatifs)
6. Dans le ou (les cas) favorable de la question 5, déterminer, en utilisant la question 4, une
estimation arrondie à l’unité de la ou les variables correspondantes S et/ou N en 2012.
RC-2013
Reproduction interdite
30/64
Exercice 2-5
Le tableau ci-dessous donne la répartition des effectifs des salariés d’une entreprise suivant l’âge et
la rémunération mensuelle nette.
On complétera le tableau ci-après pour effectuer les calculs demandés.
Les produits nij.xi.yj seront écrits dans les demi-cases centrales.
1. Préciser la population, les variables étudiées et leur nature.
2. Déterminer les effectifs marginaux.
3. Déterminer la moyenne et l’écart type des deux variables à 10–2 près.
4. Déterminer la covariance à 10–4 près.
5. Déterminer le coefficient de corrélation à 10–2 près. Commenter.
Age yj →
Salaire xi ↓
[17; 30[
[500; 800[
[800; 1200[
[1200; 2000[
[2000; 5000[
[30; 45[
[45; 55[
164
33
5
380
349
9
271
932
296
58
761
582
ni •
ni • x i
ni • xi2
n• j
n• j y j
n• j yj2
Exercice 2-6
Une enquête portant sur les salariés d’une entreprise a permis de mettre en relation le montant d’une
prime annuelle x exprimée en euros et l’ancienneté y en années au sein de l’entreprise.
Les données sont consignées dans le tableau ci-dessous.
Les résultats demandés seront arrondis :
pour x, à 1 euro près, pour y en années et mois à 1 mois près.
xi
RC-2013
\ yj
[4;8[
[8;12[
[12;16[
[16;20[
[20;24[
[140;160[ 7
3
0
0
0
[160;200[ 32
17
5
3
0
[200;220[ 9
19
18
9
7
[220;260[ 0
4
17
15
16
[260;300[ 0
0
0
4
19
Reproduction interdite
31/64
1. Déterminer la moyenne et l’écart-type des deux variables, la covariance à 10–6 près puis le
coefficient de corrélation linéaire à 10–3 près ainsi que le coefficient de détermination.
2. Commenter les valeurs de r et de r2.
3. Déterminer, en tableau, les séries marginales et les effectifs cumulés croissants de ces séries.
4. Déterminer la médiane des primes et celle de l’ancienneté.
5. Déterminer, à 1% près, le pourcentage de salariés :
5.1. dont la prime est comprise entre x – S(x) et x + S(x).
5.2. dont l’ancienneté est comprise entre y – S(y) et y + S(y).
6. Déterminer la prime moyenne des salariés dont l’ancienneté est dans l’intervalle [12 ; 16[.
(Série conditionnelle de x connaissant y).
7. Déterminer l’ancienneté moyenne des salariés dont la prime est dans l’intervalle [160 ; 200[.
(Série conditionnelle de y connaissant x)
Exercice 2-7
Pour étudier une série double (xi , yj ; nij), on a utilisé un changement de variables affines pour les
deux variables en posant : Xi = (xi – 46)/5 et Yj = (85 – yj)/10.
On a alors étudié la série (Xi , Yj ; nij) et on a obtenu les résultats suivants : pour les moyennes, variances, covariance et coefficient de corrélation linéaire :
X = 7,2 ; Y = 6,8 ; S2(X) = 3,5 ; S2(Y) = 2,6 ; cov(X,Y) = 2 ; r(X,Y) = 0,94.
Montrer que les changements de variables sont bien affines.
En déduire les valeurs de x , S2(x), S(x), y , S2(y)), S(y), cov(x,y) et r(x,y).
Exercice 2-8
Une entreprise fabrique un produit A. Le prix de revient d’une unité varie selon que le produit est
vendu à l’unité, par lots de 2, de 3, ...et de 8, selon le tableau ci-après dans lequel :
xi désigne le nombre d’unités par lot, yi désigne le prix de revient d’une unité en euros.
xi
yi
1
2
1504 809
3
540
4
438
5
375
6
320
7
290
8
254
Partie A
1. Représenter le nuage de points dans un repère orthogonal dont les unités sont : 1 cm sur le
premier axe et 1 cm pour 200 € sur le deuxième axe.
2. Déterminer la valeur exacte des moyennes x et y , des variances S2(x) et S2(y) et de la
covariance cov(x,y) de la série double (xi , yi).
3. Déterminer une équation de la première droite de régression Dy/x : on donnera seulement une
valeur approchée à 10–2 près des coefficients.
Construire cette droite sur le dessin. Peut-on dire que cette droite ajuste bien le nuage ?
4. Estimer le prix de revient unitaire pour des lots de 10. Commenter.
5. Calculer le coefficient de corrélation r(x,y) à 10–2 près. Commenter.
Partie B (Complément : pour ceux qui connaissent les logarithmes)
Pour améliorer l’ajustement, on va effectuer un ou deux changements non affines sur les variables.
Les coefficients de corrélation sont demandés à 10–3 près.
Les coefficients des droites et des fonctions sont demandés avec trois chiffres significatifs.
RC-2013
Reproduction interdite
32/64
1. On pose Xi = ln xi.
Calculer le coefficient de corrélation r(X,y) et une équation de la 1ere droite de régression Dy/X de
la série (Xi , yi). En déduire y en fonction de x.
2. On pose Yi = ln yi.
Calculer le coefficient de corrélation r(x,Y) et une équation de la 1ere droite de régression DY/x de
la série (xi ,Yi). En déduire y en fonction de x.
3. On pose Xi = ln xi et Yi = ln yi.
Calculer le coefficient de corrélation r(X,Y) et une équation de la 1ere droite de régression DY/X de
la série (Xi ,Yi). En déduire y en fonction de x.
4. En utilisant les 3 fonctions déterminées précédemment, estimer le prix de revient unitaire pour
des lots de 10. Commenter. Lequel faut-il retenir ?
5. Construire sur le dessin la courbe la plus fiable.
RC-2013
Reproduction interdite
33/64
Chapitre III - Exercices sur les indices
Exercice 3-1
Cotation physique du lait : prix moyen payé aux producteurs en France.
Année - Trim.
2010 - 1
2010 - 2
2010 - 3
2010 - 4
2011 - 1
2011 - 2
2011 - 3
Valeur €/1000 litres
289
282
330
330
308
355
325
Source : http://www.web-agri.fr/observatoire_marches/lait.html
On s'
intéresse à l'
évolution du prix d'
un millier de litres de lait en euros.
1. On s'
intéresse à l'
évolution du prix entre les trimestres 1 de 2010 et 2011.
1.1. Quelle est la variation absolue entre ces dates ?
1.2. Quelle est la variation relative en pourcentage entre ces dates à 0,1% près ?
1.3. Calculer le rapport des deux prix à 10–3 près et retrouver le résultat précédent.
1.4. Si l'
on prend comme base 100 du prix du lait au trimestre 1 de 2010, quel est, à 0,1 près
l'
indice élémentaire du prix du lait au trimestre 1 de 2011 ?
2. On s'
intéresse à l'
évolution du prix entre les trimestres 1 et 2 de 2010.
2.1. Quelle est la variation absolue entre ces dates ?
2.2. Quelle est la variation relative en pourcentage entre ces dates à 0,1% près ?
2.3. Calculer le rapport des deux prix à 10–3 près et retrouver le résultat précédent.
2.4. Si l'
on prend comme base 100 du prix du lait au trimestre 1 de 2010, quel est, à 0,1 près
l'
indice élémentaire du prix du lait au trimestre 2 de 2010 ?
3. Si l'
on prend comme base 100 du prix du lait au trimestre 1 de 2010, quel est, à 0,1 près, l'
indice
élémentaire du prix du lait aux 7 dates proposées dans le tableau ?
indice élémentaire du prix du lait au trimestre 2 de
4. Déduire du tableau précédent, à 0,1 près, l'
2011 si l'
on prend comme base le trimestre 2 de 2010.
5. Interpréter cet indice en terme de pourcentage.
Exercice 3-2
Indices sur les prix. Prix moyen du litre de gazole en euros.
Compléter le tableau. Arrondir les indices à 0,01 près.
Année
Prix €
I/1992
I/2000
RC-2013
1992
0,54
100
1994
0,59
1996
0,66
1998
0,64
2000
0,85
2002
0,77
2004
2006
1,08
2008
2010
1,16
164,81
100
Reproduction interdite
150,59
34/64
Exercice 3-3
Indices sur les quantités.
Quantité moyenne en grammes de pain consommé par jour et par habitant en France.
Compléter le tableau. Arrondir les indices à 0,01 près.
Année
Quantité
I/1960
I/2000
1960
245
100
1970
220
1980
195
1990
170
2000
153
2002
165
100
2007
59,18
2008
91,50
Exercice 3-4 (Polycop Paris)
On dispose, pour les ventes totales de gaz en France, des séries d’indices suivantes (source G.D.F.) :
Année
1967
1968
Indice base 100 en 1955
250
284
1969
Indice base 100 en 1969
1970
1971
1972
139
172
382
100
121
1. En utilisant les indices, de bases différentes, de l’année 1970 montrer que I69/55 ≈ 315,70.
2. Calculer, à 0,01 près, les six indices manquants du tableau ci-dessus.
3. Sachant qu’en 1969 les ventes de gaz s’élevaient à 35 455 Mth (millions de thermies), calculer :
Les ventes totales de gaz en 1967 puis en 1972 à 1 Mth près.
4. Sachant que I62/55 = 160, déterminer :
4.1. Le taux global (resp. annuel moyen) de variation des ventes totales de gaz pour la période
1955-1962. On arrondira ces taux à 0,01% près si nécessaire.
4.2. Le taux global (resp. annuel moyen) de variation des ventes de gaz pour la période 19621972. On arrondira ces taux à 0,01% près si nécessaire.
Exercice 3-5
Un visiteur médical veut étudier l'
évolution de ses dépenses d'
hôtel et de restauration pour les
années 2006 et 2010.
2006
2010
Quantité
Prix moyen unitaire (€)
Quantité
Prix moyen unitaire (€)
Hôtels
120
80
90
100
Restaurants
200
50
150
70
Cafés
40
10
50
30
1. Calculer, à 0,1 près, les indices simples des prix en 2010 (base 100 en 2006).
2. Calculez les dépenses de l'
année servant de base.
3. En déduire, à 0,1 près, l'
indice des prix de Laspeyres, de Paasche et de Fisher.
RC-2013
Reproduction interdite
35/64
Exercice 3-6
Evolution des prix et des quantités sur un panier de 3 grandes cultures sur la période 1992-2004.
Dates
1992
1998
2004
prix
10,3
13,9
12,6
Blé tendre
quantité
50
55
58
prix
9,3
10,7
9,6
Mais
quantité
40
35
30
prix
20,1
26,0
24,2
Colza
quantité
20
25
28
Les prix sont exprimés en euros par quintal. Les quantités sont exprimées en quintaux.
Prix mondiaux pour le blé et le maïs ; prix OCDE pour le colza.
OCDE = Organisation de coopération et de développement économiques.
Source : http://www.insee.fr/fr/ffc/docs_ffc/ref/agrifra07f.pdf
On prend l'
année 1992 comme année de référence (base 100).
1. Déterminer l'
indice des prix de Laspeyres et de Paasche en 1998 et 2004.
2. Déterminer l'
indice des quantités de Laspeyres et de Paasche en 1998 et 2004.
Exercice 3-7
On veut étudier l'
évolution des prix d'
un panier de 4 produits alimentaires sur les années 2003, 2008
et 2010. Le tableau ci-dessous indique le prix des denrées en unités monétaires (u.m.) et les
quantités achetées en kilogrammes.
Prix au kg
Produits
1.
2.
3.
4.
5.
6.
Quantités
P 2003
P 2008
P 2010
Q 2003
Q 2008
Q 2010
bœuf
26,18
30,08
31,89
17,6
16,7
15,9
pâtes
1,98
2,11
2,23
6,7
6,9
7,0
lait
1,15
1,20
1,23
76,7
71,0
68,5
huile
4,15
4,35
4,39
11,3
11,6
11,8
Calculer
Comparer
Calculer
Comparer
Calculer
Comparer
10/03(p),
10/08(p)
et 08/03(p).
10/08(p)× 08/03(p) et
10/03(p).
10/03(p),
10/08(p) et
08/03(p).
10/08(p)× 08/03(p) et
10/03(p).
03/10(p) et
03/10(p).
03/10(p),
03/10(p),
10/03(p) et
10/03(p).
Exercice 3-8
Tous les indices seront calculés à 0,01 près. Tous les pourcentages seront calculés à 0,01 % près.
RC-2013
Année 2006
Année 2006
Année 2009
Année 2009
Produit
Prix
Quantité
Prix
Quantité
A
2000
57
2400
97
B
6800
17
8000
67
Reproduction interdite
36/64
Tableau de calculs
p0 q0
p0 qt
ptq0
ptqt
Totaux
1. On prend comme base 100 en 2006.
Déterminer les indices élémentaires du produit A en 2009 :
1.1. Indice des prix :
1.2. Augmentation en % :
1.3. Indice des quantités :
1.4. Augmentation en % :
2. On prend comme base 100 en 2006.
Déterminer les indices :
2.1. des valeurs globales
(V) =
(p) =
2.2. des prix de Laspeyres
2.3. des quantités de Laspeyres
(q) =
2.4. des prix de Paasche
(p) =
(q) =
2.5. des quantités de Paasche
2.6. des prix de Fisher
(p) =
2.7. des quantités de Fisher
(q) =
3. De 2006 à 2009, quelle est l'
augmentation de la valeur globale en % ?
4. Décomposer cette augmentation en précisant :
augmentation dû au prix (utiliser Laspeyres) :
4.1. le % d'
4.2. le % d'
augmentation dû aux quantités :
5. De 2006 à 2009, quelle est l'
augmentation annuelle moyenne de la valeur globale en % ?
RC-2013
Reproduction interdite
37/64
Chapitre IV - Exercices sur les variables aléatoires discrètes
Exercice 4-1
Dans une urne contenant 4 jetons ronds dont 1 bleu et 3 verts et 5 jetons carrés dont 3 bleus et 2
verts, on tire simultanément 3 jetons. On suppose les tirages équiprobables.
On note : X le nombre de jetons ronds tirés et Y le nombre de jetons verts tirés.
1. On admet que les lois de probabilité de X et Y sont définies par les tableaux ci-après :
0
X(Ω)
PX
5/42
1
2
3
20/42 15/42 2/42
0
1
2
3
Y(Ω)
PY
2/42 15/42 20/42 5/42
1.1. Montrer que les tableaux ci-dessus définissent bien des lois de probabilité.
1.2. Déterminer l’espérance et la variance des variables aléatoires X et Y. Commenter.
2. On admet : P([X = 1] ∩ [Y = 2]) = 19/84.
Les variables aléatoires X et Y sont-elles indépendantes ?
3. Définir et représenter la fonction de répartition de X.
Exercice 4-2
On considère trois variables aléatoires X, Y et Z dont les lois de probabilité sont définis ci-dessous :
X(Ω) 1
PX
0,4
1.
2.
3.
4.
5.
3
0,2
5
0,3
10
0,1
3
Y(Ω) 1
PY 0,2 0,25
5
p
10
0,15
Z(Ω)
PZ
1
q
3
0,3
5
0,1
10
r
Montrer que le tableau de X définit bien une loi de probabilité. Calculer l'
espérance E(X) de X.
Déterminer et représenter le fonction de répartition de X. Interpréter les valeurs obtenues.
A quelles conditions le tableau de Y définit-il une loi de probabilité ? Déterminer p.
A quelles conditions le tableau de Z définit-il une loi de probabilité ?
On suppose que Z a la même espérance que X.
Déterminer q et r. Donner les valeurs exactes i.e. non arrondies.
Exercice 4-3
Un dé cubique à 6 faces est truqué de telle façon que la variable X qui exprime le nombre lisible sur
la face supérieure admet pour loi de probabilité le tableau suivant :
X(Ω)
1
2
3
4
5
6
P(X = x)
k
2k
3k
4k
5k
6k
1. Déterminer la valeur de k pour que X soit bien une variable aléatoire ayant comme loi de
probabilité le tableau ci-dessus.
2. Calculer l’espérance mathématique et la variance de X.
3. Construire le graphique de la distribution.
4. Déterminer la fonction de répartition et construire sa courbe représentative.
RC-2013
Reproduction interdite
38/64
Exercice 4-4
Suite à une enquête interne dans un grand magasin d'
électroménager, on a constaté qu'
en une
matinée, le nombre de lave-linge vendus variait de 0 à 5 avec des probabilités données ci-dessous.
X
0
1
2
3
4
5
P(X = x)
0,20
0,35
p
0,15
0,05
0,02
1.
2.
3.
4.
Pour quelle valeur p le tableau précédent représente-t-il une loi de probabilité de la variable X ?
Déterminer alors avec cette valeur de p l’espérance mathématique et la variance de X.
Déterminer la fonction de répartition de X. Interpréter.
Soit Y une variable aléatoire définie par Y = αX avec α une constante positive.
La variance de la variable aléatoire Y est V(Y) = 37,16. Déterminer la valeur α.
5. Soit Z une variable aléatoire définie par Z = βX + γ avec β (béta) et γ (gamma) deux constantes.
On sait : E(Z) = 34,4 et V(Z) = 334,44.
Déterminer les valeurs β et γ. Donner toutes les solutions.
Exercice 4-5
Dans une salle de jeu, on propose le jeu suivant, dit jeu 1.
On mise 4 € et on tire une carte dans un jeu de 32 cartes :
• pour un as tiré, on gagne 10 € ; pour un roi ou une dame on gagne 5 € ;
• pour un valet ou un dix, on gagne 2 € ; pour une autre carte, on ne gagne rien.
On appelle : X le gain brut (sans tenir compte de la mise)
Y le gain algébrique (ce que l'
on gagne moins ce que l'
on a misé).
1.
2.
3.
4.
5.
6.
7.
Déterminer l'
ensemble des valeurs de X.
Déterminer la loi de X.
Déterminer la fonction de répartition F de X et tracer son graphique..
Calculer l'
espérance et la variance de X.
Exprimer Y en fonction de X puis déterminer l'
espérance et la variance de Y.
Quelle est la probabilité que le gain algébrique soit positif ?
On constate que E(Y) ≠ 0 : on dit que le jeu n'
est pas équitable.
Comment modifier la mise pour qu'
il le devienne ?
8. On décide de porter la mise à 9 € et de doubler les gains bruts. On note Z le gain algébrique.
Exprimer Z en fonction de X puis déterminer l'
espérance et la variance de Z.
Le propriétaire de la salle de jeu propose aussi un autre jeu, dit jeu 2.
On mise 3 € et on lance un dé cubique non truqué :
• pour un 6 ou un 5, on gagne 6 € ;
• sinon on ne gagne rien.
On note T le gain algébrique du jeu 2.
9. Déterminer l'
ensemble des valeurs de T.
10. Déterminer la loi de T.
espérance et la variance de T.
11. Calculer l'
RC-2013
Reproduction interdite
39/64
Harold choisit de combiner les deux jeux en misant 4 € sur le jeu 1 et 3 € sur le jeu 2.
Il tire alors une carte et lance le dé. On note S son gain algébrique total.
12. Exprimer S en fonction de Y et T.
13. En déduire l'
espérance et la variance de S. (Y et T sont indépendantes)
Marion et Kenza décident de jouer 18 € chacun mais de deux façons différentes.
Marion mise 4 € sur le jeu 1, tire une carte, la remet, mise à nouveau 4 € sur le jeu 1, tire une carte,
la remet et mise une dernière fois 4 € sur le jeu 1, tire une carte, la remet.
Elle mise ensuite 3 € sur le jeu 2, lance le dé, mise de nouveau 3 € sur le jeu 2 et lance le dé.
Kenza mise 12 € sur le jeu 1, tire une carte, la remet puis mise 6 € sur le jeu 2 et lance le dé.
14. Exprimer le gain algébrique R de Kenza en utilisant des variables définies précédemment et
calculer l'
espérance et la variance de R.
15. Exprimer le gain algébrique C de Marion en utilisant des variables définies précédemment et
calculer l'
espérance et la variance de C.
16. Comparer, commenter.
Exercice 4-6
Toutes les probabilités seront données à 10–4 près.
Un candidat à un concours doit remplir un QCM comportant 10 questions.
Le candidat obtient 1 point à la question si la réponse est bonne, 0 point dans tous les autres cas.
On admet qu’à chaque question, il a 80% de chances de répondre correctement.
On suppose que les questions (donc les réponses) sont indépendantes.
On note X le total des points obtenus.
1. Déterminer la loi de X. Justifier avec soin. Donner l’espérance de X.
2. Quelle est la probabilité que le candidat obtienne 8 ? 10 ? Au moins 8 ?
Exercice 4-7
Pour financer ses études une étudiante fait du démarchage par téléphone pour vendre un produit qui
lui rapporte 20 euros. Elle ne peut vendre qu’un produit par appel.
Lorsqu’elle compose un numéro de téléphone, trois possibilités se présentent :
• l’événement A "personne ne répond" de probabilité p(A) égale à 0,3;
• l’événement B "le répondeur diffuse un message" avec une probabilité p(B) égale à 0,1;
• l’événement C "un correspondant répond" de probabilité p(C) égale à 0,6.
1. Quand le correspondant répond à son appel, la probabilité que l’étudiante vende son produit est
égale à 0,4. Les probabilités qu’elle vende son produit dans les autres cas sont nulles.
Montrer que la probabilité que l’étudiante réalise une vente lors d’un appel est 0,24.
2. On suppose que l’étudiante compose successivement de manière indépendante 10 numéros de
téléphone au hasard dans la soirée.
On appelle Y la variable aléatoire égale au nombre de fois où elle réalise une vente.
Déterminer la loi de probabilité, l’espérance et la variance de Y.
3. Déterminer, à 10–4 près, la probabilité qu’elle réalise exactement deux ventes.
4. Déterminer, à 10–4 près, la probabilité qu’elle réalise au plus deux ventes.
5. Lorsque personne ne répond à son appel téléphonique, l’étudiante débourse 0 euro.
Lorsqu’un répondeur téléphonique diffuse un message, l’étudiante débourse 1 euro.
RC-2013
Reproduction interdite
40/64
Lorsqu’un correspondant répond, l’appel coûte 1 euro et dans ce cas, elle peut vendre son
produit qui lui rapporte 20 euros ou ne pas le vendre.
On considère la variable aléatoire G correspondant au gain algébrique (positif ou négatif) de
l’étudiante lors d’un appel téléphonique.
Par exemple, son gain algébrique est égal à – 1 dans deux cas : les préciser et démontrer que la
probabilité que le gain algébrique soit égal à – 1 est 0,46.
6. Montrer que G peut prendre deux autres valeurs et déterminer la loi de probabilité de G.
7. Calculer l’espérance mathématique, la variance et l’écart-type à 0,01 près de G.
Exercice 4-8
Un cabinet médical de deux médecins Dr A et Dr B emploie une standardiste pour répondre au
téléphone des deux médecins.
Le nombre d’appels reçus pour le Dr A pendant une période de deux heures au cours d’une journée
donnée est une variable aléatoire X qui suit une loi de Poisson de paramètre 6.
Le nombre d’appels reçus pour le Dr B pendant une période de deux heures au cours d’une journée
donnée est une variable aléatoire Y qui suit une loi de Poisson de paramètre 8.
On suppose que X et Y sont des variables indépendantes.
1. Déterminer la probabilité d’avoir pour une période donnée au plus 5 appels pour le Dr A.
2. Déterminer la probabilité d’avoir une période donnée plus de 6 appels pour le Dr A.
3. Quel nombre d’appels pour le Dr A la standardiste est-elle assurée (avec une probabilité d’au
moins 0,95) de ne pas dépasser pendant une période donnée ?
On note S le nombre total d’appels dans le cabinet (i.e. pour les deux docteurs) pour une période
donnée de deux heures,.
4. Déterminer et justifier la loi de S.
5. Déterminer la probabilité d’avoir une période donnée 9 appels pour le cabinet.
6. Déterminer la probabilité d’avoir une période donnée 4 appels pour le Dr A et 5 appels pour le
Dr B.
7. Comparer et commenter les résultats des deux questions précédentes.
On note Z le nombre total d’appels pour le Dr A au cours d’une matinée de quatre heures.
On suppose que les appels au cours des 2 périodes de 2 heures sont indépendants.
8. Déterminer et justifier la loi de Z.
9. Déterminer la probabilité d’avoir pendant une matinée de quatre heures :
9.1. chaque période de deux heures au plus 5 appels pour le Dr A,
9.2. au plus 10 appels pour le Dr A.
On notera la différence entre les deux dernières questions. Commenter.
Exercice 4-9
Toutes les probabilités seront données à 10 – 3 près.
Le problème étudie le nombre de clients dans une supérette du secteur alimentation.
Dans la supérette Miniprix le nombre de clients entrant dans le magasin pendant 15 minutes est une
variable aléatoire X qui suit une loi de Poisson de paramètre 7.
1. Déterminer la probabilité des événements :
1.1. Il y a 4 clients en un quart d’heure.
1.2. Il y a au maximum 5 clients en un quart d’heure.
RC-2013
Reproduction interdite
41/64
1.3. Il y a entre 5 et 9 clients en un quart d’heure.
2. Le gérant veut annoncer un nombre maximum de clients en un quart d’heure.
2.1. C’est impossible : expliquer pourquoi.
2.2. A défaut, le gérant souhaite annoncer un nombre maximum a de clients en un quart d’heure
dont il est sûr à 90% : quel nombre a doit-il annoncer ?
On suppose que les nombres de clients par quart d’heure sont indépendants les uns des autres
(pour toute la suite du problème).
3. On note Y le nombre de clients en une demi-heure dans la supérette.
3.1. Déterminer la loi de Y.
3.2. Quelle est la probabilité qu’il y ait au maximum 10 clients en une demi-heure ?
3.3. Quelle est la probabilité que deux fois de suite en deux fois un quart d’heure il y ait au
maximum 5 clients ?
On notera la différence entre les deux dernières questions. Commenter.
RC-2013
Reproduction interdite
42/64
Chapitre V - Exercices sur les variables aléatoires continues
Exercice 5-1
T est une variable aléatoire centrée réduite, autrement dit
1. Déterminer les probabilités suivantes :
1.1. P(T ≤ 2,04).
1.2. P(0,78 < T ≤ 1,27).
1.3. P(T > 1,75).
1.4. P(T > 3,7)
1.5. P(T ≤ 0,753).
1.6. P(T ≤ – 1,96).
1.7. P(– 0,84 < T < 0,84).
1.8. P(T > – 1,56).
1.9. P(– 1,35 < T ≤ 0,95)
2. Déterminer t vérifiant la relation :
2.1. P(T ≤ t) = 0,9418.
2.2. P(T ≤ t) = 0,87.
2.3. P(T > t) = 0,421.
2.4. P(T ≤ t) = 0,218.
2.5. P(– t ≤ T ≤ t) = 0,90.
2.6. P( T < t) = 0,82.
(T) =
(0 ; 1).
Exercice 5-2
X est une variable aléatoire qui suit une loi normale (15; 4).
1. Déterminer à 10–4 près les probabilités suivantes :
1.1. P(X ≤ 20)
1.2. P(X > 29)
1.3. P(9 ≤ X ≤ 21)
1.4. P(|X – 15| < 2)
1.5. P(|X –12| ≥ 2)
2. Déterminer, à 10–3 près, le réel a que X a 90% de chances de ne pas dépasser.
3. Déterminer, à 10–3 près, le réel b que X a 70% de chances de dépasser.
espérance de X
4. Déterminer un intervalle [a ; b] dit “intervalle de prédiction” pour X, centré sur l'
dans lequel on a 80% de chances de trouver X. On arrondira les bornes à 10–3 près.
Exercice 5-3
X est une variable gaussienne (i.e. normale) de paramètres (15 ; 4).
On pose : Y = – X, et Z = 3X, U = X + 5 et W = 3X – 7.
1. Déterminer l'
espérance et la variance de Y, Z, U et W.
2. Déterminer la loi de Y, de Z, de U et de W.
RC-2013
Reproduction interdite
43/64
Exercice 5-4
X et Y sont deux variables aléatoires telles que : E(X) = 20, σ(X) = 5, E(Y) = 40 et σ(Y) = 12.
On pose : S = X + Y, D = X – Y et Z = 3X – 2Y.
1. Déterminer l'
espérance, la variance et l'
écart type de S, D et Z si :
1.1. X et Y sont indépendantes.
1.2. cov(X ; Y) = 15. [Rappel : cov(X ; Y) désigne la covariance de (X ; Y).]
1.3. cov(X ; Y) = – 20.
1.4. r(X ; Y) = 0,80. [Rappel : r(X ; Y) désigne le coefficient de corrélation linéaire de (X ; Y).]
2. On suppose que X et Y sont deux variables gaussiennes (i.e. normales) indépendantes.
Déterminer la loi de S, D et Z.
Exercice 5-5
Toutes les probabilités seront données à 10–4 près.
La menuiserie BOPIN fabrique des planches en bois de pin.
La longueur (exprimée en centimètres) d’une planche fabriquée par une machine est une variable
aléatoire X qui suit la loi (204 ; 4).
Quelle est la probabilité que la longueur d’une planche :
1. dépasse 209 cm ? soit inférieure à 197 cm ? soit comprise entre 198 et 210 cm ?
2. Déterminer un intervalle centré sur la moyenne dans lequel la longueur d'
une planche a 95% de
chances de se trouver.
une planche a 90% de
3. Déterminer un intervalle centré sur la moyenne dans lequel la longueur d'
chances de se trouver.
4. Quelle longueur L (arrondie au mm) a 90% de chances d’être dépassée ?
Exercice 5-6
Toutes les probabilités seront données à 10–4 près.
Un joueur lance 90 fois un dé cubique non pipé. Il est déclaré gagnant quand il obtient 5 ou 6.
On note X la variable aléatoire égale un nombre de victoires en 90 lancers.
1. Déterminer la loi de X, son espérance et sa variance.
2. Montrer que la loi de X peut être approchée par une autre loi dont on précisera les paramètres.
3. Déterminer, en utilisant la loi approchée exclusivement :
P(X = 40) puis P(X ≤ 35) et P(X < 27).
4. Déterminer un intervalle [a ; b] centré sur l'
espérance de X avec a et b entiers tels que X ait 90%
de chances d’être compris entre a et b.
Exercice 5-7
Pour téléphoner à une administration, on doit d’abord passer par un standard avant d’obtenir le
service désiré. Pour un appel donné, on note X la variable aléatoire égale au temps d’attente en
secondes pour obtenir le standard et Y la variable aléatoire égale au temps d’attente en secondes
pour obtenir le service. On suppose que ces deux variables X et Y sont indépendantes.
On admet aussi que les appels au standard sont indépendants entre eux ainsi que les appels aux
différents services, que X suit une loi normale (18 ; 6) et que Y suit une loi normale (60 ; 10).
1. On appelle une fois cette administration.
1.1. Quelle est la probabilité que le temps d’attente du standard dure moins de 20 s ?
RC-2013
Reproduction interdite
44/64
1.2. Quelle est la probabilité que le temps d’attente du standard soit compris entre 10 et 20 s ?
1.3. Calculer à 1 s près le temps a d’attente du standard qui n’est dépassé que dans 10% des cas.
1.4. Déterminer un intervalle centré sur la moyenne 18 i.e. [18 – α ; 18 + α] avec α > 0 dans
lequel on est assuré de trouver le temps d’attente du standard avec une probabilité de 0,95.
(On arrondira les bornes à 1 s près).
2. On note Z le temps total d’attente pour obtenir un service de cette administration : Z = X + Y.
2.1. Quelle est la loi de Z ?
2.2. Quelle est la probabilité que le temps d’attente total Z soit inférieur à la minute ?
2.3. Quelle est la probabilité que le temps d’attente du standard soit inférieur à 20 secondes et
que le temps d’attente du service soit inférieur à 40 secondes ?
2.4. Comparer les résultats des deux questions précédentes ? Etait-ce prévisible ?
3. Pour améliorer le service, on a pris des dispositions pour réduire le temps d'
attente total.
On note U ce nouveau temps.
Il s'
exprime en fonction de l'
ancien temps d'
attente total Z par U = 0,9Z – 2,2.
3.1. Montrer que la loi de U est normale avec des paramètres que l'
on précisera.
3.2. Quelle est la probabilité que le nouveau temps d’attente total U soit inférieur à la minute ?
Exercice 5-8
Le nombre de vols commis dans un supermarché pendant une journée est une variable X de Poisson
de paramètre 2. On admet que les vols d’une journée sur l’autre sont indépendants.
1. On note Z le nombre de vols commis pendant une semaine de 6 jours ouvrables.
Quelle est la loi de la variable Z ?
Déterminer le nombre de vols que l’on a 90% de chances de ne pas dépasser en une semaine
2. On note V le nombre de vols commis pendant un mois de 26 jours ouvrables.
Quelle est la loi de la variable V ? Par quelle loi peut-on approcher la loi de V ?
3. Déterminer le nombre de vols que l’on a 90% de chances de ne pas dépasser en un mois (26 j).
Exercice 5-9
Dans une grande entreprise, on a étudié, par succursales, sur un an, le nombre de produits retournés
pour défaut de fabrication.
Nombre xi de produits retournés
de 0 à moins de 5
de 5 à moins de 10
de 10 à moins de 15
de 15 à moins de 20
de 20 à moins de 25
de 25 à moins de 30
de 30 à moins de 35
de 35 à moins de 40
au moins 40
Nombre ni de succursales
5
9
17
30
59
36
25
14
5
Etudier la normalité de la distribution (3 méthodes)
RC-2013
Reproduction interdite
45/64
Chapitre VI - Exercices sur les tests du khi2
Exercice 6-0
Dans une grande boulangerie, on a procédé pour un contrôle à la pesée de 200 pains extraits de la
production journalière qui était ce jour-là de 2849 pains.
Le tableau ci-dessous résume les résultats de l’étude.
Poids en g Nb pains
[180 ; 185[
7
[185 ; 190[
30
[190 ; 195[
34
[195 ; 200[
54
[200 ; 205[
36
[205 ; 210[
18
[210 ; 215[
13
[215 ; 220[
6
[220 ; 225[
2
1.
2.
3.
4.
5.
6.
Préciser la population, l’échantillon étudié, l’unité statistique, la variable et sa nature.
Construire l’histogramme de la série. Commenter.
Déterminer les effectifs cumulés croissants et les fréquences cumulées croissantes.
Déterminer à 10–2 près la moyenne arithmétique, le mode et la médiane. Commenter.
Analyser la distribution observée par la méthode de la droite de Henri. Commenter.
En utilisant le test du χ2, vérifier si la loi normale constitue une loi théorique s’ajustant
convenablement aux données, le risque α de rejet à tort de l’hypothèse nulle étant de 10 %.
On prendra des paramètres arrondis à l’unité la plus proche.
7. Aurait-on la même conclusion avec d’autres valeurs de α ? (5% ? 2,5% ? par exemple)
Exercice 6-1
Suite à une étude réalisée auprès de 250 concessions de la société automobile PIJOT qui
commercialise le modèle 747, on a relevé le nombre de véhicules vendus par concession pendant
l'
année 2010. Cette étude est résumée dans le tableau ci-après.
On cherche à modéliser la distribution.
Nombre de véhicules vendus
Moins de 160
[160 ; 220[
[220 ; 300[
[300 ; 380[
[380 ; 460[
[460 ; 560[
[560 ; 600[
600 et plus
1.
2.
3.
4.
Nombre ni de concessions
14
21
41
59
54
40
11
10
Préciser la population, l’échantillon étudié, l’unité statistique, la variable et sa nature.
Construire l’histogramme de la série. Commenter.
Déterminer les effectifs cumulés croissants et les fréquences cumulées croissantes.
Déterminer à 10–2 près la moyenne arithmétique, le mode et la médiane. Commenter.
RC-2013
Reproduction interdite
46/64
5. Analyser la distribution observée par la méthode de la droite de Henri. Commenter.
6. En utilisant le test du χ2, vérifier si la loi normale constitue une loi théorique s’ajustant
convenablement aux données, le risque α de rejet à tort de l’hypothèse nulle étant de 5 %.
On prendra des paramètres arrondis à l’unité.
7. Aurait-on la même conclusion avec d’autres valeurs de α ?
Exercice 6-2
Suite à une enquête dans un grand magasin, on a relevé le nombre X de vols au cours d'
une journée
sur un échantillon de 400 jours. On cherche à modéliser la distribution.
xi
0
1
2
3
4
5
6
7
8
9
10
11
ni
9
30
58
80
82
62
40
22
11
3
2
1
1. Calculer la moyenne et la variance de la distribution statistique. Commenter.
2. En utilisant le test du χ2 (en respectant bien toutes les étapes), vérifier si la loi de Poisson
constitue une loi théorique s’ajustant convenablement aux données, le risque α de rejet à tort
étant de 5 %. On prendra un paramètre entier.
Exercice 6-3
Le constructeur automobile ERNO qui sort une nouvelle version de son modèle haut de gamme ZT
vient de réaliser une étude sur la consommation d’essence de 250 véhicules de ce modèle.
Le tableau ci-dessous indique la consommation en litres pour 100 km.
Consommation en l
[6 ; 6,2[
[6,2 ; 6,3[
[6,3 ; 6,4[
[6,4 ; 6,5[
[6,5 ; 6,6[
[6,6 ; 6,7[
[6,7 ; 6,8[
[6,8 ; 6,9[
[6,9 ; 7,2[
1.
2.
3.
4.
Nombre de véhicules
7
15
34
58
60
36
23
12
5
Construire l’histogramme de la série. Commenter
Déterminer la moyenne arithmétique, la médiane et le mode. Commenter.
Construire la droite de Henri sur du papier gausso-arithmétique. Commenter.
Construire un test du χ2 pour étudier la normalité de la loi avec un risque α = 10% de la rejeter.
On calculera moyenne et écart type à 10–2 près dans l’échantillon. Conclure.
Exercice 6-4
Le responsable du rayon approvisionnement d’une grande enseigne commercialisant des lits 1 place
souhaite modéliser la demande de ses clients pour mieux pouvoir gérer le stock nécessaire.
Pour cela, il dispose d’un relevé du nombre de commandes sur une période de 200 jours décrit dans
le tableau ci-après :
Nombre de commandes
Nombre de jours
RC-2013
1
2
2 3 4 5 6 7 8 9 10 11 12 13
5 15 27 34 33 27 21 15 10 6 3 2
Reproduction interdite
47/64
1. Déterminer la moyenne et la variance du nombre X de commandes journalières des lits 1 place.
2. Quelle hypothèse peut-on émettre quant à la loi de X ?
3. Utiliser un test de χ2 avec un risque de rejeter à tort l’hypothèse égal à 5% pour confirmer
l’hypothèse précédente. On choisira un paramètre entier.
On supposera dorénavant pour la suite que X suit la loi ainsi établie.
4. Quelle est la probabilité d'
observer moins de 4 commandes journalières ?
5. Le responsable du rayon souhaiterait prévoir son stock pour 2 semaines de 5 jours ouvrables.
Soit Y le nombre de commandes reçues en 2 semaines de 5 jours ouvrables.
Quelle est la loi de Y sachant que les nombres de commandes reçues d'
un jour sur l'
autre sont
indépendants ? Par quelle loi peut-on l'
approcher ? Justifier votre réponse.
6. Quelle est la probabilité de recevoir plus de 70 commandes en 2 semaines ?
On utilisera la correction de continuité.
7. Quelle est la probabilité de recevoir exactement 62 commandes en 2 semaines ?
Complément chapitre VI : ajustement pour d’autres lois
Exercice 6-5 : test d'
ajustement à une loi uniforme
Le constructeur de véhicules automobiles TAYOTO commercialise le modèle Pyrrhus sous 5
couleurs différentes : bleu, gris, jaune, noir et rouge. Le tableau ci-dessous indique la répartition
des choix de la couleur parmi 500 clients choisis au hasard parmi les acheteurs.
Couleur
Nombre de clients
bleu
94
gris
111
jaune
90
noir
118
rouge
87
Pensez-vous que la couleur ait une importance pour les clients ?
On effectuera pour cela un test du χ2 pour tester si l’on peut considérer la distribution comme
uniforme avec un risque de rejet à tort égal à 10%.
Exercice 6-6 : test d'
ajustement à une loi uniforme
On lance 600 fois un dé cubique. On obtient la répartition suivante.
Faces
Nombre d’apparitions
1
95
2
3
110 108
4
92
5
115
6
80
Utiliser un test du χ2 pour vérifier si ce dé peut être considéré comme équilibré.
On prendra un risque égal à 5% de rejeter à tort l’hypothèse nulle.
Exercice 6-7 : test d'
ajustement à une loi exponentielle (bac S)
En terminale S, on a rencontré une variable aléatoire continue X suivant la loi exponentielle de
paramètre λ avec λ constante réelle strictement positive aussi bien dans le cours de mathématiques
que dans le cours de physique à propos de la désintégration des atomes. On note : (X) = (λ).
On rappelle :
• X prend ses valeurs dans [0 ; + ∞[,
• sa fonction de répartition FX est définie par : pour tout réel x, x >0, FX(x) = P(X ≤ x) = 1 – e – λx,
1
1
• son espérance est E(X) =
et sa variance est V(X) = 2 .
λ
RC-2013
λ
Reproduction interdite
48/64
On peut rencontrer cette loi dans d’autres contextes.
Dans une grande surface, suite à divers réclamations concernant le temps d’attente aux caisses, le
responsable du service “clients” a fait relevé ce temps d’attente sur un échantillon de 400 clients.
On a consigné les résultats dans le tableau ci-dessous. Le temps X est exprimé en minutes.
xi
ni
[0;2[
136
[2;4[
90
[4;6[
58
[6;8[ [8;10[ [10;12[ [12;14[ [14;16[ [16;18[ [18;20[ [20;22[
30
30
14
18
12
6
4
2
1. Déterminer la moyenne x et variance S2 de la série statistique. Commenter.
2. On veut utiliser un test du χ2 pour montrer que le temps suit une loi exponentielle.
On choisit comme paramètre une valeur approchée (à 10– 3 près) de 1/ x : est-ce logique ?
Construire le test du χ2 :
On calculera les probabilités théoriques pi à 10–4 près en utilisant bien sûr l’expression de la loi
théorique FX.
On prendra un risque égal à 5% de rejeter à tort l’hypothèse nulle.
On ouvrira la dernière classe pour la rendre illimitée à droite.
RC-2013
Reproduction interdite
49/64
Chapitre VII - Exercices sur les notions d'échantillonnage
Exercice 7-1
Le temps moyen de connexion au réseau Internet par le service en ligne WADOUDOU a été de 15
secondes (écart-type 5 secondes) sur un échantillon de 250 connexions.
1. Déterminer une estimation ponctuelle du temps moyen de connexion et de l’écart-type pour
l'
ensemble des connexions à ce service en ligne.
2. Déterminer un intervalle de confiance au niveau de confiance 0,98 du temps moyen de
connexion de ce service en ligne. On arrondira les bornes à 0,1 s près.
Exercice 7-2
On a effectué une enquête sur un échantillon de 226 anciens sportifs professionnels et on constate
une durée de vie moyenne de 72 ans et un écart-type de 4 ans.
écart type de la
1. Déterminer une estimation ponctuelle de la durée de vie moyenne et de l'
population des anciens sportifs.
2. Déterminer un intervalle de confiance au niveau de confiance 0,95 de la durée de vie moyenne
dans ce milieu-là. On arrondira les bornes à 0,1 an près.
Exercice 7-3
Dans une grande agglomération, on a effectué deux sondages en vue des municipales :
• dans un échantillon de 560 femmes, on a constaté que 35% d’entre elles étaient prêtes à voter
pour le parti “Bleu”,
• dans un échantillon de 700 hommes, on a constaté que 30% d’entre eux étaient prêts à voter
pour le parti “Bleu”.
1. Déterminer une estimation ponctuelle du pourcentage de votants pour le parti “Bleu” dans la
population féminine puis dans la population masculine.
2. Déterminer un intervalle de confiance au niveau de confiance 0,90 du pourcentage de votants
pour le parti "Bleu" dans la population féminine puis dans la population masculine.
Exercice 7-4
Au cours de l'
hiver 2009-2010, on a constaté, dans un cabinet médical du département du Rhône,
que, sur 150 personnes ayant consulté une semaine donnée, 27 étaient venues pour une grippe.
1. Déterminer une estimation ponctuelle du pourcentage personnes grippées dans le département du
Rhône la semaine considérée.
2. Déterminer un intervalle de confiance, au niveau de confiance 0,95 du pourcentage de personnes
grippées dans le département du Rhône la semaine considérée.
On arrondira les bornes à 0,1% près.
3. Préciser l’amplitude de cet intervalle.
4. Combien le cabinet médical aurait-il du recevoir de clients cette semaine pour que l’on puisse
obtenir un intervalle de confiance d’amplitude inférieure à 2% au même niveau de confiance et
avec une proportion identique de malades grippés ?
RC-2013
Reproduction interdite
50/64
Exercice 7-5
L'
hypermarché MERCADO a ouvert au 01.12.2010 un rayon “cadeaux”.
D ‘après une étude, réalisée en décembre, sur un échantillon de 500 personnes, 40 % des personnes
interrogées ont effectué un achat au rayon “cadeaux”.
1. Déterminer une estimation ponctuelle du pourcentage de clients de MERCADO ayant acheté au
rayon “cadeaux” en décembre 2010.
2. Construire un intervalle de confiance au niveau de confiance 0,90 du pourcentage de clients de
MERCADO ayant acheté au rayon “cadeaux” en décembre 2010.
On arrondira les bornes à 0,1 % près.
Parmi les 200 personnes ayant effectué un achat au rayon “cadeaux”, on a constaté que le montant
moyen de leurs dépenses étant de 50 euros et l’écart-type de 15 euros.
3. Déterminer une estimation ponctuelle du montant moyen et de l’écart-type de la dépense au
rayon “cadeaux” (arrondies à 0,01 € près).
4. Construire un intervalle de confiance au niveau de confiance 0,90 du montant moyen de la
dépense d’un client de MERCADO au rayon “cadeaux” au mois de décembre 2010.
On arrondira les bornes à 0,1 € près.
RC-2013
Reproduction interdite
51/64
Partie 3 : tables et annexes
Table de la loi de Poisson pour m variant de 0,05 à 0,90 avec un pas de 0,05
X↓
m → 0,05
0,10
0,15
0,20
0,25
0,30
0
0,9512 0,9048 0,8607 0,8187 0,7788 0,7408
1
0,0476 0,0905 0,1291 0,1637 0,1947 0,2222
2
0,0012 0,0045 0,0097 0,0164 0,0243 0,0333
3
0,0000 0,0002 0,0005 0,0011 0,0020 0,0033
4
0,0000 0,0000 0,0000 0,0001 0,0001 0,0003
5
0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
0,35
0,7047
0,2466
0,0432
0,0050
0,0004
0,0000
0,40
0,6703
0,2681
0,0536
0,0072
0,0007
0,0001
0,45
0,6376
0,2869
0,0646
0,0097
0,0011
0,0001
X↓
m → 0,50
0,55
0,60
0,65
0,70
0,75
0,80
0
0,6065 0,5769 0,5488 0,5220 0,4966 0,4724 0,4493
1
0,3033 0,3173 0,3293 0,3393 0,3476 0,3543 0,3595
2
0,0758 0,0873 0,0988 0,1103 0,1217 0,1329 0,1438
3
0,0126 0,0160 0,0198 0,0239 0,0284 0,0332 0,0383
4
0,0016 0,0022 0,0030 0,0039 0,0050 0,0062 0,0077
5
0,0002 0,0002 0,0004 0,0005 0,0007 0,0009 0,0012
6
0,0000 0,0000 0,0000 0,0001 0,0001 0,0001 0,0002
0,85
0,4274
0,3633
0,1544
0,0437
0,0093
0,0016
0,0002
0,90
0,4066
0,3659
0,1647
0,0494
0,0111
0,0020
0,0003
Table de la loi de Poisson pour m variant de 1,0 à 5,0 avec un pas de 0,5
X↓
RC-2013
m→
1,0
1,5
2,0
2,5
3,0
3,5
4,0
4,5
5,0
0
0,3679 0,2231 0,1353 0,0821 0,0498 0,0302 0,0183 0,0111 0,0067
1
0,3679 0,3347 0,2707 0,2052 0,1494 0,1057 0,0733 0,0500 0,0337
2
0,1839 0,2510 0,2707 0,2565 0,2240 0,1850 0,1465 0,1125 0,0842
3
0,0613 0,1255 0,1804 0,2138 0,2240 0,2158 0,1954 0,1687 0,1404
4
0,0153 0,0471 0,0902 0,1336 0,1680 0,1888 0,1954 0,1898 0,1755
5
0,0031 0,0141 0,0361 0,0668 0,1008 0,1322 0,1563 0,1708 0,1755
6
0,0005 0,0035 0,0120 0,0278 0,0504 0,0771 0,1042 0,1281 0,1462
7
0,0001 0,0008 0,0034 0,0099 0,0216 0,0385 0,0595 0,0824 0,1044
8
0,0000 0,0001 0,0009 0,0031 0,0081 0,0169 0,0298 0,0463 0,0653
9
0,0000 0,0000 0,0002 0,0009 0,0027 0,0066 0,0132 0,0232 0,0363
10
0,0000 0,0000 0,0000 0,0002 0,0008 0,0023 0,0053 0,0104 0,0181
11
0,0000 0,0000 0,0000 0,0000 0,0002 0,0007 0,0019 0,0043 0,0082
12
0,0000 0,0000 0,0000 0,0000 0,0001 0,0002 0,0006 0,0016 0,0034
13
0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0002 0,0006 0,0013
14
0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0002 0,0005
15
0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0002
Reproduction interdite
52/64
Table de la loi de Poisson pour m variant de 5,5 à 9,5 avec un pas de 0,5
X↓ m→
5,5
6,0
6,5
7,0
7,5
8,0
8,5
9,0
9,5
0
0,0041 0,0025 0,0015 0,0009 0,0006 0,0003 0,0002 0,0001 0,0001
1
0,0225 0,0149 0,0098 0,0064 0,0041 0,0027 0,0017 0,0011 0,0007
2
0,0618 0,0446 0,0318 0,0223 0,0156 0,0107 0,0074 0,0050 0,0034
3
0,1133 0,0892 0,0688 0,0521 0,0389 0,0286 0,0208 0,0150 0,0107
4
0,1558 0,1339 0,1118 0,0912 0,0729 0,0573 0,0443 0,0337 0,0254
5
0,1714 0,1606 0,1454 0,1277 0,1094 0,0916 0,0752 0,0607 0,0483
6
0,1571 0,1606 0,1575 0,1490 0,1367 0,1221 0,1066 0,0911 0,0764
7
0,1234 0,1377 0,1462 0,1490 0,1465 0,1396 0,1294 0,1171 0,1037
8
0,0849 0,1033 0,1188 0,1304 0,1373 0,1396 0,1375 0,1318 0,1232
9
0,0519 0,0688 0,0858 0,1014 0,1144 0,1241 0,1299 0,1318 0,1300
10
0,0285 0,0413 0,0558 0,0710 0,0858 0,0993 0,1104 0,1186 0,1235
11
0,0143 0,0225 0,0330 0,0452 0,0585 0,0722 0,0853 0,0970 0,1067
12
0,0065 0,0113 0,0179 0,0263 0,0366 0,0481 0,0604 0,0728 0,0844
13
0,0028 0,0052 0,0089 0,0142 0,0211 0,0296 0,0395 0,0504 0,0617
14
0,0011 0,0022 0,0041 0,0071 0,0113 0,0169 0,0240 0,0324 0,0419
15
0,0004 0,0009 0,0018 0,0033 0,0057 0,0090 0,0136 0,0194 0,0265
16
0,0001 0,0003 0,0007 0,0014 0,0026 0,0045 0,0072 0,0109 0,0157
17
0,0000 0,0001 0,0003 0,0006 0,0012 0,0021 0,0036 0,0058 0,0088
18
0,0000 0,0000 0,0001 0,0002 0,0005 0,0009 0,0017 0,0029 0,0046
19
0,0000 0,0000 0,0000 0,0001 0,0002 0,0004 0,0008 0,0014 0,0023
20
0,0000 0,0000 0,0000 0,0000 0,0001 0,0002 0,0003 0,0006 0,0011
21
0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0001 0,0003 0,0005
22
0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0001 0,0002
23
0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001
RC-2013
Reproduction interdite
53/64
Table de la loi de Poisson pour m variant de 10 à 18 avec un pas de 1
X↓ m→
10
11
12
13
14
15
16
17
18
0
0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
1
0,0005 0,0002 0,0001 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
2
0,0023 0,0010 0,0004 0,0002 0,0001 0,0000 0,0000 0,0000 0,0000
3
0,0076 0,0037 0,0018 0,0008 0,0004 0,0002 0,0001 0,0000 0,0000
4
0,0189 0,0102 0,0053 0,0027 0,0013 0,0006 0,0003 0,0001 0,0001
5
0,0378 0,0224 0,0127 0,0070 0,0037 0,0019 0,0010 0,0005 0,0002
6
0,0631 0,0411 0,0255 0,0152 0,0087 0,0048 0,0026 0,0014 0,0007
7
0,0901 0,0646 0,0437 0,0281 0,0174 0,0104 0,0060 0,0034 0,0019
8
0,1126 0,0888 0,0655 0,0457 0,0304 0,0194 0,0120 0,0072 0,0042
9
0,1251 0,1085 0,0874 0,0661 0,0473 0,0324 0,0213 0,0135 0,0083
10
0,1251 0,1194 0,1048 0,0859 0,0663 0,0486 0,0341 0,0230 0,0150
11
0,1137 0,1194 0,1144 0,1015 0,0844 0,0663 0,0496 0,0355 0,0245
12
0,0948 0,1094 0,1144 0,1099 0,0984 0,0829 0,0661 0,0504 0,0368
13
0,0729 0,0926 0,1056 0,1099 0,1060 0,0956 0,0814 0,0658 0,0509
14
0,0521 0,0728 0,0905 0,1021 0,1060 0,1024 0,0930 0,0800 0,0655
15
0,0347 0,0534 0,0724 0,0885 0,0989 0,1024 0,0992 0,0906 0,0786
16
0,0217 0,0367 0,0543 0,0719 0,0866 0,0960 0,0992 0,0963 0,0884
17
0,0128 0,0237 0,0383 0,0550 0,0713 0,0847 0,0934 0,0963 0,0936
18
0,0071 0,0145 0,0255 0,0397 0,0554 0,0706 0,0830 0,0909 0,0936
19
0,0037 0,0084 0,0161 0,0272 0,0409 0,0557 0,0699 0,0814 0,0887
20
0,0019 0,0046 0,0097 0,0177 0,0286 0,0418 0,0559 0,0692 0,0798
21
0,0009 0,0024 0,0055 0,0109 0,0191 0,0299 0,0426 0,0560 0,0684
22
0,0004 0,0012 0,0030 0,0065 0,0121 0,0204 0,0310 0,0433 0,0560
23
0,0002 0,0006 0,0016 0,0037 0,0074 0,0133 0,0216 0,0320 0,0438
24
0,0001 0,0003 0,0008 0,0020 0,0043 0,0083 0,0144 0,0226 0,0328
25
0,0000 0,0001 0,0004 0,0010 0,0024 0,0050 0,0092 0,0154 0,0237
26
0,0000 0,0000 0,0002 0,0005 0,0013 0,0029 0,0057 0,0101 0,0164
27
0,0000 0,0000 0,0001 0,0002 0,0007 0,0016 0,0034 0,0063 0,0109
28
0,0000 0,0000 0,0000 0,0001 0,0003 0,0009 0,0019 0,0038 0,0070
29
0,0000 0,0000 0,0000 0,0001 0,0002 0,0004 0,0011 0,0023 0,0044
30
0,0000 0,0000 0,0000 0,0000 0,0001 0,0002 0,0006 0,0013 0,0026
31
0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003 0,0007 0,0015
32
0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0001 0,0004 0,0009
33
0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0002 0,0005
34
0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0002
35
0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001
36
0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001
RC-2013
Reproduction interdite
54/64
Extrait de la table de la loi normale centrée réduite
(Table de la loi de Laplace-Gauss)
(0; 1)
Cette table donne pour t 0, avec un pas de 0,01, les valeurs de la fonction de répartition φ de la
variable aléatoire T suivant la loi normale centrée réduite (0; 1).
On rappelle : φ(t) = P(T ≤ t)
t
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3,0
0,00
0,5000
0,5398
0,5793
0,6179
0,6554
0,6915
0,7257
0,7580
0,7881
0,8159
0,8413
0,8643
0,8849
0,9032
0,9192
0,9332
0,9452
0,9554
0,9641
0,9713
0,9772
0,9821
0,9861
0,9893
0,9918
0,9938
0,9953
0,9965
0,9974
0,9981
0,9987
0,01
0,5040
0,5438
0,5832
0,6217
0,6591
0,6950
0,7291
0,7611
0,7910
0,8186
0,8438
0,8665
0,8869
0,9049
0,9207
0,9345
0,9463
0,9564
0,9649
0,9719
0,9778
0,9826
0,9864
0,9896
0,9920
0,9940
0,9955
0,9966
0,9975
0,9982
0,9987
0,02
0,5080
0,5478
0,5871
0,6255
0,6628
0,6985
0,7324
0,7642
0,7939
0,8212
0,8461
0,8686
0,8888
0,9066
0,9222
0,9357
0,9474
0,9573
0,9656
0,9726
0,9783
0,9830
0,9868
0,9898
0,9922
0,9941
0,9956
0,9967
0,9976
0,9982
0,9987
0,03
0,5120
0,5517
0,5910
0,6293
0,6664
0,7019
0,7357
0,7673
0,7967
0,8238
0,8485
0,8708
0,8907
0,9082
0,9236
0,9370
0,9484
0,9582
0,9664
0,9732
0,9788
0,9834
0,9871
0,9901
0,9925
0,9943
0,9957
0,9968
0,9977
0,9983
0,9988
0,04
0,5160
0,5557
0,5948
0,6331
0,6700
0,7054
0,7389
0,7704
0,7995
0,8264
0,8508
0,8729
0,8925
0,9099
0,9251
0,9382
0,9495
0,9591
0,9671
0,9738
0,9793
0,9838
0,9875
0,9904
0,9927
0,9945
0,9959
0,9969
0,9977
0,9984
0,9988
0,05
0,5199
0,5596
0,5987
0,6368
0,6736
0,7088
0,7422
0,7734
0,8023
0,8289
0,8531
0,8749
0,8944
0,9115
0,9265
0,9394
0,9505
0,9599
0,9678
0,9744
0,9798
0,9842
0,9878
0,9906
0,9929
0,9946
0,9960
0,9970
0,9978
0,9984
0,9989
0,06
0,5239
0,5636
0,6026
0,6406
0,6772
0,7123
0,7454
0,7764
0,8051
0,8315
0,8554
0,8770
0,8962
0,9131
0,9279
0,9406
0,9515
0,9608
0,9686
0,9750
0,9803
0,9846
0,9881
0,9909
0,9931
0,9948
0,9961
0,9971
0,9979
0,9985
0,9989
0,07
0,5279
0,5675
0,6064
0,6443
0,6808
0,7157
0,7486
0,7794
0,8078
0,8340
0,8577
0,8790
0,8980
0,9147
0,9292
0,9418
0,9525
0,9616
0,9693
0,9756
0,9808
0,9850
0,9884
0,9911
0,9932
0,9949
0,9962
0,9972
0,9979
0,9985
0,9989
0,08
0,5319
0,5714
0,6103
0,6480
0,6844
0,7190
0,7517
0,7823
0,8106
0,8365
0,8599
0,8810
0,8997
0,9162
0,9306
0,9429
0,9535
0,9625
0,9699
0,9761
0,9812
0,9854
0,9887
0,9913
0,9934
0,9951
0,9963
0,9973
0,9980
0,9986
0,9990
0,09
0,5359
0,5753
0,6141
0,6517
0,6879
0,7224
0,7549
0,7852
0,8133
0,8389
0,8621
0,8830
0,9015
0,9177
0,9319
0,9441
0,9545
0,9633
0,9706
0,9767
0,9817
0,9857
0,9890
0,9916
0,9936
0,9952
0,9964
0,9974
0,9981
0,9986
0,9990
Complément :
table de la loi normale centrée réduite (0; 1) pour quelques grandes valeurs de t
RC-2013
t
φ(t)
3,0
0,998650
3,1
0,999032
3,2
0,999313
3,3
0,999517
3,4
0,999663
t
φ(t)
3,5
0,999767
3,6
0,999841
3,8
0,999928
4,0
0,999968
4,5
0,999997
Reproduction interdite
55/64
Extrait des tables du Khi-2 pour ν (nu) variant de 1 à 30
v (nu) désigne le nombre de degrés de liberté et α le risque de rejet à tort de H0
v↓α→
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
RC-2013
0,999
0,000
0,002
0,024
0,090
0,210
0,381
0,598
0,857
1,15
1,48
1,83
2,21
2,62
3,04
3,48
3,94
4,42
4,90
5,41
5,92
6,45
6,98
7,53
8,08
8,65
9,22
9,80
10,39
11,0
11,6
0,995
0,000
0,010
0,071
0,206
0,411
0,675
0,989
1,34
1,73
2,16
2,60
3,07
3,57
4,07
4,60
5,14
5,70
6,26
6,84
7,43
8,03
8,64
9,26
9,89
10,5
11,2
11,8
12,5
13,1
13,8
0,990
0,000
0,020
0,114
0,297
0,554
0,872
1,24
1,65
2,09
2,56
3,05
3,57
4,11
4,66
5,23
5,81
6,41
7,01
7,63
8,26
8,90
9,54
10,2
10,9
11,5
12,2
12,9
13,6
14,3
15,0
0,975
0,000
0,050
0,215
0,484
0,831
1,24
1,69
2,18
2,70
3,25
3,82
4,40
5,01
5,63
6,26
6,91
7,56
8,23
8,91
9,59
10,3
11,0
11,7
12,4
13,1
13,8
14,6
15,3
16,0
16,8
0,950
0,003
0,102
0,351
0,710
1,15
1,64
2,17
2,73
3,33
3,94
4,57
5,23
5,89
6,57
7,26
7,96
8,67
9,39
10,1
10,9
11,6
12,3
13,1
13,8
14,6
15,4
16,2
16,9
17,7
18,5
0,900 0,500 0,100 0,050 0,025 0,010 0,005 0,001
0,015 0,454 2,71 3,84 5,02 6,63 7,88 10,8
0,210 1,39 4,61 5,99 7,38 9,21 10,6 13,8
0,584 2,37 6,25 7,81 9,35 11,3 12,8 16,3
1,06 3,36 7,78 9,49 11,1 13,3 14,9 18,5
1,61 4,35 9,24 11,1 12,8 15,1 16,7 20,5
2,20 5,35 10,6 12,6 14,4 16,8 18,5 22,5
2,83 6,35 12,0 14,1 16,0 18,5 20,3 24,3
3,49 7,34 13,4 15,5 17,5 20,1 22,0 26,1
4,17 8,34 14,7 16,9 19,0 21,7 23,6 27,9
4,87 9,34 16,0 18,3 20,5 23,2 25,2 29,6
5,58 10,3 17,3 19,7 21,9 24,7 26,8 31,3
6,30 11,3 18,5 21,0 23,3 26,2 28,3 32,9
7,04 12,3 19,8 22,4 24,7 27,7 29,8 34,5
7,79 13,3 21,1 23,7 26,1 29,1 31,3 36,1
8,55 14,3 22,3 25,0 27,5 30,6 32,8 37,7
9,31 15,3 23,5 26,3 28,8 32,0 34,3 39,3
10,1 16,3 24,8 27,6 30,2 33,4 35,7 40,8
10,9 17,3 26,0 28,9 31,5 34,8 37,2 42,3
11,7 18,3 27,2 30,1 32,9 36,2 38,6 43,8
12,4 19,3 28,4 31,4 34,2 37,6 40,0 45,3
13,2 20,3 29,6 32,7 35,5 38,9 41,4 46,8
14,0 21,3 30,8 33,9 36,8 40,3 42,8 48,3
14,8 22,3 32,0 35,2 38,1 41,6 44,2 49,7
15,7 23,3 33,2 36,4 39,4 43,0 45,6 51,2
16,5 24,3 34,4 37,7 40,6 44,3 46,9 52,6
17,3 25,3 35,6 38,9 41,9 45,6 48,3 54,1
18,1 26,3 36,7 40,1 43,2 47,0 49,6 55,5
18,9 27,3 37,9 41,3 44,5 48,3 51,0 56,9
19,8 28,3 39,1 42,6 45,7 49,6 52,3 58,3
20,6 29,3 40,3 43,8 47,0 50,9 53,7 59,7
Reproduction interdite
56/64
ESCE-Lyon
Module STATISTIQUE (1e année)
Méthodes Quantitatives
Grille 1 pour exercice traité en cours (Ch 1 - variable définie par classes)
Le tableau ci-dessous (colonnes 1 et 2) présente la répartition des salaires mensuels au sein d’une entreprise de 200 personnes en centaines d’euros.
Salaires
Eff ni
[6 ; 10[
40
[10 ; 14[
52
[14 ; 20[
72
[20 ; 28[
16
[28 ; 38[
20
Totaux
200
RC-2013
Ni
N'
i
fi
Fi
Reproduction interdite
F'
i
ai
hi =
1 ni
×
n ai
aire
57/64
Centre ci
ni ci
ni ci2
ESCE-Lyon
Module STATISTIQUE (1e année)
Méthodes Quantitatives
Grille 2 pour exercices traités en cours (Ch 1 - Concentration)
Répartition des salaires mensuels (en euros) dans 4 entreprises avec 4 salariés et 1 entreprise avec
20 salariés.
Entreprise 1
Salaire xi Effectif ni
1000
3
7000
1
4
Entreprise 2
Salaire xi Effectif ni
1000
3
2000
1
4
Entreprise 3
Salaire xi Effectif ni
1000
4
5000
0
4
Entreprise 4
Salaire xi Effectif ni
0
3
5000
1
4
Entreprise 5
Salaire xi Effectif ni
1000
6
1500
9
2000
3
2500
1
4000
1
20
RC-2013
fi
Fi
Si
Si cum
qi
fi
Fi
Si
Si cum
qi
fi
Fi
Si
Si cum
qi
fi
Fi
Si
Si cum
qi
fi
Fi
Si
Si cum
qi
Reproduction interdite
58/64
ESCE-Lyon
Méthodes Quantitatives
Module STATISTIQUE (1e année)
Grille 3 pour exercices traités en cours (Ch 2)
Exemple 1 : ce tableau indique les relevés de la production industrielle xi et des exportations yi d’un
pays d’Afrique exprimés en milliards d'
euros pendant 6 ans.
xi
72
83
100
116
135
160
yi
105
118
131
127
140
147
Exemple 2 : étude sur un groupe de 149 femmes du nombre yi de divorces suivant l’âge xi de la
personne.
xi
[20,30[
[20,30[
[30,40[
[30,40[
[30,40[
yi
0
1
0
1
2
ni
54
21
35
30
9
Exemple 3 : répartition d’un groupe de 100 filles d’une école primaire suivant deux critères,
leur âge xi (en années) et leur poids yj (en kilogrammes).
yj → [15 ; 21[
xi ↓
6
8
10
12
[21 ; 27|
[27 ; 33[
[33 ; 41[
21
4
1
0
5
20
3
1
0
2
17
4
0
0
3
19
ni •
ni• xi
n i• xi2
n• j
n• j y j
n• j yj2
RC-2013
Reproduction interdite
59/64
ESCE-Lyon
Module STATISTIQUE (1e année)
Méthodes Quantitatives
Grille 4 pour exercices traités en cours (Ch 3 - Indices)
Exemple 1
Indices sur les prix.
Prix d’un produit vaisselle (au litre) en euros. Ne pas arrondir les indices.
date t (1er janvier)
prix x(t) du produit (€)
Indice du prix base 100 en 2000
Indice du prix base 100 en 2005
2000
2,50
2002
2,80
2005
3,20
2010
110
2012
168,8
Exemple 2
Quantités consommées par an et prix des œufs par douzaine en euros. Valeur = prix × quantité.
On prend comme année de base 1980, pour les quantités, les prix et les valeurs.
Déterminer les indices des prix, des quantités et des valeurs. Arrondir les indices à 10–5 près
date
nb œufs/an
1970
190
1980
238
1990
233
2007
226
2008
225
prix dz
Valeur
IQ/1980
IP/1980
IV/1980
IP*IQ/100
0,77
1,78
2,29
2,67
3,07
Exemple 3
Le tableau ci-dessous donne les prix et les quantités de 2 produits aux 1er janvier 2006 et 2009.
Tous les indices seront calculés à 0,01 près. Tous les pourcentages seront calculés à 0,01 % près.
Produit
A
B
année 2006
Prix
2200
5600
année 2006
Quantité
43
25
année 2009
Prix
2500
6500
année 2009
Quantité
63
45
Calculs préliminaires :
Produits
A
B
Total
RC-2013
p0 q0
pt q0
Reproduction interdite
p0 qt
pt qt
60/64
ESCE-Lyon
Module STATISTIQUE (1e année)
Méthodes Quantitatives
Grille 5 pour les exemples traités en cours (Ch 5 et Ch 6)
Ex1. Une étude sur la consommation mensuelle d'
électricité (kWh) par les ménages durant les mois d'
hiver a été menée sur un échantillon de 400 ménages.
Classes
ni
[0 ; 500[
12
[500 ; 900[
26
[900 ; 1200[
66
[1200 ; 1500[
116
[1500 ; 1800[
104
[1800 ; 2100[
60
[2100 ; 2400[
16
ai
ni/ai
ci
nici
Ni
Fi
BGT
BDT
pi
npi
400
Ex 2. Dans un département français, on a étudié la répartition du nombre de jours ni avec xi accidents sur une période de 200 jours.
RC-2013
xi
ni
0
26
1
55
2
56
3
35
4
20
5
6
6
2
ni/ni-1
1/xi
Reproduction interdite
ni / ni −1
1 / xi
pi
npi
ni reg
61/64
npi reg
(ni − npi ) 2
npi
(ni − npi ) 2
npi
Papier gausso-arithmétique
RC-2013
Reproduction interdite
62/64
Papier gausso-arithmétique
RC-2013
Reproduction interdite
63/64
Papier gausso-arithmétique
RC-2013
Reproduction interdite
64/64
Téléchargement