Telechargé par Kenza OUZIDAD

cours statistique

publicité
Cours de statistique
Réalisé par : Mme SID Akila
1
Chapitre I : Définitions, terminologie et notations
1.1
Définition de la statistique :
La statistique est une science qui se divise en deux parties :
1.1.1
Statistique descriptive :
S’interesse à décrire et caractériser un ensemble d’individus représenté la plupart du temps
sous forme de tableaux, à résumer et synthétiser ces tableaux par l’intermédiaire de graphique et
de paramètres appropriés (Fréquence, distribution, moyenne, dispersion, etc.). Elle s’attachera à
éventuellement rechercher des ccorrélations (liaisons statistiques) entre les éléments de ces tableaux
(variables et individus).
b) Statistique inférentielle :
S’interesse à extrapoler des résultats issus d’échantillons en vue de caractériser une population
mère inconnue, de faire des prévisions de comportements basés sur le calcul de probabilités.
1.2
1.2.1
Terminologie et concepts fondamentaux de la statistique :
Population :
Ensemble des individus représentant un caractère commun. Pour une thématique donnée, la
population regroupe toujours la totalité des individus relatif à cette thématique (notion d’exhaustivité), l’effectif total de la population est notée N .
1
1.2.2
Echantillon :
Sous-ensemble construit et représentatif d’une population donnée. Lorsque l’on parle d’échantillon on parle en général de population mère, c’est à dire de la population dont est issu l’échantillon.
Le nombre d’observations ou d’individus ou d’unités statistique dans un échantillon est appelée
taille de l’échantillon notée souvent n.
1.2.3
Unité statistique (ou individu) :
Elément de base constitutif de la population à laquelle il appartient, noté i.
Exemple :
On s’intéresse au niveau d’instruction des femmes algériennes. Donner la ou les bonnes
réponses :
1. L’ensemble des femmes algériennes constitue la population d’étude V
2. les femmes algériennes nées entre 1962 et 1970 constituent un échantillon F
3. les femmes algériennes ayant un niveau d’instruction « Secondaire » constituent un échantillon représentatif F
4. On peut considérer en pratique que prendre les femmes algériennes nées entre 1962 et 1970
revient à constituer un échantillon par tirage au sort F
1.2.4
Le caractère (ou variable) :
Est une caractéristique observée ou mesurée sur les individus d’une population
Définition1 :
donnée (étudiée), exemple : Le poids, la couleur des yeux, etc...
Définition2 :
C’est la propriété ou l’aspect singulier que l’on se propose d’observer dans la po-
pulation ou l’échantillon. Un caractère qui fait le sujet d’une étude porte aussi le nom de variable
statistique.
a) La modalité :
Valeur qualitative ou quantitative que peut prendre le caractère précédemment
défini. Exemple : Le genre composé des modalités Masculin et Féminin, Le poids égale à 45kg, etc.
2
b) Caractère ou variable qualitative :
Contient des modalités qui exprime une qualité, un état,
etc.(ses modalités sont non mesurables). Les opérations arithmétiques sur ce type de variables
sont relativement réduites et se limitent au comptage des effectifs par modalité et au calcul de
pourcentage.
Ses modalités n’ont pas d’ordre à suivre, exemple :Le niveau
b-1 Variable qualitative nominale :
d’instruction, type de logement, etc.
b-2 Variable qualitative ordinale :
Ses modalités peuvent être ordonner. Exemple : Le degrè de
satisfaction à un service d’hôtel.
c) Caractère ou variable quantitative :
Ses valeurs sont des nombres exprimant une quantité,
sur lesquels les opérations arithmétiques (somme, multiplication, etc.) ont un sens. Exemple : La
taille, le poids, l’âge, le nombre de frères et soeurs dans un ménage.
a) Variable quantitative discrète :
Ses valeurs sont isolées les unes des autres. notée souvent xi .
Exemple : Nombre de frères et soeurs.
b) Variable quantitative continue :
Ses valeurs peuvent être présentées en intervalles. Exemple :
La taille en cm, âge exprimé en jours, heures, secondes etc., la moyenne au Bac, etc.
1.2.5
La série statistique brute (Données non-groupées) :
Définition1 : C’est la suite des valeurs prises par une variable X sur les unités statistiques (ou
individus). Les valeurs de la variable X , sont notées : x1, x2 , ... xn .
Exemple1 : Sciences, Maths, Maths technique, Sciences, Sciences, Maths, Maths, Maths technique, Maths technique, Maths technique, Sciences, Maths. Cette série représente la série du Baccalauréat.
Exemple2 : 0,1, 1, 4, 4, 4, 2, 2, 2, 7, 1, 1, 1, 3, 0, 3,0, 3, 3, 5, 5, 1, 1, 0, 4, 2. Cette série représente
le nombre de frères et soeurs.
Exemple3 : 11.20, 11.03, 14.23, 14.52, 14.80, 15.01, 15.20, 15.21,15.01, ....... Cette série représente
la moyenne au Baccalauréat.
3
Définition2 : Consiste à énumérer les unes à la suite des autres les valeurs prises par le caractère,
dans leur ordre d’apparition ou de collecte des données.
a) L’étendue :
L’étendue de la série est la différence entre la plus grande valeur et la plus petite
valleur de la série, noté : E = xmax − xmin
b) L’effectif total :
Définition1 : L’effectif total de la série est la taille n de la série.
Définition2 : C’est le nombre total des observations (individus) d’un échantillon (ou population),
noté n(ou N dans la population)
c) L’éffectif (fréquence absolue) :
Définition1 : C’est le nombre de répétitions d’une valeur
xk du caractère dans la série, notée ni .
Définition2 : C’est le nombre de fois qu’apparait une modalité dans un échantillon (ou population), noté ni (ou Ni dans la population)
d) L’effectif relatif (ou fréquence) :
Définition1 : C’est la proportion de répétitions d’une valeur
xk du caractère dans la série, notée fi ,tel que fi =
ni
n
Définition2 : Rapport du nombre d’individus d’une population (ou d’un échantillon) ayant un
caractère commun (modalité) au nombre total des individus de cette même population (ou de
ce même échntillon), notée souvent fi =
Ni
N
dans une population, et fi =
ni
n
dans un échantillon.
Notamment cette fréquence relative peut être exprimée en (%), elle sera notée : fi (%) =
une population, et fi (%) =
ni
.100
n
dans un échantillon.
4
Ni
.100dans
N
2
Chapitre II : Représentation des données en graphiques et tableaux
statistiques
2.1
Tableau statistique (Ou ditribution d’effectifs ou de fréquences) :
Définition1 : Regroupe l’ensemble des données de la série statistique ordonnée, en indiquant
la répartition des individus selon le caractère étudié (cette répartition est appelée distribution
d’effectifs ou de fréquences).
Définition2 : C’est l’ensemble des données d’une série statistique associées à un ou plusieurs
caractères. Façon dont les individus d’une population (ou échantillon) se répartissent en fonction
d’une ou plusieurs modalités, représentée dans un tableau statistique.
2.1.1
Cas d’un caractère qualitatif :
La distribution d’éffectifs sera de la forme suivante :
Caractère
xi
x1
x2
.
.
.
xk
Total
Table 1 – distribution de fréquences
Effectif
Effectif relatif Pourcentage (%)
ni
fi
fi (%)
n1
f1
f1 .100
n2
f2
f2 .100
.
.
.
.
.
.
.
.
.
nk
fk
fk .100
k
P
Pk
ni = n
fi ≈ 1
100
i=1
i=1
Tels que :
xi : La ième modalité du caractère X.
ni : Le nombre d’individus ayant la modalité i
fi : La proportion d’individus ayant la modalité i
fi (%) : Le pourcentage d’individus ayant la modalité i
n : La taille de l’échantillon.
Exemple (Exercice 1 de la série 2, avec modification dans les effectifs) :
étudié : La série du Baccallauréat, sa nature :Qualitatif nominal.
5
1) Le caractère
2) Ses modalités : Maths Technique, Maths, Sciences, Lettres.
3) Représentation des résultats sous forme de tableau statistique :
Table 2 – Répartition d’un échantillon d’étudiants de l’université de Blida selon la série du Baccalauréat
Caractère Effectif Effectif relatif Pourcentage (%)
xi
ni
fi
fi (%)
M aths.T
18
0.36
36
M aths
10
0.2
20
.
Sciences
5
0.1
10
Lettres
17
0.34
34
Pk
fi ≈ 1
Total
n = 50
100
i=1
4) Le pourcentage des étudiants issus de série de Baccalauréat Sciences, est : 10%, ceux issus
de série de Baccalauréat Lettres, est : 34%.
2.1.2
Cas d’un caractère quantitatif :
Avant d’établir la distribution de fréquences il faut nécessairement ordonner la série (par ordre
croissant ou décroissant) afin d’éviter les erreurs de calculs.
a) Cas discret :
La distribution d’éffectifs sera de la forme suivante :
Caractère
Effectif
xi
x1
x2
.
.
.
xk
Total
ni
n1
n2
.
.
.
nk
n
Table 3 – Distribution de fréquences
Eff. cumulé Eff. cumulé Fréquence Fréq. cumulée
croissant
décroissant
croissante
nicum %
nicum &
fi
ficum %
n1
n
f1
f1
n1 + n2
n − n1
f2
f1 + f2
.
.
.
.
.
.
.
.
.
.
.
.
n
nk
fk
1
_
_
1
_
Tels que :
xi : La ième modalité du caractère X.
ni : Le nombre d’individus ayant la modalité i
fi : La proportion d’individus ayant la modalité i
fi (%) : Le pourcentage d’individus ayant la modalité i
6
Fréq. cumulée
décroissante
ficum &
1
1 − f1
.
.
.
fk
_
nicum % : L’effectif cumulé croissant à la ième modalité est l’effectif augmenté de ceux des
Pi
modalités précédentes, nicum %= nl , représentant le nombre d’individus ayant X ≤ xi .
l=1
f icum % : La fréquence cumulée croissante à la ième modalité est la fréquence augmentée de
Pi
celles des modalités précédentes, ficum %= fl , représentant la proportion des individus ayant
l=1
X ≤ xi .
nicum & : L’effectif cumulé décroissant à la ième modalité est l’effectif total diminué des effectifs
i−1
P
cumulés des modalités précédentes, nicum &=n − nl , représentant le nombre d’individus ayant
l=1
X ≥ xi .
f icum & : La fréquence cumulée croissante à la ième modalité est la fréquence totale (égale api−1
P
proximativement à 1) diminuée des fréquences cumulées des modalités précédentes, ficum &= fl ,
représentant la proportion des individus ayant X ≥ xi .
n : La taille de l’échantillon.
Exemple :
1) Le caractère étudié :
Le nombre de frères et soeurs, sa nature : quantitatif discret
2) Ses modalités : 0, 1, 2, 3, 4.
3) La distribution de fréquences :
Table 4 – Répartition d’un échantillon d’étudiants selon le nombre de frères et soeurs
Caractère Effectif Eff. cumulé Eff. cumulé Fréquence Fréq. cumulée Fréq. cumulée
croissant
décroissant
croissante
décroissante
xi
ni
nicum %
nicum &
fi
ficum %
ficum &
0
8
8
50
0.16
0.16
1
1
14
22
42
0.28
0.44
0.84
0.78
0.56
2
17
39
28
0.34
3
8
47
11
0.16
0.94
0.22
4
3
50
3
0.06
1
0.06
Total
50
_
_
1
_
_
7
l=1
b) Cas continu :
b)-1- La distribution de fréquences :
La distribution d’effectifs ou de fréquences dans le cas
continu s’éffectue suite à un regroupement en classes d’égales amplitudes, comme suit :
Caractère
ou classes
x
[a1 , a2 [
[a2 , a3 [
.
.
.
Effectif
[aj , aj+1 [
nj
Total
ni
n1
n2
.
.
.
Table 5 – Distribution de fréquences
Eff. cumulé Eff. cumulé Fréquence Fréq. cumulée
croissant
décroissant
croissante
nicum %
nicum &
fi
ficum %
n1
n
f1
f1
n1 + n2
n − n1
f2
f1 + f2
.
.
.
.
.
.
.
.
.
.
.
.
P j
nj = n
nj
fj
1
i=1
_
n
_
1
_
Fréq. cumulée
décroissante
ficum &
1
1 − f1
.
.
.
fj
_
Tels que :
[ai , ai+1 [ : La ième classe du caractère X, avec ai représentant sa borne inférieure et ai+1 sa
borne supérieure.
ni : Le nombre d’individus appartenant à la ième classe.
fi : La proportion d’individus appartenant à la ième classe.
fi (%) : Le pourcentage d’individus appartenant à la ième classe.
nicum % : L’effectif cumulé croissant à la ième classe est l’effectif augmenté de ceux des modalités
Pi
précédentes, nicum %= nl , représentant le nombre d’individus ayant X ≤ ai+1 .
l=1
f icum % : La fréquence cumulée croissante à la ième classe est la fréquence augmentée de
Pi
celles des modalités précédentes, ficum %= fl , représentant la proportion des individus ayant
X ≤ ai+1 .
l=1
nicum & : L’effectif cumulé décroissant à la ième classe est l’effectif total diminué des effectifs
i−1
P
cumulés des modalités précédentes, nicum &=n − nl , représentant le nombre d’individus ayant
X ≥ ai .
l=1
f icum & : La fréquence cumulée croissante à la ième classe est la fréquence totale (égale api−1
P
proximativement à 1) diminuée des fréquences cumulées des modalités précédentes, ficum &= fl ,
représentant la proportion des individus ayant X ≥ ai .
n : La taille de l’échantillon.
8
l=1
C’est la longueur de la classe, calculée souvent par la différence
b)-1-1- L’amplitude de la classe :
entre sa borne supérieure et inférieure, notée k. Supposons la classe [a, b[⇒ k = b − a .
b)-1-2- Le centre de la classe :
0
0
xi tel que : xi =
Remarque :
a+b
2
0
ou xi = a +
C’est le point qui divise la classe en deux parties égales, notée
k
2
0
ou xi = b −
k
2
0
0
0
0
ou xi = xi−1 + k ou xi = xi+1 − k.
Les deux dernières formules ne peuvent être utilisées que dans le cas de classes à
égales amplitudes.
b)-2- Méthode de regroupement en classes d’égales amplitudes :
Après avoir ordonner la
série, nous passons au regroupement par classes, suivant la relation :
E
k=
l
=
xmax − xmin
√
n
Tel que :
√
— l = n : représentant le nombre de classes, pour le calcul nous arrondissons à l’entier
supérieur.
— E : représentant l’étendue c-à-d la longueur de la série.
— k : représentant l’amplitude de la classe.
Exemple :
Le taux de réussite au Baccalauréat observé au sein de 32 lycées est donné ci-dessous :
0,58 0,63 0,63 0,63 0,64 0,66 0,67 0,68 0,68 0,70 0,70 0,71 0,73 0,74 0,74 0,75 0,77 0,79 0,80 0,85
0,87 0,90 0,93 0,94 0,94 0,95 0,97 0,97 0,98 0,98 0,99 1,00.
1. Quel est le caractère étudié ? Donner sa nature.
2. Répartir cette série en classes d’égale amplitude.
3. Etablir le tableau de distribution de fréquences.
4. Tracer l’histogramme et les courbes cumulatives
Solution :
1. Le caractère étudié : le taux de réussite au Baccalauréat, sa nature quantitatif
continu.
2. Répartition de la série en classes d’égales amplitudes :
9
1. La série est ordonnée de manière croissante.
2. Calcul de l’amplitude :
E
k=
l
=
xmax − xmin 1 − 0.58 0.42 0.42
√
=
= 0.07
= √
=
5.65
6
n
32
3. Tableau de distribution de fréquences :
Table 6 – Répartition d’un échantillon de lycées selon leur taux de réussite au Baccalauréat
Le taux de réussite Effectif
x
ni
[0.58, 0.65[
5
[0.65, 0.72[
7
[0.72, 0.79[
5
[0.79, 0.86[
3
[0.86, 0.93[
2
[0.93, 1.00]
10
Total
32
2.2
2.2.1
Représentation graphique :
Le graphique :
Est une représentation visuelle et simplifiée d’une réalité (ou phénomène) appréhendée sous
une forme essentiellement numérique (série, tableau).
1- Cas du caractère discret :
1-1- Le diagramme en bâtons :
Il est adapté à l’étude d’un caractère quantitatif discret. Les hauteurs des bâtons sont proportionnelles aux effectifs (ou aux fréquences). Exemple :
10
Figure 1 – Répartition d’un échantillon de machines selon le nombre de pannes
1-2- Diagramme cumulatif :
Est la représentation graphique d’une fonction F, appelée fonction de répatition de la variable
statistique, il est obtenu en pratique à partir des fréquences cumulées il est sous forme de courbe
en escalier. Exemple :
11
Figure 2 – Diagramme cumulatif croissant
2- Cas du caractère continu :
2-1- L’histogramme :
Définition1 : Est un graphique composé de rectangles ajascents dont la hauteur et la surface
sont proportionnelles à l’effectif qu’ils représentent.
Définition2 : Il est adapté à l’étude d’un caractère quantitatif continu. Les aires des rectangles
sont proportionnelles aux effectifs (ou aux fréquences). Exemple :
4. Représentation graphique de la distribution de fréquences (Suite solution de l’exemple précédent) :
12
Figure 3 – Répartition d’un échantillon de lycées selon leurs taux de réussite
2-2- Le polygône de fréquences :
S’obtient en joignant les points milieux des sommets de chaque rectangle dans le cas du caractère
continu, voir ligne en rouge figure 3 (les sommets des bâtons dans le cas du caractère discret,voir
ligne en rouge figure 1). Il en résulte que la surface sous le polygône de fréquences est égale à celle
de l’histogramme.
2-3- Courbes cumulatives :
Elles sont obtenues en portant les points dont les abscisses représentent les bornes des classes
et les ordonnées les fréquences absolues cumulées (ou les fréquences relatives cumulées) correspondantes, puis en reliant ces points.
Exemple : (réponse à la question 5)
5. Représentation graphique des courbes cumulatives :
13
Table 7 – Effectifs cumulés croissants et décroissants
Le taux de réussite Effectif Eff. cumulé croissant Eff. cumulé décroissant
x
ni
nicum %
nicum &
[0.58, 0.65[
5
5
32
[0.65, 0.72[
7
12
27
[0.72, 0.79[
5
17
20
[0.79, 0.86[
3
20
15
[0.86, 0.93[
2
22
12
[0.93, 1.00]
10
32
10
Total
32
_
_
a) Calcul des effectifs cumulés croissants et décroissants :
b) Courbes cumulatives :
Figure 4 – Evolution des courbes cumulatives
14
3- Cas de caractère qualitatif :
Plusieurs graphiques lui sont adaptés (Diagramme circulaire, semi-circulaire, regtangulaire, en
barres), nous traitrons deux seulement :
3-1- Diagrammes en barres :
formés de barres dont l’abscisse est la valeur xi d’un caractère et la hauteur est proportionnelle
à ni ou fi .
Figure 5 – Répartition d’un échantillon d’étudiants de Blida selon la série du Baccalauréat
Exemple :
3-2- Diagramme à secteurs (ou circulaire ou camembert) :
C’est un disque partagé en secteurs dont l’angle au centre est proportionnel à l’effectif de chaque
valeur. Les angles sont obtenus suivant la formule :
αi = fi .360°
15
Exemple :
Table 8 – Répartition d’un échantillon d’étudiants de l’université de Blida selon leurs séries de Baccalauréat
Série de Baccalauréat Effectif Fréquence Angle
xi
ni
fi
αi
Maths Technique
18
0.36
129°.6
Maths
10
0.20
72°
Sciences
14
0.28
100°.8
Lettres
8
0.16
57°.6
Total
50
1
360°
Représentation graphique de la distribution de fréquences :
Figure 6 – Répartition d’un échantillon d’étudiants de Blida selon la série du Baccalauréat
16
3
Chapitre III : Paramètres de position et dispersion :
3.1
Paramètres de position (ou tendance centrale) :
3.1.1
Le mode :
a) Données non groupées :
Le mode d’une série est la valeur la plus fréquente de la série (celle
qui a l’effectif le plus élevé), noté M o.
Exemple : La série 12, 13, 12, 15, 13, 12, 8, 10 a pour mode M o = 12.
b) Données groupées :
- Cas continu :
On définit la classe modale, comme étant la classe ayant l’effectif le plus élevé,
tel que le mode sera donné par la formule suivante :
M o = L1 +
∆1
∆1 + ∆2
(L2 − L1 )
Avec :
L1 : Borne inférieure de la classe modale.
L2 : Borne supérieure de la classe modale.
∆1 : La différence entre l’effectif de la classe modale et l’effectif de celle qui la précède.
∆2 : La différence entre l’effectif de la classe modale et l’effectif de celle qui la succède.
Exemple (Reprenant l’exemple du chapitre II) :
Table 9 – Répartition d’un échantillon de lycées selon leur taux de réussite au Baccalauréat
Le taux de réussite Effectif
x
ni
[0.58, 0.65[
5
[0.65, 0.72[
7
[0.72, 0.79[
5
[0.79, 0.86[
3
[0.86, 0.93[
2
[0.93, 1.00]
10
Total
32
17
Calcul du mode :
La classe modale est [0.93, 1.00], donc le mode sera :
(10 − 2)
M o = 0.93 +
.(1.00 − 0.93) = 0.96
(10 − 2) + (10 − 0)
Détermination graphique du mode :
Figure 7 – Répartition d’un échantillon de lycées selon leurs taux de réussite
- Cas discret :
Le mode correspond à la modalité ayant l’effectif le plus élevé.
Exemple :
Détermination du mode à partir du tableau :
Table 10 – Répartition d’un échantillon d’étudiants selon le nombre de pannes
Nombre de pannes Effectif
xi
ni
0
8
1
14
Mo=2
17
3
8
4
3
Total
50
18
Table 11 – Répartition d’un échantillon d’étudiants de l’université de Blida selon leurs séries de Baccalauréat
Série de Baccalauréat Effectif
xi
ni
Maths Technique
18
Maths
10
Sciences
14
Lettres
8
Total
50
Le mode correspond à x3 = 2 = M o, car son effectif n3 = 17correspond à l’effectif le plus élevé
dans la distribution de fréquences.
Détarmination graphique du mode :
Figure 8 – Répartition d’un échantillon de machines selon le nombre de pannes
- Cas qualitatif :
Détermination du mode à partir du tableau :
Le mode correspond à la modalité ayant l’effectif le plus élevé.
Exemple :
Le mode correspond à la modalité x1 = M aths technique = M o .
Détermination du mode graphiquement :
19
Figure 9 – Répartition d’un échantillon d’étudiants de Blida selon la série du Baccalauréat
3.1.2
La médiane :
a) Données non groupées :
C’est la valeur du caractère qui divise l’ensemble des données (série
ordonnée) en deux parties égales, notée M e. Donc la moitié des valeurs de la série ordonnée sera
inférieure à M e et l’autre moitié lui sera supérieure.
- n impair :


 n + 1
Me = x 

2
Exemple : Soit la série brute suivante : 6,7, 7, 9, 10, 11, 11, 13, 13.


 9 + 1
n = 9 ⇒ Me = x 
 = x(5) = 10
2
20
- n pair :
 


 n
n

x   + x  + 1
2
2
Me =
2
Exemple : Soit la série brute suivante : 6,7, 7, 9, 10, 11, 11, 13.


 
8

 8
x   + x  + 1
2
2
n = 8 ⇒ Me =
x(4) + x(5)
=
2
2
9 + 10
=
2
= 9.5
a) Données groupées :
- Cas discret :
— Calcul des effectifs cumulés
n
— Calcul du
 2





n


n

 n + 1


=
x
[
]
+
1
si
∈
/N
x






2
2
2




 

— Me =


n
 n



+
x
x
+ 1





2
2


n



si
∈N
2
2
Exemple :
Détermination de la médiane à partir du tableau :
Table 12 – Répartition d’un échantillon de machines selon le nombre de pannes
Nombre de pannes Effectif Effectif cumulé croissant
xi
ni
nicum %
0
8
8
1
14
22
n
Mo=2← M e
17←
39 ←
← = 25
2
3
8
47
4
3
50
Total
50
-
21
Figure 11 – Diagramme cumulatif décroissant
Calcul du
n
2
n
2
:
 


 n

n
x   + x  + 1
2
2
50
=
2
= 25 ∈ N ⇒ M e =




 50

 50
x   + x  + 1
2
2
=
2
2
Détermination graphique de la médiane :
Figure 10 – Diagramme cumulatif croissant
- Cas continu :
22
x(25) + x(26)
=
2
2+2
=
2
=2
Figure 12 – Détermination graphique de la médiane
Méthode d’interpolation linéaire :
4
4
Nous avons abcet adedeux triangles semblanles, donc :
n
− F1
bc
M e − L1
ab
=
=⇒
= 2
ad
de
L2 − L1
F2 − F1
=⇒
n
n
− F1
− F1
M e − L1
= 2
=⇒ M e = L1 + 2
.a
a
nM e
nM e
L1 : la borne inférieure de la classe médiane
L2 : la borne supérieure de la classe médiane
F1 : Effectif (ou fréquence) cumulé croissant jusqu’à L1
F2 : Effectif (ou fréquence) cumulé croissant jusqu’à L2
a : amplitude de la classe médiane
nM e : Effectif de la classe médiane
Exemple :
— Calcul de
n
2
:
n
2
=
32
2
= 16 =⇒ M e ∈ [0.72, 0.79[ représentant la classe médiane.
M e = 0.72 +
16 − 12
.(0.79 − 0.72) = 0.776
17 − 12
23
Table 13 – Répartition d’un échantillon de lycées selon leur taux de réussite au Baccalauréat
Le taux de réussite Effectif Effectif cumulé croissant Effectif cumulé décroissant
x
ni
nicum%
nicum&
[0.58, 0.65[
5
5
32
[0.65, 0.72[
7
12
27
n
32
M e ∈[0.72, 0.79[←−
5←−
17 ←− 2 = 2 = 16
20
[0.79, 0.86[
3
20
15
[0.86, 0.93[
2
22
12
[0.93, 1.00]
10
32
10
Total
32
-
Figure 13 – Détarmination graphique de la médiane
Détermination grapique de la médiane :
3.1.3
Généralisation : Les quantiles
Les quantiles sont déterminés comme la médiane. Soit α ∈]0, 1[, on appelle quantile d’ordre α,
noté qα la valeur du caractère qui est supérieure à nαvaleurs de la série ordonnée.
Données non groupées :
Soit 0 ≺ α ≺ 1 :
24
Figure 14 – Détermination graphique des quantiles d’ordre α
Après avoir ordonner la série, nous calculons nα
qα =





x ([nα] + 1)
si nα ∈
/N

x (nα) + x (nα + 1)



si nα ∈ N
2
Données groupées :
Cas discret :
(Même formule que pour les données non groupées)
qα =





x ([nα] + 1)
si nα ∈
/N

x (nα) + x (nα + 1)



si nα ∈ N
2
Détermination graphique :
25
Cas continu :
Soit 0 ≺ α ≺ 1 :
qα = L1 +
nα − F1
(L2 − L1 )
F2 − F1
Tel que :
— L1 :La borne inférieure de la classe contenant qα
— L2 :La borne supérieure de la classe contenant qα
— nα : Effectif des individus ayant la valeur du caractère inférieure à qα
— F1 :Effectif cumulé jusqu’à L1
— F2 :Effectif cumulé jusqu’à L2
Remarques :
On peut remplacer les effectifs cumulés croissants par les fréquences cumulées
croissantes.
0
qα = L 1 +
α − F1
0
0
F2 − F1
(L2 − L1 )
Figure 15 – Détermination graphique des quantiles d’ordre α
Détermination graphique des quantiles d’ordre α :
26
— Si α = 1/4, 1/2, 3/4, on parlera de quartile. Les quartiles divisent l’ensemble des données
ordonnées en quatre parties égales.
— Si α = 1/10, 2/10, 3/10, ........., 9/10, on parlera de décile. Les déciles divisent l’ensemble des
données ordonnées en dix parties égales.
— Si α = 1/100, 2/100, 3/100, ........., 99/100, on parlera de centile. Les centiles divisent l’ensemble des
données ordonnées en cent parties égales.
3.1.4
La moyenne arithmétique :
a) La méthode directe :
- Données non groupées :
La moyenne arithmétique simple :
C’est la somme des valeurs de la série divisée par leur effectif
total, notée x̄ et calculée suivant la formule :
Pn
i=1
X̄ =
xi
n
- Données groupées :
Cas discret :
La moyenne arithmétique pondérée :
Pk
X̄ =
i=1 ni xi
n
Tel que k représente le nombre de modalités du caractère.
Cas continu :
0
Pk
X̄ =
i=1
ni xi
n
Tel que :
— k représente le nombre de classes du caractère.
27
Table 14 – Calcul de la moyenne arithmétique par la méthode indirecte
X −b
Age de possession de véhicule Effectif Centre de la classe
Y =
a
0
0 2
xi − 55
0
0
x
ni
xi
ni xi n i xi
yi =
10
[20, 30[
2
25
50
1250
-3
[30, 40[
6
35
210
7350
-2
[40, 50[
20
45
900
40500
-1
[50, 60[
40
55
2200 121000
0
[60, 70[
30
65
1950 126750
1
[70, 80[
2
75
150
11250
2
Total
100
5460 308100
-
n i yi
ni yi2
-6
-12
-20
0
30
4
-4
18
24
20
0
30
8
100
0
— xi le centre de la ième classe
b) La méthode indirecte (ou par changement de variables) :
Pk
i=1
aY + b, nous aurons alors : X̄ = aY + b, tel que : Ȳ =
0
X −b
Y =
=⇒ yi =
a
=⇒
Remarque :
k
1X
n
xi − b
a
0
=⇒ ni yi =
1 Pk
ni y i = n
0
i=1 ni xi −
n i xi − b
a
b Pk
n
i=1
n
=⇒
k
X
ni
X −b
Pk
ni y i =
i=1
0
n i xi −
Pk
i=1
ni b
a
X̄ − b
=⇒ Ȳ =
a
=⇒ X̄ = aȲ + b
En général b est le mode ou valeur centrale de la série, a l’amplitude de la classe
modale ou centrale (selon le choix de b)
Exemple :
=⇒ X =
a
(Voir développement plus bas).
i=1
a
i=1
ni y i
En posant Y =
Calcul de X̄, par la méthode directe :
0
Pk
X̄ =
i=1
n
n i xi
5460
=
100
= 54.6
Calcul de X̄, par la méthode indirecte :
P6
Ȳ =
i=1
ni yi
100
=
1
(−4) = −0.04 =⇒ X̄ = 10 (−0.04) + 55 = 54.6
100
28
3.1.5
La distribution symétrique :
Dans le cas des données groupées, si X̄ = M e = M o, on dira que cette distribution est
symétrique.
3.2
3.2.1
Les paramètres de dispersion :
L’étendue :
C’est la différence entre la plus grande et la plus petite valeur de la série.
3.2.2
La variance :
a) Données non groupées :
- Variance simple :
n
1X
V (X) =
n
xi − X̄
2
=
i=1
n
1X
n
x2i − X̄
2
i=1
Démonstration :
V (X) =
=
n
1X
n
i=1
x2i
n
1X
n
− 2X̄
xi − X̄
2
=
i=1
n
1X
n
xi +
i=1
=
n
1X
n
n
X̄
2
=
x2i − X̄
i=1
a) Données groupées :
29
x2i − 2xi X̄ + X̄
2 2
i=1
i=1
n
1X
n
n 1X
n
1X
n
2
i=1
x2i − 2 X̄
2
+ X̄
2
- Variance pondérée :
- Cas discret :
V (X) =
k
1X
n
ni xi − X̄
2
=
i=1
k
1X
n
ni x2i − X̄
2
=
i=1
k
X
fi x2i − X̄
2
=
i=1
k
X
fi xi − X̄
2
i=1
- Cas continu :
- Méthode directe :
k
1X
V (X) =
n
ni xi − X̄
2
=
i=1
k
1X
n
ni x2i − X̄
2
i=1
Exemple :
V (X) =
k
1X
n
ni x2i − X̄
1
=
i=1
X −b
Soit Y =
- Méthode indirecte :
2
a
100
(308100) − (54.6)2 = 99.84
, tel que b est choisit comme étant le mode ou le centre
de la classe centrale et a l’amblitude
X −b
Y =
Démonstration :
=⇒ X = aY + b =⇒ V (X) = a2 V (Y )
a
Soit Y =
X −b
a
,
0
=⇒ yi =
=⇒ V (Y ) =
=
k
1 1X
a2 n
i=1
0
k
1X
n
i=1

xi − b
a
=⇒ V (Y ) =
k
1X
n
ni yi − Ȳ
2
i=1
2
0
k
1X
1 0
2
 xi − b X̄ − b
ni 
−
=
n
x
−
b
−
X̄
−
b

i
i
a
a
n i=1 a2
ni xi − b − X̄ + b
2
==
k
1 1X
a2 n
0
ni xi − X̄
i=1
30
2
1
=
a2
V (X) =⇒ V (X) = a2 V (Y )

Exemple :
3.2.3
 1

Voir tableau n°14, V (X) = a2 V (Y ) = (10)2 
(100) − (−0.04)2  = 99.84
100
Ecart-type :
L’écart-type est la racine carrée de la variance σ =
3.2.4

p
V (X).
Ecart-interquartile :
C’est la différence entre le troisième et le premier quartile Qi = Q3 − Q1
3.2.5
Intervalle semi-interquartile :
Q3 − Q1
QI =
2
Qtypeoutnf ss@catcodes
3.2.6
Coefficient de variation :
Définition1 :
C’est un coefficient sans dimenssion, indépendant des unités de mesures, il sert à
rendre les comparaisons entre des séries statistiques différentes plus aisées. Ce coefficient permet
de relativiser l’écart-type σ (X)par rapport à la moyenne arithmétique X̄. Il est noté par α =
σ (X)
.100 plus le coefficient est élevé plus la dispersion est forte.
X̄
Définition2 :
Le coefficient de variation est défini comme le rapport entre l’écart-type σet la
moyenne m, noté α et calculé α =
σ
.100 il est sans unité, utilisé pour comparer les séries de
m
différentes unités.
Exemple :
Nous avons une première série représentant les tailles des étudiants avec un coefficient
de variation α1 = 40%, la seconde représentant leurs poids avec un coefficient de variation α2 =
38%. Nous pouvons conclure que la dispersion relative est plus importante dans la première série
que dans la seconde.
31
4
Chapitre IV : Statistique descriptive bivariée
4.1
Série bivariée :
On appellera une série bivariée le tableau associant X et Y sous la forme suivante :
X
Y
Table 15 – La série bivariée
x1 x2 x3 ....... xi .......
y1 y2 y3 ....... yi .......
xn
yn
Elle associe à chaque individu i , avec i = 1, n le couple (xi , yi ) représentant les ièmes valeurs
ou modalités des deux variables X et Y observées sur les n individus, ces données peuvent être
regroupées aussi dans un tableau de contingence, comme suit :
4.2
Tableau de contingence :
Représentation de la distribution jointe du couple (X, Y ), appelé aussi tableau à double entrées.
Y
X
x1
x2
.
.
.
xi
.
.
.
xk
Total
4.2.1
n pj
Table 16 – Tableau de contingence
. . .
. . .
y1
y2
yj
n11
n21
.
.
.
ni1
.
.
.
nk1
n p1
n12
n22
.
.
.
ni2
.
.
.
nk2
n p2
. . .
. . .
. . .
. . .
. . .
. . .
. . .
n1j
n2j
.
.
.
nij
.
.
.
nkj
n pj
. . .
. . .
. . .
. . .
. . .
. . .
. . .
yp
n1p
n2p
.
.
.
nip
.
.
.
nkp
n pp
Total
n ip
n1p
n2p
.
.
.
n ip
.
.
.
nk p
npp
Notations :
— Nous noterons par xi , i = 1, k la ième modalité ou classe de la variable X.
— Nous noterons par yj , j = 1, p la j ème modalité ou classe de la variable Y .
— Les deux variables X et Y sont mesurées simultanément
Le croisement de X et Y nous donne la distribution d’effectifs ci-dessus appelé tableau de contingence.
32
Remarque : X et Y peuvent être de mêmes natures ou de natures différentes.
Exemple : Le croisement de deux variables qualitatives.
Table 17 – Croisement
Y
X
x1 = Lycée1
x2 = Lycée2
x3 = Lycée3
Total
n pj
4.2.2
de la performance d’élèves de secondaire et le lycée
. y3 . .
y1
y2
y4
F aible
M oyenne
Elevée
T rès élevée
n11 = 2
n12 = 15
n13 = 7
n14 = 1
n21 =5
n22 = 10
n23 = 12
n24 = 3
n31 = 3
n32 = 7
n33 = 9
n34 = 6
np1 =10 np2 = 32 np3 = 28
np4 = 10
d’appartenance
Total
n ip
n1p = 25
n2p = 30
n3p = 25
npp = 80
Les distributions marginales :
X
n ip
x1
n1p
Table 18 – Distribution marginale de X
. . .
. . .
x3
xi
xk
T otal
avec i = 1, k
. . .
. . .
n3p
ni p
nk p
n
x2
n2p
a) Distribution marginale de X :
Table 19 – Distribution marginale de X
X
Lycées
ni p
Lycée1
Lycée2
Lycée3
T otal
25
30
35
80
avec i = 1, 3
Exemple :
Y
n pj
y1
n p1
Table 20 – Distribution marginale de Y
. . .
. . .
y2
yj
yp
Total
avec j = 1, p
. . .
. . .
n p2
n pj
n pp
n
b) Distribution marginale de Y :
Table 21 – Distribution marginale de Y
Y
P erf ormance
n pj
F aible
M oyenne
Elevée
T rès élevée
Total
10
32
28
10
80
Exemple :
33
avec j = 1, 4
4.2.3
Les distributions conditionnelles :
a) Distribution de X :Y :
X/Y = yj
nij
On a p distributions conditionnelles :
Table 22 – Distribution conditionnelle de X/Y = yj
. . .
. . .
x1 x2 x3
xi
xk T otal
avec j = 1, p
. . .
. . .
n1j n2j n3j
nij
nkj
n pj
On veut représenter la distribution conditionnelle X/Y = y2
Exemple :
Table 23 – Distribution conditionnelle de X/Y = y2
X/Y = y2
Lycée1 Lycée2 Lycée3 T otal
Les lycées/P erf ormance moyenne
avec i = 1, 3
ni2
15
10
7
32
b) Distribution de Y/X :
Y /X = xi
nij
On a k distributions conditionnelles :
Table 24 – Distribution marginale de Y/X
. . .
. . .
y1 y2
yj
yp Total
avec i = 1, k
. . .
. . .
ni1 ni2
nij
nip nip
Table 25 – Distribution conditionnelle de Y /X = x3
Y /X = x3
T rès élevée
F aible M oyenne Elevée
Les P erf ormance/Lycée3
n3j
3
7
9
6
Total
25
avec j = 1, 4
Exemple :
nij : L’effectif associé au couple (xi , yj ) avec i = 1, k et j = 1, p
p
P
: L’effectif associé à xi , tel que : nip =
nij ,i = 1, k
c) Effectif :
nip
j=1
k
P
npj : L’effectif associé à yj , tel que : npj =
nij , j = 1, p
i=1
n : La taille de l’échantillon ou effectif total,tel que : n =
p
k P
P
i=1j=1
f ip =
i=1
j=1
: Proportion associée au couple (xi , yj ) avec i = 1, k et j = 1, p
p
P
: Proportion associée à xi , tel que : fip =
fij ,i = 1, k
d) Fréquence :
nip :
n
nij
n
p
Pk
P
nij = nip =
n pj
fij =
j=1
34
k
P
n
fpj = npj : Proportion associée à yj , tel que : fpj = fij , j = 1, p
i=1
p
k P
P
fij =
i=1j=1
fi/Y =yj =
fj/X=xi =
4.2.4
k
P
i=1
nij
:
npj
nij
nip
f ip =
p
P
j=1
fpj = 1, représentant la proportion totale.
Proportion conditionnelle de X/Y, avec i = 1, k et j = 1, p
: Proportion conditionnelle de Y/X, avec i = 1, k et j = 1, p
Représentation graphique d’une distribution à deux variables qualitatives :
Figure 16 – Croisement de la performance d’élèves de secondaire et le lycée d’appartenance
4.2.5
Indépendance :
Cas de deux variables qualitatives (ou mixtes) :
X et Y sont indépendantes si et seulement si :
nij =
1
× nip × npj ∀i = 1, k et ∀j = 1, p
n
Ou : X et Y sont indépendantes si et seulement si :
fij = fip × fpj ou fi/Y =yj = f ∀i = 1, k et ∀j = 1, p
ip
4.3
4.3.1
Etude de deux variables quantitaives :
Notations :
— Si X et Y sont des variables quantitatives discrètes : xi et yj sont les modalités prises.
35
— Si X et Y sont des variables quantitatives continues : xi et yj désignent les centres des classes.
Table 26 – Croisement de la performance d’élèves de secondaire et le lycée d’appartenance
Y
X
[5, 7[ [7, 9[ [9, 11[ nip
[11, 15[
1
0
0
1
[15, 19[
9
1
0
10
[19, 23[
16
13
0
29
[23, 27[
8
32
14
54
n pj
34
46
14
94
Exemple :
4.3.2
Principales caractéristiques :
a- Moyennes de X et Y :
a- 1- Série bivariée :
X=
n
1 X
xi et Y =
n i=1
1
n
n
P
yj
i=1
a- 2- Tableau de contingence (Moyennes marginales) :
X=
k
1 X
n xi et Y =
n i=1 ip
1
n
p
P
i=1
npj yj
Remarque : Si X et Y sont deux variables continues xi et yj représentent les centres de classes.
b- Variances de X et Y :
b- 1- Série bivariée :
n
n
2
2
1 X
1 P
x2i − X
xi − X =
V (X) =
n i=1
n i=1
etV (Y ) =
n
n
2
2
1 X
1 X 2
yi − Y =
yi − Y
n i=1
n i=1
36
b- 2- Tableau de contingence (Variances marginales) :
k
2
1 X
nip x i − X =
V (X) =
n i=1
1
n
k
P
i=1
nip x2i − X
2
p
p
2
2
1 X
1 X
npj yj − Y =
npj yj2 − Y
etV (Y ) =
n i=1
n i=1
c- Moyennes et variances conditionnelles :
c- 1- Moyenne et variance de X sachant Y = yj :
X i/j =
k
k
X
1 X
nij xi =
pi/j xi
n pj
i=1
Vi/j (X) =
i=1
k
2
1 X
nij x2i − X i/j
n pj
i=1
c- 2- Moyenne et variance de Y sachant X = xi :
Y j/i =
p
p
X
1 X
nij yj =
pj/i yj
ni p
j=1
Vj/i (Y ) =
j=1
p
2
1 X
nij yj2 − Y j/i
nip
j=1
d- Covariance entre X et Y :
d-1- Série bivariée :
Cov (X, Y ) =
n
n
1 X
1 X
xi − X y i − Y =
xi yi − XY
n i=1
n i=1
37
Table 27 – Croisement de la performance d’élèves de
yj
xi
6
8 10
13
1
0
0
17
9
1
0
21
16 13 0
25
8 32 14
npj 34 46 14
secondaire et le lycée d’appartenance
ni p
1
10
29
54
94
d- 2 - Tableau de contingence :
p
k p
k X
1 X
1 XX
Cov (X, Y ) =
nij xi − X yj − Y =
nij xi yj − XY
n
n
i=1 j=1
i=1 j=1
Exemple : Série bivariée voir exercice n°7
Exemple : le tableau de contingence voir exercice n°4
— Moyennes marginales :
k
1 X
2142
1
X=
(13 × 1 + 17 × 10 + 21 × 29 + 25 × 54) =
= 22, 79
n i p xi =
n i=1
94
94
Y =
p
1 X
712
1
n pj y j =
(6 × 34 + 8 × 46 + 10 × 14) =
= 5, 57
n i=1
94
94
— Variances marginales :
k
2
1 X
V (X) =
nip xi − X =
n i=1
=
1
n
k
P
i=1
nip x2i − X
2
1
132 × 1 + 172 × 10 + 212 × 29 + 252 × 54 − (22, 79)2
94
=
49598
− (22, 79)2 = 8, 25
94
p
p
2
2
1 X
1 X
V (Y ) =
n pj y j − Y =
npj yj2 − Y
n i=1
n i=1
=
1 2
6 × 34 + 82 × 46 + 102 × 14 − (5, 57)2
94
38
=
5568
− (5, 57)2 = 28, 20
94
Moyennes et variances conditionnelles :
— Moyenne et variance de X sachant Y = yj :
X i/j
X i/j=1
X i/j=2
k
k
X
1 X
=
nij xi =
pi/j xi
npj i=1
i=1
k
1
702
1 X
ni1 xi =
(13 × 1 + 17 × 9 + 21 × 16 + 25 × 8) =
= 20, 64
=
np1 i=1
34
34
k
1 X
1
1090
=
(13 × 0 + 17 × 1 + 21 × 13 + 25 × 32) =
= 23, 69
ni2 xi =
np2 i=1
46
46
X i/j=3
k
1 X
1
350
ni3 xi =
(13 × 0 + 17 × 0 + 21 × 0 + 25 × 14) =
= 25
=
np3 i=1
14
14
k
2
1 X
Vi/j (X) =
nij x2i − X i/j
npj i=1
k
2
1 X
1
ni1 x2i − X i/j=1 =
132 × 1 + 172 × 9 + 212 × 16 + 252 × 8 −(20, 64)2
Vi/j=1 (X) =
np1 i=1
34
k
2
1
1 X
ni2 x2i − X i/j=2 =
132 × 0 + 172 × 1 + 212 × 13 + 252 × 32 −(23, 69)2
Vi/j=2 (X) =
np2 i=1
46
k
2
1 X
1
Vi/j=3 (X) =
ni3 x2i − X i/j=3 =
132 × 0 + 172 × 0 + 212 × 0 + 252 × 14 −(25)2
np3 i=1
14
— Moyenne et variance de Y sachant X = xi :
Y j/i
Y j/i=1
Y j/i=2
p
p
X
1 X
=
nij yj =
pj/i yj
nip j=1
j=1
p
1 X
1
=
n1j yj = (6 × 1 + 8 × 0 + 10 × 0) = 6
n1p j=1
1
p
1 X
1
62
=
n2j yj =
(6 × 9 + 8 × 1 + 10 × 0) =
= 6, 2
n2p j=1
10
10
39
p
2
1 X
nij yj2 − Y j/i
Vj/i (Y ) =
nip j=1
p
2 1 2
1 X
n1j yj2 − Y j/i=1 =
Vj/i=1 (Y ) =
6 × 1 + 82 × 0 + 102 × 0 − 62 = 0
n1p j=1
1
p
2
1 X
1 2
n2j yj2 − Y j/i=2 =
Vj/i=2 (Y ) =
6 × 9 + 82 × 1 + 102 × 0 − (6, 2)2 = 0.36
n2p j=1
10
d- Covariance entre X et Y :
d-1- Série bivariée :
n
n
1 X
1 X
xi − X y i − Y =
xi yi − XY
Cov (X, Y ) =
n i=1
n i=1
d- 2 - Tableau de contingence :
p
k p
k X
1 X
1 XX
Cov (X, Y ) =
nij xi − X yj − Y =
nij xi yj − XY
n
n
i=1 j=1
i=1 j=1
40
5
Chapitre V : Analyse combinatoire
5.1
Théorème fondamental de l’analyse combinatoire :
Théorème :
Si une expérience E1 peut donner n1 résultats différents, et si une expérience E2 peut
donner n2 résultats différents, alors la suite des expériences
E1 et
E2
peut donner n1 × n2
résultats différents.
Règle :
— Le « Ou » se traduit très souvent par une addition c-à-d le nombre de résultats de l’expérience
E1 ou E2 est n1 + n2 .
— Le « Et » se traduit très souvent par une multiplication c-à-d le nombre de résultats de
l’expérience E1 et E2 est n1 × n2 .
Exemple :
Soit une urne contenant 6 boules rouges et 4 noires, appelons E1 : tirer une boule
rouge, E2 : tirer une noire. Le nombre de résultats différents de E1 est n1 = 6, le nombre de
résultats différents de E2 est n2 = 4.
— Le nombre de résultats différents de E1 et E2 représentant l’expérience « Tirer une boule
rouge et une boule noire est n1 × n2 = 6 × 4 = 24résultats différents.
— Le nombre de résultats différents de E1 ou E2 représentant l’expérience « Tirer une boule
rouge ou une boule noire est n1 + n2 = 6 + 4 = 10résultats différents.
5.2
Les permutations :
Définition :
Permuter des objets c’est les réarranger dans un autre ordre. Nous allons distinguer
trois sortes de permutations :
5.2.1
Les permutations sans répétition :
Les permutations rectilignes de n objets tous différents, notée :
Pn = n!
41
Exemple :
Combien de mots différents peut-on former à l’aide des lettres des mots : ALGER et
CHAPITRE (les mots ne doivent pas avoir nécessairement un sens) ?
Réponse :
Pour le mot ALGER, on a P5 = 5! mots possibles et pour le mot CHAPITRE on a
P8 = 8! mots possibles.
5.2.2
Les permutations avec répétition :
Les permutations rectilignes de n objets dont certains sont identiques, notée :
n!
Pn ( n1 , n2 . . . nk ) =
Exemple :
n1 !n2 ! · · · nk !
Combien de mots différents peut-on former à l’aide des lettres des mots : TIZI OUZOU
et ANNABA (les mots ne doivent pas avoir nécessairement un sens) ?
Réponse :
Pour le mot TIZI OUZOU, on a P9 (2, 2, 2, 2) =
ANNABA on a P6 (2, 3) =
5.2.3
6!
2!3!
9!
2!2!2!2!
mots possibles et pour le mot
mots possibles.
Les permutations circulaires de n objets tous différents, notée : Pn = (n − 1)!
Exemple :
De combien de façon peut-on faire asseoir 8 personnes autour d’une table ronde .
Réponse :
P8 = (8 − 1)! = 7! façons.
5.3
Arrangement :
Définition :
Un choix ordonné de p objets choisis parmi n objets différents est un arrangement
de n objets pris p à p.
42
5.3.1
Arrangement sans répétition :
Sous entend des dispositions différentes des éléments mis en ligne. Il n’y a donc pas de répétition
et l’ordre des éléments à tout son impotance, notée :
Apn =
Exemple :
n!
(n − p)!
Le mot de passe d’une porte est composé de trois chiffres différents, combien de mots
de passe sont-ils possibles ? Le mot de passe d’un PC portable est composé de 6 lettres différentes,
combien de mots de passe sont-ils possibles ?
Réponse :
Le nombre de mots de passe possibles pour la porte est :
A310 =
10!
10!
(10 − 3)!
=
7!
= 720
Le nombre de mots de passe possibles pour le PC portable est :
A626 =
5.3.2
26!
26!
(26 − 6)!
=
20!
= 165765600
Arrangement avec répétition :
Lorsqu’un objet peut être observé plusieurs fois dans un arrangement. Le nombre d’arrangement
avec répétition de p objets pris parmi n, est alors :
αnp = np avec 1 ≤ p ≤ n
Exemple :
Le mot de passe d’une porte est composé de trois chiffres, combien de mots de passe
sont-ils possibles ? Le mot de passe d’un PC portable est composé de 6 lettres, combien de mots
de passe sont-ils possibles ?
Réponse :
Le nombre de mots de passe possibles pour la porte est :
3
α10
= 103
43
Le nombre de mots de passe pour le PC portable est :
6
α26
= 266
6
Chapitre VI : Espace de probabilité
6.1
6.1.1
Espace probabilisable :
Quelques définitions :
1- Expérience aléatoire :
Une expérience est aléatoire si son résultat ne peut être prévu à priori.
Exemple : le jet d’une pièce de monnaie, ou le jet d’un dé.
2- Espace fondamental (ou espace des évènements) :
C’est l’ensemble de tous les résultats pos-
sibles d’une expérience aléatoire donnée. Il est noté Ω, un élément ωde Ωest dit résultat élémentaire
.
Exemple :
— Le jet d’une pièce de monnaie, Ω = {P, F }.
— Le jet d’un dé, Ω = {1, 2, 3, 4, 5, 6}.
3- Evènement :
Un évènement peut à la suite d’une expérience aléatoire être réalisé ou ne pas
être réalisé. Un évènement doit toujours être défini avec précision. Il peutt être identifié à un sousensemble de Ω, constitué par les résultats ωde Ω. Il est noté par A, B, C lettres majuscules de
l’Alphabet.
Exemple ;
On lance un dé l’évènement A= « Le numéro 3 apparait » est un évènement dit élémentaire
car A = {3}. L’évènement B= « Un nombre impair apparait » est un évènement composé car
B = {1, 3, 5}.
a) Evènement élémentaire :
Est un évènement de la forme {ω}ou ω ∈ Ω. {ω}est un sous-
ensemble de Ω, alors que ω est un élément de Ω, exemple : A = {3}.
44
Figure 17 –
Est une ensemble d’évènements élémentaires, de la forme : {ω1 , ω2 , ω3 },
b) Evènement composé ;
exemple : B = {1, 3, 5}.
Un évènement A est dit réalisé lorsque le résultat ω de l’expérience
c) Evènement réalisé :
aléatoire appartient à A (ω ∈ A).
6.1.2
Opérations sur les évènements :
a) Evènement certain :
Un évènement est dit certain s’il arrive nécessairement. On l’identifie
en tant que sous-ensemble de Ω,à Ω.
b) Evènement impossible :
Un évènement est dit impossible s’il n’arrive jamais. On l’identifie
au sous-ensemble vide φ de Ω.
c) L’inclusion :
Un évènement A =⇒ B, si chaque fois que A est réalisé, B est réalisé. Celà se
traduit par la relation d’inclusion : A ⊂ B. On aura :
A ⊂ B =⇒ ω ∈ A =⇒ ω ∈ B
45
Le contraire d’un évènement A ( « Non A”), est l’évènement noté :
d) Evènement contraire :
A = Ω − A qui est réalisé si et seulement si A n’est pas réalisé. On aura :
ω∈
/ A ⇐⇒ ω ∈ A
e) L’intersection :
L’évènement ”A et B” est l’évènement qui est réalisé si A et B sont simultanément réalisés.
On le note A ∩ B. En tant que sous-ensemble de Ω c’est A ∩ B.. On aura :
ω ∈ A ∩ B ⇐⇒ ω ∈ A et ω ∈ B
f ) L’union :
L’évènement ”A ou B” est l’évènement qui est réalisé si et seulement si l’un au
moins des deux évènements A ou B est réalisé. En tant que sous-ensemble de Ω, c’est la réunion
A ∪ B de A et B. On aura :
ω ∈ A ∪ B ⇐⇒ ω ∈ A ou ω ∈ B
7- Evènements incompatibles :
Deux évènements A et B sont incompatibles (ou mutuellement
exclusifs ou disjoints) , s’ils ne peuvent être réalisés simultanément. En d’autres termes si : A∩B =
φ.
8- La différence :
Lorsque l’évènement A se réalise sans B, on dira que la différence se réalise.
On notera A − B cette différence. En d’autres termes : :
ω ∈ A − B ⇐⇒ ω ∈ A et ω ∈
/B
9- La différence symétrique :
Lorsque des deux évènements A et B, un et un seul se réalise,
on dira que la différence symétrique se réalise . On notera A4B cette différence symétrique. On
aura :
ω ∈ A4B ⇐⇒ ω ∈ A − B ou ω ∈ B − A
46
10- Système complet d’évènements :
L’ensemble d’évènements incompatibles A1 , A2 , ............An
tels que : A1 ∪ A2 ∪ A3 ........... ∪ AN = Ω te Ai ∩ Aj = φ, pour tous i, j = 1, n tel que (i 6= j) est
appelé système complet d’évènements.
6.1.3
Espace probabilisable :
Une classe Θ de P (Ω) est une σ − algèbre, si :
1. Ω ∈ Θ.
2. Si A ∈ Θ, alors A ∈ Θ.
3. Si (Ai )i∈I est une famille (finie ou infinie) d’évènements de Θ, alors ∪ Ai ∈ Θ, le couple
i∈I
(Ω, Θ) s’appelle espace probabilisable.
Dans ce cours nous utiliserons une algèbre d’évènements particulière qui est
Remarque :
l’ensemble des parties de Ω, noté P (Ω), et donc l’espace probabilisable sera : (Ω, P (Ω)).
Exemple :
Soit Ω = {1, 2, 3, 4, 5, 6}un espace fondamental, montrez que (Ω, P (Ω)) est un
espace probabilisable (avec P (Ω) l’ensemble des parties de Ω) ?
Solution :
P (Ω) = {φ, Ω, {1} , {2} , {3} , {4} , {5} , {6} , {1, 2} , {1, 3} , {1, 4} , {1, 5} , {1, 6} , {2, 3} , {2, 4} , {2, 5} , {2, 6} , {
On a :
1. Ω ∈ P (Ω)
2. Si A ∈ P (Ω) =⇒ A ∈ P (Ω), si on prend n’importe quel élément de P (Ω), on retrouvera
son contraire dans P (Ω), exemple : A = {1} A P (Ω) =⇒ A = {2, 3, 4, 5, 6} ∈ P (Ω)
3. Si A ∈ P (Ω) et B ∈ P (Ω) =⇒ A ∪ B ∈ P (Ω) , donc (Ω, P (Ω)) est un espace probabilisable.
6.1.4
Espace probabilisé :
1- Définition d’une probabilité :
— On appelle probabilité sur un espace probabilisable (Ω, Θ), toute application P de cet espace
à valeurs dans l’intervalle [0, 1], telle que :
47
— P (Ω) = 1
— ∀ (Ai ), la suite d’évènements deux à deux incompatibles :
P
∞
[
!
Ai
∞
X
=
P (Ai ) (σ − additivité) .
i=1
Remarque :
i=1
Dans le cas d’un espace Ω fini de cardinal n, cette propriété s’écrit :
n
[
P
!
Ai
i=1
n
X
=
P (Ai ) (additivité) .
i=1
L’espace (Ω, Θ, P ) est appelé espace probabilisé ou espace de probabilité.
2- Conséquences de cette définition :
— Probabilité de l’évènement contraire :
P A = 1 − P (A)
Démonstration :
P A ∪ A = P (A) + P A = P (Ω) = 1
=⇒ P A = 1 − P (A)
Comme P (Ω) = 1 alors P (φ) = 0.
— Probabilité de deux évènements liés par l’inclusion :
Si A ⊂ B =⇒ P (A) ≤ P (B)
Démonstration :
B = A ∪ (B − A)
=⇒ P (B) = P (A) + P (B − A)
On a P (B − A) ≥ 0, donc :
P (B) ≥ P (A) =⇒ P (A) ≤ P (B)
48
— Probabilité de l’union :
P (A ∪ B) = P (A) + P (B) − P (A ∩ B) , (si A et B sont quelconques)
P (A ∪ B) = P (A) + P (B) , (si A et B sont incompatibles)
Démonstration :
A ∪ B = (A − B) ∪ (A ∩ B) ∪ (B − A)
=⇒ P (A ∪ B) = P (A − B) + P (A ∩ B) + P (B − A)
On a :
B = (B − A) ∪ (A ∩ B) =⇒ P (B) = P (B − A) + P (A ∩ B)
=⇒ P (B − A) = P (B) − P (A ∩ B)
=⇒ P (A ∪ B) = P (A) − P (A ∩ B) + P (A ∩ B) + P (B) − P (A ∩ B)
=⇒ P (A ∪ B) = P (A) + P (B) − P (A ∩ B) (∗)
La formule (∗)se généralise à l’union de trois évènements quelconques :
P (A ∪ B ∪ C) = P (A) + P (B) + P (C) − P (A ∩ B) − P (A ∩ C) − P (B ∩ C) + P (A ∩ B ∩ C)
Pour quatre évènements quelconques :
P (A ∪ B ∪ C ∪ D) = P (A) + P (B) + P (C) + P (D) − P (A ∩ B) − P (A ∩ C) − P (A ∩ D)
−P (B ∩ C) − P (B ∩ D) − P (C ∩ D) + P (A ∩ B ∩ C) + P (A ∩ B ∩ D)
+P (A ∩ C ∩ D) + P (B ∩ C ∩ D) − P (A ∩ B ∩ C ∩ D)
3- Caractérisation des probabilités dans le cas d’évènements équiprobables :
Soit (Ω, Θ, P ),
un espace de probabilité avce Ωfini de cardinal n : Ω = {ω1 , ω2 , ω3 , . . . . . . , ωn }. Suppoons ωi de
même probabilité
1
n
(équiprobables) et considérons un évènement quelconque A fini de cardinal k :
49
A = {ω1 , ω2 , ω3 , . . . . . . , ωk }.
k
N ombre de cas f avorables
X
Card(A)
k
=
P (A) =
P ({ωi }) = =
n
Card(Ω)
i=1
N ombre de cas possibles
Exemple :
On lance un dé non truqué, soit A = « Avoir un nombre pair ». Quelle la probabilité
de A ?
Solution :
On a Ω = {1, 2, 3, 4, 5, 6}avec
P ({1}) = P ({2}) = P ({3}) = P ({4}) = P ({5}) = P ({6}) =
A = {2, 4, 6} =⇒ P (A) =
4- Probabilité conditionnelle :
1
n
3
1
Card(A)
= =
Card(Ω)
6
2
Soit un espace de probabilité (Ω, Θ, P ), et B un évènement tel
que P (B) 6= 0, on appelle probabilité d’un évènement « A sachant B », noté A/B, la probabilité
conditionnelle, notée :
P (A/B) =
P (A ∩ B)
=⇒ P (A ∩ B) = P (B) .P (A/B) (**)
P (B)
On peut généraliser la relation (∗∗) à n évènements :
P (A1 ∩ A2 ∩ A3 ... ∩ An ) = P (A1 ) .P (A2 /A1 ) .P (A3 /A1 ∩ A2 ) ....P (An /A1 ∩ A2 ∩ A3 ....... ∩ An−1 )
Si P (A) 6= 0, on aura :
P (A ∩ B) = P (B ∩ A) = P (A) .P (B/A) =⇒ P (B/A) =
Exemple :
P (A ∩ B)
P (A)
Soit une urne contenant 6 boules rouges, 5 blanches et 4 noires.
1. Quelle est la probabilité de tirer sans remise 2 boules rouges successivement ?
2. Quelle est la probabilité de tirer sans remise une première rouge, une deuxième rouge, une
50
troisième blanche et une quatrième noire ?
Solution :
Notons : R1 : tirer une première boule rouge, R2 : tirer une deuxième boule rouge,
B3 : tirer une troisième boule blanche, N4 : tirer une quatrième boule noire.
1. P (R1 ∩ R2 ) = P (R1 ) .P (R2 /R1 ) =
6 5
.
15 14
2. P (R1 ∩ R2 ∩ B3 ∩ N4 ) = P (R1 ) .P (R2 /R1 ) .P (B3 /R1 ∩ R2 ) .P (N3 /R1 ∩ R2 ∩ B3 ) =
6 5 5 4
. . .
15 14 13 12
5- Indépendance :
Définition1 :
Soient A et B deux évènements tel que P (A) 6= 0 et P (B) 6= 0.
— L’évènement A est dit indépendant de B, si : P (A/B) = P (A).
— .L’évènement B est dit indépendant de A, si : P (B/A) = P (B).
Définition2 :
A et B sont indépendants, si :
P (A ∩ B) = P (A) .P (B) tel que P (A) 6= 0 et P (B) 6= 0
Définition3 :
Trois évènements A, B et C sont dit mutuellement indépendants si :
P (A ∩ B ∩ C) = P (A) .P (B) .P (C)
Propriétés :
Soient A et B deux évènements indépendants, par conséquent A, B , B, A , A, B sont
des couples d’évènements indépendants.
Remarque : Cette propriété s’applique aussi à plus de deux évènements.
6- Probabilités totales :
Soit (Ω, Θ, P ) un espace de probabilité, considérons un système complet
d’évènements A1 , , A2 , A3 , ..........An . Soit A un évènement quelconque réalisé, telque P (A) 6= 0, on
peut écrire :
h
n
i
hn
i
P (A) = P (A ∩ Ω) = P A ∩ ∪ Ai = P ∪ (A ∩ Ai )
i=1
i=1
n
n
X
X
P (A ∩ Ai ) =
P (Ai ) .P (A/Ai ) .
=⇒ P (A) =
i=1
i=1
51
Exemple :
Un étudiant doit passer un examen oral chez un des trois enseignants E1 ,E2 ,et E3 .
— P(R/E1 ) = 0.55 probabilité de réussir en passant chez E1 .
— P(R/E2 ) = 0.5 probabilité de réussir en passant chez E2 .
— P(R/E3 ) = 0.6 probabilité de réussir en passant chez E3 .
Quelle est la probabilité que l’étudiant réussisse ?
R : Evènement l’étudiant réussit., on a : Ω = E1 ∪ E2 ∪ E3 .
P (R) = P (R ∩ Ω) = P [R ∩ (E1 ∪ E2 ∪ E3 )]
= P [(R ∩ E1 ) ∪ (R ∩ E2 ) ∪ (R ∩ E3 )]
= P (R ∩ E1 ) + P (R ∩ E2 ) + P (R ∩ E3 )
= P (E1 ) .P (R/E1 ) + P (E2 ) .P (R/E2 ) + P (E3 ) .P (R/E3 )
.Les enseignants étant choisit au hasard , P (Ei ) =
P (R) =
1
3
, avec i = 1, 3. On aura :
1
1
1
× 0.55 + × 0.5 + × 0.6 = 0.55
3
3
3
On se propose de chercher .la probabilité que Ai i = 1, n soit réalisé à
7- Formule de Bayes :
travers A .
P (Ai /A) =
P (Ai ∩ A)
P (Ai ) P (A/Ai )
= P
(F ormule de Bayes)
n
P (A)
P (Ai ) P (A/Ai )
i=1
Exemple :
L’étudiant a réussit, quelle est la probabilité qu’il a passé l’examen chez E1 ?
Réponse :
P (E1 /R) =
P (E1 ) P (R/E1 )
P (E1 ∩ R)
= 3
P
P (R)
P (Ei ) P (R/Ei )
i=1
=⇒ P (E1 /R) =
1
3
× 0.55 +
52
1
.0.55
3
1
× 0.5
3
1
3
+ × 0.6
=
1
3
Téléchargement