L’articulation probabilités-statistiques
Journées de l’inspection - Octobre 2009 Page 5 Robert FERACHOGLOU
Théorème 3
est minimal lorsque c est égal à la moyenne
de la série.
La valeur de cette distance euclidienne minimale est l’écart-type de la série.
Ce résultat, hors de portée des élèves de lycée, se justifie de deux façons :
- analytiquement, en étudiant le minimum de
;
- géométriquement, en remarquant que la distance euclidienne dérive d’un produit sca-
laire, et que la distance minimale de
à la droite vectorielle engendrée par
, qui est
aussi engendrée par le vecteur
, est minimale pour le projeté orthogonal sur
cette droite vectorielle. Ainsi
doit être le projeté orthogonal de
sur
; il est calcu-
lé par les conditions :
et
.
On en tire :
2
1... . .
n
cx cx c x c c nc
.
D’où :
(moyenne de la série).
La dispersion associée est la distance minimale correspondante, soit :
1
2
2
21
1
( , ) ( )
i
in
D x x x x s
n
(c’est l’écart-type de la série).
Ainsi, le couple (moyenne, écart-type) joue-t-il un rôle privilégié parmi les paramètres.
c) Que choisir en classe ?
L’aspect théorique précédent ne doit pas être soulevé en classe ; il a cependant le mérite
de montrer que les résumés numériques fonctionnent par deux : un paramètre de tendance
centrale et l’indicateur de dispersion qui lui mathématiquement associé. Il faut également re-
tenir que les valeurs extrêmes de la série ainsi que le seul paramètre de dispersion qui est of-
ficiellement au programme de seconde, à savoir l’étendue, ne doivent pas être méprisés
même s’ils sont relativement grossiers : ils interviennent en liaison avec la distance
. Ces
paramètres ont d’ailleurs une importance réelle dans les séries statistiques où intervient un si-
nistre, voire une catastrophe ; ainsi les plans d’occupation des sols doivent tenir compte des
hauteurs maximales des cours d’eau plutôt que de leur hauteur moyenne, les normes sis-
miques des bâtiments que l’on construit prennent la mesure des plus grandes magnitudes
constatées des séismes, etc.
D’autre part, il est important de montrer aux élèves que, pour une série numérique,
moyenne et médiane peuvent être très différentes, et de les entraîner à réfléchir à la perti-
nence du choix des paramètres. La moyenne est très usuelle, mais elle est peu robuste relati-
vement à des valeurs extrêmes très élevées ; ainsi le salaire moyen en France est relativement
trompeur pour rendre compte du revenu des habitants. Les paramètres d’ordre et leur repré-
sentation (médiane, quartiles, déciles, boîtes de dispersion) sont souvent plus appropriés. De
plus ces paramètres donnent du sens à la fonction cumulative des fréquences, dont
l’équivalent probabiliste est la fonction de répartition d’une variable aléatoire.
III – DÉFINIR UNE LOI DE PROBABILITÉ
1. Expérience aléatoire et modélisation
a) Qu’est-ce que modéliser ?
Modéliser une expérience aléatoire, c’est définir les résultats possibles (appelés « résultats »
ou « issues » ou encore « événements élémentaires »)
, …,
, que l’on supposera être en
nombre fini en classe de seconde, et leur affecter une suite de nombres
, …,
tous positifs