C3 : Manipulations statistiques 1- Génération de valeurs aléatoires 2

C3 : Manipulations statistiques
Dorat Rémi
1- Génération de valeurs aléatoires
2- Statistiques descriptives
3- Tests statistiques
4- Régression linéaire
p 2
p 3
p 8
p 8
Manipulations statistiques 1
1- Génération de valeurs aléatoires
Fonction de gération de base et construction de générateurs
La fonction ALEA() renvoie un nombre aléatoire tiré uniformément dans [0;1]. A partir de cette fonction
simple, il est possible de construire différents générateurs aléatoires. Soit par exemple une cellule nommée a qui
contient une valeur numérique positive, une cellule nommée b qui contient une valeur numérique positive telle que b>a.
Dans ce cas, la fonction a*ALEA() renvoie un nombre dans [0;a]
En continuant, on a (b-a)*ALEA() qui renvoie un nombre dans [0;b-a]
Enfin, la fonction (b-a)*ALEA()+a renvoie un nombre dans [a;b]
ration de nombres entiers
En première approche, pour tirer des valeurs entières, on utilise le générateur de valeurs réelles. Par
exemple, pour tirer un nombre entier dans [N;M], on commence par nommer une cellule N qui contient la valeur de la
borne inférieure, une cellule M qui contient la valeur de la borne supérieure. Comme fonction de tirage aléatoire d'un
nombre entier, on peut proposer : ARRONDI((M-N)*ALEA()+N) qui tire une valeur aléatoire dans [N;M] et arrondit
ensuite cette valeur à l'entier le plus proche.
Une telle fonction est cependant biaisée, étudions l'évolution de ARRONDI((M-N)*ALEA()+N) en fonction
de la valeur de (M-N)*ALEA()+N :
La valeur de (M-N)*ALEA()+N est dans : Valeur de ARRONDI((M-N)*ALEA()+N)
[N;N+0.5[ N
[N+0.5;N+1.5[ N+1
[N+1.5;N+2.5[ N+2
... ...
[M-1.5;M-0.5[ M-1
[M-0.5;M] M
On remarque que la taille de l'intervalle qui permet d'obtenir N est 0.5, de même que la taille de l'intervalle qui permet
d'obtenir M. En revanche, la taille de l'intervalle permettant d'obtenir K entier dans ]N;M[ est 1. Donc, le générateur
aléatoire ARRONDI((M-N)*ALEA()+N) ne produit pas une distribution uniforme sur les entiers. Pour produire une
distribution uniforme, on part d'un tirage dans l'ensemble [N-0,5;M+0,5] : les arrondis des valeurs tirées dans cet
Manipulations statistiques 2
ensemble sont des entiers dans [N;M]. Le générateur :
ARRONDI((M-N+1)*ALEA()+N-0.5) permet de faire le tirage uniforme d'entiers dans [N;M].
Les générateurs d'Excel
Les générateurs construits proposés dans les paragraphes précédents recoupent des outils d'Excel. En
effet, non seulement on dispose du générateur de base ALEA(), mais également d'une fonction aléatoire qui permet de
tirer des nombres entier dans un intervalle : ALEA.ENTRE.BORNES(2;5) renvoi des entiers tirés au hasard
uniformément dans [2;5].
Construction d'un générateur de valeurs Gaussiennes-La méthode de Box-Mueller
Une méthode permet de générer des valeurs aléatoires gaussiennes à partir d'un générateur uniforme. Il
s'agit de la méthode de Box Mueller. Celle-ci consiste à tirer des valeurs uniformes. Pour un couple
x , y
de
valeurs réelles tirées uniformément dans
[1;1]
, en posant
s=x2y2
, et si
s1
, alors les valeurs :
v0=x
2ln s
s
et
v1=y
2ln s
s
sont à la base d'une distribution gaussienne centrée réduite. Par suite, il est possible de générer des tirages aléatoires
pour n'importe quelle gaussienne : cf a*N(0,1)+b.
Disposer d'un générateur de valeurs aléatoires s'avère nécessaire pour la simulation de processus, les
simulations Monte-Carlo etc.
2- Statistiques descriptives
Les moments
Excel propose une série de fonctions qui permettent d'obtenir les moments de base d'une distribution. On
passe une plage de valeurs en paramètres : =MOYENNE(A2:A14) (ou plusieurs plages =MOYENNE(A2:A14;B2;8)). De
la même manière, on peut utiliser les fonctions :
ECARTYPE
VAR pour la variance
KURTOSIS
D'autres caractérisations classique des distributions :
Manipulations statistiques 3
MEDIANE
MODE : renvoie la valeur la plus fréquence d'une plage de données.
COEFFICIENT.ASYMETRIE
MOYENNE.HARMONIQUE
Covariance et coefficient de corrélation
D'autres coefficients d'évaluation statistique :
COVARIANCE : calcul le coefficient de COVARIANCE entre deux séries selon la formule classique :
cov X , Y =
i=1
n
xi
Xyi
Y
COEFFICIENT.CORRELATION : calcule le coefficient de corrélation entre deux séries.
CoeffCorr X ,Y =Cov X , Y
X Y
Calcul de distributions à partir de données disponibles
Pour obtenir une distribution, il existe plusieurs solutions. On en présente deux en parallèle : l'utilisation de
la fonction NB.SI qui a été vu dans le cours précédent et l'utilisation de la fonction FREQUENCE : ces deux fonctions
produisent un résultat équivalent.
Pour la fonction de fréquence, on donne comme premier paramètre la plage des valeurs dont on veut
obtenir la distribution et comme second paramètre une plage de valeurs qui détermine la distribution. Par exemple, on
suppose avoir la liste des valeurs dont on veut obtenir la distribution dans la plage A1:A300 et la série des valeurs qui
déterminent les intervalles dans B1:B11. Dans ce cas, on rentre la formule matricielle =FREQUENCE(A1:A300;B1:B11),
on a introduite une telle formule dans la colonne C. Si par exemple on a mis une série de valeurs aléatoires tirées entre
8 et 9 dans la colonne A (=(9-8)*ALEA()+8), alors :
Manipulations statistiques 4
On constate qu'en C2, on a l'ensemble des valeurs entre B2 et B1, qu'en C3, on a l'ensemble des valeurs entre B3 et B2
etc. Pour l'autre manière de faire la distribution : on introduit =NB.SI($A$1:$A$300;"<"&B1) dans E1, =NB.SI($A$1:$A
$300;"<"&B2) dans E2 etc. Ensuite, dans F2, on met E2-E1, dans F3, on met E3-E2 etc. On obtient donc la même
distribution dans la colonne C et dans la colonne F.
D'autres fonctions statistiques
La fonction QUARTILE. Cette fonction prend deux arguments : une plage de données et une option. Le
paramètre d'option peut prendre les valeurs 0, 1, 2, 3 ou 4. Pour 0, la fonction renvoie la valeur minimale. Pour 1, la
fonction renvoie la valeur telle que le quart des valeurs sont plus petites, le reste des valeurs étant plus grandes. Pour 2,
la fonction renvoie la médiane. Pour 3, la fonction renvoie la valeur telle que un quart des valeurs lui sont supérieures.
Pour 4, la valeur renvoie la valeur maximale de la distribution.
La fonction CENTILE fonctionne de la même manière que QUARTILE, elle prend en premier paramètre
une plage de données et en second paramètre une valeur comprise entre 0 et 1. Soit para2 le second paramètre. La
fonction renvoie la valeur V telle qu'une part para2 des valeurs de la plage de données sont inférieures à V, le reste
étant supérieur.
La fonction GRANDE.VALEUR prend deux paramètres : une plage de données et un entier K, elle renvoie
la Kème plus grande valeur de la plage de donnée. De la même manière, il existe une fonction PETITE.VALEUR pour
renvoyer la Kème plus petite valeur.
Information sur les distributions classiques
Excel donne accès à une série de distributions classiques. Pour chacune de ces distributions, le logiciel
Manipulations statistiques 5
1 / 10 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !