C3 : Manipulations statistiques 1- Génération de valeurs aléatoires 2

Téléchargement

C3 : Manipulations statistiques

Dorat Rémi

1- Génération de valeurs aléatoires

2- Statistiques descriptives

3- Tests statistiques

4- Régression linéaire

p 2

p 3

p 8

Manipulations statistiques 1

1- Génération de valeurs aléatoires

Fonction de génération de base et construction de générateurs

La fonction ALEA() renvoie un nombre aléatoire tiré uniformément dans [0;1]. A partir de cette fonction

simple, il est possible de construire différents générateurs aléatoires. Soit par exemple une cellule nommée a qui

contient une valeur numérique positive, une cellule nommée b qui contient une valeur numérique positive telle que b>a.

●Dans ce cas, la fonction a*ALEA() renvoie un nombre dans [0;a]

●En continuant, on a (b-a)*ALEA() qui renvoie un nombre dans [0;b-a]

●Enfin, la fonction (b-a)*ALEA()+a renvoie un nombre dans [a;b]

Génération de nombres entiers

En première approche, pour tirer des valeurs entières, on utilise le générateur de valeurs réelles. Par

exemple, pour tirer un nombre entier dans [N;M], on commence par nommer une cellule N qui contient la valeur de la

borne inférieure, une cellule M qui contient la valeur de la borne supérieure. Comme fonction de tirage aléatoire d'un

nombre entier, on peut proposer : ARRONDI((M-N)*ALEA()+N) qui tire une valeur aléatoire dans [N;M] et arrondit

ensuite cette valeur à l'entier le plus proche.

Une telle fonction est cependant biaisée, étudions l'évolution de ARRONDI((M-N)*ALEA()+N) en fonction

de la valeur de (M-N)*ALEA()+N :

La valeur de (M-N)*ALEA()+N est dans : Valeur de ARRONDI((M-N)*ALEA()+N)

[N;N+0.5[ N

[N+0.5;N+1.5[ N+1

[N+1.5;N+2.5[ N+2

... ...

[M-1.5;M-0.5[ M-1

[M-0.5;M] M

On remarque que la taille de l'intervalle qui permet d'obtenir N est 0.5, de même que la taille de l'intervalle qui permet

d'obtenir M. En revanche, la taille de l'intervalle permettant d'obtenir K entier dans ]N;M[ est 1. Donc, le générateur

aléatoire ARRONDI((M-N)*ALEA()+N) ne produit pas une distribution uniforme sur les entiers. Pour produire une

distribution uniforme, on part d'un tirage dans l'ensemble [N-0,5;M+0,5] : les arrondis des valeurs tirées dans cet

Manipulations statistiques 2

ensemble sont des entiers dans [N;M]. Le générateur :

ARRONDI((M-N+1)*ALEA()+N-0.5) permet de faire le tirage uniforme d'entiers dans [N;M].

Les générateurs d'Excel

Les générateurs construits proposés dans les paragraphes précédents recoupent des outils d'Excel. En

effet, non seulement on dispose du générateur de base ALEA(), mais également d'une fonction aléatoire qui permet de

tirer des nombres entier dans un intervalle : ALEA.ENTRE.BORNES(2;5) renvoi des entiers tirés au hasard

uniformément dans [2;5].

Construction d'un générateur de valeurs Gaussiennes-La méthode de Box-Mueller

Une méthode permet de générer des valeurs aléatoires gaussiennes à partir d'un générateur uniforme. Il

s'agit de la méthode de Box Mueller. Celle-ci consiste à tirer des valeurs uniformes. Pour un couple

x , y 

valeurs réelles tirées uniformément dans

[−1;1]

, en posant

s=x2y2

, et si

s1

, alors les valeurs :

v0=x∗



−2∗ln s

v1=y∗



−2∗ln s

sont à la base d'une distribution gaussienne centrée réduite. Par suite, il est possible de générer des tirages aléatoires

pour n'importe quelle gaussienne : cf a*N(0,1)+b.

Disposer d'un générateur de valeurs aléatoires s'avère nécessaire pour la simulation de processus, les

simulations Monte-Carlo etc.

2- Statistiques descriptives

Les moments

Excel propose une série de fonctions qui permettent d'obtenir les moments de base d'une distribution. On

passe une plage de valeurs en paramètres : =MOYENNE(A2:A14) (ou plusieurs plages =MOYENNE(A2:A14;B2;8)). De

la même manière, on peut utiliser les fonctions :

●ECARTYPE

●VAR pour la variance

●KURTOSIS

D'autres caractérisations classique des distributions :

Manipulations statistiques 3

●MEDIANE

●MODE : renvoie la valeur la plus fréquence d'une plage de données.

●COEFFICIENT.ASYMETRIE

●MOYENNE.HARMONIQUE

Covariance et coefficient de corrélation

D'autres coefficients d'évaluation statistique :

●COVARIANCE : calcul le coefficient de COVARIANCE entre deux séries selon la formule classique :

cov X , Y =∑

i=1

xi−

X∗ yi−

Y

●COEFFICIENT.CORRELATION : calcule le coefficient de corrélation entre deux séries.

CoeffCorr X ,Y =Cov X , Y 

 X Y

Calcul de distributions à partir de données disponibles

Pour obtenir une distribution, il existe plusieurs solutions. On en présente deux en parallèle : l'utilisation de

la fonction NB.SI qui a été vu dans le cours précédent et l'utilisation de la fonction FREQUENCE : ces deux fonctions

produisent un résultat équivalent.

Pour la fonction de fréquence, on donne comme premier paramètre la plage des valeurs dont on veut

obtenir la distribution et comme second paramètre une plage de valeurs qui détermine la distribution. Par exemple, on

suppose avoir la liste des valeurs dont on veut obtenir la distribution dans la plage A1:A300 et la série des valeurs qui

déterminent les intervalles dans B1:B11. Dans ce cas, on rentre la formule matricielle =FREQUENCE(A1:A300;B1:B11),

on a introduite une telle formule dans la colonne C. Si par exemple on a mis une série de valeurs aléatoires tirées entre

8 et 9 dans la colonne A (=(9-8)*ALEA()+8), alors :

Manipulations statistiques 4

On constate qu'en C2, on a l'ensemble des valeurs entre B2 et B1, qu'en C3, on a l'ensemble des valeurs entre B3 et B2

etc. Pour l'autre manière de faire la distribution : on introduit =NB.SI($A$1:$A$300;"<"&B1) dans E1, =NB.SI($A$1:$A

$300;"<"&B2) dans E2 etc. Ensuite, dans F2, on met E2-E1, dans F3, on met E3-E2 etc. On obtient donc la même

distribution dans la colonne C et dans la colonne F.

D'autres fonctions statistiques

La fonction QUARTILE. Cette fonction prend deux arguments : une plage de données et une option. Le

paramètre d'option peut prendre les valeurs 0, 1, 2, 3 ou 4. Pour 0, la fonction renvoie la valeur minimale. Pour 1, la

fonction renvoie la valeur telle que le quart des valeurs sont plus petites, le reste des valeurs étant plus grandes. Pour 2,

la fonction renvoie la médiane. Pour 3, la fonction renvoie la valeur telle que un quart des valeurs lui sont supérieures.

Pour 4, la valeur renvoie la valeur maximale de la distribution.

La fonction CENTILE fonctionne de la même manière que QUARTILE, elle prend en premier paramètre

une plage de données et en second paramètre une valeur comprise entre 0 et 1. Soit para2 le second paramètre. La

fonction renvoie la valeur V telle qu'une part para2 des valeurs de la plage de données sont inférieures à V, le reste

étant supérieur.

La fonction GRANDE.VALEUR prend deux paramètres : une plage de données et un entier K, elle renvoie

la Kème plus grande valeur de la plage de donnée. De la même manière, il existe une fonction PETITE.VALEUR pour

renvoyer la Kème plus petite valeur.

Information sur les distributions classiques

Excel donne accès à une série de distributions classiques. Pour chacune de ces distributions, le logiciel

Manipulations statistiques 5

1 / 10 100%

Documents connexes

Fréquences-Probabilités

Module 13 : Des fréquences vers une probabilité Seconde

Introduction au Modèle Linéaire

Fonction homographique et comportement d`oiseaux

TD Statistique & Reconnaissance de Formes - MATLAB

Text mining

l`actuariel n° 15

GCI 102: Méthodes Probabilistes en Génie Civil - Plan de Cours

Offre de stage

Nom : Date : / / Associer par une flèche le verbe avec sa définition

La lecture de la procédure VOSPEC

Le 14/02/97 CONTROLE N° 1èreL

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d''utilisation

C3 : Manipulations statistiques 1- Génération de valeurs aléatoires 2

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

C3 : Manipulations statistiques 1- Génération de valeurs aléatoires 2

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib