MSV31 - Statistique
Cyril Dalmasso
cyril.dalmasso@genopole.cnrs.fr
Université d’Evry Val d’Essonne
2015-2016
Cyril Dalmasso (UEVE) L2 SDV - MSV31 1/175
Organisation
Cours - 16,5 heures
Cyril DALMASSO (cyril.dalmasso@genopole.cnrs.fr)
TD - 16,5 heures
Alia DEHMAN (alia.dehman@genopole.cnrs.fr)
Cyril DALMASSO (cyril.dalmasso@genopole.cnrs.fr)
Evaluation
Note finale = 1/3 DS (vendredi 6 novembre 2015) + 2/3 Partiel
Rappel
La présence en TD est OBLIGATOIRE
Justificatifs d’absences à fournir à la scolarité
Cyril Dalmasso (UEVE) L2 SDV - MSV31 2/175
1Introduction
2Rappels de statistique descriptive
3Rappels de probabilités
4Estimation
5Tests d’hypothèses
Cyril Dalmasso (UEVE) L2 SDV - MSV31 3/175
Introduction
1Introduction
2Rappels de statistique descriptive
3Rappels de probabilités
4Estimation
5Tests d’hypothèses
Cyril Dalmasso (UEVE) L2 SDV - MSV31 4/175
Introduction
Exemple introductif
On s’intéresse à l’eet d’une dose faible de cambendazole sur les infections
des souris par la Trichinella Spiralis...
Cyril Dalmasso (UEVE) L2 SDV - MSV31 5/175
Introduction
Exemple introductif
On s’intéresse à l’eet d’une dose faible de cambendazole sur les infections
des souris par la Trichinella Spiralis. 16 souris ont été infectées par un
même nombre de larves de Trichinella et ensuite réparties au hasard entre
deux groupes. Le premier groupe de 8 souris a reçu du cambendazole, à
raison de 10 mg par kilo, 60 heures après l’infection. Les 8 autres souris
n’ont pas reçu de traitement. Au bout d’une semaine, toutes les souris ont
été sacrifiées et les nombres suivants de vers adultes ont été retrouvés dans
les intestins :
Souris non traitées 51 55 62 45 68 71 46 79
Souris traitées 45 53 52 51 57 51 68 88
Que peut-on dire au sujet d’une éventuelle ecacité du cambendazole,
dosé à 10mg / kg pour le traitement des infections des souris par la
Trichinella Spiralis ?
Cyril Dalmasso (UEVE) L2 SDV - MSV31 6/175
Introduction
Statistique et biologie
La statistique permet de répondre à de nombreuses questions biologiques.
Exemples
Quelle sont les valeurs normales de grandeurs biologiques (taille,
poids, glycémie, ...) ?
Les niveaux d’expression de deux gènes sont-ils diérents ?
Un nouveau traitement est-il plus ecace que le traitement de
référence ?
Peut-on définir de nouvelles typologies de tumeurs ?
Un test de dépistage est-il fiable ?
Les modifications de poids d’un individu sont-elles liées aux
modifications de cholestérolémie ?
Cyril Dalmasso (UEVE) L2 SDV - MSV31 7/175
Introduction
Statistique
Statistique : étude de la variabilité
Définitions
Le terme statistique est utilisé pour désigner trois notions distinctes :
1Recueil de données
2Méthodes utilisées pour analyser ces données
3Toute grandeur calculée à partir d’observations
Cyril Dalmasso (UEVE) L2 SDV - MSV31 8/175
Introduction
Statistique
Définitions
On appelle statistique descriptive l’ensemble des méthodes et
techniques mathématiques permettant de représenter, de décrire et de
résumer un ensemble de données.
On appelle statistique inférentielle (ou inductive) l’ensemble des
méthodes visant à modéliser un ensemble de données afin de tirer des
conclusions sur un ensemble plus vaste.
Remarque
La statistique repose sur des modèles et des hypothèses issus des
probabilités.
Cyril Dalmasso (UEVE) L2 SDV - MSV31 9/175
Introduction
Démarche statistique
Cyril Dalmasso (UEVE) L2 SDV - MSV31 10 / 175
Introduction
Statistiques et probabilités
Statistiques et probabilités sont deux aspects complémentaires de l’étude
des phénomènes aléatoires
Cyril Dalmasso (UEVE) L2 SDV - MSV31 11 / 175
Introduction
Objectifs du cours
Donner les bases nécessaires pour :
Comprendre les méthodes utilisées
Savoir interpréter des résultats
Réaliser des analyses statistiques élémentaires
Cyril Dalmasso (UEVE) L2 SDV - MSV31 12 / 175
Rappels de statistique descriptive
1Introduction
2Rappels de statistique descriptive
3Rappels de probabilités
4Estimation
5Tests d’hypothèses
Cyril Dalmasso (UEVE) L2 SDV - MSV31 13 / 175
Rappels de statistique descriptive
Statistique descriptive
Objectif
Organiser et résumer les données afin d’en dégager les caractéristiques
principales sous une forme simple et intelligible
Remarque
La statistique descriptive permet notamment d’identifier des valeurs
extrêmes ou aberrantes et de vérifier certaines hypothèses de modélisation
Types de représentation
Tableaux
Graphiques
Indicateurs numériques
Cyril Dalmasso (UEVE) L2 SDV - MSV31 14 / 175
Rappels de statistique descriptive
Vocabulaire
Population : ensemble (grand, voire infini) d’individus ou d’objets de
même nature
Echantillon : sous ensemble de la population
Caractère / Variable : une caractéristique de la population pouvant
prendre diérentes valeurs
Modalité : toute valeur que peut prendre une variable
Série statistique : ensemble des données recueillie pour un caractère
donné à partir d’un échantillon
Cyril Dalmasso (UEVE) L2 SDV - MSV31 15 / 175
Rappels de statistique descriptive
Types de variables
Variable quantitative : variable/caractère à laquelle on peut associer
un nombre
discrète : ne peut prendre qu’un nombre fini ou dénombrable de valeurs
continue : peut prendre toutes les valeurs d’un intervalle de l’ensemble
des nombres réels
Variable qualitative : variable/caractère dont les modalités ne sont
pas quantifiables
ordinale : variable dont les modalités peuvent être ordonnées
nominale : variable dont les modalités ne peuvent pas être ordonnées
Cyril Dalmasso (UEVE) L2 SDV - MSV31 16 / 175
Rappels de statistique descriptive
Exemple 1
Qualité de l’air
Dans le cadre d’une étude portant sur la qualité de l’air à New York en
1973, les données suivantes ont été recueillies :
Ozone Ensoleillement Vent Température Mois
6 78 18.4 57 5
11 44 9.7 62 5
11 320 16.6 73 5
11 290 9.2 66 6
37 284 20.7 72 6
39 323 11.5 87 6
50 275 7.4 86 7
85 175 7.4 89 7
7 48 14.3 80 7
168 238 3.4 81 8
23 115 7.4 76 8
24 259 9.7 73 8
32 92 15.5 84 9
20 252 10.9 80 9
23 220 10.3 78 9
Cyril Dalmasso (UEVE) L2 SDV - MSV31 17 / 175
Rappels de statistique descriptive Tabl e aux
Tableaux
Tableau individu-caractère
Dans le cadre d’une étude portant sur la contamination du lait par des
spores de clostridia, on analyse 10 tubes de 1ml de lait et, pour chaque
tube, on compte le nombre de spores présents :
Indice tube Nombre de spores
1 0
2 1
3 0
4 3
5 2
6 0
7 0
8 1
9 2
10 1
Cyril Dalmasso (UEVE) L2 SDV - MSV31 18 / 175
Rappels de statistique descriptive Tabl e aux
Tableaux
Définitions
Soit Xun caractère qualitatif ou quantitatif discret pouvant prendre k
modalités (x1,...,xk) observé sur un échantillon de taille n.
L’eectif nid’une modalité xiest le nombre d’individus pour lesquels
la modalité xia été observée
La fréquence fid’une modalité xiest le nombre fitel que :
fi=ni
n
Remarque
Pour un caractère quantitatif continu, la notion de fréquences suppose une
répartition des observations en kclasses (chaque classe étant définie par
un intervalle)
Cyril Dalmasso (UEVE) L2 SDV - MSV31 19 / 175
Rappels de statistique descriptive Tabl e aux
Tableaux
Définitions
Soit Xun caractère qualitatif ordinal ou quantitatif discret pouvant
prendre kmodalités (x1<...<xk) observé sur un échantillon de taille n.
L’eectif cumulé Nid’une modalité xiest le nombre d’individus
pour lesquels une modalité inférieure ou égale à xia été observée
Ni=
i
ÿ
j=1
nj=n1+n2+... +ni
La fréquence cumulée Fid’une modalité xiest le nombre Fitel que :
Fi=Ni
n=
i
ÿ
j=1
fj=f1+f2+... +fi
Cyril Dalmasso (UEVE) L2 SDV - MSV31 20 / 175
1 / 22 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !