Université de Franche-comté Année Universitaire … / … Licence de psychologie 1e Année STATISTIQUES DESCRIPTIVES MYUA 7234 - Travaux dirigés TD1 MESURES DE TENDANCE CENTRALE ET DE DISPERSION Exercice 1 Lors d’un sondage, on a proposé à 92 collégiens sélectionnés au hasard un questionnaire. La distribution des réponses pour la question "Vous ennuyez-vous lorsque vous êtes en classe?" est indiquée ci-dessous. 1) Quel est le mode de la distribution? 2) Est-ce que le pourcentage d'élèves s'ennuyant souvent ou plus est supérieur à 50%? effectifs jamais 25 parfois 40 souvent 20 très souvent 0 toujours 7 total 92 Exercice 2 1) Quel est le mode de la série statistique x = {10, 2, 4, 2, 2, 7, 10, 10, 2, 10, 9} correspondant aux nombres de mots rappelés après un jour par des jeunes adultes, après avoir entendu une liste de 50 mots (liste lue en une minute)? Combien de sujets ont été interrogés? Quelle est l'étendue de la distribution? Quel est le pourcentage de sujets ayant mémorisé 10 mots ou plus ? 2) Idem pour la série y = {13, 2, 9, 2, 4, 10, 13, 13, 7, 15, 12} correspondant au rappel des mêmes mots par les mêmes sujets, lorsque l'expérimentateur fourni des indices de récupération au cours d'un second essai. 3) a) Calculer la somme ! x de mots mémorisés, puis ! y . b) Calculez les moyennes x et y en utilisant la formule des données groupées. c) Calculez une moyenne du nombre de mots mémorisés pour les deux essais pour chaque sujet ( mi = xi + yi ), puis calculez la moyenne m de cette nouvelle 2 variable. d) Calculez une variable z , correspondant à la différence de mots mémorisés entre les deux essais ( zi = yi ! xi ), puis calculez z . Est-il possible de calculer m et z , directement à partir des moyennes x et y ? Exercice 3 Pour la distribution suivante des notes de 40 élèves en français, 1) Quelle est la médiane? 2) Quels sont les quartiles Q1, Q2 et Q3? 3) Quelle est la distance inter-quartile? x 0 1 2 3 4 5 6 7 n 4 0 4 2 0 4 4 0 Légende : x, notes; n, effectifs par note. 8 2 9 2 10 11 12 13 14 15 16 17 18 19 20 2 0 2 2 2 2 0 0 2 4 2 Exercice 4 On recueille les résultats d’une expérimentation. Il y a 142 sujets. Les scores peuvent aller de 0 à 40 points. Ils sont consignés en classes dans un tableau. 10 sujets ont eu un score inférieur ou égal à 5 points ; 20 ont eu un score compris entre 5 (exclu) et 10 (inclus), etc. Scores 0<x≤5 5 < x ≤ 10 10 < x ≤ 15 15 < x ≤ 20 20 < x ≤ 25 25 < x ≤ 30 30 < x n 10 20 30 35 22 18 7 nc 10 … … … … … 142 N = 142 Légende : x, scores; n, effectifs; nc, effectifs cumulés 2 Après avoir complété la colonne d'effectifs cumulés, donnez une valeur approximative de la médiane, en donnant l'intervalle dans laquelle elle se situe. * 2) Calculez la médiane de manière plus précise, par interpolation linéaire . 3) Calculez la moyenne arithmétique du tableau, en utilisant les valeurs centrales des intervalles*. 1) * Les calculs sont différents si on considère les scores x comme variant sur une échelle continue ou si on les considère comme entiers. Exercice 5 Trois groupes de sujets ont participé à une épreuve de mémoire (type rappel immédiat). Pour le Groupe 1, composé de 20 sujets, la moyenne de chiffres correctement rappelés est de 4.10. Pour le Groupe 2 (n2 = 38), le score moyen de rappel est de 4.75. Le Groupe 3 (composé de 26 sujets) a un score moyen de 6.12 chiffres. Quelle est la moyenne de l’échantillon composé des trois groupes ? Exercice 6 Soit les scores: 1,2,2,5,7,10,12 Calculer l'étendue, la variance et l’écart-type de cette distribution. Démontrez l'équivalence entre la formule classique et la formule rapide. S= ! # & %$ " x (' "x 2 ! n (x " x )2 ou n "1 n !1 2 TD2 RECUEIL DE DONNEES, ECHELLES DE MESURE, DISTRIBUTIONS ET REPRESENTATIONS GRAPHIQUES EXERCICE 1 100 enfants ont été étudiés sous l'angle de leur âge chronologique et de leur résultat à un test de vocabulaire noté entre 0 et 100. Préparez le tableau de recueil de données pour les 10 premiers sujets et remplissez ce tableau de données factices. Combien y a-t-il d'unités statistiques, de variables, d'observations dans ce tableau de 10 sujets ? EXERCICE 2 Lors d'une enquête, on a interrogé 200 étudiants de première année de psychologie. Dans une partie de l'enquête, on leur a demandé, entre autres, d'indiquer leur âge, leur sexe, la profession qu'ils souhaitaient exercer après leurs études, et de donner une note de satisfaction vis-à-vis de leur cursus de 0 (pas du tout satisfait) à 20 (tout à fait satisfait). 1. Préparez le tableau de recueil de données pour les 5 premiers sujets. Combien y a-t-il d'unités statistiques, de variables, d'observations pour les 5 sujets ? 2. Pour chaque variable, indiquez son échelle de mesure (en justifiant) et le nombre de modalités possibles. EXERCICE 3 Le tableau suivant est extrait des données concernant un échantillon de patients souffrant de la maladie d'Alzheimer. On a sélectionné les quinze premières lignes et les deux premières colonnes du tableau initial. La première colonne enregistre le sexe des patients, la deuxième enregistre le score obtenu à un test évaluant la démence. Ce test, nommé MMSE (Mini Mental State Examination) de Folstein, est composé de 30 items valant chacun 1 point. 3 1. Quelles sont les échelles de mesure de ces deux variables ? 2. Dans la colonne 3, vous transformerez les scores de MMSE en classement (par ordre croissant des scores). Donnez un nom à cette nouvelle variable. Quelle est son échelle de mesure ? 3. Une présence de démence étant concordante avec un score de 23 ou moins, quel est la fréquence de démence observée dans cet échantillon? 4. Etablissez un histogramme des effectifs en mixant les hommes et les femmes, en regroupant les scores par intervalles de 5 (premier intervalle : 0 < x ≤ 5). Identificateur 1 2 3 4 5 6 7 8 Sexe H F F F H H F F Score MMSE 5 8 12 19 14 14 28 25 Identificateur 9 10 11 12 13 14 15 Sexe F F F H H F F Score MMSE 15 14 16 6 25 6 24 EXERCICE 4 Vous trouverez ci-dessous un tableau de tri à plat concernant la taille des ménages au moment du recensement de 1999 (INSEE). Nombre de personnes composant le ménage 1 2 3 4 5 6 et + n (en milliers) 7381 7404 3857 3285 1310 573 1. Indiquez combien de lignes comporte le tableau de données originel. 2. Complétez le tableau de tri à plat en indiquant les effectifs cumulés, les fréquences et les fréquences cumulées (ou les pourcentages et pourcentages cumulés). 3. Quel est le pourcentage de ménages comportant au moins trois personnes ? 4. Quelle est l'échelle de mesure correspondant au nombre de personnes composant le ménage? Permetelle de calculer le nombre moyen de personnes composant le ménage? 5. En utilisant le mode, la médiane et une moyenne, commentez l'ensemble de ce tableau. EXERCICE 5 184 étudiants devaient décrire leur personnalité. Plusieurs traits de personnalité leur étaient proposés et, pour chacun d'eux, ils devaient se positionner sur une échelle allant de 0 (je ne suis pas du tout comme ça) à 9 (je suis tout à fait comme ça). L'une de ces échelles concernait le trait « audacieux », une autre le trait « ambitieux ». Les résultats sont reportés ci-dessous sous forme d'un double tri à plat. Réponse : 0 Effectifs pour « audacieux » 0 Effectifs pour « ambitieux » 3 1 6 3 2 12 3 3 22 10 4 30 18 5 48 36 6 26 31 7 22 34 8 13 23 9 5 23 n1 = 184 n2 = 184 Choisir une représentation graphique appropriée afin de représenter simultanément les deux distributions d'effectifs. 4 TD3 CORRELATION BRAVAIS-PEARSON Rappel La corrélation entre deux variables x et y se mesure par le coefficient r de corrélation de Bravais-Pearson: r = covariance de x y divisée par les écart-types de x et de y r= cov (x, y) = (Sx ) (Sy ) " (x ! x )(y ! y ) N !1 = " (x ! x )2 " (y ! y )2 N !1 N !1 "x " xy ! (" x) ! 2 2 N " x" y N "y 2 ! (" y)2 N - Ne pas confondre ∑xy et ∑x∑y - Ne pas confondre ∑x² et (∑x)² - Vérifier que r est compris entre –1 et +1. EXERCICE 1 Après avoir tracé le diagramme de corrélation entre x et y, 1) calculez la corrélation entre x et y, puis celle entre x' et y', avec x' = x + 10 et y' = 10y. 2) Quelle est la paire de scores allant le plus à l'encontre d'une corrélation élevée ? x 1 2 3 4 5 6 2 8 9 5 6 7 7 y 3 4 3 4 5 6 3 1 6 6 7 8 9 EXERCICE 2 On propose 2 tests de mémorisation à des étudiants. Pour le premier, on présente une série de 30 nombres qu'ils doivent apprendre en un temps limité. On leur demande de rappeler le maximum de nombres une minute après. Pour le second, on leur présente une série de 30 syllabes qu'ils devront également apprendre et restituer. Pour chacun de ces tests, on recueille dans un tableau le nombre d'éléments rappelés après la minute de pause. Chaque sujet est caractérisé par deux scores: un score x au test des nombres et un score y au test de syllabes. Les résultats portant sur 50 sujets sont reportés dans le tableau ci-dessous. 5 s 1 2 3 4 5 6 7 8 9 10 11 12 13 x 5 4 4 5 4 5 6 7 6 7 3 4 7 y 7 5 6 9 8 7 9 9 7 7 3 6 9 s 14 15 16 17 18 19 20 21 22 23 24 25 26 x 6 7 9 4 9 5 6 8 6 5 7 4 7 y 6 7 10 4 10 6 8 9 7 6 8 6 7 s 27 28 29 30 31 32 33 34 35 36 37 38 39 x 3 3 6 7 4 5 10 4 6 4 4 4 5 y 4 3 6 7 4 6 13 4 8 4 5 4 6 s 40 41 42 43 44 45 46 47 48 49 50 x 5 7 6 8 7 3 7 4 4 3 7 y 5 7 6 8 7 3 9 5 6 4 9 1. Indiquer l'étendue théorique et l'étendue observée du nombre de syllabes restituées. 2. Dans un tableau, établir la distribution marginale/partielle/univariée des scores de syllabes et de nombres restitués. 3. Tracer un diagramme bivarié à bulles des scores restitués. 4. En supposant que sx = 1.73 et que sy = 2.10, calculez la corrélation existant entre x et y. EXE R CI CE 3 Dans le graphique ci-dessous, indiquer dans quel quadrants se situeraient les observations qui iraient le plus dans le sens d'une d'une corrélation négative. Valeurs des y Moyenne des y Moyenne des x Valeurs des x EXERCICE 4 145 sujets ont rempli le questionnaire de personnalité d'Eysenck comprenant, entre autres, une échelle de sociabilité (avec des items tels que "Aimez-vous beaucoup sortir ?" ou "Aimez-vous parler à autrui au point d'adresser la parole à n'importe quelle personne inconnue ?") et une échelle d'impulsivité (avec des items tels que "Agissez-vous et parlez-vous rapidement sans réfléchir ?" ou "Aimez-vous les situations dans lesquelles il faut agir vite ?"). On fait l'hypothèse que ces deux traits de personnalité sont positivement liés, ce qui permettrait d'additionner les scores obtenus aux deux échelles pour former une échelle unique d'extraversion. On appelle x la variable "note de sociabilité" et y la variable "note d'impulsivité" et on a les résultats numériques suivants : 6 ∑x = 1012; ∑x2 = 8018; ∑y = 541 ; ∑y² = 2509 ; ∑xy = 3932 Le nuage de points est rassemblé uniformément dans l'ensemble indiqué ci-dessous: Impulsivité Sociabilité 1. Commenter le graphe 2. Calculer r 3. Commenter les résultats par rapport à l'hypothèse et à la pertinence de l'établissement d'un score d'extraversion EXE R CI CE 5 1. Si deux variables varient dans le même sens, comment qualifier leur relation? 2. Soit un r de Bravais–Pearson entre deux variables égal à –.85. Que représente le signe "–", que représente la valeur ".85"? 3. On a trouvé une corrélation de +.30 entre les notes obtenues par cinquante étudiants à une épreuve de maths et celles obtenues en gymnastique. On a trouvé une corrélation de -.45 entre les performances de gymnastique et celles de chant. Les performances de gymnastique sont-elles plus liées à celles de maths ou à celles de chant ? Justifiez. 4. On s'intéresse à la relation entre les notes obtenues à une épreuve de statistiques (notée sur 20) et celles obtenues en biologie (notée sur 40). Est-il nécessaire de diviser par 2 les notes de biologie pour calculer la corrélation (ou de multiplier par 2 celles de statistiques) ? 7 TD4 REGRESSION LINEAIRE EXERCICE 1 Lors d'un examen professionnel, 15 candidats réalisent une prestation orale devant un jury constitué de 2 membres (M1 et M2). La procédure choisie est celle de la notation séparée de chaque candidat par chaque membre du jury (notes de 0 à 6, à partir d'une grille de notation élaborée en commun). Voici les notes attribuées aux candidats par les 2 membres du jury: Candidat 1 M1 2 M2 3 2 4 2 3 5 3 4 1 0 5 4 4 6 1 2 7 1 1 8 4 5 9 1 1 10 3 3 11 5 5 12 1 1 13 5 5 14 0 1 15 0 2 1. Effectuer une distribution graphique des couples de notes attribuées aux 15 candidats. 2. Décrire par un simple examen visuel de la distribution la relation entre les notes attribuées par M1 et celles attribuées par M2. 3. Déterminer et tracer les 2 lignes de régression. 4. Calculer le coefficient de corrélation entre les notes données par M1 et celles données par M2. EXERCICE 2 A partir de la distribution indiquée dans le tableau ci-dessous: y 2 1 0 -1 -2 10 1 2 11 1 3 1 3 1 x 12 13 5 6 2 5 2 4 14 1 1 1. Construire l'histogramme de la distribution marginale de la variable x. 2. Construire l'histogramme de la distribution des y conditionnellement à la valeur x = 11. 3. Calculer la moyenne des y pour la distribution partielle obtenue lorsque x = 11. 4. Calculez la ligne de régression des y en x (y = ax+b). 8 TD5 (optionnel) CORRELATIONS SUR DONNES ORDINALES EXERCICE 1 Pierre, Paul et Jacques doivent classer 9 visages (notés de a à i) par ordre de préférence esthétique. Pierre et Paul se sont concertés avant d'ordonner les visages, afin de discuter des critères à utiliser pour l'appréciation des visages. Jacques ne s'est pas joint à la réunion de concertation de Pierre et Paul. Mettre en évidence l'effet de cette discussion préalable sur les ordres de préférence indiqués ci-après: Rang Pierre Paul Jacques 1 b i i 2 i a e 3 c b h 4 a f b 5 f e d 6 e c a 7 d h c 8 h d f 9 g g g EXERCICE 2 Calculer le coefficient de corrélation de Spearman pour les 6 situations suivantes, montrant le rang de réussite à deux problèmes. Sujet 1 2 3 Pbl 1 1 2 3 Pbl 2 1 2 3 Sujet 1 2 3 Pbl 1 1 2 3 Pbl 2 1 3 2 Sujet 1 2 3 Pbl 1 1 2 3 Pbl 2 2 1 3 Sujet 1 2 3 Pbl 1 1 2 3 Pbl 2 2 3 1 Sujet 1 2 3 Pbl 1 1 2 3 Pbl 2 3 1 2 Sujet 1 2 3 Pbl 1 1 2 3 Pbl 2 3 2 1 EXERCICE 3 Un chercheur souhaite classer les 15 éléments figurant sur son échelle de difficulté langagière sur la base de l'ordre d'apparition des aptitudes linguistiques au cours du développement. N'étant pas tout à fait certain d'avoir choisi l'ordre le plus correct, il demande à un collègue de classer les éléments de 1 à 15 selon l'ordre qu'il estime adéquat. Les données figurent cidessous: Element Chercheur 1 Chercheur 2 a 1 1 b 2 3 c 3 2 d 4 4 e 5 7 f 6 5 g 7 6 h 8 8 i 9 10 j 10 9 k 11 11 l 12 12 m 13 15 n 14 13 o 15 14 Calculez le tau ( ! ) de Kendall. 9 TD6 I. COMBINATOIRE ET PROBABILITE 1. Un comité de 3 membres doit être formé, comprenant un représentant de chacune des catégories direction, personnel et consommateur. Il y a 2 représentants parmi la direction, 3 parmi le personnel et 4 chez les consommateurs. Quel est le nombre de comités possibles ? 2. Il faut asseoir 5 hommes et 4 femmes en ligne, de manière à ce que chaque femme soit assise entre 2 hommes. Combien y a-t-il de manières de faire asseoir ces 9 personnes? 3. Combien de nombres (n'incluant pas ceux commençant par 0) de 4 chiffres peut-on former avec les dix chiffres de 0 à 9 si : a. les répétitions sont autorisées. b. les répétitions sont interdites. c. les répétitions sont interdites et le dernier chiffre doit être égal à 0. 4. On doit ranger sur une étagère 4 ouvrages de maths, 6 de physique et 2 de chimie. a. Combien y a-t-il de rangements différents si les ouvrages sont rangés par spécialité ? b. Combien y a-t-il de rangements différents si seuls les ouvrages de maths doivent être rangés ensemble ? 5. Une usine fabrique des pièces métalliques en utilisant trois machines M1, M2 et M3 qui produisent respectivement 1%, 3% et 6% de pièces défectueuses. Par ailleurs, 60% de la production est assurée par la machine M1, 30% par la machine M2 et le reste par la machine M3. On prélève au hasard une pièce en sortie de fabrication. On désigne par : • m1, l'événement "la pièce a été fabriquée par la machine M1" (de même pour M2 et M3). • d, l'événement "la pièce est défectueuse". a. Donner les probabilités suivantes: P(m1), P(m2) et P(m3). b. Donner les probabilités conditionnelles suivantes: P(d/m1), P(d/m2) et P(d/m3). c. Déduire des questions précédentes la probabilité des événements suivants : d ∩ m1, d ∩ m2, d ∩ m3. d. En déduire une écriture de d sous forme disjointe. e. Calculer la probabilité de l'événement d. f. Sachant que la pièce prélevée est défectueuse, évaluer la probabilité qu'elle ait été fabriquée par la machine M3. g. Peut-on dire qu'au moins 99% des pièces sortent en bon état de la fabrication. h. Représenter les probabilités P(d/m1), P(m1), P(d ∩ m1), P(d/m2), P(m2), P(d ∩ 2), P(d/m3), P(m3), et P(d ∩ m3) par : - Un arbre de décision dont les feuilles représentent les probabilités conjointes. - Un tableau de contingence à 6 cases dont les colonnes représentent M1, M2 et M3 et les lignes la présence ou l'absence de défectuosité des pièces, en omettant la représentation des probabilités conditionnelles. 10 TD7 II. COMBINATOIRE ET PROBABILITE Ex1. On tire deux cartes d'un jeu de 52. Quelle est la probabilité de tirer deux as, a) si la première carte est replacée dans le paquet ? b) si la première carte n'est pas replacée dans le paquet ? Ex2. Quelle est la probabilité de tirer au moins un 4 au cours de deux jets de dé ? Ex3. Un récipient contient 6 boules rouges, 4 boules blanches et 5 boules bleues. a) Quelle est la probabilité de tirer une boule rouge ? b) Quelle est la probabilité de tirer une boule rouge ou blanche ? c) Quelle est la probabilité de tirer successivement une boule rouge, une boule blanche et une boule bleue si les boules sont replacées au fur et à mesure ? d) Quelle est la probabilité de tirer successivement une boule rouge, une boule blanche et une boule bleue si les boules ne sont pas replacées au fur et à mesure ? e) Quelle est la probabilité de tirer une boule rouge, une boule blanche et une boule bleue quelque soit l'ordre, si les boules sont replacées ? f) Quelle est la probabilité de tirer une boule rouge, une boule blanche et une boule bleue quelque soit l'ordre, si les boules ne sont pas replacées ? Ex4. Combien y a-t-il de façons de ranger 10 paires de chaussettes dans deux tiroirs (il y a un tiroir dans lequel on peut mettre 6 paires et un autre dans lequel on peut en mettre 4). Ex5. Combien de salades de fruits peut-on faire avec 5 fruits (on choisit des combinaisons de 1, 2, 3, 4 ou 5 fruits) ? Ex6. Combien peut-on former de mots de 7 lettres de 4 consonnes différentes et 3 voyelles différentes à partir d'un ensemble de 7 consonnes différentes et 5 voyelles différentes ? On négligera la nécessité que les mots aient un sens. Ex7. On tire 5 cartes parmi celles qui constituent un jeu de 52. Evaluer la probabilité (a) de tirer 4 as, (b) 4 as et un roi, (c) 3 cartes d'une couleur et 2 d'une autre couleur, (d) au moins un as. Ex8. 4896 personnes jouent au tiercé où il y a 18 chevaux au départ. Ils jouent tous une combinaison différente et misent 1 euro. Comment rémunérer ce tiercé si tout l'argent qui a été misé doit être redistribué, sachant que celui qui trouve le tiercé dans l'ordre sera rémunéré cinq fois plus que celui qui le touche dans le désordre ? 11 TD8 I. COMBINATOIRE, PROBABILITE ET LOI NORMALE Dans un zoo ; il y a 180 animaux placés dans 180 cages numérotées de 1 à 180. Les cages dont le numéro est un multiple de 3 sont occupées par un fauve, 20% de celles dont le numéro n’est pas un multiple de 3 sont occupées par un ours, les autres par un singe. Les cages des singes contiennent, pour moitié d’entre elles des chimpanzés, et pour l’autre moitié des gibbons. Les cages des fauves contiennent, pour 40% d’entre elles des lions, et pour les autres des tigres. Les cages à ours contiennent, pour 25% d’entre elles des ours bruns, et pour les autres des ours polaires. On extrait une cage au hasard du zoo. (1) Quelle est la probabilité qu’elle soit occupée par un fauve ? (2) Quelle est la probabilité qu’elle soit occupée par un ours brun? (3) Combien y a-t-il de façons de composer un groupe de 4 chimpanzés? On effectue une série de tirages avec remise dans l’ensemble des cages. (4) Dans un tirage de 3 cages, quelle est la probabilité de n’avoir aucun chimpanzé ? On effectue maintenant une série de tirages sans remise. (5) Quelle est la probabilité d’extraire successivement 3 cages dont les numéros vont en ordre croissant ? (6) Quelle est la probabilité d’extraire 3 cages occupées par des singes ? Les animaux sont soignés par 14 employés dont 2 portent des souliers vernis et 7 cadres dont 5 portent également des souliers vernis. (7) Quelle est la probabilité qu’un employé porte des souliers vernis? (8) Quelle est la probabilité qu’une personne choisie au hasard porte des souliers vernis? (9) On extrait une personne au hasard, elle porte des souliers vernis. Quelle est la probabilité que ce soit un employé ? Les ours polaires appartiennent à une population dont la taille est normalement distribuée. (moyenne = 1,95 m ; écart-type = 6 cm). (10) Quel pourcentage de la population est dépassé par un ours polaire qui mesure 1,87 m ? (11) Quelle est la taille d’un ours polaire dépassé par 35 % de la population ? (12) Les tigres appartiennent à une population dont le poids est normalement distribué (moyenne = 172 kg). Un tigre de 186 kg dépasse 92% de la population, quel pourcentage de la population est dépassée par un tigre de 169 kg ? (13) Par quel pourcentage de la population un tigre de 170 kg est-il dépassé ? 12 TD10 REVISION EXERCICE 1 On a demandé à des enfants de CE2 de choisir parmi 5 jeux celui qu'ils préféraient pratiquer pendant les loisirs (choix forcé). Les réponses sont les suivantes: Sujet 1 2 3 4 5 6 7 8 Choix 1 3 3 5 1 1 1 4 Légende: 1, jeux électroniques; 2, football; 3, jeux de cartes; 4, loup; 5, ping-pong. 9 2 10 2 1) Quelle est l'échelle de mesure utilisée ici? Justifier. 2) A partir du protocole du protocole de données, construisez la distribution des fréquences des choix dans un tableau. 3) Représenter graphiquement ces fréquences, par ordre croissant 4) Calculez le ou les indices de tendance centrale approprié(s) pour ces données. EXERCICE 2 Dans le cadre d'une évaluation du niveau des étudiants en français et en mathématiques à l'entrée de l'Université des Sciences du Langage, de l'Homme et de la Société, on a demandé à 14 étudiants de 1ère année de passer une épreuve dans chacune de ces matières. Leurs notes sur 20 sont les suivantes: Français Maths 12 10 14 12 8 1 3 9 11 10 17 10 2 4 10 10 14 7 12 11 13 2 18 2 9 3 7 1 1) Définissez l'échelle utilisée pour ces variables. Définissez l'étendue théorique et observée des deux variables. 2) Construisez les distributions univariées d'effectifs et de fréquence pour chacune des variables dans un tableau. 3) Construisez le diagramme de dispersion des couples de notes de maths en fonction des notes de français et concluez quand à la valeur possible de la corrélation, a priori. 4) Déterminez la ligne de régression des notes de maths en fonction des notes de français. 5) Calculez le coefficient de corrélation Bravais-Pearson pour ces données. EXERCICE 3 Le camping a été créé dans les années soixante-dix par un ancien groupe de soixante-huitards, sur un vaste terrain planté de pins, un peu au sud de Bandol. Les vacanciers peuvent s’adonner à diverses activités organisées en de nombreux ateliers (e.g., théâtre, informatique, jeux de cartes, développement personnel...). Au cours de l’été de 1997, le camping a accueilli 400 personnes. Les vacanciers situés près de la plage sont de CSP (catégorie socio-professionnelle) élevée. Parmi eux, on retrouve 20 professions libérales, 40 chefs d’entreprise, 60 enseignants et 8 chercheurs. Les vacanciers, dont l’emplacement est plus éloigné de la plage, appartiennent à des CSP moins élevées. Parmi eux, on retrouve 23 techniciens de surface, 54 ouvriers, 12 employés. Il y a 180 femmes et 220 hommes, tous âges confondus, dont 30% de femmes célibataires et 40% d’hommes célibataires. Parmi les femmes du campement, 60% ont les cheveux longs, 25% les cheveux mi-longs et les autres ont les cheveux courts. Parmi les hommes, 5% ont les cheveux longs, 60% ont les cheveux mi-longs et les autres ont les cheveux courts. On dispose d’un classeur dans lequel sont classées les fiches individuelles de chaque personne, décrivant l’identité des 400 vacanciers et leurs caractéristiques qui sont indépendantes les unes des autres. 1. 2. 3. 4. Quelle est la probabilité d’extraire la fiche d’un homme célibataire? On constitue une table de 4 femmes pour jouer au bridge. Quelle est la probabilité pour qu’au moins l’une d’entre elles soit célibataire? Trois chercheurs du camping doivent assister au colloque organisé à Bandol. Combien y a-t-il de façons de composer la délégation? Les femmes du camping mesurent en moyenne 165 cm (s = 10). Quelle est la proportion de femmes mesurant au moins 160 cm? 13