Les diamants
Prix et caractéristiques
Données parues dans le Singapore’s Business Times du 18 février 2000
Accessibles sur :
http://www.amstat.org/publications/jse/jse_data_archive.html
Ce document présente les premiers résultats de l’exploration d’un fichier de
données à l’aide des méthodes de statistique descriptive (uni- et bi-dimensionnelle)
et quelques explications sur les résultats couramment proposés par les logiciels de
traitement et d’analyse de données statistiques.
Des parties de ce fichier peuvent être utilisées pour illustrer des définitions de
termes couramment utilisés en statistique descriptive.
Exploration d’un fichier de données
Valérie Fontanieu - Ingénieur statisticien
Institut National de Recherche Pédagogique
1
Sommaire
1 - Les données : le prix et 4 variables caractérisant les diamants
2 - Le tableau des données
3 - Description d’une variable quantitative : les résumés numériques
4 - Représentation graphique synthétique : le boxplot
5 - Représentation de la distribution des valeurs : l’histogramme
6 - Représentation des fréquences cumulées : la fonction de répartition
7 - Description d’une variable qualitative : le tri à plat
8 - Représentations graphiques : les diagrammes en colonnes et secteurs
9 - Description simultanée de deux variables quantitatives : le nuage de points
10 - Description simultanée d’une variable quantitative et d’une variable qualitative
11 - Description simultanée de deux variables qualitatives : la table de contingence
Annexes
A - Les résumés numériques
B - Le boxplot
C - Le coefficient de corrélation linéaire et la régression linéaire
1 - Les données : le prix et 4 variables caractérisant les diamants
-Carats : le poids du diamant exprimé en carats (1 carat = 0,20g)
-Couleur : l’échelle de graduation de la couleur s’étend de la lettre D à la lettre Z, de la teinte la plus incolore vers une
teinte jaune et même parfois d’autres teintes (bleu, vert…) ; dans cet échantillon les diamants appartiennent aux 6
premières catégories :
D Blanc exceptionnel +
E Blanc exceptionnel
F Blanc rare +
G Blanc rare
H Blanc
I Blanc légèrement teinté +
-Clarté : indique la présence plus ou moins importante d’imperfections (11 catégories) ; dans l’échantillon les diamants
sont caractérisés par 5 catégories parmi les mieux classées, de la plus grande clarté vers la présence croissante
d’imperfections et d’inclusions :
IF Internally Flawless - absence d’inclusions mais minuscules imperfections de surface
VVS1 Very Very Small inclusions - minuscules inclusions et éventuellement minuscules imperfections de surface
VVS2 imperfections de surface légèrement plus présentes que VVS1
VS1 Very Small inclusions - petites inclusions et éventuellement petites imperfections de surface
VS2 imperfections de surface légèrement plus présentes que VS1
-Certification : 3 instituts de certification :
GIA Gemological Institute of America
HRD Hoge Raad voor Diamant
IGI International Gemological Institute
-Prix en dollars
Remarque : Ces variables n’apporte pas le même type d’information. Le poids en carats, la couleur et la clarté sont des
attributs des diamants. Ces caractéristiques intrinsèques sont évaluées par un institut de certification qui établit un
certificat, garantissant l’exactitude des informations. Le prix quant à lui est estimé par le vendeur et est vraisemblablement
établi en fonction des caractéristiques des diamants.
2 - Le tableau des données
308
diamants
La structure des données usuellement proposée dans les logiciels est celle d’un tableau croisant, les individus
(diamants) en ligne, et les variables (carats, couleur…) en colonne.
Les variables sont observées sur un échantillon de 308 diamants certifiés.
Les données ont été recueillies dans un encart publicitaire du Singapore’s Business Times.
Cet échantillon n’est représentatif que de lui-même.
3 - Description d’une variable quantitative : les résumés numériques
Résumés numériques :
- Au moins 25 % des données sont inférieures ou
égales au premier quartile, et au moins 75 % des
données sont supérieures ou égales au premier
quartile.
- Au moins 75 % des données sont inférieures ou
égales au troisième quartile, et au moins 25 %
des données sont supérieures ou égales au
troisième quartile.
- Au moins 50 % des données sont inférieures ou
égales à la médiane, et au moins 50% des
données sont supérieures ou égales à la médiane.
(voir en annexe la définition des indicateurs)
-0,356-1,252Aplatissement (Kurtosis)
0,6510,015Asymétrie (Skewness)
0,6780,439CV (écart-type/moyenne)
5902,0000,500Interquartile
7524,0000,8503ème quartile
4215,0000,620Médiane
1622,0000,3501er quartile
15370,0000,920Etendue (Min - Max)
16008,0001,100Maximum
638,0000,180Minimum
3397,5870,277Ecart-type
5019,4840,631Moyenne
Prix ($)Carats
Les quartiles :
Le plus gros diamant du monde, le Cullinan, a été découvert en 1905 dans la mine Premier près de Pretoria
en Afrique du Sud. Il pesait 3106 carats à l’état brut (soit plus de 621 grammes). Il a été taillé en plusieurs
fragments dont les deux célèbres Cullinan I et Cullinan II, ayant un poids respectif de 530,2 et 317,4 carats.
Les autres diamants taillés célèbres (une dizaine) font entre 40 et 550 carats.
1 / 31 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !