Telechargé par j.h-acm

SNT-Les données-Cours POLY

publicité
Thème 1 : Les données structurées
Fiche bilan
2nde SNT
Page 1/2
Fiche bilan : Les données structurées
Une donnée est la représentation d’une information.
Bien avant la naissance de l’informatique, on a eu
besoin de stocker, puis de structurer ces informations,
pour pouvoir les utiliser.
Les données constituent désormais la matière
première de toute activité numérique.
A cause de l’explosion de la quantité de données
disponibles, de nouvelles formes de stockage, de
structuration et d’exploitation ont vu le jour.
1.
Les données
➢
➢
➢
➢
➢
➢
➢
➢
➢
➢
Repères historiques
1728 : utilisation de cartes perforées pour automatiser un
métier à tisser (J-B. Falcon)
1930 : utilisation de cartes perforées pour stocker des données
1956 : invention du disque dur (Ramac 350 - IBM)
1960 : apparition des 1ères bases de données
1970 : invention du modèle relationnel (structuration et
indexation des bases de données)
1979 : création du 1er tableur (VisiCalc – Software Arts)
1984 : invention de la mémoire flash (F. Masuoka – Toshiba)
1997 : apparition du terme Big Data
2000 : invention de la clé USB (Trek Technology & IBM)
2013 : charte du G8 pour l’ouverture des données publiques
1.1. Les données personnelles
•
Une donnée est un élément se rapportant à un objet, une personne ou un évènement.
•
Une donnée personnelle est une donnée permettant d’identifier une personne, directement
ou indirectement.
Exemple : le numéro de téléphone d’un contact est une donnée.
1.2. Les métadonnées
•
Une métadonnée est une donnée particulière qui apporte
des informations sur la donnée principale.
Exemple : Pour un fichier de musique, la donnée principale est la
chanson et le nom de l’artiste ou le nom de l’album sont des
métadonnées.
2.
Les données structurées
2.1. Les tables de données
•
On organise les données sous la forme d’un tableau appelé «
table de données ».
Une liste de descripteurs permet de caractériser les
données.
Un objet est un élément d’une table.
Une collection regroupe des objets partageant les mêmes descripteurs.
Les valeurs de tous les descripteurs d’un objet sont précisées. Les données sont alors dites « structurées ».
Exemple : le numéro de téléphone d’un contact est une donnée.
•
Une base de données regroupe plusieurs collections de données reliées entre elles.
Exemple : la base de données d’une bibliothèque conserve les données sur les livres, les abonnés et les emprunts effectués.
Thème 1 : Les données structurées
Fiche bilan
2nde SNT
Page 2/2
2.2. Formats et représentations des données
•
Les données sont organisées de manière à s’adapter à des traitements spécifiques.
La manière dont elles sont organisées est le format, les plus utilisés sont : CSV, JSON et XML.
Exemple : ci-contre, la table de
données du doc 3 aux formats csv, json
et xml.
3.
Les données structurées
•
Le traitement des données peut consister en : recherche, tri,
estimation, calcul …
•
Pour réaliser ces opérations, on peut utiliser un tableur
(comme Excel) ou un langage informatique (le plus utilisé
aujourd’hui est le SQL).
Exemple : la requête ci-dessous (en SQL), sélectionne le nom des
élèves des tables Seconde7 et TS3 qui ont plus de 15 ans et moins
de 19 ans.
« select nom from Seconde7,TS3 where age>15 and age<19 »
4.
Le stockage des données
4.1. Localisation
•
Les fichiers de données sont stockés sur des supports de stockage : internes (disque dur HDD ou SSD) ou externes (disque
SSD ou clé USB), locaux ou distants (cloud = « nuage »).
•
Le « nuage » (ou cloud computing) désigne l’accès, par l’intermédiaire d’un réseau, à des ressources informatiques
(stockage, logiciels, puissance de calcul, données) situées dans des serveurs informatiques distants.
Exemple : Dropbox, iCloud de Apple ou Google Drive sont le plus connus.
4.2. Impact sur les pratiques humaines
•
L’évolution des capacités de stockage, de traitement et de diffusion des données provoque un phénomène de
surabondance des données.
L’exploitation de données massives (Big Data) est en plein essor dans des domaines variés (sciences, santé, économie …).
Les conséquences sociétales sont nombreuses en termes de démocratie, de surveillance de masse ou encore d’exploitation
des données personnelles.
•
Certaines de ces données sont dites ouvertes (OpenData), leurs producteurs considérant qu’il s’agit d’un bien commun.
Mais on assiste aussi au développement d’un « marché des données » où des entreprises collectent et revendent des
données sans transparence pour les usagers.
Le règlement général sur la protection des données (RGPD) fixe un cadre juridique pour ce « marché des données »
permettant ainsi de protéger les usagers.
•
Aujourd’hui, des centres de données (Data centers) hébergent un nombre toujours croissant de données mais posent des
problèmes écologiques : consommation d’énergie en hausse pour fonctionnement des serveurs et des climatisations
nécessaires.
Le cloud est devenu un des premiers consommateurs d’électricité dans le monde. Les entreprises du net doivent donc
adapter leurs technologies pour réduire leur impact écologique.
Exemple : les centres de données consomment 10 % de l’électricité mondiale.
Téléchargement