La notion de fichier

Téléchargement

École Technique de Zahlé – Classe de TS2 Informatique de Gestion

Cours de Base de Données

Cours préparé par : Joseph BARHOUM.

2009 - 2010

Chapitre I : Les Systèmes de Gestion des Fichiers.

I-1 La notion de fichier

Comme avec plusieurs aspects de la vie humaine, la plupart des données présentes

entre elles un certain ordre naturel. Généralement, les données sont groupées sous

forme de fichiers ; étant la méthode d’organisation des données la plus simple et la pu

répandue en informatique.

II- Définitions

II-1 Fichier

Un fichier renferme un ensemble d'informations plus ou moins structurés, se rapportant

à un groupe d’individus ou d’objets. On ne parle cependant de fichier que dans le cas où

ces informations sont stockées sur des supports qui leur permettent une durée de vie

assez longue, et ce sans avoir besoin de trop d'entretien, comme, par exemple, les

disquettes ou les bandes magnétiques. Les fichiers peuvent contenir absolument tous

les types de données que l'on veut.

Ainsi, toutes les informations concernant les employés d’une entreprise peuvent être

groupées dans un fichier « Personnel » de l’entreprise.

Un fichier est un groupe organisé et structuré d’articles de la même nature. Ainsi ,

chaque fichier est divisé en plusieurs articles.

II-2 Article

L’article (ou enregistrement logique) d’un fichier donné contient toutes les informations

relatives au même individu ou bien au même objet. C’est l'ensemble minimum de

données qui peut être manipulé par une seule opération élémentaire du fichier. Il est

souvent constitué de diverses données élémentaires, que l'on peut décrire dans le

langage de programmation utilisé, comme le montre la figure 1-1. Dans cet exemple, le

fichier est constitué d'une collection d'enregistrements qui ont la structure d'EMPLOYE.

II-3 Champ

01 EMPLOYE

02 NOM PICTURE X(30)

02 PRENOM PICTURE X(20)

02 NUM-S-S

03 SEXE PICTURE 9

03 DATE-NAISSANCE

04 ANNEE PICTURE 99

04 MOIS PICTURE 99

03 ADRESSE

04 REGION PICTURE 99

04 VILLE PICTURE 999

02 CODE-INTERNE PICTURE 9999

Fig. 1-1. Exemple de description en COBOL d'un enregistrement logique

École Technique de Zahlé – Classe de TS2 Informatique de Gestion

Cours de Base de Données

Cours préparé par : Joseph BARHOUM.

2009 - 2010

Un attribut (ou attribut) est une variable qui renseigne sur une caractéristique d'une

entité. C’est un groupe d’informations élémentaires. Par exemple l’adresse dans le

fichier « Personnel » constitue une donnée qui rassemble plusieurs informations

élémentaires : Région et Ville.

Le Num-S-S représente un sous article du fichier « Personnel ». Un article alors peut

être divisé en différents niveaux de champs (ou sous articles).

Un caractère correspond au groupe de bits le plus petit (0, 1).

Une zone ou un mot correspond à un groupe de caractères successifs représentant les

informations accessibles dans l’opération de traitement.la longueur d’une zone est le

nombre de caractère de cette zone.

Ainsi :

Groupe de Caractères  Zone ou Mot.

Groupe de Mots  Champ.

Groupe de Champs  Article.

Groupe d’Article  Fichier.

II-4 Domaine de l'attribut

Le domaine de l'attribut est l'ensemble des valeurs qu'il peut prendre. Pour un attribut de

type nominal (par exemple : nom, occupation, type de culture), le domaine est défini par

un ensemble de valeurs possibles (l'ensemble des types de cultures possibles dans une

région). Cet ensemble est habituellement fini mais est parfois difficile à cerner (domaine

des noms de familles). Pour les attributs de type quantitatif (pente, température, âge), le

domaine se définit souvent par des bornes minimales et maximales. Le respect du

domaine des attributs contribue grandement à l'intégrité référentielle. Il est d'usage de

créer une table contenant l'ensemble des valeurs du domaine d'un attribut de type

nominal afin d'offrir à la personne qui saisit les données une liste correcte des valeurs

possibles. Il s'agit alors d'une table de consultation.

III- Les structures des Fichiers

III-1 Les fichiers séquentiels

Les fichiers à organisation séquentielle représentent la forme la plus simple de stockage

d’informations en mémoire de masse. On place dans le fichier les enregistrements les

uns derrière les autres au fur et à mesure de leur saisie.

La saisie d’un enregistrement se fera toujours en fin du fichier.

L'accès à un enregistrement de rang n ne peut se faire que par le parcours des n-1

précédents (parcours séquentiel).

L’accès séquentiel est l’unique accès possible sur un fichier à organisation séquentiel.

Avantage : simplicité de mise en place et d’utilisation.

Inconvénient : lenteur d’accès à l’information.

III-2 Les fichiers directes

Fig. 1-2.Organisation séquentielle d’un fichier.

École Technique de Zahlé – Classe de TS2 Informatique de Gestion

Cours de Base de Données

Cours préparé par : Joseph BARHOUM.

2009 - 2010

Ce type d’organisation de fichier est plus efficace lorsqu’on désire obtenir des

enregistrements particuliers. Les enregistrements sont stockés sur un disque à une

adresse particulière qui peut être déterminée à partir de leur champ clé. Cette adresse

est calculée via une technique connue sous le nom de HASHING. Ces programmes de

hashing transforment par des opérations mathématiques, la valeur numérique du champ

clé en une adresse particulière de stockage. Ces programmes sont utilisés

premièrement pour stocker les enregistrements, puis pour les accéder ailleurs.

Ces fichiers sont stockés seulement sur disques.

Avantage : localisation rapide des enregistrements donnés.

Inconvénient : couteux, besoin d’un très grand espace de stockage. Et pas trop

efficace quant aux grand nombre de modifications et

d’enregistrements.

III-3 Les fichiers séquentiels indexes

C’est un compromis entre l’organisation directe des fichiers et l’organisation

séquentielle. Les enregistrements sont stockés dans un fichier selon un ordre

séquentiel. Un tableau d’index est utilisé pour localiser les enregistrements. Dans ce

tableau on trouve les clés de chaque enregistrement ainsi que leur adresse

correspondante sur le disque. Ainsi, pour trouver un enregistrement donné dans un

fichier indexé séquentiel, une recherche dans le tableau d’index est effectuée pour

trouver la clé de l’enregistrement donné, puis une fois trouvé, la valeur de l’adresse

physique sur le support est connue, et l’enregistrement est trouvé.

Remarque : la clé d’index que l’on peut nommer clé primaire est identifiante : elle

identifie de façon unique l’enregistrement auquel elle appartient.

Donc une clé d’index ou clé primaire caractérise la connaissance d’un seul

enregistrement dans un fichier à organisation séquentielle indexée.

Avantage : Accès sélectif rapide à un enregistrement à partir de la valeur

de sa clé.

Accès séquentiel efficace selon l’ordre des clés.

Taille du fichier variable au cours du temps.

Inconvénient : Insertions / suppressions parfois coûteuses en E/S.

Fig. 1-3.Organisation Directe d’un fichier.

Fig. 1-4.Organisation Séquentielle Indexée d’un fichier.

École Technique de Zahlé – Classe de TS2 Informatique de Gestion

Cours de Base de Données

Cours préparé par : Joseph BARHOUM.

2009 - 2010

Fig. 1-5.Différents types d’index.

École Technique de Zahlé – Classe de TS2 Informatique de Gestion

Cours de Base de Données

Cours préparé par : Joseph BARHOUM.

2009 - 2010

Dans cette organisation (séquentielle indexée), la clé est composée d’un ou plusieurs

attributs; elle est un identifiant des enregistrements du fichier (pas de doubles).

L’index plus les enregistrements du fichier constituent un B−arbre. Les enregistrements

sont donc triés selon l’ordre de la clé. On dit que l’index est "plaçant". L’accès séquentiel

selon l’ordre des clés est très efficace.

Les index secondaires

Objectif: permettre l’accès par plusieurs attributs (ou groupes d’attributs) différents et qui

ne sont pas nécessairement identifiants. Par exemple sur un fichier des étudiants,

accéder par le nom (homonymes possibles), par l’année de naissance, ...

Pour chaque attribut (ou groupe d’attributs), appelé clé secondaire, on crée un index

(avec plusieurs entrées de même valeur de clé dans le cas de clé non identifiante)

organisé en B−arbre. Ces index sont appelés index secondaires ou fichiers inversés. Ils

ne sont ni plaçants, ni denses.

Exemple:

Avantage des index secondaires: Plusieurs accès sélectifs selon des clés différentes

possibles, en plus des accès dus à l’organisation de base du fichier.

Inconvénients: Multiplier les index secondaires multiplie les E/S lors des mises à

jour des fichiers.

Arbre B+

Les fichiers séquentiels indexés perdent leurs performances quand leur taille grandit. On

propose donc des organisations différentes tels que les fichiers indexés par arbre B+ (B

Balanced, équilibré) , qui sont très utilisés si l’on a des modifications fréquentes. Ils sont

efficaces, quelque soit les opérations d'insertion ou d'effacement de données. Servitude

lors des opérations d'insertion ou de suppression. Un arbre B+ est sous la forme d'un

arbre équilibré.

Arbre B

Les fichiers indexés par arbre B ont le même aspect que les arbres B+ mais les

redondances des clés de tri sont éliminés.

Néanmoins la structure des nœuds non terminaux est différente. Il y a moins de nœuds

que les arbre B+. Dans le cas d'une recherche, on n’est pas obligé d'aller au bout d'un

chemin.

L’accès aux données :

Les données stockées en mémoire sont perdues dès la sortie du programme. Les

fichiers sur support magnétique (bande, disquette, disque) sont par contre conservables,

mais au prix d'un temps d'accès aux données très supérieur. On peut distinguer les

fichiers séquentiels (on accède au contenu dans l'ordre du stockage) ou à accès direct

1 / 25 100%

Documents connexes

Initiation aux SGBD

IF118 : Base de données - Enseirb

I4 : Bases de données

Base de Données Relationnelles

Gestionnaire de base de données

(spécialiste Oracle) - fiche de poste ref: 409 > pdf

introduction aux bases de donne es

Bases de données - Introduction - Fichier

Access Premières définitions Quelques

Introduction aux SGBD

Les bases de données 1) Introduction a) Qu`est ce qu`une base de

resumé

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d''utilisation

La notion de fichier

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

La notion de fichier

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib