Techniques de compression de données : Cours complet

Telechargé par mawou.aa

Téléchargement

Techniques de compression de données

Référence : Compression.docx / PCT

Version : 1.6 / novembre 2014

Par P. CRUCHET

D'après « COMPRESSION DE DONNÉES » de Pascal Plumé Edition EYROLLES

et la revue « PC EXPERT » Janvier 1995.

Lien Internet : http://fr.wikipedia.org/wiki/Compression_de_données

PLAN DU DOCUMENT

PRESENTATION DE LA COMPRESSION ........................................................................................ 1

NALYSE DU BESOIN

............................................................................................................................. 1

1.1.

Dans le domaine de la transmission de données.......................................................................... 1

1.2.

Le Stockage des informations ...................................................................................................... 1

1.3.

Autres domaines d’utilisation ...................................................................................................... 1

ESURE DE LA COMPRESSION

............................................................................................................... 2

ES METHODES

..................................................................................................................................... 2

3.1.

Compression des répétitions ........................................................................................................ 2

3.2.

Codage statistique ........................................................................................................................ 3

3.3.

Utilisation d’un dictionnaire ........................................................................................................ 3

3.4.

Algorithmes prédictifs .................................................................................................................. 3

LE CODAGE RLE .................................................................................................................................. 4

RINCIPE

............................................................................................................................................... 4

XEMPLE D

’

UTILISATION

...................................................................................................................... 4

S4.3 Structure et gestion de donnée Techniques de compression de données

Page - 1

Présentation de la compression

1. Analyse du besoin

La compression de donnée consiste à réduire la taille de données.

1.1. Dans le domaine de la transmission de données

Dans le domaine des réseaux et des télécommunications, le canal de transmission est

souvent un facteur de limitation de la vitesse de transfert.

La compression des données peut soit réduire le temps de transfert, soit permettre de

réduire le coût du matériel.

1.2. Le Stockage des informations

La compression de données est utilisée pour :

* Rentabiliser au maximum les capacités physiques de stockage en

augmentant le volume apparent de données emmagasinées.

* Augmenter les capacités de sauvegarde des disques durs (doublage).

* Avoir un accès plus rapide aux informations stockées.

1.3. Autres domaines d’utilisation

* Le son (ADPCM) : Taux d’erreur admis.

* L’image fixe (JPEG) : Beaucoup de données identiques.

* L’image animée (MPEG)

Compression

Décompression

ARJ

ZIP

....

Ordinateur

Modem

Ordinateur

S4.3 Structure et gestion de donnée Techniques de compression de données

Page - 2

2. Mesure de la compression

Compression

Décompression

Données

origiales Données

compressées

Le degré de réduction des données obtenu par une méthode de compression se mesure

et prend le nom de quotient de compression.

Taille des données compressées

Taux de compression = -----------------------------------------

Taille des données originales

Le taux de compression est exprimé en pourcentage.

3. Les méthodes

Un algorithme de compression sans perte restitue après les opérations successives de

compression et de décompression une suite de bits strictement identique à l'originale. Les

algorithmes de compression sans perte sont utiles pour les documents, les archives, les

fichiers exécutables ou les fichiers textes.

Avec un algorithme de compression avec perte, la suite de

bits obtenue après les opérations de compression et de

décompression est différente de l'originale, mais l'information

restituée est en revanche voisine. La compression avec pertes ne

s'applique qu'aux données « perceptibles », en général sonores ou

visuelles, qui peuvent subir une modification, parfois importante,

sans que cela soit perceptible par un humain. La perte

d'information est irréversible, il est impossible de retrouver les

données d'origine après une telle compression.

3.1. Compression des répétitions

C’est une des techniques des plus simples, elle est connue sous le nom de Run Length

Encoding « RLE » par exemple. Le principe consiste à détecter une donnée ayant un nombre

d’apparitions consécutives qui dépasse un seuil fixé. Puis, cette séquence est remplacée par

deux informations, un chiffre représentant le nombre de répétitions et l’information à répéter.

Exemple : ASCII ⇔ ASC2I

Cette méthode présente peu d’avantage pour la compression de fichier texte. Par

contre pour une image, elle devient intéressante, car on rencontre régulièrement une

succession de données de même valeur, des pixels de même couleur.

S4.3 Structure et gestion de donnée Techniques de compression de données

Page - 3

3.2. Codage statistique

Le but de ces méthodes est de coder des caractères avec un minimum de bits en

fonction de leur fréquence d’apparition dans les données originales. On peut citer les

algorithmes de Huffman et de Shannon/Fano.

Le principe du codage d’Huffman est similaire a celui du code morse utilisé en

transmission : coder ce qui est fréquent sur peu de place, et coder en revanche sur des

séquences plus longues ce qui revient rarement. En morse le « e », lettre très fréquente, est

codé par un simple point.

Exemple : si W est rencontré 10 fois, on peut le coder sur 12 bits

si E est rencontré 200 fois, il sera stocké sur un seul bit

Sans codage : 10

8 + 200

8 = 1680 bits

Avec codage : 10

12 + 200

1 = 320 bits

3.3. Utilisation d’un dictionnaire

Des méthodes comme celle de Lempel Ziv Welch « LZW » font intervenir un

dictionnaire.

Principe :

On constate que les mêmes suites d’octets apparaissant régulièrement dans les

données sources. Elles peuvent être remplacées par un indice représentant leurs adresses dans

un dictionnaire de référence construit progressivement.

3.4. Algorithmes prédictifs

Ces méthodes cherchent à prévoir les caractères futurs en fonction des caractères déjà

lus. Par exemple, celle élaborer par Teuhola et Raita consiste à explorer un fichier texte

syllabe par syllabe.

S4.3 Structure et gestion de donnée Techniques de compression de données

Page - 4

Le codage RLE

1. Principe

L’encodage des répétitions (RLE pour Run-Length Encoding) est l’une des méthodes

les plus anciennes. Elle a l’avantage d’être des plus simples et est souvent utilisée. Le principe

est d’identifier les séquences d’octets puis de les encoder en une forme plus compacte. Le

codage RLE est à la fois rapide et simple à mettre en oeuvre. Les textes ASCII se prêtent

malheureusement assez mal à cette méthode, car ils contiennent rarement de très longues

séquences répétitives. Les fichiers exécutables ou mieux encore les fichiers contenant des

images bitmap ou des bases de données composées d’enregistrement de format fixe

permettent d’obtenir un taux de compression relativement important.

2. Exemple d’utilisation

Un fichier contient les 32

octets suivants : Sous une autre forme :

00 32 46 00 00 00 00 05

99 02 02 02 01 01 01 01

01 01 01 01 01 01 01 64

00 00 00 00 00 00 00 00

00 00 00 00

02 02 02

01 01 01 01 01 01 01 01 01 01 01

00 00 00 00 00 00 00 00

On constate qu’un certain nombre d’octets sont répétés.

Le remplacement de chaque ligne par deux octets,

l’un pour le nombre d’octets de la séquence,

l’autre pour l’octet répété donne le résultat suivant

01 00

01 32

01 46

04 00

01 05

01 99

03 02

0B 01

01 64

08 00

1 / 6 100%

Documents connexes

JOIGNEZ-VOUS À NOUS LORS DE CETTE FORMATION

Indications aux bandes compressives Insuffisance veineuse / Lymphoedème / Hypotension orthostatique / Thrombose veineuse

La compression de Huffman

Améliorer la compression des données des modèles océaniques !

fiche sur la prise en charge de l hemorragie

TIPE : JPEG

Décrire l`algorithme d`optimisation débit-distorsion des points

Plan_cours

Algorithme de compression De Huffman

Il existe une multitude de formats d`images. Certains sont cependant

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d''utilisation

Techniques de compression de données : Cours complet

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Techniques de compression de données : Cours complet

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib