3. Codages de l’information
Pourquoi et quoi coder ?
L’ordinateur peut stocker et manipuler tout type d’information mais sa mémoire ne peut
contenir que des nombres binaires. C’est pourquoi les données traitées sont converties en bits. Le
codage des donnes n’est pas une technique nouvelle et n’est pas réservée à l’informatique. Par
exemple, l’alphabet morse qui remplace des lettres par des codes.
Le codage de textes : un traitement de textes.
Les images : un logiciel de traitement d’images.
Les sons : un logiciel de traitement du son qui code un son en une séquence binaire comme un auteur
traduit ses partitions en symboles sur une portée. L’ordinateur échantillonne le son et le digitalise.
A chaque type d’information correspond une codification symbolique précise. Il est capital pour écrire
et lire un quelconque de ces types d’être parfaitement au fait de la codification à l’œuvre. Donc il est
nécessaire et ce par le nom complet du fichier, d’associer à celui-ci une codification terminée.
Pour tout type d’information (texte, son, film,…), la codification adoptée doit respecter un standard
afin d’être compris par le plus grand nombre.
D’où la nécessité d’identifier et de diffuser ces standards à tout un chacun y compris dans les logiciels
traitant du type d’information concernée.
Codification des textes : Chaque caractère sur un clavier est codé automatiquement. Il fait
appel au code ASCII qui associe une valeur numérique à chaque lettre minuscule et majuscule de
même qu’à chaque chiffre et signe de ponctuation. Le code ASCII est un code caractère qui est une
norme mettant en correspondance chaque position du code avec une définition (Dans le code
ASCII, la position décimale 33 correspond à la définition ‘exclamation point’), proposant des
symboles typographiques pour chaque position (Dans le code ASCII, la position décimale 33
correspond au symbole graphique ‘ !’) et proposant une ou plusieurs façons de coder le caractère
sous forme de suite organisées de bits (les caractères du code ASCII sont codés sur un octet).
Mais ces codes posent encore des problèmes comme celui des équivalences entre caractère composé.
En plus du code ASCII, il existe différents autres codes :
- le ASCII : La mémoire d’un ordinateur conserve toutes les données sous forme numérique. Il
n’existe pas de méthodes pour stocker des caractères. Chaque caractère possède son équivalent
en code numérique.
Il ne contient pas de caractère accentués, ni de caractères spécifiques à une langue.
- le ASCII étendu portant sur 256 caractères (minuscules, majuscules, chiffres, ponctuation,…)
et codés sur 8bits
- Normes ISO 8859-n qui normalise des langues étrangères
- UNICODE est système de codage des caractères sur 16bits. Il permet de représenter n’importe
quel caractère par un code sur 16bits. Il regroupe ainsi la quasi-totalité des alphabets existants
(4000 caractères) et est compatible avec le code ASCII.
Ce type de code a pour l’avantage de permettre la saisie de textes multilingues et de passer
d’un système d’écriture à un autre sans problèmes. De plus avec ce code, à un code caractère
ne peut correspondre q’un seul caractère.
Il est implanté sur plusieurs systèmes comme le langage JAVA, le système MS-Windows,
l’éditeur de texte MS-Word,….
Cependant, il a quelques inconvénients :
o En Unicode, un caractère prend 2octets. Donc un texte dactylographié prend 2fois
plus de places qu’en ASCII.
o Le manque d’outils sachant gérer les caractères sur plus d’un octet est un autre frein