RÉSUMÉ – Numérisation et traitement des fichiers numérisés par Nadine St-Amand
NUMERISATION ET TRAITEMENT DES FICHIERS NUMERISES
NUMERISATION (SCAN)
Il faut savoir que la numérisation est un échantillonnage de l’image réelle
Pour pouvoir ré-imprimer l’image numérisée il convient d’en faire l’acquisition à au moins 300 dpi
Un truc pour éviter de numériser l’envers d’une page de journal : utiliser un carton gris ou noir
derrière l’article
RECONNAISSANCE OPTIQUE DES CARACTERES (OCR)
La reconnaissance optique des caractères consiste en la conversion d’un document en format image
(PNG, JPG, GIF, BMP…) vers un document texte (TXT) qui encode les caractères suivant un format de
caractères reconnu (ASCII ou iso-8859 ou UTF8 ou Unicode)
La reconnaissance optique des caractères est difficile à réaliser, elle repose sur des algorithmes variés,
qui sont parfois basés sur l’intelligence artificielle. Le résultat est parfois incertain et peut être validé
par un dictionnaire de mots dans la langue cible.
Il existe plusieurs logiciels qu’on peut installer dans son ordinateur et utiliser, ainsi que des services
web
TRAITEMENT DES FICHIERS IMAGES
Une image numérisée requiert généralement un recadrage qui peut être réalisé dans Photoshop, dans
Gimp, ou directement avec le pilote du numériseur, ou même encore dans Picasa
D’autres traitements particulier seront étudiés dans les cours photoshop (à venir)
CLASSIFICATION DES FICHIERS DANS L’ORDINATEUR
On utilise un logiciel permettant de classifier nos photos selon des classeurs et aussi, surtout, des
mots-clés, qui agissent comme des classeurs virtuels
Les logiciels qu’on a utilisés en classe sont ACDSee et Picasa
Leur avantage commun est de permettre d’associer des mots-clés aux fichiers numériques telles que
les images, cette approche est en lien avec la nouvelle mode de l’informatique sémantique (voir web
sémantique) qui nous permet de nous débrouiller dans une mer de données. Cela est également en
lien avec les nuages de mots-clés à la mode (tag cloud).