RÉSUMÉ – Numérisation et traitement des fichiers numérisés par Nadine St-Amand NUMERISATION ET TRAITEMENT DES FICHIERS NUMERISES NUMERISATION (SCAN) Il faut savoir que la numérisation est un échantillonnage de l’image réelle Pour pouvoir ré-imprimer l’image numérisée il convient d’en faire l’acquisition à au moins 300 dpi Un truc pour éviter de numériser l’envers d’une page de journal : utiliser un carton gris ou noir derrière l’article RECONNAISSANCE OPTIQUE DES CARACTERES (OCR) La reconnaissance optique des caractères consiste en la conversion d’un document en format image (PNG, JPG, GIF, BMP…) vers un document texte (TXT) qui encode les caractères suivant un format de caractères reconnu (ASCII ou iso-8859 ou UTF8 ou Unicode) La reconnaissance optique des caractères est difficile à réaliser, elle repose sur des algorithmes variés, qui sont parfois basés sur l’intelligence artificielle. Le résultat est parfois incertain et peut être validé par un dictionnaire de mots dans la langue cible. Il existe plusieurs logiciels qu’on peut installer dans son ordinateur et utiliser, ainsi que des services web TRAITEMENT DES FICHIERS IMAGES Une image numérisée requiert généralement un recadrage qui peut être réalisé dans Photoshop, dans Gimp, ou directement avec le pilote du numériseur, ou même encore dans Picasa D’autres traitements particulier seront étudiés dans les cours photoshop (à venir) CLASSIFICATION DES FICHIERS DANS L’ORDINATEUR On utilise un logiciel permettant de classifier nos photos selon des classeurs et aussi, surtout, des mots-clés, qui agissent comme des classeurs virtuels Les logiciels qu’on a utilisés en classe sont ACDSee et Picasa Leur avantage commun est de permettre d’associer des mots-clés aux fichiers numériques telles que les images, cette approche est en lien avec la nouvelle mode de l’informatique sémantique (voir web sémantique) qui nous permet de nous débrouiller dans une mer de données. Cela est également en lien avec les nuages de mots-clés à la mode (tag cloud). Page 1