PSI Librairie Adam Sébastien Delalandre Mathieu Héroux Pierre Séminaire Doc Mining Paris 13/11/2002 Plan Introduction Démonstration Conclusion Séminaire DocMining Paris 13/11/2002 Plan Introduction Démonstration Conclusion Séminaire DocMining Paris 13/11/2002 Introduction Présentation de la PSILib (1) Librairie traitement « équipe document» PSI Historique 1992-2001 LTI, LibImage, TAI, GraphePsi, … 2001-2002 PSI Librairie Début projet : Avant projet : Versions : Séminaire DocMining Paris Octobre 2001 Février 2002 (S Nancy) Mai (S Lannion), Juillet, Octobre 2002 13/11/2002 Introduction Présentation de la PSILib (2) Base d’outils standards pour le traitement des documents découpés en 4 bibliothèques : PSI Image Processing Library PSI Classification Tool Library PSI Interpretation Interface Library PSI Knowledge Management Library Séminaire DocMining Paris 13/11/2002 Introduction Caractéristiques (1) Taille >50 000 lignes de code >2 Mégas de fichier source Langages 10% java 20% C++ 60% CANSI 5% script (XSLT, XML-QL) Séminaire DocMining Paris 13/11/2002 Introduction Caractéristiques (2) Bibliothèques externes Java JAI Xerces Keelt C/C++ LibTiff STL Séminaire DocMining Paris 13/11/2002 Introduction Caractéristiques (3) Points forts Exploitation Multi langage Java & C/C++ 100% interfaçable depuis Java Partiellement interfaçable depuis le C/C++ Exploitation Multi Plate forme Windows et Linux Séminaire DocMining Paris 13/11/2002 Introduction Caractéristiques (4) Points forts Paramétrage des outils Externalisation des connaissances opératoires Interfaçage des outils Flots de données dédiés & XML (SVG, XGMML) Bibliothèque documentée Générée Automatiquement avec JavaDoc Pointe 56 MO de rapport (>2000 pages) PS, PDF, HTML,Word Séminaire DocMining Paris 13/11/2002 Introduction Caractéristiques (5) Points faibles Fiabilité de la librairie Pas de test de robustesse Pas de code de gestion d’erreurs Implémentation plus procédurale qu’objet Séminaire DocMining Paris 13/11/2002 Introduction Traitements (1) PSI Image Processing Library Gestion fichiers (tout formats) Gestion objets Convolution (médian, moyenneur) Conversion couleur (Otsu, Kittler) Morphologie Marquage de masses connexes (filtrage, occlusions) Structurel(Taconnet, Dibaja, la corde, split & merge, nœud) Statistique(Fourier-Mellin, sondes circulaires, Zernike) Séminaire DocMining Paris 13/11/2002 Introduction Traitement (2) PSI Classification Tool Library Kppv Graphe de voisinage, toponyme Appariement Graphe (générique) Séminaire DocMining Paris 13/11/2002 Introduction Traitement (3) PSI Interpretation Interface Library Shell, Affichage, Fichier PSI Knowledge Management Library XSLT (Xerces), XML-QL(Keelt) Séminaire DocMining Paris 13/11/2002 Introduction Mise à disposition Actuellement Site de thèse http://site.voila.fr/roxml A venir Serveur PSI Séminaire DocMining Paris 13/11/2002 Plan Introduction Démonstration Conclusion Séminaire DocMining Paris 13/11/2002 Démonstration Documentation & Utilisation Séminaire DocMining Paris 13/11/2002 Plan Introduction Démonstration Conclusion Séminaire DocMining Paris 13/11/2002 Conclusion Points faibles Problèmes éventuels de robustesse & performance Implémentation plus procédurale que objet Exploitation depuis Java favorisée Architecture interne discutable Séminaire DocMining Paris 13/11/2002 Conclusion Points forts Package « complet » Documentation technique et scientifique Contraintes techniques « faibles » Portable sous Linux & Window Langage d’interface (java et C/C++) Interfaçage système « aisé » (XML et dérivés « SVG, XGMML») Séminaire DocMining Paris 13/11/2002