Librairie PSI - Mathieu Delalandre`s Home Page

publicité
PSI Librairie
Adam Sébastien
Delalandre Mathieu
Héroux Pierre
Séminaire Doc Mining Paris
13/11/2002
Plan
 Introduction
 Démonstration
 Conclusion
Séminaire DocMining Paris
13/11/2002
Plan
 Introduction
 Démonstration
 Conclusion
Séminaire DocMining Paris
13/11/2002
Introduction
 Présentation de la PSILib (1)
 Librairie traitement « équipe document» PSI
 Historique
 1992-2001
 LTI, LibImage, TAI, GraphePsi, …
 2001-2002
 PSI Librairie
 Début projet :
 Avant projet :
 Versions :
Séminaire DocMining Paris
Octobre 2001
Février 2002 (S Nancy)
Mai (S Lannion), Juillet, Octobre 2002
13/11/2002
Introduction
 Présentation de la PSILib (2)
 Base d’outils standards pour le traitement
des documents découpés en 4
bibliothèques :
 PSI Image Processing Library
 PSI Classification Tool Library
 PSI Interpretation Interface Library
 PSI Knowledge Management Library
Séminaire DocMining Paris
13/11/2002
Introduction
 Caractéristiques (1)
 Taille
 >50 000 lignes de code
 >2 Mégas de fichier source
 Langages
 10% java
 20% C++
 60% CANSI
 5% script (XSLT, XML-QL)
Séminaire DocMining Paris
13/11/2002
Introduction
 Caractéristiques (2)
 Bibliothèques externes
 Java
 JAI
 Xerces
 Keelt
 C/C++
 LibTiff
 STL
Séminaire DocMining Paris
13/11/2002
Introduction
 Caractéristiques (3)
 Points forts
 Exploitation Multi langage
 Java & C/C++
 100% interfaçable depuis Java
 Partiellement interfaçable depuis le C/C++
 Exploitation Multi Plate forme
 Windows et Linux
Séminaire DocMining Paris
13/11/2002
Introduction
 Caractéristiques (4)
 Points forts
 Paramétrage des outils
 Externalisation des connaissances opératoires
 Interfaçage des outils
 Flots de données dédiés & XML (SVG, XGMML)
 Bibliothèque documentée
 Générée Automatiquement avec JavaDoc
 Pointe 56 MO de rapport (>2000 pages)
 PS, PDF, HTML,Word
Séminaire DocMining Paris
13/11/2002
Introduction
 Caractéristiques (5)
 Points faibles
 Fiabilité de la librairie
 Pas de test de robustesse
 Pas de code de gestion d’erreurs
 Implémentation plus procédurale qu’objet
Séminaire DocMining Paris
13/11/2002
Introduction
 Traitements (1)
 PSI Image Processing Library








Gestion fichiers (tout formats)
Gestion objets
Convolution (médian, moyenneur)
Conversion couleur (Otsu, Kittler)
Morphologie
Marquage de masses connexes (filtrage, occlusions)
Structurel(Taconnet, Dibaja, la corde, split & merge, nœud)
Statistique(Fourier-Mellin, sondes circulaires, Zernike)
Séminaire DocMining Paris
13/11/2002
Introduction
 Traitement (2)
 PSI Classification Tool Library
 Kppv
 Graphe de voisinage, toponyme
 Appariement Graphe (générique)
Séminaire DocMining Paris
13/11/2002
Introduction
 Traitement (3)
 PSI Interpretation Interface Library
 Shell, Affichage, Fichier
 PSI Knowledge Management Library
 XSLT (Xerces), XML-QL(Keelt)
Séminaire DocMining Paris
13/11/2002
Introduction
 Mise à disposition
 Actuellement
 Site de thèse
 http://site.voila.fr/roxml
 A venir
 Serveur PSI
Séminaire DocMining Paris
13/11/2002
Plan
 Introduction
 Démonstration
 Conclusion
Séminaire DocMining Paris
13/11/2002
Démonstration
 Documentation & Utilisation
Séminaire DocMining Paris
13/11/2002
Plan
 Introduction
 Démonstration
 Conclusion
Séminaire DocMining Paris
13/11/2002
Conclusion
 Points faibles
 Problèmes éventuels de robustesse &
performance
 Implémentation plus procédurale que objet
 Exploitation depuis Java favorisée
 Architecture interne discutable
Séminaire DocMining Paris
13/11/2002
Conclusion
 Points forts
 Package « complet »
 Documentation technique et scientifique
 Contraintes techniques « faibles »
 Portable sous Linux & Window
 Langage d’interface (java et C/C++)
 Interfaçage système « aisé » (XML et dérivés
« SVG, XGMML»)
Séminaire DocMining Paris
13/11/2002
Téléchargement