Comment intégrer des composants TAL open source pour créer un logiciel d'analyse de courriels Sylvain Surcin [email protected] Gaëlle Recourcé [email protected] Kwaga • • • • décembre 2008 Equipe expérimentée Partenariat Inria Brevet « Procédé et système d’enrichissement de mél » • Le meilleur du mail Awards Est-ce que le mail vous prend trop de temps? (levez la main) 4 25% Plus de des employés reconnaissent que le nombre de e-mails qu’ils reçoivent est une cause de retard . En moyenne un cadre est interrompu par un media électronique toutes les 10 minutes 59% des employés déclarent perdre trop de temps à chercher des mails égarés 71 % des cadres sont stressés par le volume d’information qu’ils reçoivent dans le cadre de leur travail …60% se sentent dépassés Votre assistant personel Les Besoins Etude d’usage du mail en entreprise • La volumétrie est connue mais qu'en est-il qualitativement ? • Projet DLM3.0 – Définition des besoins – Créer des composants qui soient des réponses à un besoin réel. • APCE – partenaire utilisateur projet – Agence gouvernementale. – Une cinquantaine d'employés. – De nombreux cas d'usage. • Lettre d'information • Site avec hotline d'aide aux porteurs de projet. • Veille au centre de documentation et chez les juristes. Quelques paradoxes... • Indispensable mais … – J'adore le mail / pourquoi tant de mails ? • Faut-il mettre en copie ? – Je ne suis qu'en copie… • Quel style pour un mail ? – Salut, Cordialement, Bonne journée ? • Les bonnes résolutions – Ranger sa boite de réception – (Ne pas) regarder sa webmail • Urgent ou non ? – Pratique ou agressif ? • Mail contre téléphone Fonctionnalités 14 14 BirdsEye Notifier • Signaler les mails importants • Répondre et relancer Technologie linguistique Sélection du corps du message Annotations linguistiques Date Date Invitation Meeting Interprétation (1) interprétations candidates Date Invitation Invitation 27/10/2009 18:0023:59 Meeting Meeting 27/10/2009 18:0023:59 Interprétation (2) interprétation finale Date Invitation Invitation 27/10/2009 18:0023:59 Meeting Meeting 27/10/2009 18:0023:59 Architecture 23 IA Linguistique Informatique Distribuée Serveur Mail Serveur IMAP Serveur Kwaga IMAP get IMAP flags Serveur Kwaga Webservice Rest Normal IMAP interaction JSON Client Mail Kwaga Notifier Invoke Client Mail Annotations Open Source JTCL (Sourceforge) Java Code propriétaire Unitex (Marne-la-Vallée) C/C++ UIMA (Apache) Java UnitexJNI (Ergonotics) C/C++, Java Chaine Kwaga Pulse-UIMA Formateur RMB Analyse linguistique Type System Interprétation Open Source Code propriétaire Kwaga Unitex Java wrapper JUnitex UIMA Annotateur UnitexAnnotator Type System Open Source