INSTITUT DE RECHERCHE EN INFORMATIQUE ET SYSTEMES ALEATOIRES Campus universitaire de Beaulieu ● 263 Avenue du Général Leclerc - 35042 Rennes Cedex France www.irisa.fr OFFRE de THÈSE Sujet de thèse : Apport des Champs Conditionnels Aléatoires dans la structuration d'un flux vidéo Description : Qu'il s'agisse de vidéo à la demande ou d'archivage de programmes télévisés, une même nécessité s'impose à toutes les applications exploitant des flux vidéo : structurer ces flux de manière à pouvoir accéder individuellement aux différents programmes qui les composent. Le développement d'outils de structuration automatique de flux est un problème qui est loin d'être trivial. En effet, si d'un point de vue humain un flux vidéo est facilement décomposable en une suite de programmes séparés par des coupures diverses, l'examen du signal vidéo ne révèle qu'une suite d'images sans structure apparente. Cette absence de structure au niveau du signalcomplique fortement la mise au point de méthodes automatiques de structuration. Généralement, la structuration automatique d'un flux s'effectue en deux étapes : (1) la segmentation, consistant à déterminer précisément les bornes des différents segments composant le flux ; (2) l'étiquetage, consistant à reconnaître le type de chaque segment (programme, spot de publicité, bandeannonce, etc). Pour favoriser cette dernière phase d'étiquetage, des méthodes de classification variées ont été utilisées : SVM, arbres de classification, programmation logique inductive. Si les classifieurs produits ont montré leur efficacité, ces méthodes nécessitent le plus souvent de disposer de données d'entraînement qui ne peuvent être obtenues que par un étiquetage manuel souvent fastidieux. Parmi les nombreuses méthodes d'apprentissage, les Champs Conditionnels Aléatoires (Conditional Random Fields - CRF) offrent un cadre théorique approprié à la construction de modèles probabilistes capables de prédire les étiquettes associées à des données séquentielles. Il s'agit d'une méthode d'apprentissage supervisé puisque les modèles sont à partir de séquences déjà étiquetées. La pertinence des modèles a été largement démontrée sur des problèmes variés de biologie ou de linguistique computationnelles. Le thème principal abordé par cette thèse est celui de l'automatisation de la phase (2)d'étiquetage des segments. En partant du principe qu'un flux video segmenté est une suite séquentielle de segments auxquels il faut attribuer des étiquettes correspondant à leurs types respectifs, l'objectif général est d'étudier la pertinence des Champs Conditionnels Aléatoires dans un contexte d'automatisation de cette phase d'étiquetage. Plusieurs roblématiques devront être abordées, en particulier : - identification des données pertinentes dans la reconnaissance des types des segments - détournement du caractère supervisé des Champs Conditionnels Aléatoires, pour les faire fonctionner en mode non supervisé et éviter ainsi la production de séquences d'entraînement par étiquetage manuel des segments. Cette thèse se déroulera au sein de l'équipe Texmex de l'IRISA. Elle comporte une partie théorique mais également une partie pratique importante puisque les techniques développées seront testées sur des données réelles issues d'enregistrement en continu de chaines de la télévision française. http://www.irisa.fr/texmex/sujets/sujets_these_2011/crf.php Département : D6 - Media et interactions Equipe : Texmex; http://www.irisa.fr/texmex/ Directeur de thèse : Patrick Gros 1/ 2 Encadrant(s) : Emmanuelle Martienne ; Vincent Claveau Contact : [email protected] Début des travaux : 1er octobre 2011 Bibliographie : Des articles : * Manolis Delakis, Guillaume Gravier, Patrick Gros. Audiovisual Integration with Segment Models for Tennis Video Parsing. Computer Vision and Image Understanding, 111(2):142-154, Août 2008. * Xavier Naturel, Guillaume Gravier, Patrick Gros. Fast Structuring of Large Television Streams using Program Guides. In 4th International Workshop on Adaptive Multimedia Retrieval, AMR'06, Stéphane Marchand-Maillet, Éric Bruno, Andreas Nûrnberger, Marcin Detyniecki (eds.), LNCS, Volume 4398, Pages 223-232, Genève, Suisse, Juillet 2006. * Gaël Manson, Sid-Ahmed Berrani.Automatic TV Broadcast Structuring.International Journal of Digital Multimedia Broadcasting, 2010. Des thèses : * Xavier Naturel. Structuration automatique de flux vidéos de télévision. Thèse de l'Université de Rennes 1, Avril 2007. * Gaël Manson. Délinéarisation automatique de flux de télévision. Thèse de l'Université de Rennes 1, Juillet 2010. 2/2