OFFRE de THÈSE

publicité
INSTITUT DE RECHERCHE EN INFORMATIQUE ET SYSTEMES ALEATOIRES
Campus universitaire de Beaulieu ● 263 Avenue du Général Leclerc - 35042 Rennes Cedex France
www.irisa.fr
OFFRE de THÈSE
Sujet de thèse :
Apport des Champs Conditionnels Aléatoires dans la structuration d'un flux vidéo
Description :
Qu'il s'agisse de vidéo à la demande ou d'archivage de programmes télévisés, une même nécessité s'impose à
toutes les applications exploitant des flux vidéo : structurer ces flux de manière à pouvoir accéder
individuellement aux différents programmes qui les composent. Le développement d'outils de structuration
automatique de flux est un problème qui est loin d'être trivial. En effet, si d'un point de vue humain un flux vidéo
est facilement décomposable en une suite de programmes séparés par des coupures diverses, l'examen du
signal vidéo ne révèle qu'une suite d'images sans structure apparente. Cette absence de structure au niveau du
signalcomplique fortement la mise au point de méthodes automatiques de structuration.
Généralement, la structuration automatique d'un flux s'effectue en deux étapes : (1) la segmentation, consistant à
déterminer précisément les bornes des différents segments composant le flux ;
(2) l'étiquetage, consistant à reconnaître le type de chaque segment (programme, spot de publicité, bandeannonce, etc).
Pour favoriser cette dernière phase d'étiquetage, des méthodes de classification variées ont été utilisées : SVM,
arbres de classification, programmation logique inductive.
Si les classifieurs produits ont montré leur efficacité, ces méthodes nécessitent le plus souvent de disposer de
données d'entraînement qui ne peuvent être obtenues que par un étiquetage manuel souvent fastidieux.
Parmi les nombreuses méthodes d'apprentissage, les Champs Conditionnels Aléatoires (Conditional Random
Fields - CRF) offrent un cadre théorique approprié à la construction de modèles probabilistes capables de prédire
les étiquettes associées à des données séquentielles. Il s'agit d'une méthode d'apprentissage supervisé puisque
les modèles sont à partir de séquences déjà étiquetées. La pertinence des modèles a été largement démontrée
sur des problèmes variés de biologie ou de linguistique computationnelles.
Le thème principal abordé par cette thèse est celui de l'automatisation de la phase (2)d'étiquetage des segments.
En partant du principe qu'un flux video segmenté est une suite séquentielle de segments auxquels il faut attribuer
des étiquettes correspondant à leurs types respectifs, l'objectif général est d'étudier la pertinence des Champs
Conditionnels Aléatoires dans un contexte d'automatisation de cette phase d'étiquetage. Plusieurs roblématiques
devront être abordées, en particulier :
- identification des données pertinentes dans la reconnaissance des types des segments
- détournement du caractère supervisé des Champs Conditionnels Aléatoires, pour les faire fonctionner en mode
non supervisé et éviter ainsi la production de séquences d'entraînement par étiquetage manuel des segments.
Cette thèse se déroulera au sein de l'équipe Texmex de l'IRISA. Elle comporte une partie théorique mais
également une partie pratique importante puisque les techniques développées seront testées sur des données
réelles issues d'enregistrement en continu de chaines de la télévision française.
http://www.irisa.fr/texmex/sujets/sujets_these_2011/crf.php
Département : D6 - Media et interactions
Equipe : Texmex; http://www.irisa.fr/texmex/
Directeur de thèse : Patrick Gros
1/ 2
Encadrant(s) : Emmanuelle Martienne ; Vincent Claveau
Contact : [email protected]
Début des travaux : 1er octobre 2011
Bibliographie :
Des articles :
* Manolis Delakis, Guillaume Gravier, Patrick Gros. Audiovisual Integration with Segment Models for Tennis
Video Parsing. Computer Vision and Image Understanding, 111(2):142-154, Août 2008.
* Xavier Naturel, Guillaume Gravier, Patrick Gros. Fast Structuring of Large Television Streams using Program
Guides. In 4th International Workshop on Adaptive Multimedia Retrieval, AMR'06, Stéphane Marchand-Maillet,
Éric Bruno, Andreas Nûrnberger, Marcin Detyniecki (eds.), LNCS, Volume 4398, Pages 223-232, Genève,
Suisse, Juillet 2006.
* Gaël Manson, Sid-Ahmed Berrani.Automatic TV Broadcast Structuring.International Journal of Digital
Multimedia Broadcasting, 2010.
Des thèses :
* Xavier Naturel. Structuration automatique de flux vidéos de télévision. Thèse de l'Université de Rennes 1, Avril
2007.
* Gaël Manson. Délinéarisation automatique de flux de télévision. Thèse de l'Université de Rennes 1, Juillet
2010.
2/2
Téléchargement