Français Anglais
Accueil Annuaire Plan du site
Accueil > Production scientifique > Thèses et habilitations
Production scientifique
Doctorat de

Doctorat
Equipe : Systèmes Parallèles

Real-time object tracking by descriptor/operator switching

Début le 01/01/2010
Direction : LACASSAGNE, Lionel

Ecole doctorale : ED STIC 580
Etablissement d'inscription : Université Paris-Saclay

Lieu de déroulement : IEF puis LRI

Soutenue le 03/12/2013 devant le jury composé de :
Encadrants: Michèle Gouiffès Maître de conférences, Université Paris-Sud XI, LIMSI
Lionel Lacassagne Maître de conferences, Université Paris-Sud XI, LRI
Rapporteurs : Alice Caplier, Professeur, Grenoble-INP, France
Guy Gogniat, Professeur, Université de Bretagne-Sud
Examinateurs: Thierry Chateau, Université Blaise Pascal, Clermont-Ferrand
Alain Tremeau, Professeur, Université Jean Monnet, Saint Etienne
Invité : Gregory Ligny, Consultant Senior chez Thales University Consulting

Activités de recherche :

Résumé :
Cette thèse propose un système de vision par ordinateur pour la détection et le suivi multi-cibles dans les vidéos.
Plusieurs contributions sont proposées, tout d’abord pour adapter automatiquement l’algorithme en fonction du
contexte dans un schéma de coopération de méthodes, ensuite pour définir des descripteurs à la fois discriminants et
compacts, et enfin pour accélérer les algorithmes et offrir une solution rapide utilisable dans des applications
embarquées.
Le système repose sur deux approches : d’une part sur les matrices de covariance de caractéristiques pour modéliser
l'information texture-couleur, d’autre part sur le flot-optique (KLT) d'un ensemble de points distribués uniformément
sur chaque objet (FoT pour Flock of Trackers). Afin d’améliorer la capacité de reconnaissance visuelle des descripteurs,
deux approches sont proposées. La première consiste en une adaptation des opérateurs LBP (pour Local Binary
Patterns) afin de les inclure dans les matrices de covariance. Cette méthode est appelée ELBCM pour Enhanced Local
Binary Covariance Matrices. La seconde approche se base sur l'analyse de différents espaces et invariants couleur afin
d’obtenir un descripteur discriminant et robuste aux changements d'illumination. Les diverses expérimentations mises
en oeuvre en suivi mais également en reconnaissance (de texture, de visages, de piétons) montrent des résultats très
prometteurs.
Ensuite, des mécanismes d’adaptation au contexte sont proposés : tout d’abord l'utilisation d’heuristiques de
changement contextuel entre différentes méthodes (Flock of Trackers, Covariance Tracking and Mean-Shift) pour
choisir à chaque instant la méthode la plus efficace et rapide, ensuite le suivi KLT de points d’intérêt couleur adapté à 
la saturation. Nous proposons également la ré-identification des cibles en utilisant un ensemble spatialement adapté de
descripteurs de covariance et la minimisation d'une fonction d'énergie discrète qui prend en compte le comportement
cinématique de l'ensemble des objets et modélise leur apparence.
Enfin, cette thèse propose une série d'optimisations pour accélérer l'algorithme de mise en correspondance par
covariance. La vectorisation des calculs (SIMD) et d'autres transformations scalaires et la fusion de boucles a rendu
possible l’exécution temps-réel de l'algorithme non seulement sur les processeurs Intel classiques mais aussi sur les
plateformes embarquées (processeurs ARM Cortex A9 et Intel ULV U9300).