GdR Stic-Santé
    Présentation
Calendrier des Réunions
Organisation
Devenir Membre

Intranet
    Mon compte [Logout]
Demande de mission
Proposition de réunion
Annuaire des membres

Services
    Archive stic-sante-all
Bibliothèque
Manifestations satellites
Perte de mot de passe
Contact

Inter-GdR


© Stic-Santé
CNRS GdR 2873 / Inserm 
 Accueil   Kiosque   
 

Liste des Thèses et HDR Soutenues

[Soutenance de Thèse ou HdR]
Retour
BURRUS nicolas : Apprentissage a-contrario et architecture efficace pour la détection d'évènements visuels significatifs
Thèse ou HDR soutenue le 11/12/2008 à ENSTA, 32 Bd Victor, 75015 Paris, Salle Marie Curie
Contact : thierry.bernard@ensta.fr
Manuscrit : http://www.ensta.fr/~burrus/2008-these-burrus-apprentissage-acontrario.pdf
JuryThierry Bernard, directeur de thèse
Jacques Blanc-Talon, examinateur
Bertrand Collin, examinateur
Matthieu Cord, examinateur
Jean-Michel Jolion, directeur de thèse
Alain Mérigot, rapporteur
Lionel Moisan, rapporteur
DirectionThierry Bernard
Jean-Michel Jolion
LaboratoireENSTA, Paris
Résumé
Il est particulièrement difficile de développer des algorithmes de détection robustes en vision artificielle, à cause de la grande variabilité des images naturelles. Cette complexité amène généralement à introduire des paramètres choisis a priori qui limitent la portée des algorithmes. Récemment, en recherchant des évènements trop improbables pour être le fruit du hasard, l'approche statistique a-contrario a montré sa capacité à détecter des structures visuelles sans autre paramètre libre que le nombre moyen de fausses alarmes tolérées.

Les applications existantes reposent toutefois sur un cadre purement analytique qui requiert un travail important de modélisation, rend difficile l'utilisation de caractéristiques multiples et limite l'utilisation d'heuristiques de recherche dirigées par les données. Nous proposons dans cette thèse d'assouplir ces restrictions en ayant recours à de l'apprentissage pour les quantités non calculables analytiquement. Nous illustrons tout d'abord l'intérêt de la démarche à travers deux applications de bas niveau où l'apprentissage est effectué à partir d'images de bruit blanc : la détection de segments et la segmentation en régions homogènes. L'approche est ensuite appliquée à la détection d'objets à partir d'une base de photos, où nous montrons que quelques exemples d'images naturelles suffisent pour apprendre des seuils de décision robustes.

Enfin, nous remarquons que la monotonicité du raisonnement a-contrario permet d'intégrer incrémentalement des informations partielles. Cela nous conduit à proposer un algorithme ``anytime'' pour la détection d'objets, qui peut être stoppé à tout moment pour satisfaire à des contraintes temporelles.

Mots-Clefsvision, méthodes a-contrario, apprentissage statistique, segmentation, reconnaissance d'objets, anytime
Abstract
Because of the great variability of natural images, it is difficult to design robust detection algorithms in computer vision. This complexity generally leads to the introduction of a priori chosen parameters that limit the validity of the resulting algorithms. Recently, by searching for events that are very unlikely to be due to chance, the a-contrario statistical approach has proved successful to provide detection algorithms whose only free parameter is the tolerated average number of false alarms.

However, existing applications rely on a purely analytical framework that requires a big modeling effort, makes it difficult to use heterogeneous features and limits the use of data-driven search heuristics. In this thesis, we propose to overcome these restrictions by using statistical learning for quantities that cannot be computed analytically. The interest of this approach is first demonstrated through two low-level applications, where learning can be performed from white noise images: segment detection and segmentation into homogeneous regions. Our approach is then applied to object matching from a database of pictures, where we show that a few examples of natural images are sufficient to learn robust decision thresholds.

Finally, we notice that the monotonicity of a-contrario reasoning enables an incremental integration of partial data. This property leads us to propose an architecture for object detection which has an ``anytime'' behavior: it provides results all along its execution, the most salient first, and thus can be constrained to run in limited time.

KeyWordsComputer vision, a-contrario reasoning, statistical learning, segmentation, object detection, anytime