| GdR Stic-Santé | |
|
Présentation
Calendrier des Réunions Organisation Devenir Membre |
|
|
Intranet |
|
|
Mon compte [Logout]
Demande de mission Proposition de réunion Annuaire des membres |
|
|
Services |
|
|
Archive stic-sante-all
Bibliothèque Manifestations satellites Perte de mot de passe Contact |
|
|
Inter-GdR |
|
|
© Stic-Santé CNRS GdR 2873 / Inserm |
|
| |||
| Retour | |||
| Jury | Thierry Bernard, directeur de thèse Jacques Blanc-Talon, examinateur Bertrand Collin, examinateur Matthieu Cord, examinateur Jean-Michel Jolion, directeur de thèse Alain Mérigot, rapporteur Lionel Moisan, rapporteur |
| Direction | Thierry Bernard Jean-Michel Jolion |
| Laboratoire | ENSTA, Paris |
| Résumé | Il est particulièrement difficile de développer des algorithmes de détection robustes en vision artificielle, à cause de la grande variabilité des images naturelles. Cette complexité amène généralement à introduire des paramètres choisis a priori qui limitent la portée des algorithmes. Récemment, en recherchant des évènements trop improbables pour être le fruit du hasard, l'approche statistique a-contrario a montré sa capacité à détecter des structures visuelles sans autre paramètre libre que le nombre moyen de fausses alarmes tolérées.
Les applications existantes reposent toutefois sur un cadre purement analytique qui requiert un travail important de modélisation, rend difficile l'utilisation de caractéristiques multiples et limite l'utilisation d'heuristiques de recherche dirigées par les données. Nous proposons dans cette thèse d'assouplir ces restrictions en ayant recours à de l'apprentissage pour les quantités non calculables analytiquement. Nous illustrons tout d'abord l'intérêt de la démarche à travers deux applications de bas niveau où l'apprentissage est effectué à partir d'images de bruit blanc : la détection de segments et la segmentation en régions homogènes. L'approche est ensuite appliquée à la détection d'objets à partir d'une base de photos, où nous montrons que quelques exemples d'images naturelles suffisent pour apprendre des seuils de décision robustes. Enfin, nous remarquons que la monotonicité du raisonnement a-contrario permet d'intégrer incrémentalement des informations partielles. Cela nous conduit à proposer un algorithme ``anytime'' pour la détection d'objets, qui peut être stoppé à tout moment pour satisfaire à des contraintes temporelles. |
| Mots-Clefs | vision, méthodes a-contrario, apprentissage statistique, segmentation, reconnaissance d'objets, anytime |
| Abstract | Because of the great variability of natural images, it is difficult to design robust detection algorithms in computer vision. This complexity generally leads to the introduction of a priori chosen parameters that limit the validity of the resulting algorithms. Recently, by searching for events that are very unlikely to be due to chance, the a-contrario statistical approach has proved successful to provide detection algorithms whose only free parameter is the tolerated average number of false alarms.
However, existing applications rely on a purely analytical framework that requires a big modeling effort, makes it difficult to use heterogeneous features and limits the use of data-driven search heuristics. In this thesis, we propose to overcome these restrictions by using statistical learning for quantities that cannot be computed analytically. The interest of this approach is first demonstrated through two low-level applications, where learning can be performed from white noise images: segment detection and segmentation into homogeneous regions. Our approach is then applied to object matching from a database of pictures, where we show that a few examples of natural images are sufficient to learn robust decision thresholds. Finally, we notice that the monotonicity of a-contrario reasoning enables an incremental integration of partial data. This property leads us to propose an architecture for object detection which has an ``anytime'' behavior: it provides results all along its execution, the most salient first, and thus can be constrained to run in limited time. |
| KeyWords | Computer vision, a-contrario reasoning, statistical learning, segmentation, object detection, anytime |