Download PDF

Multi-View Object Class Recognition and Metadata Transfer (Herkenning van voorwerpsklassen vanuit meerdere aanzichten en overdracht van metadata)

Publication date: 2009-12-21

Author:

Thomas, Alexander
Van Gool, Luc

Keywords:

Computer Vision, PSI_VISICS

Abstract:

In het onderzoeksdomein van de computervisie is tijdens het laatste decennium de focus op specifieke objectherkenning verschoven naar het herkennen van voorwerpscategorieën. Het oorspronkelijke doel van het zoeken naar typische kenmerken die een specifiek voorwerp identificeren, is daardoor veranderd naar veralgemening over de verschillende uitzichten van voorwerpen binnen de klasse. De prestaties van de huidige herkenningssystemen voor voorwerpsklassen heeft een niveau bereikt dat toelaat om verder te kijken dan louter herkenning. In deze thesis wordt het bestaande Impliciete-Vormmodel (ISM) van Leibe & Schiele gebruikt als basis voor verder onderzoek. Eerst wordt het model uitgebreid zodat het meerdere aanzichten van de voorwerpsklasse kan herkennen. Zoals veel andere voorwerpsklasse-herkenningssystemen kan het oorspronkelijke ISM enkel een specifieke pose zoals een zijaanzicht herkennen. Door verbanden tussen de verschillende aanzichten te gebruiken, kan een efficiëntere en robuustere herkenning over meerdere aanzichten bekomen worden dan door gewoon een reeks detectoren voor specifieke aanzichten in parallel te gebruiken. Vervolgens wordt het herkenningssysteem uitgebreid met de mogelijkheid om verschillende soorten metadata-annotaties te genereren voor nooit eerder geziene voorwerpen van de categorie. Metadata kan eender welk soort informatie zijn die per pixel kan toegekend worden aan een beeld van het voorwerp. Bijvoorbeeld, een decompositie in onderdelen, of een dieptekaart. In de experimentele resultaten worden meerdere voorbeelden getoond van toepassingen die kunnen profiteren van deze vorm van cognitieve terugkoppeling. De experimenten evalueren zowel het vermogen tot het herkennen van voorwerpen in meerdere aanzichten, als de kwaliteit van metadata-annotaties over een scala van verschillende categorieën en soorten metadata. Tenslotte worden methoden geëvalueerd die herkenning meer robuust kunnen maken in moeilijke situaties.