Gesichtserkennung mit 30.000 Merkmalen

Fraunhofer-Software SHORE

von Markus Tischner, 12. Januar 2015

Die Gesichtserkennungs-Software „SHORE“ des Fraunhofer Instituts für Integrierte Schaltungen erkennt Geschlecht, Gemütszustand, Alter von Personen, die vor einer Digital Signage-Installation stehen. Was wird dabei genau erfasst und wie funktioniert die Technik, die dahinter steckt?

Zur Erfassung der Personen benötigt man eine beliebige Kamera, die mit einem Standard-PC verbunden werden kann. Im praktischen Einsatz sind von der einfachen Webcam bis zur Full-HD-Kamera verschiedenste Typen. Die Kamera sendet ihren Stream an die Software, die auf Windows- und Linux-Betriebssystemen lauffähig ist.

Damit ein Gesicht überhaupt als solches erkannt werden kann, muss es mindestens 24 × 24 Pixel groß abgebildet sein. Wenn die Software ein oder mehrere Gesichter erkannt hat, analysiert sie als nächstes, wo Augen und Mund sind und ob Augen und Mund offen oder geschlossen sind. In der dritten Stufe gleicht „SHORE“ das Gesicht mit einer Datenbank mit rund 30.000 Gesichtern ab. Gleichzeitig werden so genannte Kantenmerkmale und Strukturmerkmale des Gesichts analysiert und mit einer Datenbank von ebenfalls 30.000 Gesichtsmerkmalen abgeglichen. Für die Auswertung werden die 500 am besten zutreffenden Merkmale verwendet.

Die Software gibt zu jedem erkannten Gesicht in Echtzeit Werte für Geschlecht, Gemüts zu – stand und Alter aus. Darüber hinaus können auch Parameter, wie Kopfhaltung (direkt in die Kamera / an der Kamera vorbei) erfasst werden. Für die Beschreibung des Gemütszustands gibt es die vier Emotionsarten fröhlich, traurig, überrascht, wütend. Dabei sind die einzelnen Emotionen unterschiedlich schwierig zu erfassen. „Fröhlich“ wird bereits heute zu 80–90 % richtig erkannt. Bei „traurig“, „überrascht“ und „wütend“ liegt die Erkennungsrate erst bei circa 60 %. Die Alterserkennung hat eine Toleranz von ±10 Jahren und ist damit für eine Zielgruppenanalyse im Erwachsenenbereich gut geeignet. In der Zukunft sollen auch Bewegungen des Gesichts erkannt werden. So könnte man erfassen, wie konzentriert jemand in eine Richtung schaut und damit sein Interesse messen.