Produkt: Professional System 03/2019
Professional System 03/2019
Special: AV & IT – GEFAHR ODER CHANCE? +++ SDVoE – Warum Interoperabilität wichtig ist +++ AES67, SMPTE ST 2110, AMWA NMOS – eine Übersicht +++ Variable Coverage im PHILIPS STADION EINDHOVEN +++ LED-Grundlagen: WÄRMEMANAGEMENT – Gewicht oder Geräuschentwicklung?
Gesichtserkennung mit 30.000 Merkmalen

Fraunhofer-Software SHORE

Die Gesichtserkennungs-Software „SHORE“ des Fraunhofer Instituts für Integrierte Schaltungen erkennt Geschlecht, Gemütszustand, Alter von Personen, die vor einer Digital Signage-Installation stehen. Was wird dabei genau erfasst und wie funktioniert die Technik, die dahinter steckt?

Zur Erfassung der Personen benötigt man eine beliebige Kamera, die mit einem Standard-PC verbunden werden kann. Im praktischen Einsatz sind von der einfachen Webcam bis zur Full-HD-Kamera verschiedenste Typen. Die Kamera sendet ihren Stream an die Software, die auf Windows- und Linux-Betriebssystemen lauffähig ist.

Anzeige

Damit ein Gesicht überhaupt als solches erkannt werden kann, muss es mindestens 24 × 24 Pixel groß abgebildet sein. Wenn die Software ein oder mehrere Gesichter erkannt hat, analysiert sie als nächstes, wo Augen und Mund sind und ob Augen und Mund offen oder geschlossen sind. In der dritten Stufe gleicht „SHORE“ das Gesicht mit einer Datenbank mit rund 30.000 Gesichtern ab. Gleichzeitig werden so genannte Kantenmerkmale und Strukturmerkmale des Gesichts analysiert und mit einer Datenbank von ebenfalls 30.000 Gesichtsmerkmalen abgeglichen. Für die Auswertung werden die 500 am besten zutreffenden Merkmale verwendet.

Die Software gibt zu jedem erkannten Gesicht in Echtzeit Werte für Geschlecht, Gemüts zu – stand und Alter aus. Darüber hinaus können auch Parameter, wie Kopfhaltung (direkt in die Kamera / an der Kamera vorbei) erfasst werden. Für die Beschreibung des Gemütszustands gibt es die vier Emotionsarten fröhlich, traurig, überrascht, wütend. Dabei sind die einzelnen Emotionen unterschiedlich schwierig zu erfassen. „Fröhlich“ wird bereits heute zu 80–90 % richtig erkannt. Bei „traurig“, „überrascht“ und „wütend“ liegt die Erkennungsrate erst bei circa 60 %. Die Alterserkennung hat eine Toleranz von ±10 Jahren und ist damit für eine Zielgruppenanalyse im Erwachsenenbereich gut geeignet. In der Zukunft sollen auch Bewegungen des Gesichts erkannt werden. So könnte man erfassen, wie konzentriert jemand in eine Richtung schaut und damit sein Interesse messen.

 

Produkt: Professional System 03/2019
Professional System 03/2019
Special: AV & IT – GEFAHR ODER CHANCE? +++ SDVoE – Warum Interoperabilität wichtig ist +++ AES67, SMPTE ST 2110, AMWA NMOS – eine Übersicht +++ Variable Coverage im PHILIPS STADION EINDHOVEN +++ LED-Grundlagen: WÄRMEMANAGEMENT – Gewicht oder Geräuschentwicklung?
Anzeige

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Das könnte Sie auch interessieren: