Je nach Aufgabenstellung können PTZ-Kameras in Video-Konferenz- oder Multifunktionsräumen sehr vorteilhaft eingesetzt werden. Stets gilt es, Aufwand und Nutzen in Relation zu setzen.
Der Einsatz von Webcams für Kollaboration, Video-Konferenz und Streaming ist spätestens seit der Pandemie selbstverständlich. Statische Kamerasysteme sind in kleineren Konferenzräumen häufig in der Nähe eines zentralen Displays oder einer Projektionsfläche installiert. Sie arbeiten meist mit einem vorgegebenen Blickwinkel und übertragen das Livebild in einer festen Größendarstellung. Oft sind sie in Videobars integriert oder an Soundbars angedockt.
In größeren Konferenzräumen stoßen diese Lösungen jedoch schnell an ihre Grenzen. In der Totalen sind zwar alle Teilnehmer im Bild sichtbar, aber je nach Position nicht gut erkennbar, eben nicht groß genug im Bild. Das führt zu Livebildern, die zugeschaltete externe Konferenzteilnehmer oder Betrachter eines Videostreams nicht mehr zufriedenstellend mitverfolgen können. Kommt dann noch eine stärkere Bildkompression hinzu, stößt eine ausreichende Erkennbarkeit an ihre Grenzen.
Eine Lösung für größere Räumlichkeiten bieten PTZ- und ePTZ-Kameras, deren Blickwinkel und Bildgrößendarstellung variabel sind. Die Namensbezeichnung beschreibt dabei die Funktionen: PTZ steht für Pan, Tilt und Zoom. PTZ-Kameras sind in der Lage, mittels Mechanik zu schwenken, den Neigungswinkel anzupassen und den Zoom-Faktor des Objektivs zu verändern. Im Vergleich zur fest installierten statischen Webcam, kann die PTZ-Kamera also gezielt verschiedene Konferenzteilnehmer im Raum fokussieren und dabei in einer gut erkennbaren Größe abbilden.
Bei ePTZ-Kameras wird auf die Kamerabewegung verzichtet. Das Teilbild eines großen Sensors wird dynamisch verwendet hinsichtlich des Ausschnitts und der Bildlage. Digital-Zoom und Crop-Faktor ermöglichen das variable Livebild. Diese Freiheitsgrade, unabhängig ob PTZ oder ePTZ, bieten nicht nur die Möglichkeit der flexiblen Bildgestaltung, sondern erfordern anderseits auch die Handhabung, diese Bildvarianz dramaturgisch und/oder szenisch zu steuern, damit sinnvolle und ansprechende Bildmotive übertragen werden.
Verschiedene PTZ-Technologien für die Live-Übertragung
Gregor von Ungern-Sternberg ist bei macom AV-Senior Consultant und Projekt Manager. Er betreut unter anderem Projekte in den Bereichen Corporate AV Videokonferenz- und Veranstaltungsräume sowie Studiotechnik. Er sieht im Produkt-Angebot eine Dreiteilung: „Da gibt es im oberen Bereich die PTZ-Kameras, die mechanisch arbeiten. Am unteren Ende stehen die Kameras mit Großformatsensor – 4k und größer – und deren Kamera-Konzept ohne bewegliche optomechanische Komponenten ausgelegt ist. Die Funktionen Pan und Crop, ähnlich wie bei der Filmproduktion, liefern Software-gesteuert Livebilder in kleinerer Zielauflösung, z. B. Full-HD.
Dazwischen existieren noch einige Speziallösungen: beispielsweise Kameras, die den Sensor in Millimeterdimension seitlich drehen können, um eine gewisse seitliche Ausrichtung des Blickwinkels zu ermöglichen. Oder die Cisco Webex Quadcam, die über mehrere fest angeordnete Optiken verfügt. Mit den insgesamt vier Optiken wird der Bereich der sitzenden Personen am Konferenztisch erfasst und systemintern der jeweils am besten geeignete Bildausschnitt automatisch gewählt. Das System verfügt dabei über eine Weitwinkelkamera für die Totale sowie drei Kameras mit Teleoptik und engerem Erfassungsbereich, alle jeweils mit 5K-Auflösung.
Das System ermittelt über ein Mikrofonarray automatisch den aktiven Sprecher und wählt die am besten geeignete Kamera aus. Innerhalb des jeweiligen Kamerabilds erfolgt zudem ein digitaler Zoom sowie ein Pan und Zoom. All dies erfolgt Software-gesteuert im Gerät, und es wird am Ausgang ein standardmäßiges HDMI-Signal ausgegeben.“ Der Hersteller sieht die Quad-Kamera-Leiste im Einsatz für Konferenzräume mit bis zu 14 Teilnehmern. „Es sei angemerkt, dass die volle Funktionalität nur in Verbindung mit einem Cisco Videokonferenz-Codec nutzbar ist,“ merkt Gregor von Ungern-Sternberg zu dieser Lösung an.
Eine weitere Speziallösung hat der Hersteller Poly mit der Eagle Eye Director II im Programm, die weitgehend die gleiche Funktionalität abdeckt. Hier sind es drei getrennte Kameras: eine Weitwinkel-Übersichtskamera und zwei „klassische“ PTZs mit Zoom u.s.w., dazu noch ein Mikrofonarray. Der versierte Fachplaner von Ungern-Sternberg erklärt die Merkmale: „An dem System sind drei Features sehr interessant, im Vergleich zu dem Cisco- System: Es arbeitet komplett autark, unter anderem auch per USB, und kann so mit beliebigen Kommunikationslösungen kombiniert werden. Standardmäßig macht das System automatisch ein Bild-in-Bild aus dem Übersichtsbild (Weitwinkel) und Close Up. Das lässt sich natürlich bei Bedarf abschalten.
Es können zwei solcher Eagle-Eye- Systeme recht einfach kaskadiert werden, auch hier arbeitet das Ganze voll automatisch. Man kann damit z. B. in einem größeren Raum das folgende Szenario abdecken: normales Meeting, Kamera an Raumfront macht Speaker Tracking. Ein Teilnehmer steht auf und geht nach vorne, um einen Vortrag zu halten. Daraufhin schaltet das System vollautomatisch auf die zweite Kamera, die an der Raumrückseite steht/hängt, und trackt nun den Vortragenden. Das Ganze funktioniert in den Demovideos wirklich beeindruckend. Wir haben auch ein aktuelles Projekt mit dieser Konfiguration, das wird aber erst im September spielbereit sein.“
Allen aufgeführten Technologien ist gemeinsam, dass sie, fertig installiert, eben nicht wie Standard-Webcams auf einen Blickwinkel und eine Bildgröße festgelegt sind, sondern dynamisch eingesetzt werden können, sei es mittels Mechanik oder Elektronik oder Software.
Auch wenn Standard-Webcams PTZ-Kameras in der Regel qualitativ unterlegen sind und weniger Optionen bieten, so ist ihre Handhabung denkbar einfach, und es sind keine weiteren Betrachtungen außer der Live-Schaltung zu beachten. Bei PTZ-/ ePTZ-Systemen ist das anders, sie müssen für den effektiven und dynamischen Einsatz gesteuert werden. Hanna Blochum, Product Managerin beim AV-Distributor Exertis Pro AV, beschreibt die aktuellen gängigen Techniken für gesteuerte PTZ-Systeme: „Letztendlich geht es darum, die PTZ-Kamera im Raum auszurichten, so dass Bildgröße und Bildwinkel zur Veranstaltung, zur Szene passen. Häufig orientieren sich die Systeme am Speaker, und die Kamera wird danach ausgerichtet.“
Alternativ oder ergänzend können Joysticks oder Fernbedienungen oder auch eine Mediensteuerungen auf einem Tablet o. Ä. zur Steuerung verwendet werden. Mittels abgespeicherter Presets können Kamera-Positionen aufgerufen werden. Video-Konferenzkameras können je nach Ausführung auch selbst erkennen, wie viele Personen sich im Raum befinden, beispielsweise unter Einsatz von Gesichtserkennungssystemen. Neben einem Tracking der Audioereignisse können auch Funk- oder IR-Signale zur Ortung im Raum genutzt werden. Hierbei tragen die zu verfolgenden Personen einen Sender mit sich, z. B. um den Hals oder um den Arm. Dank leistungsfähiger und präziser Decken-Mikrofon-Arrays ist das Audio-Tracking jedoch weiter verbreitet.
Aber auch bei einem derartigen zonenbasierten System müssen Fallunterscheidungen getroffen werden und in der Steuerung realisiert werden. „In der Regel befindet sich die festinstallierte Kamera in der Nähe des Displays oder auch einer Projektion. Die sprechende Person wird ins Bild genommen. Bei Rednerwechsel schwenkt die Kamera auf die neue sprechende Person. Die Bildveränderung erfolgt dabei für den Betrachter visuell nachvollziehbar in zwei oder auch drei Sekunden. Bei einer einzigen Kamera im Raum ist diese für die gesamte Session „im On“. Bildschnitte sind hierbei nicht vorgesehen. Die Bilddramaturgie basiert ausschließlich auf der Bewegung der PTZ-Kamera“, so Hanna Blochum abschließend.
Von den Herstellern der Audiosysteme gibt es vorgefertigte Software-Module, „so dass nicht jeder Integrator/ Programmierer von Anfang an programmieren muss“, so Gregor von Ungern-Sternberg. „Eine Stufe luxuriöser“ ist nach seiner Auffassung ein bildbasiertes Tracking mit Bild- und Gesichtserkennung, „was mittlerweile erstaunlich gut funktioniert. In komplexeren Räumen oder, wenn es in Richtung Event geht, bin ich Verfechter von stabileren Verfahren, sprich unabhängigen Tracking-Lösungen auf Funk- oder Infrarotbasis. Diese liefern zuverlässige Tracking- Koordinaten, die von der Kamera verarbeitet werden können. So sind dann auch sanfte Fahrten möglich, die dem Sprecher folgen, sowie eine stabile Handhabung komplexer Situationen mit mehreren Protagonisten bzw. flexiblen Raumausrichtungen und Spielflächen. Damit sind wir dann aber weit entfernt vom Meeting-Raum, eher im größeren Multifunktionsraum, schon wegen der Kosten.“ Systeme, mit denen per Hand voreingestellte Presets abarbeitet werden, sind seiner Meinung nach nicht „State of the Art“ und werden „oftmals nicht mehr akzeptiert“.
Die Steuerung der PTZ-Kamera ist wesentlich, um die Nutzung zu ermöglichen. Während in der Vergangenheit die Steuerung oftmals durch einen eingewiesenen Konferenzteilnehmer z. B. über eine Mediensteuerung im Raum erfolgte oder bei größeren Meetings oder Veranstaltungen von einer mit Technikern besetzten Bildregie durchgeführt wurde, sind aktuell vermehrt automatisierte Lösungen gefragt.
Gregor von Ungern-Sternberg berichtet von bisherigen Projekten: „Da hatten viele Kunden schon vor Jahren PTZ-Kameras installiert. Die ließen sich durchaus mehrere ‚dumme Kameras‘ in den Raum montieren, und stellten später fest, dass sie sich ständig und kostenintensiv Techniker in eine Bildregie setzen mussten für die Steuerung der Kameras. Das ist aktuell beim Austausch alter Technik nicht mehr erwünscht.“ Und so wird inzwischen auf intelligente und automatisierbare Systeme gesetzt, die nach Möglichkeit und Einsatz ohne personelle Bedienung auskommen.
Eine weitere treibende Kraft sind die Erfahrungen der Kunden selbst, ergänzt Gregor von Ungern-Sternberg: „Auch hier spielt Corona eine Rolle. Kunden nutzten verstärkt Streaming-Studios für Online- oder Hybrid-Veranstaltungen und erlebten den Einsatz moderner Systeme, beispielsweise mit automatisierten Kamerafahrten, statt Hin- und Her-Schalten von Kamerabildern.“
Und so sind intelligente PTZ-Systeme gefragt, die mittels Automation langfristig personelle Aufwände reduzieren. Hanna Blochum beschreibt die Funktionsweise von Systemen, die analytisch und logisch verknüpft arbeiten: „Tongesteuert oder über Gesichts-/Haar- und Kleidererkennung werden Redner verfolgt, die sich beispielsweise referierend vor einem Bild bewegen. Zonen können vordefiniert werden, um den Sprecher aktiv zu halten, selbst wenn eine zweite Person ins Bild läuft. Mit Timeouts werden Rednerwechsel definiert, wenn z. B. ein Redner die definierte Zone über eine vorgegebene Zeit hinaus verlässt und nicht wiederkommt. Kamerasysteme können Personengruppen erkennen und logisch verknüpft in eine totale Ansicht fahren.“
Abfolgen von Rednern können also automatisch gehandhabt werden und komplette Streaming-Veranstaltungen für die Bildübertragung vordefiniert werden. Jedoch ist der Erfolg stark von der Konferenzraumarchitektur, der Art der Anwendungen und der gewünschten Kameratechnik abhängig. „Wie sehen die Szenarien aus? Welche technische Ausstattung hat der Raum? Was soll von einem entfernt sitzenden Teilnehmer gesteuert werden können? Sollen bestimmte Protokolle unterstützt werden wie VISCA oder NDI? Welche Konnektivitäten erfordert die Infrastruktur? Sind die PTZ-Kameras für die gewünschten Konferenz-Tools zertifiziert oder getestet?“
(Bild: macom)
Das sind wesentliche Fragen für die Wahl der richtigen Technik, bestätigt Hanna Blochum. Ganz grundsätzlich stellt sich auch die Frage, ab welcher Konferenzraum-Dimension der Einsatz von PTZ-Kameras sinnvoll ist?
Diese Frage kann Gregor von Ungern-Sternberg beantworten: „In kleinen Meeting-Räumen lohnen sich PTZ-Kameras nicht. Hier habe ich eine feste Kameraposition; ein Bildwechsel zwischen den Teilnehmern führt schnell zu einer hektischen Bilddramaturgie, beispielsweise bei einem Audiotracking des gesprochenen Worts. Da die Anwender keinen Einfluss auf die Logik des Systems haben, wird es in vielen Kundenumgebungen abgeschaltet werden.“
Im klassischen Meeting- oder Konferenzraum sieht er in der Regel maximal eine PTZ-Kamera im Einsatz. Und er erkennt die Tendenz, dass diese Raumgrößen oftmals nicht mehr vom Fachplaner, sondern von der hauseigenen IT-Abteilung realisiert werden. Das kann seiner Einschätzung nach problematisch sein, weil häufig die Positionierung Tisch/Personen/Kamera ungünstig ausfällt und beispielsweise die Raumakustik oder die Lichtsituation nur ungenügend berücksichtigt werden.
In der Folge sind Personen im Bild ungünstig „angeschnitten“, und das Audiotracking mit Mikrofon-Array arbeitet nicht vernünftig und wird ebenfalls einfach abgeschaltet. Erst bei größeren Räumen lohnt ein effektiver und automatisierte Einsatz von PTZ-Kameras. „Beispielsweise in Multifunktionsräumen mit 80 bis 150 Quadratmetern, da finden keine Gruppenbesprechungen mit sechs Personen statt, sondern eher Abteilungsmeetings oder Veranstaltungen. Und angesichts der Pandemie wird für diese Räume verstärkt in moderne Videokonferenz- und Streaming-Technik, also auch PTZ-Kameras, investiert. Gleichzeitig besteht dabei die Forderung, dass keine Techniker in Regien für den Betrieb nötig sind. Kleinere Veranstaltungen werden mit Presets für Raumsituationen in Abhängigkeit von Szenerien und Bestuhlungssituationen gesteuert. Größere sollen automatisiert erfolgen, auch unter Einsatz von Tracking-Technologien“, erklärt der Fachplaner. So hoffen die Betreiber auf eine „verlässliche und reproduzierbare Qualität, die einheitlich ausschaut, ohne dass jedes Mal mehrere Leute vom Eventdienstleister hinzu gebucht werden müssen“.
Es ist nicht verwunderlich, dass seit Beginn der Pandemie das Interesse an hochwertigen Live-Übertragungen im Rahmen von Videokonferenzen und Streamings stark gestiegen ist und damit auch die Nachfrage nach PTZ-Systemen. Neben bekannten Einsatzgebieten sind neue entstanden: „Zu gängigen Videoübertragungen in Unternehmen und an Universitäten entstehen verstärkt Anwendungen in Hotels oder auch in Kirchen. Da die Menschen sich nicht mehr auf Veranstaltungen treffen konnten, sind eben viele auf das Live-Streaming umgestiegen“, so Hanna Blochum.
Mit festinstallierten PTZ-Kameras können beispielsweise Unis oder Kirchen Vorlesungen und Gottesdienste online und hybrid an Studenten oder Gläubige übertragen. Automatisierte PTZ-Systeme ermöglichen aussagekräftigere Livebilder als statische Kameras, die ohne Zoom und räumliche Ausrichtung arbeiten. Gleichzeitig ist die passende Automation sehr sinnvoll, um Kosten für zusätzliche Techniker zu vermeiden, insbesondere bei stereotypen Veranstaltungsabfolgen, wie Vorlesungen oder auch Gottesdienste.
Ähnliche Nutzen finden sich auch im Broadcasting, allgemein bei Lehrstühlen und in medizinischen Einrichtungen. In der langen Dauer der Pandemie könnten so z. B. Medizinstudenten, die derzeit nur Online-Seminare belegen können, gestreamte OPs verfolgen. Derartige Technologien könnten also helfen, dem Ausbildungsrückstand in wichtigen Bereichen entgegenzuwirken.
Gregor von Ungern-Sternberg rät den Kunden grundsätzlich zu einer möglichst übersichtlichen Usability. So können z. B. über die Mediensteuerung in einem Multifunktionsraum für bestimmte Nutzungssituationen, unter Berücksichtigung der Veranstaltungsart mit ihrer spezifischen Bestuhlung, passende Szenen aufgerufen werden. Unterstützt werden kann das mit grafischen Raumansichten sowie eingezeichneten Kameraperspektiven und mit erkennbaren Blickwinkeln.
Deshalb ist es aus seiner Sicht einerseits sinnvoll, die PTZ-Kamerasteuerung in Mediensteuerungen zu implementieren, selbst wenn diese Anforderung zunächst nicht definiert wurde, „damit bei Zusatzwünschen nicht wieder von Anfang an eingestiegen werden muss“. Andererseits ist er ein Verfechter für die Reduzierung von Komplexität, „damit sich der Anwender nicht verheddert“. Bei aller Festlegung auf definierte Strukturen und Automation für hochwertige und selbst veranstaltete Events befürwortet er, „… dass auch handgeführte Kameras für die bestmögliche Übertragung von hochkarätigeren Veranstaltungen mit angeschlossen werden können. Auch wenn dann der Dienstleister seine Cases wieder in den Raum schiebt.“
Für hybride Veranstaltungen mit einem größeren Teilnehmerkreis vor Ort hält er es ferner für wichtig, dass trotz aktueller Fokussierung auf USB-C und NDI (Network Device Interface) für Steuerung und Streaming bei den PTZ-Kameras Bildsignale am Veranstaltungsort in hoher Qualität, z. B. HDMI oder HDSDI, mit geplant werden.
Gleichzeitig berichtet er aber auch von Kunden, die angesichts der Preise hochwertiger PTZ-Kameras erstaunt reagieren. Auch Fragen, warum nicht einfach die existenten PTZ-Überwachungskameras mitverwendet werden können, hat er schon zu hören bekommen. Doch so einfach ist das nicht: Während die Überwachungskamera strategisch im Raum hängt, soll die Live-Übertragungskamera nach dramaturgischen Gesichtspunkten positioniert sein.
Erstgenanntes System gehört zur sicherheitsrelevanten Gebäudetechnik im getrennten Netz, das praktisch bei jeder Helligkeit komprimierte Bilder zur Verfügung stellt. Letztgenannte PTZ-Kamera soll in möglichst hoher Bildqualität ansprechende Livebilder übertragen und benötigt dafür neben einer robusten Mechanik unter anderem auch eine hochwertige Optik und kann so Zoomfaktoren bis zu 30-fach abdecken, was mit digitalem Zoom nicht möglich ist.
Eher als derartige Diskussionen wünscht sich Gregor von Ungern-Sternberg nützliche Innovationen. So weiß er von Kunden, die Meetings und Workshops gemeinsam mit externen Teilnehmern durchführen und dabei weitere Webcam-Notebooks mit virtuellen „Teams“-Usern aufstellen, nur damit die extern zugeschalteten Personen den Verlauf der Veranstaltung noch besser mitverfolgen können als nur über das eine gestreamtes Videosignal aus dem Raum. Und er weiß, dass in den Entwicklungsabteilungen der Videokonferenzplattformen bereits über derartige Lösungen mit mehreren gleichzeitigen Kameraperspektiven nachgedacht wird.
Ein Bericht als dauerwerbesendung für Lumens
Nicht sehr objektiv