EIN GESPRÄCH MIT AR-PIONIER MARTIN HERDINA
Von Jana Riethausen
Martin Herdina ist seit 2010 eine prägende Figur in der Welt der Augmented Reality (AR). Der ehemalige Senior Director XR bei Qualcomm und Geschäftsführer des AR-Startups Wikitude gibt uns exklusive Einblicke in den Status quo der Technologie, die Rolle von Apple – und warum wir uns auf Überraschungen gefasst machen sollten.
Redaktion: Apple hat in diesem Jahr mit der Apple Vision Pro für viel Aufsehen gesorgt. Traditionell verfolgt Apple die „Wait-and-Perfect”-Strategie und steigt erst in neue Märkte ein, wenn die Technologie und das Verbraucherverhalten eine gewisse Reife erreicht haben. Was ist deine Einschätzung – wird AR bzw. „Spatial Computing“, wie man auch übergeordnet sagt, jetzt den Durchbruch schaffen?
Martin Herdina: Die Apple Vision Pro ist in meinen Augen ein Early-Adopter-Prototyp: extrem teuer, vollgepackt mit teurer Technologie, aber noch weit entfernt von einem Massenprodukt. Apple testet hier den Markt und zeigt, was möglich ist. Die Applikationen, die wir bislang gesehen haben, kratzen nur an der Oberfläche dessen, was das Gerät technologisch eigentlich kann. Mit zwölf Außenkameras und Video-Passthrough in extrem hoher Qualität zeigt Apple auf jeden Fall das Potenzial von Spatial Computing.
Aber um ehrlich zu sein: Das Gerät ist sperrig, schwer und hat eine kurze Akkulaufzeit – es ist ein Proof of Concept. Apple geht bewusst behutsam vor, um die Nutzer nicht zu überfordern. Der normale Verbraucher hat noch nie eine AR- oder VR-Brille aufgehabt. Und wenn du ihn dann mit all den Funktionen wie Gestenerkennung und 3D-Elementen konfrontierst, wird er wahrscheinlich erstmal überfordert sein. Darum fängt Apple mit einfachen Anwendungen an, die jeder versteht, wie Video-Streaming und räumliche Videos.
Wann werden wir mit AR-Brillen durch die Straßen spazieren?
Das hängt von mehreren Faktoren ab. Erstens muss die Technologie weiter miniaturisiert werden – die Geräte sind aktuell noch zu groß und schwer. Zweitens sind die aktuellen Use Cases noch nicht stark genug, um die breite Masse zu begeistern. Was Apple jetzt macht, ist ein vorsichtiger Markttest.
Ich denke, wir sehen zwei verschiedene Ansätze. Auf der einen Seite gibt es Headsets wie die Apple Vision Pro, die sehr immersive Erlebnisse bieten, aber eher für den Heimgebrauch gedacht sind. Auf der anderen Seite haben wir leichte Smart Glasses wie die Ray-Ban Brille von Meta, die viel weniger Funktionen bietet und aktuell noch gar kein Display hat, aber für den Outdoor-Einsatz entwickelt wurde. Sie werden von den Nutzern gut angenommen. Irgendwann werden sich diese Ansätze wahrscheinlich annähern.
Welche Anwendungsfälle sind denn für Unternehmen besonders vielversprechend?
Zwei Bereiche stehen ganz klar im Vordergrund: Fernunterstützung bzw. Remote Assist, und Training.
Nehmen wir das Beispiel einer Bohrplattform: Entweder fliegt ein Techniker per Helikopter hinaus, wenn es ein technisches Problem gibt, oder du versuchst, das Problem per Fernunterstützung zu lösen. Der Business Case ist hier eindeutig. Viele Unternehmen haben diesen Bereich bereits stark ausgebaut und erzielen damit sehr gute Ergebnisse.
Ein weiterer großer Bereich ist das Training. Besonders in Industrien, wo risikoreiche oder komplexe Arbeitsabläufe trainiert werden müssen, sind immersive Technologien und Smart Glasses unschlagbar. Ob es um das Training an Maschinen oder die Schulung von Mitarbeitenden in simulierten Gefahrenumgebungen geht – die Technologie ermöglicht es, sicher und mittelfristig auch sehr kosteneffizient zu arbeiten.
Bei AR-Brillen und Headsets gibt es zurzeit zwei Ansätze: Video-Passthrough und See-Through-Displays. Beim Video-Passthrough siehst du deine Umgebung über Kameras, die die Umgebung filmen und auf das Display übertragen. Bei See-Through-Displays hingegen blickst du durch ein transparentes Display und siehst die echte Welt direkt, überlagert mit digitalen Inhalten. Was ist aus deiner Sicht der bessere Ansatz für Unternehmen und warum?
Das ist eine spannende Frage. Video-Passthrough, wie es zum Beispiel die Apple Vision Pro nutzt, hat den Vorteil, dass du ein sehr immersives Erlebnis hast, ähnlich wie bei der Virtual Reality (VR). Aber: Du siehst die Realität nicht direkt, sondern nur als Video-Stream, was immer eine gewisse Verzögerung und mögliche Sicherheitsrisiken mit sich bringt. Besonders in kritischen Industrien ist das ein Problem. Deshalb setzen viele Unternehmen lieber auf See-Through-Displays, bei denen du die reale Welt siehst und digitale Inhalte darübergelegt werden.
Für den Produktiveinsatz, insbesondere in sicherheitskritischen Umgebungen, ist Seethrough definitiv die bessere Wahl. Video-Passthrough ist gut für Entertainment und Training in simulierten, eher statischen Umfeldern, aber in der Industrie sehe ich die Zukunft eher bei See-Through-Displays.
Was fehlt AR noch zum Durchbruch?
Die Geräte müssen leichter und günstiger werden, es braucht mehr Anwendungen, und vor allem muss der Content einfacher und günstiger zu produzieren sein. Aktuell sind viele AR-Use Cases noch zu komplex oder zu teuer in der Umsetzung. Ein Beispiel: Unternehmen entwickeln aufwändige 3D-Modelle für Work Instructions, aber am Ende reicht es den Technikern oft, wenn sie eine einfache PDF-Anleitung haben. Der Aufwand steht oft noch nicht im Verhältnis zum Nutzen.
Und natürlich fehlt immer noch der „Killer-Usecase“ – eine Anwendung, die so überzeugend ist, dass die breite Masse sie nutzen möchte. Bis dahin wird es noch einige Zeit dauern, aber die Richtung stimmt.
Ich denke, der Durchbruch wird in kleinen Schritten kommen, und die aktuellen smarten Brillen sind ein Vorgeschmack. KI-gesteuerte Modelle wie die Ray-Ban Meta verkaufen sich überraschend gut, obwohl sie nur eingeschränkte Funktionen bieten. Besonders interessant: Diese Geräte werden viele Nachahmer finden, vor allem in Asien. In den nächsten Jahren werden wir dort neue Modelle und Innovationen sehen, die den Markt in eine neue Richtung treiben. Überraschungen sind also vorprogrammiert!
Wie schätzt du die Rolle von Künstlicher Intelligenz und von Eye Tracking und für die Zukunft von AR ein?
Wie gesagt haben KI-Brillen bislang noch ein eingeschränktes Einsatzspektrum – sie können auf Sprachbefehle reagieren, Videos aufnehmen oder Anrufe tätigen. Doch es ist erstaunlich, wie gut sie sich verkaufen und wie positiv sie aufgenommen werden! Die nächste Generation dieser Brillen wird noch intelligenter und natürlicher in der Interaktion werden. Sie könnten zu einem ständigen Begleiter im Alltag werden – ähnlich wie unser Smartphone heute, aber noch nahtloser integriert.
Eye Tracking ergänzt diese Vision perfekt. Es geht weit über die einfache Steuerung hinaus, bei der du mit den Augen Objekte auswählst und per Micro-Gesture bestätigst – auch wenn das schon eine enorm intuitive Art der Interaktion ist, wie es Apple mit der Vision Pro demonstriert.
Aber das Potenzial von Eye Tracking ist viel größer. Es kann verwendet werden, um deinen emotionalen oder mentalen Zustand zu erkennen. Diese Informationen könnten in vielen Bereichen hilfreich sein – etwa in der Arbeitssicherheit oder im Gesundheitswesen, wo die Brille erkennen könnte, wenn jemand übermüdet oder gestresst ist.
Langfristig ist die Vision, dass AR-Brillen auf Basis dieser Technologien zu einer Art persönlichem Assistenten werden: Sie verstehen unsere Umgebung, reagieren auf unsere Bedürfnisse und arbeiten dabei so diskret wie möglich.
Viele denken bei Innovation automatisch an das Silicon Valley. Wie schätzt du die Innovationskraft in Europa in Bezug auf AR und Spatial Computing ein?
Europa und gerade der DACH-Raum sind extrem stark in der technologischen Innovation und der Grundlagenforschung. Viele der großen amerikanischen Tech-Unternehmen, wie Google oder Meta, haben hier bewusst ihre Entwicklungszentren, um von diesem Wissen zu profitieren. Institutionen wie die ETH Zürich, die TU Wien oder die TU Graz leisten hervorragende Arbeit, zum Beispiel im Bereich Computer Vision.
Allerdings haben die amerikanischen Player den Vorteil, dass sie über die Budgets und die Nutzerbasis verfügen, Innovationen schneller in den Markt zu drücken und zu forcieren. Europa spielt definitiv eine Schlüsselrolle bei der technologischen Innovation – aber wir müssen besser darin werden, diese Innovationen auch zu vermarkten bzw. sie schnell in marktfähige Produkte umzusetzen.
Du bist seit fast 15 Jahren im AR-Bereich tätig. Was fasziniert dich nach all den Jahren weiterhin daran?
Es ist die Vision, Teil der nächsten Generation von Computing zu sein. AR und Spatial Computing werden langfristig unser Leben verändern, und ich glaube, es wird auf eine Weise geschehen, die wir uns heute noch gar nicht vollständig vorstellen können. Dass ich in einer Zeit lebe, in der diese Entwicklung passiert, und sogar aktiv daran mitarbeiten kann – das ist einfach faszinierend.
Was mich besonders begeistert ist, wenn die Technologien echte Probleme lösen – sei es im Bereich Healthcare oder bei der Ausbildung in risikoreichen Berufen. Es ist schön zu sehen, wenn Technologie nicht nur für Unterhaltung genutzt wird, sondern echte, lebensverändernde Vorteile bietet.