Frank Gerwarth von Reichelt Elektronik über Sprachassistenz:

Voice – die Benutzeroberfläche der Zukunft?

von Moritz Hell

Egal ob Amazon, Apple, Google oder Microsoft, jeder der ganz Großen aus der Tech-Branche möchte den stark umkämpften Markt der Sprachassistenten für sich beanspruchen. Die jährlich steigenden Verkaufszahlen zeigen deutlich, dass die Technologie immer relevanter für uns wird. Es wird sogar spekuliert, dass Sprachtechnologie sich zur Benutzeroberfläche der Zukunft entwickelt.

Frank Gerwarth, Produktmanager für Sprachassistenzsysteme bei Reichelt Elektronik, stellt sich der Frage, ob wir in Zukunft noch physikalische Eingabegeräte benötigen, um einen Computer oder andere elektronische Geräte zu bedienen und welche Herausforderungen die Sprachassistenztechnologie dafür überwinden muss.

Frank Gerwarth (Bild: Reichelt Elektronik)

Historie und Weiterentwicklung der Benutzeroberfläche

Bei genauerem Hinsehen zur Entwicklung von Benutzeroberflächen von Computern und Anwendungen lässt sich feststellen, dass die Bedienung technischer Geräte immer mehr an unsere menschliche Interaktion angepasst wird: Waren Computer in der Verwendung anfangs noch so abstrakt, dass sie ausschließlich von Experten bedient werden konnten, änderte sich dies durch die Einführung kompakter PC-Systeme und neuer Ein- und Ausgabegeräte. Die erste Computermaus machte 1968 die Nutzung der Desktopcomputer für ein wesentlich breiteres Publikum zugänglich.

Die aktuelle Entwicklung von Touchscreens geht noch einen Schritt weiter: Diese reagieren bereits auf natürliche Gesten wie Tippen oder Wischen. Ist es da nicht eine logische Folge, dass Sprache als nächste Stufe auf der Leiter zu noch intuitiverer Benutzung und Steuerung von elektronischen Geräten und Anwendungen folgt? Das Ergebnis wäre eine Mischung aus Augmented Reality, Gesten und Sprachbefehlen, die uns helfen sollen, Geräte noch einfacher zu steuern.

Herausforderungen an die Sprachtechnologie

Herausforderung 1: Sicherheitsbedenken

Einfach sprechen statt die Eingabe in das Gerät per Touchscreen einzugeben – das ist für den Verbraucher weitaus intuitiver und meist schneller. Es bleibt jedoch ein Spagat, den Nutzer vollbringen müssen: Einerseits ist der Wunsch groß, dass der digitale Assistent eine echte Hilfestellung und Erleichterung für den Alltag bieten kann – und dafür muss er den Nutzer gut verstehen. Um dies zu gewährleisten, ist es jedoch nötig, dass der Nutzer Informationen über sich preisgibt, die der Sprachassistent mithilfe von künstlicher Intelligenz verarbeitet, um daraus lernen zu können.

Diese Informationen freizugeben, widerstrebt jedoch vielen Nutzern, da sie bei den Sprachassistenten Sicherheitsbedenken vermuten. Dies hat eine im März 2019 durchgeführte Studie von OnePoll im Auftrag von Reichelt Elektronik bestätigt. Selbst unter denjenigen, die bereits einen Sprachassistenten nutzen, hat ein signifikanter Teil (40%) Sicherheitsbedenken – ganze 77 Prozent von ihnen sagen, dass sie speziell bei der Speicherung ihrer Daten Sorgen haben. Keines der aktuellen Modelle ist schon so weit ausgereift, dass es diese Bedenken beseitigen kann.

Herausforderung 2: Geschlechtervorurteile überwinden

Alexa, Siri, Cortana – die bekanntesten und beliebtesten Sprachassistenten haben allesamt weibliche Stimmen und werden als weiblich wahrgenommen. In ihrer Rolle als stets geduldige, devote Helferinnen, die fraglos alle Befehle befolgen, bestärkt das veraltete Rollenbilder – so ein kürzlich erschienener Bericht der UNESCO. Als besonders prekär wird herausgehoben, dass die Sprachassistentinnen auf sexuelle Anspielungen oder Beschimpfungen meist nachsichtig oder sogar flirtend reagieren.

Hier wird deutlich, dass künstliche Intelligenz keineswegs neutral, sondern stark von den Daten beeinflusst ist, mit denen sie trainiert wird. So übertragen sich menschengemachte Vorurteile und Diskriminierung auf den digitalen Helfer. Die Hersteller stehen also vor der großen Herausforderung, bestehende Geschlechtervorurteile in ihren Systemen abzubauen, um für Gleichheit zu sorgen und für alle Nutzer – egal welchen Geschlechts – eine gute Nutzererfahrung zu bieten.

Herausforderung 3: Nutzung an öffentlichen Orten

Eine weitere Schwierigkeit, die noch nicht ausreichend zu Ende diskutiert wurde, ist die Nutzung einer sprachlichen Benutzeroberfläche in öffentlichen Räumen, wie Zügen oder Restaurants. Kritisch ist in einem solchen Szenario zum Beispiel, dass die Umstehenden die Spracheingabe mithören könnten. Dadurch würden persönliche Informationen nicht nur an den Adressaten, sondern an alle Personen im näheren Umfeld weitergeben.

Ein weiterer Punkt, der bei der Durchsetzung der Sprache als Eingabemodus eine Rolle spielt, ist der Aspekt der Lärmbelästigung. Wenn beispielsweise ein gesamtes Zugabteil lautstark mit seinem Sprachassistent sprechen würde, anstatt auf dem Smartphone oder Tablet zu tippen oder zu wischen, gäbe es einen immensen Anstieg des Lärmpegels.

Herausforderung 4: Spracherkennung

In den letzten Jahren hat sich die Sprachentwicklung um ein Vielfaches verbessert und die Hersteller arbeiten fieberhaft daran, die Technologie kontinuierlich voranzutreiben. Dennoch liegt die Erkennungsrate der Worte immer noch nicht bei 100 Prozent.

Schwierig wird es zusätzlich, wenn die Person versucht, mit dem Sprachassistenten in einem Dialekt zu sprechen. Dieser Eindruck wird von Verbrauchern bestätigt. Ganze 75 Prozent der Befragten geben an, nicht überzeugt zu sein, dass ihre Eingaben korrekt verstanden werden.

Sprachtechnologie kommt vor allem im Smart Home und im Auto zum Einsatz

Auch wenn die Nutzung von Sprachassistenten als Benutzeroberfläche prognostiziert wird, gilt es noch ein paar Hürden zu meistern, damit der Nutzer dies als wirkliche Bereicherung wahrnimmt. Nichts desto trotz werden die Sprachsysteme immer besser und erobern immer mehr Lebensbereiche.

Ein großer Vorteil gegenüber dem Tippen ist, dass die Hände dabei frei sind. Das ist auch der Grund, warum Spracheingabe bisher vor allem im Smart-Home-Bereich eingesetzt wird. Ein weiterer Bereich, der gerade erobert wird, ist das Auto. Hier liegt der Vorteil klar auf der Hand: Der Fahrer kann sich die Nachrichten vorlesen lassen und den Assistenten mit weiteren sprachlichen Anleitungen bedienen – die Hände bleiben dabei am Lenkrad.

Daraus kann geschlossen werden, dass Sprachassistenten sich momentan überall dort durchsetzen, wo wir meist mit vorranging anderen Dingen beschäftigt sind oder beide Hände für eine bestimmte Tätigkeit benötigen. Die Bedienung von Technik wird so beinahe zur Nebensache. Dass sie das Smartphone in naher Zukunft komplett ablösen, ist nicht zu erwarten, doch sie haben das Potential, unseren Umgang mit Technologie grundlegend zu verändern.

www.reichelt.at

Bericht der UNESCO über den Zusammenhang zwischen Rollenbildern und Sprachassistenz

Ähnliche Artikel

Hinterlassen Sie einen Kommentar

* Zur Speicherung Ihres Namens und Ihrer E-Mailadresse klicken Sie bitte oben. Durch Absenden Ihres Kommentars stimmen Sie der möglichen Veröffentlichung zu.

Unseren Newsletter abonnieren - jetzt!

Neueste Nachrichten aus der Licht- und Elektrotechnik bestellen.