August 31

5 Schlüssel um Deinen Sprachassistenten zu monetarisieren

Ganz oben auf der Prioritätenliste aller Unternehmen steht das Thema Monetarisieren. Also die Frage, wie kann ich den ROI meines Sprachassistenten in Form von Einnahmen nachweisen?

Die Ära der Sprach-KI, die sich aktuell noch in den Kinderschuhen befindet, geht schnell in eine Phase der frühen Reife über. In den letzten vier Jahren haben technologische Verbesserungen eine bessere Ausbildung und eine breitere Verfügbarkeit von Sprach-KI-Technologie zu einer schnellen Akzeptanz in allen Branchen und auf der ganzen Welt geführt. Für Unternehmen, die bereits einen Sprachassistenten in mindestens einem Kanal implementiert haben, gehören Omnichannel-Spracherlebnisse mit multimodalem Zugang zu den nächsten Schritten auf ihrer Voice AI-Reise.  

Von Anfang an bestand das Ziel der Sprach-KI darin die Customer Journey zu vereinfachen. Menschen sollen mit der Technologie so interagieren können, wie sie es untereinander tun - nämlich durch einfaches Sprechen. Dieses Vorhaben hat Unternehmen aller Branchen dazu veranlasst die Reibungsverluste für ihre Kunden und Interessenten zu verringern. Also haben sie ihre mobilen Apps, Hardwaregeräte, Kontaktzentren, Kioske in Geschäften und vieles mehr sprachfähig gemacht. Laut einem Bericht von Opus Research war bisher der größte Indikator für den Erfolg dieser sprachgesteuerten Benutzeroberflächen deren Fähigkeit, die Kundenzufriedenheit und die Net Promoter Scores zu verbessern.


Hier findest Du fünf wichtige Überlegungen für Unternehmen, die den nächsten Schritt auf ihrem Weg zum monetarisieren ihrer Sprachassistenten in Erwägung ziehen:

  1. Implementierung einer konversationellen Schnittstelle
  2. Verstehen von Kontext und Absicht
  3. Personalisierung und Datenschutz
  4. Eine globale Perspektive für Ihre Sprachassistentenstrategie einnehmen
  5. Multimodale Schnittstellen zur Verbesserung des Spracherlebnisses


1. Implementierung einer konversationellen Schnittstelle

Bevor Dein Sprachassistent entlang der Customer Journey auch Kaufvorschläge machen kann, benötigst Du eine KI-Technologie welche die Sprache Deiner Nutzer versteht und auf natürliche, konversationelle Weise reagiert.

Die Teilnahme an einer Konversation ist für Sprachassistenten nur dann möglich, wenn deren Technologie so fortschrittlich ist, dass sie das natürliche Sprachverständnis (NLU) und die automatische Spracherkennung (ASR) in eine zusammenhängende Funktion integriert. Hierbei muss die Verzögerungszeit minimiert werden die bei den meisten Sprachassistenten auftritt, da sie die Konversation in zwei Schritten verarbeiten.

Das andere wesentliche Element eines Sprachassistenten ist seine Fähigkeit, Bedeutungen abzuleiten und präzise zu antworten. Für Sprachassistenten ergibt sich die Bedeutung aus den Inhaltsbereichen, auf die sie für deine Antworten zugreifen. Content Domains sind wie Skills oder Fähigkeiten für Alexa und Google, mit einem großen Unterschied: Content Domains sind Wissensbereiche, die von Fachexperten entwickelt und auf Sprach-KI-Plattformen verfügbar gemacht werden.

Content Domains sind wie Skills oder Fähigkeiten für Alexa und Google, mit einem großen Unterschied: Content Domains sind Wissensbereiche, die von Fachexperten entwickelt und auf Sprach-KI-Plattformen zur Verfügung gestellt werden.

Wenn deine sprachgesteuerte Benutzeroberfläche deinen Kunden hilft mit einem Gerät oder Produkt zu interagieren das für einen bestimmten Zweck entwickelt wurde (etwa zum Autofahren, Kühlen von Lebensmitteln, Waschen von Wäsche oder Bereitstellen von TV-Inhalten) erwarten sie wahrscheinlich, dass der Sprachassistent über spezielles Wissen verfügt. Wenn ihre Anfragen auf Ungenauigkeiten stoßen, werden sie schnell auf andere Interaktionsmöglichkeiten ausweichen und Ihren Sprachassistenten vielleicht für immer ignorieren.


2. Verstehen von Kontext und Absicht

Wir Menschen verstehen uns durch Worte in Verbindung mit dem Kontext einer Situation, um aus den Worten eine Bedeutung abzuleiten. Einer der Gründe, warum die Menschen ihre intelligenten Lautsprecher nur zum Einstellen von Timern, zur Unterhaltung, z. B. mit Musik, oder zum Einstellen von Erinnerungen verwenden, ist der fehlende Kontext, den diese Sprachassistenten zu den sich ändernden Umständen haben.

Andererseits ist der Erfolg, den einige Marken mit ihren sprachgesteuerten Benutzeroberflächen erzielt haben, wahrscheinlich auf das spezielle Wissen und die Fähigkeit zurückzuführen, den Kontext und die Absicht des Benutzers zu verstehen. Dieses Maß an präziser Reaktionsfähigkeit ist das Ergebnis kundenspezifischer Sprachassistentenlösungen, die auf der Grundlage umfangreicher Nutzerdaten und eines Verständnisses der Kundenbedürfnisse und -wünsche entwickelt wurden.

Andere Technologien, wie z.B. Deep Meaning Understanding™, ermöglichen es dem Benutzer das Gespräch fortzusetzen, ohne die Informationen zu wiederholen die er dem Sprachassistenten bereits mitgeteilt hat. Diese Art von Technologie ermöglicht es dem Sprachassistenten auf mehrere Fragen oder solche, die eine Vielzahl von Änderungen oder Verneinungen enthalten, einzugehen. Da Erwachsene von Natur aus in komplexen Sätzen sprechen, die über einfache Befehlsanweisungen hinausgehen, muss ein Sprachassistent, der Gesprächsintelligenz verspricht, mindestens so schlau sein wie sein Gesprächspartner - wenn nicht sogar noch schlauer, wenn er von der Person erwartet, dass sie sich weiter mit ihm beschäftigt.

Ein Sprachassistent, der Gesprächsintelligenz verspricht, muss mindestens so intelligent sein wie die Person, mit der er spricht - wenn er nicht sogar noch intelligenter ist, wenn er die Person so gut kennt, dass sie sich weiter mit ihm beschäftigt.

In naher Zukunft werden Fachwissen und die Fähigkeit, den Kontext und die Absicht zu verstehen, durch die Fähigkeit eines Sprachassistenten ergänzt werden auch die Emotionen des Benutzers zu verstehen. Erst dadurch wird ein wirklich personalisiertes Spracherlebnis geschaffen und so die Chance zum Monetarisieren.


3. Personalisierung und Datenschutz versus Monetarisieren

Personalisierte Spracherlebnisse gehören für viele Marken zu den Zielen der Sprach-KI. Auch wenn es schwierig ist die Daten der Nutzer zu schützen. Marken die hoffen, die Kluft zwischen Sicherheitsbedenken und der Nachfrage nach besseren Nutzererlebnissen zu überbrücken müssen sicherstellen, dass sie ihren Nutzern ihre Datenschutzrichtlinien klar vermitteln.

Um das Nutzererlebnis zu verbessern ist es außerdem unabdingbar, um die Erlaubnis zur Nutzung von Daten zu bitten. Diejenigen, die eine stärkere Personalisierung und die Bequemlichkeit eines Sprachassistenten wünschen, der Bedürfnisse und Wünsche vorhersehen kann, werden gerne ihre Daten mit einem Unternehmen teilen, dem sie vertrauen. Andere Nutzer sind vielleicht mit einer weniger persönlichen Erfahrung und etwas weniger Komfort zufrieden. Egal wofür sich ein Nutzer entscheidet - der Punkt ist, dass es seine Entscheidung ist und nicht die des Unternehmens, das den Sprachassistenten besitzt.

Unternehmen, die das Vertrauen und die Loyalität ihrer Kunden gewinnen wollen, werden den Weg zu personalisierten Spracherlebnissen nicht überstürzen, indem sie die Möglichkeit auslassen, die Zustimmung der Kunden einzuholen und ihre individuellen Wünsche und Bedürfnisse zu verstehen. Wirklich personalisierte Spracherlebnisse werden eine Partnerschaft zwischen Marken und Nutzern sein, mit dem Verständnis, dass das Unternehmen den Sprachassistenten als Service anbietet und nicht als Aufdringlichkeit.

Wirklich personalisierte Spracherlebnisse werden eine Partnerschaft zwischen Marken und Nutzern sein. Hier bietet das Unternehmen den Sprachassistenten als Dienstleistung und nicht als Aufdringlichkeit an.


4. Eine globale Perspektive für Ihre Sprachassistentenstrategie einnehmen

Wenn dein Sprachassistent nicht die Sprache deiner Nutzer spricht, wirst du nie die Möglichkeit zum Monetarisieren haben oder sogar Kundenbeziehungen zu schaffen. Selbst wenn deine Kunden und deine Sprachassistenten die gleiche Sprache sprechen ist das Verstehen von Akzentsprache ein Problem für viele Sprachbenutzerschnittstellen. Und die Menschen möchten in der Regel ihre Muttersprache sprechen.

Wenn du ein globales Unternehmen bist und einen einsprachigen Sprachassistenten auf den Markt bringen willst, dann mach nicht den Fehler diesen in allen Märkten anzubieten.

Nimm nur die Märkte ins Visier, in denen dein Sprachassistent die Hauptsprache Ihrer Nutzer spricht. Wenn du dann deine Spracherfahrung verbessert hast kannst du weitere Sprachen hinzufügen und in den Ländern und Regionen starten, in denen deine Nutzer gehört und verstanden werden können.

Nimm nur die Märkte ins Visier, in denen dein Sprachassistent die primäre Sprache deiner Nutzer spricht.

Wenn du von den Nutzern verlangst, dass sie sich an deinen Sprachassistenten anpassen sollen, dann werden sie sich mit Sicherheit von deinem sprachgesteuerten Dienst oder Hardwareprodukt abwenden. Selbst wenn du zu einem späteren Zeitpunkt eine Version des Sprachassistenten in der jeweiligen Muttersprache anbieten würdest ist die Aufgabe einen verärgerten Nutzer zu integrieren doppelt so schwer, wie jemanden dazu zu bringen, sich mit einem Sprachassistenten zu beschäftigen, der ihn von Anfang an versteht. So wird der Weg zum Monetarisieren geebnet.


5. Multimodale Schnittstellen zur Verbesserung des Spracherlebnisses

Neben der Sprache sind visuelle Bildschirme, die Möglichkeit zu tippen oder zu streichen, Gesten- und Blickerkennung, Daumenabdruck- und Gesichtserkennung Teil des neuen Zeitalters der KI-gestützten Schnittstellen für eine Vielzahl von Zwecken in verschiedenen Branchen. Die Voice-First-Ära war nie dazu gedacht andere Formen der Interaktion zu verdrängen. Sie ist vielmehr ein Weg mehr Möglichkeiten für den Zugang zu Ihrer Hardware und Ihren Dienstleistungen zu bieten.

Je mehr Wahlmöglichkeiten die Menschen haben wie und wann sie mit Ihren Produkten und Dienstleistungen interagieren, desto wahrscheinlicher ist es, dass sie proaktive oder reaktionsschnelle Kaufvorschläge hilfreich finden.

In manchen Fällen kann ein Fernsehbildschirm oder eine andere visuelle Schnittstelle die einzige Möglichkeit sein, eine Kaufentscheidung zu treffen - vor allem wenn das Aussehen des Produkts wichtig ist. In anderen Fällen kann es hilfreich sein eine Liste zu haben, auf die man sich beziehen kann, wenn man die Ergebnisse auf einem Bildschirm sieht, während sie vom Sprachassistenten vorgelesen werden. Natürlich gibt es immer wieder Situationen, wie z. B. im Auto, in denen eine visuelle Darstellung dem Erlebnis zuwiderlaufen würde - vor allem, wenn es um die Sicherheit des Fahrers geht.

Anstatt über die Vorteile der Sprache allein zu sprechen sollten Marken darüber reden, wie Sprache eine Komponente sein kann, um ihre Produktfunktionalität zu erweitern und die Kundenerfahrung zu verbessern, wenn sie in Kombination mit anderen Interaktionsarten als Teil einer multimodalen Benutzererfahrung verwendet wird.


Die Zukunft der Sprach-KI ist das Monetarisieren

Konversationelle Spracherlebnisse, die den Kontext und die Absicht verstehen und personalisierte Erlebnisse liefern, ohne die Privatsphäre der Kunden zu gefährden, sind die Säulen, auf denen das Monetarisieren von Sprachassistenten aufgebaut sind.


ÜBER DEN AUTOR

Peter Enkel ist Voice Consultant, Gründer der Agentur Masterclass Marketing, zertifizierter Berater für Marketing Automatisierung und leidenschaftlicher Rhetorik Coach der Jürgen Höller Academy. Wenn er nicht gerade seinen Kunden auf Alexa, Siri & Co. hilft, ist er für sein Leben gerne draußen in der Natur.


Das könnte dir auch gefallen

Kontakt aufnehmen

Name*
E-Mail*
Nachricht
0 of 350