Magazin INNOVATION
  • 23.08.2023

InWorld AI – Sprechen mit Sherlock Holmes, Zuckerberg und Cäsar

Bei ChatGPT spricht man mit einer Maschine. Faszinierend, klar, aber wie wäre es mit Elon Musk, Gandalf, Lara Croft oder Albert Einstein? Schon bald kann man mithilfe von InWorld AI mit seinen größten Helden chatten. Was bringt's? 

ChatGPT begeistert. Die KI hat die Wirtschaftswelt in Windeseile erobert. Mit einem Mal öffnete das Programm einen Zugang zu einer völlig neuen Welt, auf einmal konnten auch NIcht-Programmierer:innen mit Maschinen sprechen. Was aber ist, wenn man dieses Erlebnis noch intensiver gestalten könnte?

Und damit nun zu "InWorld": Stellt euch vor, ihr könntet euch mit euren Vorbildern aus der Weltgeschichte ins Gespräch gehen. Oder euch mit fiktiven Charakteren aus dem Fernsehen oder Hollywood unterhalten: Was würde ein Darth Vader einem wohl erzählen? Wie verliefe ein Gespräch mit Elon Musk? Wie eine Audienz bei Julius Cäsar? Albern – würden wohl die meisten denken. 

Aber: Die Firma „InWorld“ möchte uns genau diese Erlebnisse liefern und arbeitet zusammen mit bekannten Entwicklern an VR-Erfahrungen, die einem die Kinnlade herunterklappen lassen. Und wir haben uns natürlich gefragt, was ihr im (Berufs-)Alltag davon habt. 

 

 Was ist InWorld?

 

InWorld ist ein 2021 gegründetes Startup, das auf Basis von ChatGPT-3 eine Software entwickelt hat, mit der man realistische Konversationen mit KI-Avataren führen kann. Als Entwickler schreibt man lediglich eine Charakterisierung und gibt an, auf welche Informationen ein Avatar sich fokussieren soll.

Das Programm bastelt daraufhin eine Figur, die unendlich lange chatten kann, ohne sich zu wiederholen. Die Software kann einem die Avatare nicht nur als Chat-Bots ausgeben, sondern auch als 3D-Modelle, die man personalisieren kann – Julius Cäsar stünde also tatsächlich vor einem.

Hier ein Beispiel: Im Spiel "InWorld Origins" schlüpft man in die Rolle eines Detektivs, der beauftragt ist, ein Verbrechen in einer Roboterwelt aufzuklären. Um das Rätsel zu lösen, muss man zahlreiche Zeugen befragen, die alle unterschiedlichen Informationen bereithalten.

Dabei ist jedoch Vorsicht geboten. Denn nicht alle Aussagen stimmen. Die Herausforderung liegt darin, die richtigen Informationen herauszufiltern und so Schritt für Schritt ein vollständiges Gesamtbild des Verbrechens zu rekonstruieren. Die Zeugen sind alle unterschiedlich charakterisiert. Einer von ihnen ist sehr passiv-aggressiv und wartet nur darauf, dass man sich verspricht. Ein anderer ist sehr ängstlich und muss beruhigt werden.

Sie alle haben öffentliche Basisinformationen über die Spielwelt und können einem von ihr erzählen, aber jede:r einzelne von ihnen kennt auch exklusive Informationen, die die Handlung vorantreiben können. Die Gesichtsanimationen sind bei ihnen allen an ihre Persönlichkeit gekoppelt. Das heißt, dass der wütende Roboter, solange er sich wütend fühlt, auch so schaut. Mit den richtigen Sätzen kann man aber auch ihn zum Lächeln bringen.

Alle Interaktionen des Spieles laufen über eine Sprachfunktion und müssen nicht abgetippt werden. Das Ganze funktioniert so gut, dass man weder einen Knopf zum Sprechen drücken muss, noch ein Hinweis gibt, dass man den Satz beendet hat. Eine Konversation endet erst, wenn der Spieler es will.

Man kann auch am Thema vorbei, die KI über die Deutsche Bundesliga oder das internationale Geschehen ausfragen. Diese versucht daraufhin eine kreative, an ihre Persönlichkeit angepasste Antwort darauf zu geben. Das Ganze funktioniert so gut, dass man dabei echt ins Staunen kommt.

 

 Wie kann man das im Unternehmen nutzen?

"Context matters when it comes to interactions with AI. An e-commerce business and AAA game need different models."

Der wohl logischste Use-Case findet sich in Schulungsprogrammen. Arbeiten deine Mitarbeiter nah am Kunden, kannst du sie mit einem KI-Avatar auf alle möglichen Situationen vorbereiten. So lernt man auch mit impulsiven, oder einfach unpräzisen Kunden und ihren Wünschen umzugehen, ohne direkt im realen Leben einer wahren Feuertaufe ausgesetzt zu sein.

Besonders für das Medizinstudium lassen sich hiermit unter anderem auch sehr realistische Patientensituationen erstellen. Hier müsste man einem bedürftigen Avatar Fragen stellen, um am Ende die richtige Diagnose geben zu können. Eine solche Software bietet Sicherheit, denn man läuft nicht in Gefahr, dass ein Anfänger, einem echten Patienten, eine verheerende Fehldiagnose ausspricht.

Im Bildungssektor ließe sich auch Geschichts- und Sozialkunde Unterricht deutlich immersiver gestalten. Mit oder ohne der Hilfe von VR-Brillen, könnte man sich mit Rittern, Königen, Präsidenten und fernen Kulturen unterhalten. InWorld wirbt selbst auch mit der Nutzung der Avatare als „Digital Brand Ambassadors“. Sie könnten die Kunden über Produkte aufklären und alle ihre Fragen beantworten.

 

Woran fehlt es dem Programm noch?

 

Bei unendlichen Sprachausgaben haben es Synchronsprecher natürlich schwer, denn sie müssten theoretisch den ganzen Duden einsprechen. Alternativ könnte man zwar anhand von Aufnahmen die Stimme der Person virtuell imitieren, jedoch klingt das oft nicht realistisch genug und raubt vielen damit die Immersion. Außerdem kann man das noch nicht schnell genug mit Avatar-KI verschmelzen lassen, ohne dass alles robotisch klingt und dabei längere Gesprächspausen entstehen. Man muss dementsprechend noch mit einer Auswahl an Roboterstimmen von InWorld selbst auskommen.

Für Unternehmen könnte es außerdem teuer werden. Nicht nur zahlt man ewig die Abo-Gebühren von InWorld für deren Software, sondern muss sich die Avatare ja auch noch selbst erstellen. Dass man diese wirklich nutzen kann, braucht es Entwickler, die die Kosten noch weiter in die Höhe treiben.

Möchte man also Cäsar ultrarealistisch und in 4K Auflösung, muss man auch dementsprechend tief in die Tasche greifen. Die Software ist zwar sehr laienfreundlich, aber ohne weitere Kenntnisse recht begrenzt.

JETZT TEILEN:
Portrait von Jason Michael Schmitt

Über den Autor: 

Jason M. Schmitt ist ein vielseitiger Fachmann mit Expertise in digitalem Marketing, Sales, Social Media und Content-Erstellung.

KEMWEB wird robotspaceship!

Unleashing the power of Innovation