Startseite » Information & TK » Mensch-Maschine-Interaktion kein technisches Problem

Mensch-Maschine-Interaktion kein technisches Problem

Bonn – Die grosse Herausforderung bei Mensch-Maschine-Projekten besteht nach Ansicht des Tom Houwing von der Firma Voice Objects http://www.voiceobjects.com nicht nur in der Auswahl der Technik. Auch die Frage, wie man eine Datenbank ordentlich aufsetzt, strukturiert und programmiert, berührt ihn nicht. „Das ist Sache der Technik-Freaks und der Software-Gurus. Und es gibt inzwischen schon einige hervorragende technische Plattformen mit exzellenter Software“, so der gebürtige Holländer, der eigentlich ausgebildeter Musiker ist. „Wenn eine neue Technologie Fuss fassen soll – zumal eine, die eine so fundamentale Sache wie die menschliche Kommunikation bedient – dann ist man gut beraten, sich in die Welt des kommunizierenden Menschen zu versetzen. Und dem ist es egal, wie etwas funktioniert: Hauptsache es läuft und verursacht kein komisches Gefühl.“ Genau aus dem Grund interessiert sich Houwing für die Struktur und Logik von Dialogen, für Frage- und Antwort-Verhalten, aber auch für den Aufbau von Sprache, für Dialekte, Töne und Geräusche, die in einem natürlichen Gesprächsverlauf eine wesentliche, und nicht immer nur atmosphärische Rolle spielen.

Voice-User-Interface (VUI) – wieder einer dieser kryptischen Begriffe einer Welt von Technologiefreaks? „Nein. Eher eine absolute Notwendigkeit – und das Normalste von der Welt“, so Houwing. Er vergleicht Musik und Musik-Instrumente mit Soft- und Hardware: „Das Voice-User-Interface zwischen Noten und Instrument ist der Interpret, die Nutzerschnittstelle zwischen Soft- und Hardware beim Computer ist das artverwandte Graphical-User-Interface. Ziel und Aufgabe des VUI-Designers ist die genaue Beschreibung des Dialog-Verhaltens der Zielgruppe, die angesprochen werden soll“.

Für Helmut Reisinger, Geschäftsführer des Stuttgarter IT-Dienstleisters Nextiraone http://www.nextiraone.de ist die Spracherkennung kein Selbstzweck. Zwar realisiere sein Unternehmen eine grosse Anzahl dieser Projekte, doch sei immer Augenmass geboten. „Spracherkennung darf kein Overkill sein. Leider konzentriert sich eine nur teilweise informierte Öffentlichkeit auf die schlechten Beispiele. Ein sehr bekannter Fall illustriert meine These: In den 90er Jahren machte man den Fehler, dass man bei einem Anruf bei der Hotline der Kriminalpolizei in Florida plötzlich auf ein IVR kam. Dieser Einsatz ist falsch, da die Anrufer in der Regel im Stress sind und schnell etwas melden wollen. In diesem Fall müsste es selbstverständlich sein, auf Sprachcomputer zu verzichten“, sagt Reisinger. Der Kunde müsse das letzte Wort haben. So werden die meisten Menschen mittags um 12 Uhr keinen Sprachcomputer akzeptieren. „Doch bei ansteigender Tageszeit, also ab 17 oder 18 Uhr, wären viele froh, wenn sie auf einen Sprachcomputer treffen. Ausserhalb der üblichen Geschäftszeiten wird der Einsatz von Sprachautomatisierung vom Kunden also sehr wohl als Service und nicht als Zurückweisung empfunden“, weiss Reisinger.

Man dürfe dem Klienten nicht vorgaukeln, dass er mit einem Menschen spricht, sondern dass er mit ansteigender Tageszeit einen zusätzlichen automatisierten Service erhält. Massentauglichkeit werde bei der Sprachautomatisierung hergestellt, wenn der Nutzer nicht erst fünf Minuten benötigt, um über eine Kinohotline zu erfahren, wann und wo ein bestimmter Film läuft. Oder wenn man an die Bundesliga-Ergebnisse über die Sportauskunft erst nach mehreren Minuten kommt, wird der ein oder andere lieber das Radio, den Videotext oder das Internet nutzen. „Wenn wir heute feststellen, dass so viele Interactive Voice Response-Systeme (IVR) und Sprachapplikationen noch unattraktiv sind, dann liegt dass nicht daran, dass wir nicht die richtigen Experten oder die richtige Technik haben. Es gibt Mängel bei der Anwendung, da Sprachautomatisierung immer auf den konkreten Fall zugeschnitten sein muss. Banken, Versicherungen, Versandhäuser oder andere Unternehmen oder Institutionen müssen auf jeweils verschiedene Applikationen setzen“, erläutert Michael-Maria Bommer, Managing Director von Genesys http://www.genesys.de.

Jens Klemann, Geschäftsführer des Bad Homburger Beratungshauses Strateco http://www.strateco.de und Sprecher der Brancheninitiative Voice Business http://www.voiceaward.de, berichtet von ganz anderen Akzeptanzproblemen. Es sind nicht nur technische Mängel oder eine mangelhafte Anwendung, die den Einsatz von Sprachautomatisierung blockieren können. Strateco befragte über 80 Unternehmen, die eine solche Technik verwenden. Das Ergebnis: Weder die technische Seite noch die Akzeptanz des Anwenders sind das entscheidende Problem. „Es hapert oft an der Akzeptanz bei den Managern. Die Leute, die über den Einsatz von Sprachautomatisierung entscheiden, haben vielfach noch das alte Tonwahlverfahren DTMF im Kopf. Sie bringen dann Argumente nach dem Muster vor: Bei uns im Haus lässt sich nichts standardisieren und automatisieren, unsere Prozesse sind zu komplex. Hier ist eine Menge Aufklärungsarbeit vonnöten“, so Klemann.

Computer könnten unendlich mehr zur Vorbereitung von menschlichen Entscheidungen beitragen als heute, indem sie komplexe Prozesse simulieren, mögliche Szenarien errechnen und Handlungsalternativen aufzeigen. „Bisher ist Mensch-Technik-Kommunikation davon geprägt, dass der Mensch sich an die Maschine anpasst“, so Dr. Nicole Krämer, Dozentin am Psychologischen Institut der Universität Köln http://www.uni-koeln.de. Automatisierte Sprachdialog-Systeme müssten das umkehren.

„Das gilt vor allem für die bildliche Darstellung von natürlichsprachigen Dialogsystemen im Internet über Avatare oder Lingubots. Die Einbindung von Gestik und Mimik bietet Vorteile besonders bei der Beziehungsgestaltung zwischen Bot und Nutzer“, so Krämer. Eine Analogie zu Bot-Agenten (Bot in Anlehnung an „Roboter“ = Schwerarbeiter) an der telefonischen Schnittstelle liege allerdings nahe: Die Stimme macht’s möglich. Bot-Agenten, die auch seufzen können (Hhm: Ich kann die Information leider nicht finden!), Sound-Merkmale, die Prozesse kennzeichnen (Prozess läuft: Eine Tastatur klappert; Prozess beendet: Okay!), deren Stimme „lächelt“, haben nach Erkenntnissen von Krämer sozialisierende „Nebenwirkungen“ und machen Fehl-Leistungen verzeihlich.

Posted by on 12. August 2005. Filed under Information & TK. You can follow any responses to this entry through the RSS 2.0. You can leave a response or trackback to this entry

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Time limit is exhausted. Please reload CAPTCHA.


Blogverzeichnis - Blog Verzeichnis bloggerei.de Blog Top Liste - by TopBlogs.de Blogverzeichnis