1. MZ.de
  2. >
  3. Varia
  4. >
  5. Diktiersoftware: Diktiersoftware: Schneller und präziser als jede durchschnittliche Sekretärin

Diktiersoftware Diktiersoftware: Schneller und präziser als jede durchschnittliche Sekretärin

15.03.2004, 12:41
Unterstützung für die Büroarbeit - damit die Spracherkennungssoftware richtig funktioniert, muss sie erst die Aussprache des Nutzers "lernen". (Foto: dpa)
Unterstützung für die Büroarbeit - damit die Spracherkennungssoftware richtig funktioniert, muss sie erst die Aussprache des Nutzers "lernen". (Foto: dpa) Info Pro

München/Berlin/dpa. - Maschinen und Menschen verstehen sich einfach nicht: Dieser Schluss liegt nahe, wenn der Bildschirm «Sexterminvereinbarung» und «Kulturrummel Nation» anzeigt, obwohl dem Diktierprogramm doch «zwecks Terminvereinbarung» und «Kulturrevolution» gesagt wurden. Und trotzdem: haben sich Software und Benutzer erst aufeinander eingestellt, kann dies der Beginn einer produktiven Partnerschaft sein. So urteilt jedenfalls Peter Knaak von der Stiftung Warentest in Berlin nach einem Vergleich der sechs für Heimanwender wichtigsten Spracherkennungsprogramme.

Der in der Zeitschrift «test» (Ausgabe 01/2004) veröffentlichten Untersuchung zufolge liefern alle gängigen Programme brauchbare Ergebnisse: Fünf schnitten mit dem Qualitätsurteil gut ab. Das sind «Voice Pro 10 USB-Edition» von Linguatec (Preis: 199 Euro), von IBM «ViaVoice R 10 Pro Edition» (90 Euro) und «ViaVoice Standard Edition R 8.02» (50 Euro) sowie die Standard- (99 Euro) und Preferred-Versionen (179 Euro) von «ragon Naturally Speaking 7». Einzig «Voice Offive Premium 10» (179 Euro) von InterLinx bekam ein «befriedigend».

Zu empfehlen sind solche Programme laut Stiftung Warentest vor allem denjenigen, die diktieren wollen, während sie beide Hände frei haben müssen - beispielsweise Ärzte. Aber auch Rechtsanwälten, Steuerberatern und allen, die standardisierte Texte erstellen müssen, sind sie eine Hilfe. Ebenso Behinderten und allen, die mit der Tastatur auf Kriegsfuß stehen. «Für kreatives, lyrisches Schreiben taugen Spracherkennungsprogramme aber nicht», so das Fazit von Warentester Knaak. «Je spezieller und eingeschränkter der Wortschatz, desto einfacher die Handhabung.»

Einige der genannten Diktierprogramme beinhalten daher zum Beispiel auch gleich das Fachvokabular für Recht, Wirtschaft IT oder allgemeine Medizin. Wem das nicht reicht, der muss investieren: Die Firma info pro in Düsseldorf bietet beispielsweise für IBMs «ViaVoice R 10 Pro Edition» juristische und medizinische Fachvokabulare an, ebenso für Versicherungen, Banken und Behörden. Die Preise für eine Einzelplatzlizenz beginnen nach Angaben von Geschäftsführer Eckhard Kreier bei rund 500 Euro.

Spracherkennungsprogramme haben laut Kristina Lowatzki von Linguatec in München in den vergangenen Jahren einen enormen Entwicklungssprung gemacht: «Heute kann man von einer Erkennungsgenauigkeit von 98 Prozent ausgehen», so die Firmensprecherin. Das eigentliche Erkennen der Worte ist Lowatzki zufolge reine Statistik: Der Computer analysiert die Frequenzen und Lautstärke der aufgezeichneten Laute, vergleicht sie mit den Schallsignalen in seiner Datenbank und entscheidet sich dann für das wahrscheinlichste Wort.

Peter Knaak zufolge ist die Verbesserung der Programme vor allem in der Leistungssteigerung moderner Computer begründet, wodurch die Software das Gesprochene sehr schnell mit ihren Wörterbüchern und Grammatik-Datenbanken vergleichen kann. «Die eigentliche Spracherkennung ist gar nicht besser geworden, die Programme suchen jetzt aber spezieller», so Knaak.

Plug'n'play – das Einstöpseln und Spielen beziehungsweise Sprechen – ist mit den Programmen aber nicht machbar: Zuerst müsen alle Anwender durch das «Tal der Tränen», wie Knaak es nennt: Der Nutzer muss einen vorgegebenen Text diktieren, anhand dessen die Software die individuelle Aussprache des Nutzer lernen soll. Sind diese Klippen allerdings umschifft, darf der Nutzer seine Rechenmaschine zum Diktat bitten und dabei auch Höchstleistungen erwarten: Die Geschwindigkeit, mit welcher der Rechner der Stimme seines Befehlshabers folgt, liegt Peter Knaak zufolge über dem, was durchschnittliche Sekretärinnen verarbeiten können.

Um es soweit zu bringen, müssen sich Mensch und Maschine aufeinander einstellen: «Der Benutzer muss auch Diktieren können. Man muss lernen, sich einen Satz zurecht zu legen, bevor man ihn ausspricht», sagt Kristina Lowatzki. Die Software selbst sollte auch lernfähig sein. Vorteilhaft ist es laut Stiftung Warentest, wenn nicht erkannte Worte entweder eingetippt und noch einmal gesprochen oder Buchstabe für Buchstabe diktiert werden können. Die Fehlerquote lasse sich so deutlich senken.

Um das Korrekturlesen am Ende kommt dennoch keiner umhin: Schließlich fehlt der Software das Wissen, um Sätze in ihren Gesamtzusammenhang zu stellen. Aussagen wie «Der Gefangene floh», die nach dem Ändern der Groß- und Kleinschreibung einen völlig anderen Sinn erhalten - «der gefangene Floh» - stellen nach Angaben von Linguatec auch heute noch die meisten Programme vor große Probleme.

Beim Arbeiten mit Diktierprogrammen sind auch die technischen Grenzen zu bedenken: Spracherkennungsprogramme laufen nur in halbwegs ruhiger Umgebung. Zu Hause noch schnell einen Text zu diktieren, während immer wieder die Kinder ins Zimmer stürmen und schreien, weinen, quietschen, bleibt Peter Knaak zufolge ein unerfüllter Wunsch: «Kinderlärm haut die Programme schnell aus dem Tritt.»