Schattenblick →INFOPOOL →EUROPOOL → WISSENSCHAFT

FORSCHUNG/324: Sprache - Maschinen haben das Wort (research*eu)


research*eu Nr. 53 - September 2007
Magazin des Europäischen Forschungsraums

Maschinen haben das Wort

Von François Rebufat


Mit 23 Amtssprachen, also 253 unterschiedlichen Sprachenpaaren, ist Europa der bevorzugte Kontinent für die Entwicklung dessen, was die Franzosen als "traductique" bezeichnen. Im Deutschen würde man dazu "maschinelle Übersetzung" sagen. Während der Computer sich durch geschriebene Texte langsam durcharbeitet, steht man einem ganz anderen Problem gegenüber, wenn es um die direkte Übersetzung des gesprochenen Wortes geht. Die gesamte Sprachverarbeitungskette wird in einer Reihe komplexer Versuche bearbeitet, mit denen sich einige innovative Projekte befassen.

Infolge der Erweiterung Europas verwaltet die Kommission den größten Übersetzungsdienst der Welt. Er verfügt über einen Etat von über 1,1 Milliarde. Euro pro Jahr (1). 1750 Übersetzer werden zurzeit nur für die legislativen und/oder offiziellen Aufgaben der Union bemüht, während sehr viele andere Bedürfnisse, wie die Übersetzung von Publikationen, durch externe Ressourcen gedeckt werden (2). Aber die private Nachfrage, ob es sich nun um Dienstleistungen im audiovisuellen Bereich oder um kommerzielle und persönliche Angelegenheiten handelt, ist ebenfalls enorm, und technologische Lösungen sind noch weit davon entfernt, die reellen Erwartungen der Benutzer zu befriedigen. Der globale Übersetzungsmarkt hat tatsächlich die Grenzen der klassischen Softwarepakete, die Texte "Wort für Wort" entschlüsseln, erreicht. Diese haben sich in den vergangenen Jahren kaum weiterentwickelt. Eine Ausnahme davon bilden nur einige wenige Sprachenpaare, für die ausgereiftere Lösungen implementiert wurden (grammatikalische Analyse, zweisprachige Transferlexika usw.). Angesichts der grammatischen und semantischen Zweideutigkeiten bleibt die maschinelle Übersetzung ein Unterfangen, in dem der Zufall die Hauptrolle spielt und das außerdem eine Quelle für zahlreiche Interpretationsfehler ist.


Maschinelle Übersetzung mithilfe statistischer Methoden

Steht das französische Wort livre für ein Buch, eine Maß- oder Währungseinheit oder ist es eine Konjugationsform des Verbs livrer? Bezeichnet das englische Wort book ein Buch oder die Handlung des Reservierens? Um festzustellen, in welchem Kontext ein Wort steht, stützen sich neuartige Übersetzungslösungen auf sogenannte statistische Methoden. Obwohl der Computer selbst nicht "verstehen" kann, kann er doch aufgrund seiner Rechnerleistung in kürzester Zeit in einem Korpus von Millionen bereits übersetzter Sätze die beste Lösung finden.

Der von dem europäischen Konsortium TC-Star gewählte Ansatz zur Entwicklung seiner Übersetzungsmaschine umfasst ca. 3,5 Millionen Segmente mit Satzpaaren für Englisch-Spanisch und 8 Millionen für Mandarin-Englisch. "Um die beste Lösung zu finden, sucht diese Maschine im ganzen Textkorpus nach dem Source-Target-Paar, das statistisch gesehen am häufigsten repräsentiert ist", erklärt Khalid Choukri, einer der Partner und Leiter von ELDA (Evaluations and Language Ressources Distribution Agency). "Bei dieser Suche wird ein Baum mit allen möglichen Kombinationen erzeugt, der anhand von Regeln zur Auswahl der Möglichkeiten mithilfe syntaktischer und lexikografischer Kriterien verjüngt wird, die durch die möglichen Wortfolgen (des sogenannten Sprachmodells) unter Verwendung der Anzahl der Wörter erlernt werden. Das Endergebnis bildet die Kombination mit der besten statistischen Trefferquote."


Hin zur Revolution des gesprochenen Worts

Die Innovation bei diesem ehrgeizigen Projekt betrifft nicht nur die Verbesserung der Qualität der klassischen Übersetzungsmaschinen, d. h. die Übersetzung von schriftlichen Texten. TC-Star blickt noch weiter nach vorn. Das Konsortium möchte revolutionäre Übersetzungsprodukte weiter ausfeilen, die die gesprochene Sprache in Echtzeit von einer Sprache in die andere übertragen. Der Prozess, für den Spitzenforschung sowohl im Bereich der Spracherkennung als auch der Sprachsynthese notwendig ist, ist sehr kompliziert. Er beginnt bei der Aufzeichnung des Wortflusses und seiner Segmentierung, um die Wortkette von Umweltgeräuschen zu trennen und die Stimmen der verschiedenen Sprecher zu entmischen. Diese Wortsegmente werden anschließend in Phonemketten transkribiert und mithilfe eines Sprachmodells und eines Phonemwörterbuchs entschlüsselt. Daraus ergibt sich ein Text, der in die Übersetzungsmaschine eingegeben wird. Anschließend muss das Modul zur Sprachsynthese das Ergebnis in gesprochene Sprache umsetzen. "Dazu verwendet das Modul ein riesiges Korpus von Phonemaufnahmen, mit verschiedenen Intonationen und Dauern für ein und dasselbe Phonem", führt Khalid Choukri weiter aus. "Anhand von Regeln wird das passendste Wortsegment ausgewählt. Dabei werden Zeichensetzung und die durch das Spracherkennungsmodul gelieferten Informationen (Verzögerung, falsche Satzanfänge, grammatikalisch falsche Ausdrucksweise usw.) berücksichtigt. So erhält man eine künstliche Stimme, die zwar nicht fließend und ausdrucksvoll ist, aber die Merkmale der Stimme der Sprachquelle respektiert." Abschließend könnte dieses Sprachsynthesesystem auch mit den stimmlichen Eigenschaften einer bestimmten Person vorab parametrisiert werden. Die Wiedergabe würde dann eine stimmliche Form annehmen, die der Originalstimme im Hinblick auf Intonation und Sprechweise so nah wie möglich ist.

Auch wenn TC-Star zunächst daran interessiert ist, den europäischen Instanzen ein Sprachübersetzungswerkzeug an die Hand zu geben, lässt das Konsortium nicht die zahlreichen Anwendungen für die breite Masse außer Acht. Dazu gehören beispielsweise die Übersetzung von Fernsehsendungen, die Integration in die Fernsprechtechnik und, wieso auch nicht, die Konstruktion kleiner "tragbarer Übersetzer". Khalid Choukri ist dabei sehr optimistisch und hofft, dass sich diese Technologien in fünf bis zehn Jahren durchsetzen werden.


Anmerkungen:

(1) Zahl zitiert nach Karl-Johan Lönnroth, Generaldirektor der GD Übersetzung - siehe "Sprachtechnologien für Europa" -
www.tc-star.org/pubblicazioni/D17_HLT_DE.pdf

(2) Hierzu wurde das Projekt EuroMatrix gestartet, zu dem sich mehrere Universitäten zusammengeschlossen haben. Es befasst sich vor allem mit den sprachlichen Bedürfnissen eines erweiterten Europas und spielt die Rolle eines Observatoriums für die Fortschritte in der angewendeten maschinellen Übersetzung in die 21 Sprachen der Europäischen Union www.euromatrix.net

(i)
TC-Star - 11 Teilnehmer
6 Länder (DE-ES-IT-FI-FR-NL)
www.tc-star.org/


*


Objekte mit "automatischer Kommunikation"

Zu den Anwendungsbereichen, in denen die Sprachtechnologien die größten Fortschritte machen, gehört die Steuerung von Haushaltsgeräten per Sprachbefehl. Das europäische Projekt Talk (Tools for Ambient Linguistic Knowledge) entwickelt beispielsweise Erkennungssysteme für verbale Befehle, die an den Alltag angepasst sind. Wie auch in der Forschung von TC-Star besteht die Hauptaufgabe darin, Worte, die von verschiedenen Personen gesprochen werden, zu erkennen und daraus eine Übersetzung in der Form ausführbarer Befehle herzustellen. Zu diesem Zweck teilt Talk den gesprochenen Satz anhand einer formalen Grammatik mit semantischen Kriterien ein, die der Ausführung von Handlungen entsprechen. Eine solche interaktive Software ist lernfähig, da der Benutzer seine eigenen semantischen Regeln mündlich eingibt und es der Maschine ermöglicht, ihre Relevanzkriterien abzustimmen.

Ein anderes, noch zukunftsweisenderes Projekt ist ECAgents (Embodied and Communicating Agents). Es befasst sich mit der Entwicklung von "Kommunikationsstrukturen" zwischen elektronischen Mittlern - und ermöglicht ihnen dadurch den Austausch mit ihrer Umwelt, untereinander oder mit dem Menschen. Ehrgeiziges Ziel ist die Erweiterung der Funktionalitäten bestehender Geräte (Telefone, Wifi-Anschlüsse, Heimroboter usw.), um "automatisch kommunizierende" Werkzeuge zu schaffen. Alles Innovationen, die darauf achten müssen, sich nicht im Ton zu vergreifen.

(i)
www.talk-project.org/ecagents.istc.cnr.it/

*


Quelle:
research*eu Nr. 53 - September 2007, Seite 26-27
Magazin des Europäischen Forschungsraums
Copyright: Europäische Gemeinschaften, 2007
Herausgeber: Referat Information und Kommunikation der
GD Forschung der Europäischen Kommission
Chefredakteur: Michel Claessens
Redaktion: ML DG 1201, Boîte postale 2201, L-1022 Luxembourg
Telefon: 0032-2/295 99 71, Fax: 0032-2/295 82 20
E-Mail: research-eu@ec.europa.eu
Internet: http://ec.europa.eu./research/research-eu

research*eu erscheint zehn Mal im Jahr und wird auch
auf Englisch, Französisch und Spanisch herausgegeben.


veröffentlicht im Schattenblick zum 17. Januar 2008