[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[FYI]:Echelon für die Strasse ?



aus:
http://www.bdw.de/bdw/ticker/tickerdetail.hbs?myrec=7178

Neues Spracherkennungs-Programm besser als der Mensch

(Meldung vom 8.10.1999)

Das erste technische System, das gesprochene Worte besser verstehen kann
als ein Mensch, stammt aus der University of Southern California. In
Vergleichstests hatte das "Berger-Liaw Neural Network Speaker Independent
Speech Recognition System" nicht nur sämtliche technischen
Spracherkennungssysteme weit hinter sich gelassen, sondern auch die besten
menschlichen Ohren übertroffen. Das war zuvor keinem anderen
Sprecher-unabhängigen Computersystem gelungen, so Theodore W. Berger,
Professor für biomedizinisches Ingenieurwesen und einer der Entwickler
des Systems.

Sogar aus tausendfach stärkerem Hintergrundlärm kann das System
menschliche Stimmen herausfiltern, während menschliche Ohren und Hirne
nur mit einem Bruchteil davon fertig werden. Und wird die "Zielstimme" von
Stimmengewirr überdeckt, etwa auf Cocktailparties oder in der
Bahnhofshalle, so versagen bisherige Spracherkennungssysteme bereits bei
mehr als 10 Prozent. Der Mensch muß bei etwas mehr Gewirr aufgeben,
während das Berger-Liaw-System noch zwei Drittel der gesprochenen Worte
erkennt, wenn das Stimmengewirr darum herum 560 mal lauter ist.

Auf das System warten vielfältige Anwendungsmöglichkeiten, von
stimmgesteuerten Rechnern und Maschinen über "Hörhilfen" für Taube
bis zum Erstellen automatischer Mitschriften von Debatten, bei welchen
zudem jeder einzelne Sprecher identifiziert wird.

Auch für die Erkennung anderer Laute ließe es sich einsetzen, etwa
für das Aufspüren von U-Booten in der Geräuschkulisse der Weltmeere,
oder zur Analyse medizinischer Überwachungsgeräte. Der Durchbruch
gelang durch einen fundamental neuen Denkansatz: Berger und sein Kollege
Jim-Shih Liaw orientierten sich beim Aufbau ihres neuronalen Netzwerkes
mehr als bisher an der Art und Weise, wie Signalcharakteristiken im
menschlichen Hirn verarbeitet werden. Es besteht aus nur 11 Neuronen mit 30
Verknüpfungen.

Trotzdem übertrifft aber alle bisherigen Systeme, so Berger, weil bei
deren Aufbau stets eine wichtige Dimension übersehen worden sei, man habe
die biologischen Vorbilder zu sehr simplifiziert: "Bisher hat man
Silizium-Neuronen nur diskrete Signale unterschiedlicher Stärke
übertragen lassen, ebenso getaktet wie der Computer, von
unveränderlicher Signaldauer. Doch bei lebenden Zellen ist die zeitliche
Dimension, sowohl beim anregenden Signal als auch bei der Antwort, ebenso
wichtig wie die Intensität."

[Quelle: Dörte Saße und USC]