Alltägliche Sprachanwendungen, wie zum Beispiel Sprachsteuerung in der Hausautomation, Freisprechanlagen
für Mobiltelefonie oder Spracherkennung für Maschinen, sind auf zuverlässige Sprachverarbeitung
und -übertragung angewiesen. In all diese Anwendungen ist eine hohe Stabilität gegenüber
räumlich bedingtem Nachhall und Hintergrundgeräuschen notwendig. Um den störenden und unerwünschten
Einfluss von Hintergrundgeräuschen zu minimieren, ist eine Aufbereitung des Eingangssignals notwendig.
Während sich moderne Technologien f¨ur Sprachübertragung hauptsächlich auf die Filterung der Amplituden
eines Signals konzentrieren, versuchen wir über die bisherigen Möglichkeiten hinauszugehen,
indem wir zusätzlich die Phasenanteile berücksichtigen.
Dieser Beitrag gliedert sich in drei Teile: i) Entwicklung von Methoden zur Abschätzung der Phaseninformation
des ursprünglichen sauberen Quellensignals für eine qualitativ bessere Rekonstruktion
der Sprache. ii) Zweitens, die zuvor beschriebene Methode mit der Vorabinformation des Sprechers
zu erweitern. Dieses Wissen über die Identität des Anwenders kann für eine weitere Optimierung
des Sprachverbesserung verwendet werden. iii) Weiters sollen neue Gütemerkmale zur Abschätzung der
Leistungsfähigkeit von Sprachverbesserungsmethoden vorgestellt werden, die mit der menschlichen
Wahrnehmung der Qualität von Sprache stark korrelieren. Dadurch können aufwändige Hörtests vermieden
werden.