Digital Signal Processing Reference
In-Depth Information
6.3
Audiosignale
6.3.1 Einführung
Als Audiosignale bezeichnet man für gewöhnlich Signale, die aus akustischen Signalen
(Schalldruck) durch ein Mikrophon aufgenommen wurden bzw. Signale die - nach einer even-
tuellen Digital/Analog-Umsetzung - mit einem elektrischen Schallwandler für Menschen
hörbar gemacht werden können. Ein wichtiges Kennzeichen der Audiosignale ist ihr belegtes
Frequenzband. Einige typische Frequenzbänder sind in Tabelle 6-3 zusammengestellt.
Eine weitere Besonderheit von
Audiosignalen ist, dass sie über
kurze Zeitabschnitte ein charakte-
ristisches Verhalten zeigen, dieses
sich aber über der Zeit verändert.
Ein Beispiel für Sprache zeigt
Bild 6-2. Das mit einer PC Sound
Card digitalisierte Sprachsignal
„telecommunications laboratory“
zeigt erkennbar kurze Energie-
pakete, die typisch für Vokale
sind.
Tabelle 6-3 Frequenzbänder von Audiosignalen
Signaltyp
Frequenzband
für Menschen hörbare Geräusche
16...20 Hz bis 18…20 kHz
Telefonsprache
300 Hz bis 3.4 kHz
Audio für den UKW-Rundfunk
30 Hz bis 15 kHz
Ortungsschreie von Fledermäusen
8 bis 110 kHz
1
0.5
0
-0.5
-1
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
2
t in s o
Bild 6-2 Audiosignal „telecommunications laboratory“ ( dsplab6_1 )
Sollen nichtstationäre Signale, wie das Sprachsignal, analysiert werden, kommt der Kurzzeit-
Spektralanalyse eine besondere Bedeutung zu. Sie ist deshalb ein wichtiger Baustein moderner
Sprach- und Audiocodierverfahren sowie Verfahren zur Sprach- und Sprechererkennung.
Anmerkung: Typische Analyseintervalle für die Codierung von Telefonsprache sind 5 bis 20 ms, vgl. Bild
6-2.
Die Technik der Kurzeit-Spektralanalyse wird in Bild 6-3 vorgestellt. Aus dem zu unter-
suchenden Signal x [ n ] werden mit einer Fensterfolge w [ n ] Blöcke der Länge N heraus-
geschnitten. Für jeden Block wird die DFT berechnet und in der Regel der Betrag der DFT-
Koeffizienten grafisch dargestellt. Man erhält ein Wasserfalldiagram bzw. Spektrogramm .
Search WWH ::




Custom Search