Digital Signal Processing Reference
In-Depth Information
Die Signalblöcke können sich dabei, wie in
Bild 6-3, überlagern, um bei der Darstellung
zwischen den zeitlich aufeinanderfolgenden
Spektren weiche Übergänge zu haben. Für
eine effiziente Berechnung wird unter Be-
rücksichtigung der Randbedingungen der An-
wendung meist eine Blocklänge verwendet,
die eine Radix-2-FFT zulässt. Ergebnisse für
das Sprachsignal „telecommunications labora-
tory“ für die Blocklänge 512 und Verwendung
eines Hamming-Fensters sind in Bild 6-4 und
Bild 6-5 zu sehen.
Anmerkungen: (i) Zur Interpretation der Ergebnisse wird beispielhaft auf das Kurzzeitspektrum zwischen
etwa 0.8 bis 0.9 s hingewiesen. In beiden Bildern zeigen sich in diesem Zeitintervall relativ energiereiche
Anteile zwischen 3000 und 3500 Hz. Aus der Sprachverarbeitung ist bekannt, dass derartige Frequenz-
verteilungen bei Zischlauten resultieren. Tatsächlich wird in der Sprachprobe zwischen ca. 0.8 und 0.9 s
das „s“ am Ende des Wortes „telecommunications“ stimmhaft gesprochen. Eine Vergrößerung des Sig-
nals in Bild 6-2 mit der MATLAB-Zoom-Funktion (Lupe) zeigt einen für Zischlaute typischen rausch-
artigen Verlauf ganz im Gegensatz zu den eher kurzzeitig periodischen, energiereichen Abschnitten der
Vokale. (ii) Auch bei der Entwicklung moderner Hörgeräte und Hörhilfen (Cochlearinplantant, Innen-
ohrprothese) spielt die Kurzzeitspektralanalyse eine wichtige Rolle.
„Signalblock“ i
w i [ n ]
n
n i
n i + N 1
Bild 6-3 Zerlegung des Signals in Blöcke zur
Kurzzeit-Spektralanalyse
1
0.8
0.6
0.4
0.2
0
0
1
0.8
1000
0.6
2000
0.4
3000
0.2
4000
0
t in s o
f in Hz o
Bild 6-4 Wasserfalldiagramm des Audiosignals „telecommunications laboratory“ ( dsplab6_1 )
Search WWH ::




Custom Search