Analizy przykładowych spektrogramów
Autor: dr inż. Marcin Just (DiagNova Technologies)Wpływ zakłóceń i szumów
Porównanie spektrogramu wąskopasmowego (długa głoska „a”) dla głosu z małą ilością zakłóceń nieharmonicznych i z dużą ilością zakłóceń przedstawiono na rys. 5.


Rys. 5. Dwa spektrogramy z różną ilością składowych nieharmonicznych: a) duża; b) mała
Przestrzenie pomiędzy poziomymi kreskami składowych harmonicznych w idealnym przypadku powinny być białe (a dokładniej znacznie jaśniejsze od sąsiednich kresek „harmonicznych”).
Te same próbki po operacji podbicia kontrastu przedstawiono na rys. 6. Wyraźnie widać szare wstawki składowych nieharmonicznych pomiędzy poziomymi kreskami składowych harmonicznych.


Rys. 6. Spektrogramy z rys. 5 po podbiciu kontrastu. Ilość składowych nieharmonicznych: a) duża; b) mała
Istotne jest, że w tym przypadku składowe nieharmoniczne równomiernie wypełniają obszar pomiędzy składowymi harmonicznymi, co wyraźnie widać na rys. 7 (powiększenie spektrogramów z rys. 5).


Rys. 7. Powiększenie spektrogramów z rys. 5. Ilość składowych nieharmonicznych: a) duża; b) mała
Taki obraz spektrograficzny charakterystyczny jest dla obecności szumów bez dodatkowych zniekształceń sygnału. Świadczyć to może o niepełnym zamknięciu fałdów wywołanym przez małą zmianę organiczną.
Dla przypadków głosów o niskiej częstotliwości F0 analizę szumów przeprowadzić można również na mocno „rozciągniętym” spektrogramie szerokopasmowym (rys. 8).


Rys. 8. Porównanie rozkładu energii w zakresie pojedynczych okresów dla przebiegu zaszumionego (a) i „czystego” (b)
O istnieniu szumów świadczy obecność wyższych składowych harmonicznych zwłaszcza przed momentem zamknięcia fałdów głosowych (efekt widoczny jako brak zmniejszenia zaciemnienie w kierunku prawym – rys. 8a).
Uboga struktura harmoniczna
W niektórych przypadkach generowany przez fałdy sygnał pobudzenia może być tak ubogi w częstotliwości harmoniczne, że struktura harmoniczna ogranicza się do dwóch, trzech linii na spektrogramie, co przedstawiono na rys. 9.

Rys. 9. Spektrogram głosu osoby po laryngektomii (wyraz „małżeństwo”)
Struktura formantowa jest tu zdecydowanie wyraźniejsza niż harmoniczna (rys. 10).

Rys. 10. Spektrogram z rys. 9 z zaznaczonym przebiegiem formantów
Spektrogramy takiego typu związane są zwykle z tworzeniem głosu przez struktury inne niż fałdy głosowe.
Zniekształcenia subharmoniczne
W przypadkach pewnych patologii lub stanów pozabiegowych (np. chordektomia) w głosie pojawić się mogą dosyć specyficzne zakłócenia – subharmoniczne. W głosie pojawiają się wtedy częstotliwości będące pewnym konkretnym ułamkiem F0: (1/2)F0, (1/3)F0, (1/4)F0 itd. oraz ich wielokrotnościami, np. (7/2)F0. Ilustracją wpływu subharmoniki (1/2)F0 mogą być spektrogramy z rys. 11a–11c i periogramy z rys. 12a–12c.

Rys. 11a. Wyjątkowo duży wpływ subharmoniki (1/2)F0 na postać spektrogramu (tylko dwa fragmenty bez subharmonik)

Rys. 11b. Mały wpływ subharmoniki (1/2)F0 na postać spektrogramu (tylko w jednym fragmencie)

Rys. 11c. Brak subharmonik

Rys. 12a. Wyjątkowo duży wpływ subharmonik na postać periogramu (tylko w zielonych polach brak)


Rys. 12b. Mały wpływ subharmonik na postać periogramu (czerwony kolor – linie subharmonik)
Istotny jest fakt, że linie związane z subharmonikami (kolejne wielokrotności subharmoniki) leżą pośrodku (oczywiście dla podstawowej częstotliwości subharmonicznej równej (1/2)F0) pomiędzy liniami częstotliwości harmonicznych (rys. 13).

Rys. 13. Powiększony fragment spektrogramu z widocznymi zakłóceniami subharmonicznymi
Obecność składowych nieharmonicznych, a zwłaszcza subharmonicznych, w zakresie niskich częstotliwości świadczy o zniekształceniach sygnału mowy. Zniekształcenia zwykle wywołane są nierównomierną pracą fałdów, różna pracą obu fałdów wywołaną porażeniem lub dużą zmianą organiczną. Rzadziej objawiają się w ten sposób małe zmiany organiczne. To, z jakim przypadkiem ma się do czynienia, zależy jeszcze od tego, czy zaburzenia na spektrogramie są stałe, czy chwilowe. W przypadku zaburzeń ciągłych istnieje duże prawdopodobieństwo istnienia dużych zmian typu organicznego, w przypadku zmian chwilowych często można spotkać zmęczeniowe porażenie fałdu głosowego lub mniejszą zmianę typu balotującego.