Analiza akustyczna głosu w praktyce laryngologicznej

Część II: Zastosowanie analizy akustycznej w praktyce

Analizy przykładowych spektrogramów

Autor: dr inż. Marcin Just (DiagNova Technologies)

Wpływ zakłóceń i szumów

Porównanie spektrogramu wąskopasmowego (długa głoska „a”) dla głosu z małą ilością zakłóceń nieharmonicznych i z dużą ilością zakłóceń przedstawiono na rys. 5.

a) Dwa spektrogramy z różną ilością składowych nieharmonicznych
b) Dwa spektrogramy z różną ilością składowych nieharmonicznych

Rys. 5. Dwa spektrogramy z różną ilością składowych nieharmonicznych: a) duża; b) mała

Przestrzenie pomiędzy poziomymi kreskami składowych harmonicznych w idealnym przypadku powinny być białe (a dokładniej znacznie jaśniejsze od sąsiednich kresek „harmonicznych”).

Te same próbki po operacji podbicia kontrastu przedstawiono na rys. 6. Wyraźnie widać szare wstawki składowych nieharmonicznych pomiędzy poziomymi kreskami składowych harmonicznych.

a) spektrogram
b) spektrogramy

Rys. 6. Spektrogramy z rys. 5 po podbiciu kontrastu. Ilość składowych nieharmonicznych: a) duża; b) mała

Istotne jest, że w tym przypadku składowe nieharmoniczne równomiernie wypełniają obszar pomiędzy składowymi harmonicznymi, co wyraźnie widać na rys. 7 (powiększenie spektrogramów z rys. 5).

a) spektrogram
b) spektrogram

Rys. 7. Powiększenie spektrogramów z rys. 5. Ilość składowych nieharmonicznych: a) duża; b) mała

Taki obraz spektrograficzny charakterystyczny jest dla obecności szumów bez dodatkowych zniekształceń sygnału. Świadczyć to może o niepełnym zamknięciu fałdów wywołanym przez małą zmianę organiczną.

Dla przypadków głosów o niskiej częstotliwości F0 analizę szumów przeprowadzić można również na mocno „rozciągniętym” spektrogramie szerokopasmowym (rys. 8).

a) Porównanie rozkładu energii w zakresie pojedynczych okresów dla przebiegu zaszumionego
b) Porównanie rozkładu energii w zakresie pojedynczych okresów dla przebiegu „czystego”

Rys. 8. Porównanie rozkładu energii w zakresie pojedynczych okresów dla przebiegu zaszumionego (a) i „czystego” (b)

O istnieniu szumów świadczy obecność wyższych składowych harmonicznych zwłaszcza przed momentem zamknięcia fałdów głosowych (efekt widoczny jako brak zmniejszenia zaciemnienie w kierunku prawym – rys. 8a).

Uboga struktura harmoniczna

W niektórych przypadkach generowany przez fałdy sygnał pobudzenia może być tak ubogi w częstotliwości harmoniczne, że struktura harmoniczna ogranicza się do dwóch, trzech linii na spektrogramie, co przedstawiono na rys. 9.

Spektrogram głosu osoby po laryngektomii

Rys. 9. Spektrogram głosu osoby po laryngektomii (wyraz „małżeństwo”)

Struktura formantowa jest tu zdecydowanie wyraźniejsza niż harmoniczna (rys. 10).

Spektrogram z zaznaczonym przebiegiem formantów

Rys. 10. Spektrogram z rys. 9 z zaznaczonym przebiegiem formantów

Spektrogramy takiego typu związane są zwykle z tworzeniem głosu przez struktury inne niż fałdy głosowe.

Zniekształcenia subharmoniczne

W przypadkach pewnych patologii lub stanów pozabiegowych (np. chordektomia) w głosie pojawić się mogą dosyć specyficzne zakłócenia – subharmoniczne. W głosie pojawiają się wtedy częstotliwości będące pewnym konkretnym ułamkiem F0: (1/2)F0, (1/3)F0, (1/4)F0 itd. oraz ich wielokrotnościami, np. (7/2)F0. Ilustracją wpływu subharmoniki (1/2)F0 mogą być spektrogramy z rys. 11a–11c i periogramy z rys. 12a–12c.

Wyjątkowo duży wpływ subharmoniki na postać spektrogramu

Rys. 11a. Wyjątkowo duży wpływ subharmoniki (1/2)F0 na postać spektrogramu (tylko dwa fragmenty bez subharmonik)

Wyjątkowo duży wpływ subharmoniki na postać spektrogramu

Rys. 11b. Mały wpływ subharmoniki (1/2)F0 na postać spektrogramu (tylko w jednym fragmencie)

Brak subharmonik

Rys. 11c. Brak subharmonik

Wyjątkowo duży wpływ subharmonik na postać periogramu

Rys. 12a. Wyjątkowo duży wpływ subharmonik na postać periogramu (tylko w zielonych polach brak)

Mały wpływ subharmonik na postać periogramu

Mały wpływ subharmonik na postać periogramu

Rys. 12b. Mały wpływ subharmonik na postać periogramu (czerwony kolor – linie subharmonik)

Istotny jest fakt, że linie związane z subharmonikami (kolejne wielokrotności subharmoniki) leżą pośrodku (oczywiście dla podstawowej częstotliwości subharmonicznej równej (1/2)F0) pomiędzy liniami częstotliwości harmonicznych (rys. 13).

Powiększony fragment spektrogramu z widocznymi zakłóceniami subharmonicznymi

Rys. 13. Powiększony fragment spektrogramu z widocznymi zakłóceniami subharmonicznymi

Obecność składowych nieharmonicznych, a zwłaszcza subharmonicznych, w zakresie niskich częstotliwości świadczy o zniekształceniach sygnału mowy. Zniekształcenia zwykle wywołane są nierównomierną pracą fałdów, różna pracą obu fałdów wywołaną porażeniem lub dużą zmianą organiczną. Rzadziej objawiają się w ten sposób małe zmiany organiczne. To, z jakim przypadkiem ma się do czynienia, zależy jeszcze od tego, czy zaburzenia na spektrogramie są stałe, czy chwilowe. W przypadku zaburzeń ciągłych istnieje duże prawdopodobieństwo istnienia dużych zmian typu organicznego, w przypadku zmian chwilowych często można spotkać zmęczeniowe porażenie fałdu głosowego lub mniejszą zmianę typu balotującego.