Medyczna rejestracja obrazu wideo

Część II: Kimografia

Funkcje zaawansowane (PVG)

Autor: mgr Marzena Zacirka, dr inż. Marcin Just, dr inż. Michał Tyc (DiagNova Technologies)

Kimografia standardowa (jednowymiarowa) pozwala na analizę ruchu fałdów głosowych w jednym wybranym przekroju poprzecznym. Kimografia zaawansowana (dwuwymiarowa), pozwala na pełną analizę ruchu fałdów głosowych na całej ich długości na jednym obrazie – fonowibrogramie.

Fonowibrogram jest to wykres złożony ze wszystkich jednowymiarowych obrazów kimograficznych. Dzięki temu użytkownik może obserwować zmiany w ruchu fałdów głosowych zarówno w kierunku przyśrodkowo-bocznym jak i przednio-tylnym.

Procedura wyznaczania parametrów liczbowych oraz wykresu fonowibrogramu wymaga oznaczenia krawędzi lewego i prawego fałdu głosowego (na rys. 1 w kolorze niebieskim), obszar głośni, tył i przód fałdu głosowego (na rys. 1 punkty w kolorze czerwonym; T − tył fałdu, P – przód fałdu) oraz główną oś głośni (na rys. 1 zaznaczona żółtą linią przerywaną).

Rys. 1. Obrys krawędzi wewnętrznej fałdów głosowych z wyznaczoną osią głośni

Program wyznacza obrysy krawędzi wewnętrznej fałdów głosowych dla każdego możliwego przekroju poprzecznego fałdów. Przykład wizualizacji przebiegu i zmian wyglądu obrysu krawędzi fałdów głosowych pokazano na nagraniach (rys. 2).

a)
b)

Rys. 2. Obrys krawędzi wewnętrznej fałdów głosowych na całej długości fałdów głosowych

Przy tworzeniu fonowibrogramu z sekwencji wideo zbierane są informacje na temat ruchu konturów oscylujących fałdów głosowych, a następnie przekształcone w jednobarwny obraz fonowibrogramu.

Rys. 3. Powstawanie fonowibrogramu

Wizualizacja całej charakterystyki ruchu fałdów głosowych została przedstawiona na rysunku 3. Jeżeli fałdy głosowe zostaną „przecięte” wzdłuż osi głośni, następnie lewy fałd zostanie obrócony o 180° względem punktu T, otrzymany obraz fałdów będzie wyglądał jak na rysunku 3. Ruch fałdów głosowych zmienia się w czasie (pozioma oś w kolorze zielonym na rysunku). Na wykresie kolor czarny określa stan, kiedy fałdy są zamknięte, czyli krawędź fałdu znajduje się na osi głośni. Natężenie koloru czerwonego określa w jakiej odległości od osi głośni znajduje się krawędź fałdu, czyli jaki jest stopień rozwarcia fałdów (rys. 4). Kolor niebieski dotyczy sytuacji w której krawędź fałdu przekracza oś głośni.

Rys. 4. Fonowibrogram

Fonowibrogram pozwala na skompresowanie na jednym wykresie danych z sekwencji „slow motion” z zachowaniem kluczowych informacji na temat pracy fałdów głosowych. Na ostatecznym wykresie uzyskuje się mapę niosącą informacje o zachowaniu krawędzi fałdu w czasie trwania całej analizowanej sekwencji „slow motion”. Jedna klatka zawiera więc wszystkie informacje potrzebne do zdiagnozowania pacjenta.

Mając informacje dotyczące krawędzi fałdu głosowego, możliwe jest wyznaczenie parametrów, takich jak stopień niedomykalności, amplituda pracy, asymetria, czy różnica fazy. Poniżej przedstawiono przykładowe wykresy parametrów wyznaczonych na podstawie kształtu krawędzi dla fałdów z rys. 1.

Rys. 5. Wyznaczony obrys krawędzi fałdów głosowych

Rys. 6. Obrys krawędzi obu fałdów głosowych nałożone na siebie

Rys. 7. Obrys krawędzi fałdów głosowych na obrazie kimograficznym

Na rysunkach widoczne są automatycznie wyznaczone, na podstawie wcześniej wykonanego przez użytkownika kadrowania oraz progowania, krawędzie fałdów głosowych. Na rysunku 5 widoczne są krawędzie wyznaczone z wykadrowanego obrazu fałdów głosowych. Na rysunku 6 widoczne są te same krawędzie, ale nałożone na siebie. Na jednym wykresie znajduje się obraz krawędzi fałdu lewego oraz lustrzane odbicie względem osi głośni obrazu krawędzi fałdu prawego. Na rysunku 7 obrysowane zostały krawędzie fałdów na podstawie obrazu kimograficznego.

Rys. 8. Wykres amplitudy ruchu fałdów głosowych

Rys. 9. Wykres czasu otwarcia fałdów głosowych do czasu ich zamknięcia

Rys. 10. Wykres amplitudy ruchu fałdów głosowych do średniego rozwarcia

Rysunek 8 przedstawia wykres amplitudy ruchu fałdów głosowych. Oś pionowa opisuje położenie na fałdzie głosowym, a oś pozioma przesunięcie względem osi głośni. Żółte punkty obrazują lewy fałd głosowy, niebieskie punkty prawy fałd, natomiast zielone punkty obrazują szerokość szpary głośni. W prawidłowej pracy fałdów głosowych wykres żółty oraz niebieski będą się pokrywać, natomiast zielony wykres stanowić ich sumę. Im zielony wykres ma mniejsze przesunięcie, tym bardziej jeden fałd podąża za drugim, zamiast pracować przeciwstawnie.

Rysunek 9 przedstawia stosunek czasu otwarcia fałdów głosowych do czasu ich zamknięcia w każdym przekroju (wynik podawany w procentach). Rysunek 10 to stosunek amplitudy ruchu fałdów do średniego rozwarcia.

Rys. 11. Ocena symetryczności pracy fałdów głosowych

Rys. 12. Różnica fazy między ruchem prawego i lewego fałdu

Rys. 13. Wynik fitowania krawędzi fałdu głosowego

Wykres na rysunku 11 pozwala na ocenę symetryczności pracy fałdów głosowych. Podaje wartość stosunku amplitudy ruchu środka obszaru głośni do amplitudy szerokości obszaru głośni. W przypadku symetrycznej pracy fałdów parametr powinien być równy 0. Wartość 0,5 oznacza asymetrię, kiedy jeden fałd nie pracuje w ogóle. Natomiast wartość powyżej 0,5 oznacza, że jeden z fałdów pracuje inwersyjnie, czyli podąża za drugim. Ogólnie można powiedzieć, że im większa wartość tego parametru, tym mniejsza efektywność pracy fałdów. Na rysunku 12 przedstawiono parametr, który obrazuje różnicę fazy pomiędzy ruchem prawego i lewego fałdu. W przypadku prawidłowej pracy fałdów głosowych, różnica fazy powinna być równa 0 stopni. Na rysunku 13 przedstawiony został wykres prezentujący wynik fitowania krawędzi fałdu (w module kadrowania i stabilizacji). Na wykresie wykorzystano wykadrowany pojedynczy cykl pracy fałdów obrócony o 90°. Na wykres został nałożony wynik fitowania w celu określenia różnicy fazy ruchu pomiędzy fałdami.