Medyczna rejestracja obrazu wideo

Część II: Kimografia

Nagrywanie materiału wideo kamerą stroboskopową

Autor: mgr Marzena Zacirka, dr inż. Marcin Just, dr inż. Michał Tyc (DiagNova Technologies)

Kimografia jest to analiza pracy fałdów głosowych przez ocenę ruchów fonacyjnych w przedziale czasu i w dowolnie wybranym przekroju poprzecznym fałdów.

Badanie tego typu przeprowadza się odpowiednio rejestrując obraz fałdów głosowych z kierunku do nich prostopadłego za pomocą kamery endoskopowej. Nagranie wideo przeznaczone do analizy kimograficznej powinno zawierać głównie fałdy głosowe podczas fonacji. Nagrywanie fałdów podczas wdechu lub wydechu jest bezcelowe, ponieważ w analizie kimograficznej taki ruch fałdów nie zawiera żadnych istotnych informacji. Ze względu na to, iż fałdy głosowe podczas fonacji poruszają się bardzo szybko, nagranie powinno zawierać co najmniej 2 000 klatek na sekundę, co nie jest możliwe do osiągnięcia przy użyciu zwykłych kamer sprzęganych z endoskopami. Pełny dwuwymiarowy obraz o takiej rozdzielczości czasowej można otrzymać przy użyciu kosztownych specjalistycznych kamer do zdjęć szybkich. Obraz pojedynczego wybranego przekroju fałdów głosowych o odpowiedniej rozdzielczości czasowej można również uzyskać za pomocą znacznie tańszej szybkiej kamery linijkowej (zawierającej zestaw elementów światłoczułych w postaci jednej linijki pikseli zamiast pełnej dwuwymiarowej matrycy), co jest rozwiązaniem tańszym niż kamera do zdjęć szybkich, lecz wciąż wymagającym dodatkowego specjalistycznego sprzętu. Alternatywą dla szybkich kamer nagrywających obraz ciągły jest użycie zwykłej kamery w trybie zdjęć stroboskopowych. Przy dobrej jakości sprzętu i odpowiednio wykonanym nagraniu, uzyskany w ten sposób obraz stanowi zwykle wystarczająco wiarygodny materiał do przeprowadzenia analizy kimograficznej, a w stosunku do użycie szybkiej kamery linijkowej daje możliwość wyboru przekroju fałdów do badania nawet po nagraniu.

Wykonanie zadowalającego nagrania wideostroboskopowego do przeprowadzenia kimografii wymaga od użytkownika odpowiedniego przeszkolenia oraz wprawy. Wynika to ze złożoności sposobu przeprowadzania takiego nagrania. Wysokiej klasy oprogramowanie pozwala co prawda proces analizy kimograficznej uprościć i poprawić czytelność wyników końcowych, jednak nie można pominąć znaczenia sposobu dokonania nagrania wideostroboskopowego.

Aby otrzymać nagranie, które pozwoli na pełną i możliwie wiarygodną kimografię fałdów głosowych, najważniejszą rzeczą jest odpowiednie dopasowanie momentów zbierania poszczególnych klatek (migawka kamery lub moment błyskania oświetlacza stroboskopowego) do częstotliwości ruchu fałdów głosowych. Każda następna klatka rejestrowana przez kamerę musi być zebrana w nieznacznie późniejszej fazie ruchu fałdów głosowych. Inaczej mówiąc, różnica fazy pomiędzy ruchem fałdów głosowych a stroboskopem musi być liniowo rosnąca. Pozwala to uzyskać rejestrowany obraz jako tzw. slow motion. Otrzymanie takiego efektu nie zawsze jest proste, ponieważ częstotliwość drgania fałdów może się nieznacznie zmieniać w czasie, zależnie od wysokości generowanego przez badaną osobę tonu, lub wręcz mogą one drgać bardzo nierównomiernie, nawet z okresu na okres, na skutek istniejącej patologii i nie jest możliwe odpowiednie dobranie momentów błysków lub migawki. Nieprawidłowo wykonane nagranie uniemożliwia przeprowadzenie analizy kimograficznej lub może przekłamywać wyniki. Za odpowiednie dopasowanie momentów zbierania klatek do aktualnej częstotliwości głosu badanej osoby odpowiedzialny jest wideostroboskop (jego wewnętrzny program). W tym celu musi on określić częstotliwość podstawową głosu badanej osoby (algorytmy do tego użyte nie zapewniają takiej dokładności jak te używane do komputerowej analizy głosu, ale zwykle zapewniają większą stabilność). Należy w związku z tym zapewnić wideostroboskopowi odpowiedniej jakości sygnał skorelowany z ruchem fałdów głosowych. Najlepszymi, lecz również najbardziej niewygodnymi rozwiązaniami, są glottograf lub mikrofon nakrtaniowy (laryngofon), powszechnie jednak wykorzystuje się, ze względu na prostotę, mikrofony mocowane do endoskopu. W tym ostatnim przypadku bardzo istotne jest zapewnienie dobrej jakości dzwięku mikrofonowi wideostroboskopu. Powinien on znajdować się blisko ust badanej osoby i nie może być narażony na zakłócenia zewnętrzne. Wskazane jest również zapewnienie odpowiednio długiego czasu trwania fonacji na stałej wysokości, aby wideostroboskop był w stanie uzyskać stan synchronizacji błysków lub migawki z ruchem fałdów głosowych.

Nieprawidłowa synchronizacja zbierania klatek (zbyt mała lub zbyt duża różnica fazy ruchu fałdów pomiędzy kolejnymi klatkami) może prowadzić do tego, że na nagraniu fałdy głosowe sprawiają wrażenie nieruchomych, albo też poruszających się bardzo szybko. Jako przykład nieprawidłowo dobranej różnicy fazy może posłużyć nagranie wideo poniżej oraz uzyskany z tego nagrania przekrój kimograficzny (rys. 1).

Przekrój czasowy pracy fałdów głosowych (przekrój kimograficzny) ze źle dobraną różnicą fazy zbierania klatek

Rys. 1. Przekrój czasowy pracy fałdów głosowych (przekrój kimograficzny) ze źle dobraną różnicą fazy zbierania klatek; Zbyt małą różnica fazy pomiędzy kolejnym klatkami

W tym przypadku różnica fazy pomiędzy kolejnymi klatkami jest prawie zerowa. Powoduje to wrażenie nieporuszających się fałdów głosowych, co może błędnie prowadzić do diagnozy całkowitego niedomykania się fałdów głosowych. Widoczne delikatne drganie związane jest z niewielkimi różnicami pomiędzy kolejnymi okresami ruchu fałdów głosowych i co najwyżej posłużyć może do bardzo zgrubnej oceny międzyokresowej równomierności pracy fałdów (czyli podobieństwa ruchu fałdów głosowych dla sąsiednich okresów ich ruchu).

Jak wspomniano już wyżej, nieregularne różnice pomiędzy fazą pracy stroboskopu a fazą ruchu fałdów głosowych, wynikające z nierównomiernej pracy fałdów lub rzadziej z błędów stroboskopu, objawiają się drżeniem fałdów głosowych na nagraniu, co w wyniku daje przekrój czasowy z widocznymi nieregularnymi zwężeniami szpary głośni widocznymi dla niektórych linii przekroju kimograficznego, tak jak na rysunku poniżej (rys. 2).

Przekrój czasowy pracy fałdów głosowych z niezgodnościami pomiędzy momentami zbierania klatek a częstotliwością ruchu fałdów; wrażenie drżenia fałdów głosowych

Rys. 2. Przekrój czasowy pracy fałdów głosowych z niezgodnościami pomiędzy momentami zbierania klatek a częstotliwością ruchu fałdów; wrażenie drżenia fałdów głosowych

a) Wrażenie drżenia fałdów głosowych, którego przyczyną jest źle wykonana kimografia
b) Wrażenie drżenia fałdów głosowych, którego przyczyną jest źle wykonana kimografia

Rys. 3. a) (po lewej) Wrażenie drżenia fałdów głosowych, którego przyczyną jest źle wykonana kimografia; b) (po prawej) ten sam przekrój kimograficzny po korekcji

Należy tutaj odróżnić zaburzenia związane z problemami przy wykonywaniu poprawnego nagrania wideostroboskopowego (widoczne na przekroju kimograficznym – rys. 2) od nie do końca poprawnie wykonanej analizy kimograficznej poprawnego nagrania wideostroboskopowego. Różnica jest subtelna i zasadniczo ogranicza się do istnienia symetrii w przypadku poprawnej analizy kimograficznej nie do końca poprawnego nagrania (rys. 2) i przesunięć w przypadku niepoprawnej analizy dobrego nagrania (rys. 3a). W drugim przypadku możliwe jest po starannej korekcji na etapie analizy kimograficznej uzyskanie poprawnego przekroju kimograficznego (rys. 3b).

Wykonanie poprawnego nagrania, które może zostać wykorzystane do wykonania analizy kimograficznej, zależy także w dużej mierze od właściwego wykadrowania już w trakcie rejestracji obrazu oraz uchwycenia odpowiedniego fragmentu ruchu fałdów głosowych podczas nagrywania kamerą stroboskopową. Ogólnie należy dążyć do tego, aby obraz pracujących fałdów głosowych zajmował około 50% wysokości całej klatki. Jeśli fałdy głosowe widoczne na obrazie wideo są zasadniczo mniejsze, może to utrudnić wykonanie analizy kimograficznej, pogorszyć jej jakość bądź też ją uniemożliwić. Odpowiednią wielkość fałdów głosowych na ekranie osiagnać można ustawiając końcówkę endoskopu w mniejszej odległości od fałdów lub stosując endoskopy o dłuższej ogniskowej (z węższym kątem obrazowania). Dobrym rozwiązaniem mogą być optyki z możliwością regulacji ogniskowej, czyli ze zmiennym kątem obrazowania (ZOOM). Należy tutaj odróżnić kąt nachylenia głowicy endoskopu do osi endoskopu od kąta obrazowania. Kąt obrazowania (zależny od ogniskowej obiektywu endoskopu, wynosi zwykle od 50 do 110 stopni) przekłada się bezpośrednio na wielkość pola widzenia (czyli odpowiednio odwrotnie na pozorną wielkość fałdów na obrazie wideo). Kąt nachylenia głowicy (wynoszący od 0 do 90 stopni, zwykle w endoskopach laryngologicznych 70 do 90 stopni) wymusza odpowiednie ułożenie końcówki endoskopu w stosunku do fałdów głosowych, przez co wpływa na stosowaną przez lekarza odległość końcówki od fałdów, a to z kolei pośrednio wpływa na pozorną wielkość fałdów głosowych na obrazie. Mniejsze kąty nachylenia wymuszają położenie bliżej fałdów, jednak z doborem mniejszych kątów nachylenia głowicy wiążą się większe problemy z uzyskaniem obrazu fałdów u niektórych osób badanych. Do kimografii zasugerować można endoskopy z kątem nachylenia głowicy 70 stopni, jednak wybór endoskopu jest sprawą indywidualną i powinien być poprzedzony testem praktycznym.

Nieprawidłowe kadrowanie lub ułożenie końcówki endoskopu w trakcie rejestracji obrazu może spowodować złą widoczność fałdów głosowych lub całkowity jej brak; mogą one zostać całkowicie lub częściowo zasłonięte przez inną strukturę. Analiza pracy fałdów głosowych wymaga pełnej widoczności fałdów, ponieważ zasłonięcie fałdów głosowych uniemożliwia otrzymanie prawidłowego przebiegu czasowego ich pracy. Poniżej przedstawiony został przykład nieprawidłowo zobrazowanych fałdów głosowych (nie do końca poprawne w niektórych momentach ułożenie końcówki endoskopu), co daje nieprawdziwy obraz przekroju czasowego pracy fałdów głosowych (rys. 4).

Przekrój czasowy pracy fałdów głosowych, które zostały w połowie fragmentu nagrania przysłonięte przez inną strukturę

Rys. 4. Przekrój czasowy pracy fałdów głosowych, które zostały w połowie fragmentu nagrania przysłonięte przez inną strukturę

Rysunek przedstawia przebieg czasowy pracy fałdów głosowych, które mniej więcej w połowie nagrania zostały przysłonięte całkowicie przez inną strukturę znajdującą się w pobliżu fałdów. Taki defekt nagrania spowodował utratę części danych, co w tym przypadku prawie całkowicie uniemożliwiło przeprowadzenie analizy pracy fałdów głosowych.

Jeżeli kamera stroboskopowa została już prawidłowo dostrojona pod względem doboru różnicy fazy podczas zbierania klatek a rejestrowany obraz został odpowiednio wykadrowany poprzez optymalne ułożenie końcówki endoskopu i fałdy są widoczne w całości, następnym ważnym elementem efektywnego nagrywania wideo stroboskopowego jest ustawienie ostrości.

Zdarza się, że krtań wokół fałdów jest jak najbardziej wyraźna, natomiast same fałdy są zamazane i bardzo niewyraźne, dlatego równie ważne jest takie ustawienie kamery, aby najostrzejszymi lub jednymi z najostrzejszych elementów na obrazie były właśnie fałdy głosowe. Nieprawidłowe ustawienie ostrości obrazu nie zagrozi wprawdzie wystawieniu prawidłowej diagnozy, natomiast może znacznie zmniejszyć czytelność przekroju czasowego pracy fałdów (rys. 5). Wspomnieć należy, że w przypadku większości endoskopów, możliwe jest (i wskazane) ustawianie ostrości już po wprowadzeniu końcówki endoskopu do gardła.

Przekrój czasowy pracy fałdów głosowych z nagrania, na którym fałdy głosowe są nieostre

Rys. 5. Przekrój czasowy pracy fałdów głosowych z nagrania, na którym fałdy głosowe są nieostre

Ostatnim czynnikiem wpływającym na jakość przeprowadzonej analizy jest uchwycenie co najmniej jednej całej fazy ruchu fałdów głosowych, czyli co najmniej jednego pełnego zwarcia oraz jednego pełnego rozwarcia fałdów głosowych. Najlepszym nagraniem wideo do analizy jest nagranie zawierające dwa, trzy pełne fazy ruchu fałdów głosowych. Dodatkowo w przypadku, gdy zebrane klatki zawierają więcej niż trzy pełne zwarcia oraz rozwarcia fałdów, nie należy usuwać fragmentu filmu w celu skrócenia cennego nagrania jedynie do trzech faz ruchu, ponieważ większość dobrych programów pozwalających na uzyskanie przekrojów kimograficznych z nagrania wideostroboskopowego umożliwia już w trakcie przeprowadzania analizy kimograficznej wybrać najbardziej interesujący fragment nagrania wideo i przeprowadzić analizę, bez utraty całego fragmentu nagrania.

Przekrój czasowy pracy fałdów głosowych uzyskany z nagrania, które zawierało w sobie jedynie jedno pełne zwarcie fałdów

Rys. 6. Przekrój czasowy pracy fałdów głosowych uzyskany z nagrania, które zawierało w sobie jedynie jedno pełne zwarcie fałdów

Nagranie zawierające tylko jedno niepełne zwarcie lub rozwarcie fałdów praktycznie uniemożliwi przeprowadzenie kimografii, ponieważ nie zawiera wystarczającej liczby informacji na temat pracy fałdów, tak jak na przykładzie powyżej (rys. 6). Na rysunku przedstawiono przebieg czasowy pracy fałdów, na którym widoczne jest tylko jedno pełne zwarcie fałdów oraz dwa niepełne rozwarcia. Na podstawie kimografii takiego nagrania wideo nie jest możliwe postawienie właściwej diagnozy.

Jeżeli nagrany za pomocą kamery stroboskopowej materiał wideo spełnia wszystkie wyżej wymienione warunki, analiza uzyskanego z niego przekroju kimograficznego umożliwi bardzo precyzyjną ocenę pracy fałdów głosowych pacjenta i wystawienie właściwej diagnozy.

Ponieważ w rzeczywistości nie jest możliwe nagranie idealnego obrazu wideo, w którym obraz byłby idealnie stabilny, dlatego używany do analizy kimograficznej program powinien zostać wyposażony w metodę manualnego lub półautomatycznego kadrowania (z obracaniem), która pozwala zniwelować wszelkie niechciane ruchy fałdów głosowych na ekranie wywołane niepożądanymi ruchami końcówki endoskopu. Zapraszamy do zapoznania się z opisem przeprowadzenia kolejnego kroku w analizie, czyli kadrowaniem w programie DiagnoScope Specjalista.

Nowoczesniejszą alternatywą do opisywanej stroboskopii jest wspomniana na początku technika szybkiego filmu. Eliminuje ona dwa najważniejsze problemy rejestracji stroboskopowej: nieprawidłową synchronizację błysków i drgania końcówki endoskopu. Przykładowe nagrania z użyciem szybkiej kamery oraz porównania z nagraniami stroboskopowymi w galerii filmów z szybkiej kamery.