Wpływ warunków nagrania na wyniki analizy akustycznej

Test syntetyczny

Autor: dr inż. Marcin Just (DiagNova Technologies)

Pierwszy test miał za zadanie zbadanie wpływu zakłóceń i zniekształceń na skomplikowany proces analizy nagrań.

Metodologia badania

W pierwszym etapie nagrano wzorcowe próbki głosu męskiego i kobiecego (próbka przedłużonej fonacji głoski „a”) w warunkach uznanych za optymalne: przy użyciu pojemnościowego mikrofonu studyjnego Behringer B1 z dedykowanym przedwzmacniaczem mikrofonowym i kartą muzyczną (tzw. interfejsem audio) MobilePRE firmy M-Audio, w wyciszonej i ekranowanej elektromagnetycznie komorze bezechowej, przy użyciu komputera przenośnego pracującego na zasilaniu bateryjnym i zamkniętego w pojemniku metalowym. Następnie nagrano sygnały zakłócające:

  • odgłosy różne (stuki, rozmowa, trzaski, szurania) – odgłosy z korytarza,
  • przydźwięk sieciowy,
  • wibracje i uderzenia (stukanie w obudowę mikrofonu),

oraz przygotowano pliki z szumem białym. Przy użyciu specjalnie napisanego programu komputerowego (rys. 1) sygnały łączone były w ściśle określonym stosunku energetycznym, tak aby w efekcie wygenerować sygnał z dołożonymi odpowiednimi zakłóceniami w odstępie 10, 20, 30 lub 40 dB. Dodatkowo wygenerowano przebiegi testowe bez zakłóceń, ale odwrócone w fazie jak, również przebiegi przesterowane o 3, 5, 10 dB.

Przebiegi wczytywane były do naszego oprogramowania testowego i analizowane. Analiza akustyczna była przeprowadzana automatycznie bez ingerencji operatora. Sprawdzano wyniki pod kątem wystąpienia tzw. błędów grubych w wyznaczeniu częstotliwości podstawowej, jednak nie odnotowano przypadku pomyłki.

Rys. 1. Okno specjalnie przygotowanego programu do łączenia przebiegów testowych

Wyniki

Na rysunku 2 przedstawiono przykładowe przebiegi wygenerowane w czasie trwania testów wraz z wynikami analiz. Widoczne jest wyraźne podwyższenie wartości parametrów już przypadku odstępu od szumów na poziomie 30 dB.

a)
b)

a) przebieg wzorcowy

a)
b)

b) przebieg z dodanym szumem białym – odstęp od szumu 40dB

a)
b)

c) przebieg z dodanym szumem białym – odstęp od szumu 30dB

Rys. 2. Przykłady przebiegów użytych w pierwszym etapie testów wraz z wynikami ich analiz akustycznych

Na rys. 3 przedstawiono graficznie wpływ różnych zakłóceń na wyznaczane wartości parametrów analizy akustycznej głosu. Na osi X umieszczono testowane rodzaje zakłóceń:

  • inw – inwersja sygnału,
  • clip – ograniczenie wywołane przesterowaniem,
  • przy – przydźwięk sieciowy (zakłócenia pochodzące od sieci oświetleniowej),
  • szum – szum biały,
  • wib – wibracje i uderzenia, stukanie palcem obudowę mikrofonu,
  • rozn – odgłosy różne z otoczenia (stuki, rozmowa, trzaski, szurania).

Liczba wstawiona po nazwie typu zakłócenia oznacza w przypadku przesterowania – amplitudowy stopień przesterowania wyrażony w dB, a w pozostałych przypadkach odstęp sygnału od zakłóceń wyrażony w dB. Kolor zielony oznacza brak wpływu zakłóceń na wartości parametrów, kolor niebieski obniżenie wyznaczanych parametrów a czerwony podwyższenie ich wartości.

Przeprowadzone badania wykazały największy wpływ odgłosów z z otoczenia. Całkowitą poprawność badania zapewnia dopiero różnica 40 dB pomiędzy nagrywanym sygnałem dźwiękowym a zakłóceniem. Podobna sytuacja występuje dla przydźwięku sieciowego, natomiast wpływ wibracji i odwrócenia sygnału jest znikomy. Stosunkowo niewielki jest wpływ przesterowania, lecz ponieważ obniża ono wartości parametrów, należy je bezwzględnie wyeliminować na etapie nagrań.

Rys 3. Porównanie wpływu zakłóceń i zniekształceń na wyniki analiz akustycznych: kolor czerwony – zawyżenie wyników analiz, niebieski – zaniżenie