Co to jest Vocoder
Wokoder został wynaleziony w latach dwudziestych XX wieku do celów komunikacyjnych i komunikacyjnych. Jednak jego prawdziwe przeznaczenie odkryto w muzyce elektronicznej, gdzie stał się kluczowym narzędziem do tworzenia głosów robotów. Prawie sto lat po swoim pojawieniu się wokoder jest aktywnie wykorzystywany w przemyśle muzycznym, jednak nie wszyscy wiedzą, jak działa ten wyjątkowy instrument i jak się nim posługiwać. Z tego tekstu dowiesz się, jak II wojna światowa spopularyzowała syntezatory mowy, jak działa wokoder i jak prawidłowo go używać.
Rozwój wokodera rozpoczął się w 1928 roku dzięki pracy inżyniera Homera Dudleya w Bell Labs. Pod koniec lat 30. XX w. osiągnięto ostateczny efekt i w listopadzie 1937 r. Dudley otrzymał pierwszy patent na swój wynalazek, a w 1939 r. – drugi. Główną ideą Dudleya było odtworzenie aparatu mowy ludzkiej za pomocą elektroniki. Wykorzystując elektroniczne komponenty i efekty, inżynier starał się jak najdokładniej naśladować funkcjonowanie narządów mowy człowieka, odtwarzając dźwięki powstające w wyniku przepływu powietrza przez różne części ludzkiego ciała, np. płuca i inne narządy.
W 1939 roku Bell Labs zademonstrowało społeczeństwu urządzenie do syntezy mowy o nazwie VODER (Demonstrator obsługi głosu) podczas serii demonstracji w Nowym Jorku i San Francisco. Urządzenie posiadało parę przełączalnych oscylatorów i generator szumu jako źródło dźwięku. Dedykowana ścieżka wokalna składająca się z dziesięciopasmowych filtrów została połączona z wrażliwą na prędkość klawiaturą, która kontrolowała intensywność filtrowania. Wysokość dźwięku zmieniano za pomocą pedału nożnego. Dodatkowe klawisze odpowiadały za generowanie liter „P”, „D”, „J” oraz kombinacji dźwiękowych „JAW” i „CH”.
VODER był urządzeniem skomplikowanym, wymagającym specjalistycznego przeszkolenia i wielomiesięcznego szkolenia w obsłudze. Do codziennych demonstracji Bell Labs specjalnie przeszkoliło 20 osób, które na zmianę prezentowały nowy produkt wszystkim zainteresowanym. Podczas demonstracji VODER powiedział: „Dzień dobry słuchaczom radia!”
W 1949 roku opracowano konwerter głosu KO-6, który kodował mowę i informacje z szybkością 1200 bitów na sekundę. W 1953 roku pojawił się kolejny wokoder, KY-9 THESEUS, który nie tylko zwiększył prędkość przetwarzania do 1650 bitów na sekundę, ale także wykorzystał inne komponenty. Dzięki zmodyfikowanym materiałom udało się zmniejszyć masę wokodera z 55 ton dla SIGSALY do 256 kilogramów dla KY-9. Wreszcie w 1961 roku, wraz z wypuszczeniem konwertera HY-2, udało się zmniejszyć wagę wokodera do 45 kilogramów, a także zwiększyć prędkość kodowania do 2400 bitów na sekundę. HY-2 był ostatnim wokoderem przemysłowym używanym w systemach bezpiecznej komunikacji, podczas gdy instrument pozostał w sektorze konsumenckim.
W 1948 roku niemiecki naukowiec Werner Mayer-Eppler, szczególnie zainteresowany syntezą głosu, opublikował rozprawę na temat syntezy mowy i muzyki elektronicznej z punktu widzenia syntezy dźwięku. Jego wiedza odegrała później ważną rolę w powstaniu w 1951 roku Studia Muzyki Elektronicznej Radia Zachodnioniemieckiego (WDR) w Kolonii.
Pierwsze użycie wokodera do tworzenia muzyki miało miejsce w 1959 roku, także w Niemczech. W latach 1956–1959 firma Siemens opracowała syntezator Siemensa, który potrafił przekształcać dźwięk na mowę. W 1968 roku Robert Moog, założyciel firmy Moog, opracował jeden z pierwszych wokoderów zaprojektowanych specjalnie do użytku w przemyśle muzycznym. Ten wokoder został zamówiony przez Uniwersytet w Buffalo.
Od tego czasu historia wokodera ewoluowała sama i stał się on szeroko stosowany we wszystkich obszarach audio i wideo. Instrument stał się powszechnie znany dzięki grupie Kraftwerk, która samodzielnie montowała wokoder do swoich eksperymentów i używała go od chwili jej powstania w 1970 roku. Najbardziej znanym i popularnym przykładem wykorzystania wokodera była płyta Kraftwerk „Trans-Europe Express ”, co szczegółowo sprawdziliśmy w przeglądzie niezwykłych instrumentów muzycznych niemieckich artystów elektronicznych.
Jak działa wokoder?
Lepiej używać dwóch sygnałów niż jednego. Wokoder wymaga do działania dwóch źródeł dźwięku:
- Operator: początkowy sygnał dźwiękowy;
- Modulator: sygnał o różnych charakterystykach harmonicznych, które określają dźwięk operatora.
Dźwięk przechodzi przez specjalny „bank filtrów”, który analizuje sygnał modulatora, dzieli go na pasma częstotliwości i do każdego pasma stosuje filtr. Filtry zawsze dobiera się tak, aby punkt odcięcia znajdował się dokładnie w środku każdego zakresu sygnału modulatora. Niezależnie od gęstości krojenia, sygnał w każdym zakresie jest filtrowany centralnie.
Następnie sygnał operatora podawany jest do modulatora, który przechodzi przez wszystkie filtry. Wokoder dostosowuje punkt odcięcia każdego filtra w zależności od harmonicznych i podtekstów w sygnale modulatora.
Aby zrozumieć zasadę działania wokodera, możemy przeprowadzić analogię z ludzkim głosem. Dźwięk głosu tworzą sygnały operatorów i modulatorów. Kiedy wymawiamy słowa, strumień powietrza przepływa przez struny głosowe, tworząc oryginalny operator sygnału. Jednocześnie wibrują inne części aparatu głosowego, generując sygnał modulatora. Cechy te bezpośrednio wpływają na brzmienie głosu.
Wokoder działa w podobny sposób: modyfikuje sygnał oryginalny ze względu na charakterystykę sygnału dodatkowego.
Operatorem lub modulatorem może być dowolny sygnał audio. Producenci często wykorzystują syntetyczne dźwięki jako operatory, a głos jako modulator. Przykładem zastosowania wokodera w muzyce jest utwór „Trans-Europe Express” zespołu Kraftwerk. Operatorem jest sygnał syntezatora, a modulatorem jest zwykła mowa.
Bardziej eksperymentalne wykorzystanie wokodera można zobaczyć w utworze „Nightcall” Kavinsky’ego. Efekt ten można odtworzyć za pomocą iZotope VocalSynth, ustawiając łatkę tak, aby generowała akordy z dwóch fal dźwiękowych i białego szumu jako operatora, modulowanego głosem.
Jak korzystać z wokodera
Aby wokoder brzmiał tak imponująco, jak wiele nagrań komercyjnych, operator sygnału musi być bogaty w alikwoty. Im bogatszy i bardziej zróżnicowany operator, tym silniejsze oddziaływanie modulatora.
Najlepiej zacząć eksperymentować z patchami, które wykorzystują lub bazują na przebiegu dźwiękowym piłokształtnym. Sygnały fali rampowej są zazwyczaj bogatsze i bogatsze niż fale trójkątne lub sinusoidalne. Dobrą praktyką jest również kompresja lub nasycenie sygnału operatora przed wprowadzeniem go do wokodera. Podkreśli to efekt sygnału przechodzącego przez bank filtrów.
Szczególnej uwagi wymaga głos pełniący rolę modulatora. Pisząc słowa, powinieneś być bardzo jasny i precyzyjny, podkreślając każdy dźwięk. Bez względu na to, jaki masz głos, ważne jest, aby artykulacja była wyraźna. To precyzja i klarowność tworzą charakterystyczny efekt wokodera, który nadaje głos robota. Zwróć uwagę, jak w „Zewie nocy” Kavinsky’ego każde słowo jest wymawiane wyraźnie i powoli. Podczas pracy z wokoderem ważne jest monitorowanie artykulacji, aby uniknąć zniekształceń.
Wysokość głosu nie jest tak ważna, gdy używasz wokodera. Skoncentruj się na innych cechach głosu: barwie, głębi, przejrzystości i definicji. Zamiast eksperymentować z zakresem, lepiej popracować nad ekspresją i intonacją.
Jakie parametry sterują pracą wokodera?
Zarówno wokodery sprzętowe, jak i programowe (VST) mają zwykle podobny zestaw parametrów. W większości przypadków ich ustawienia są podobne: chociaż nazwy elementów sterujących i parametry mogą się różnić w zależności od producenta, ich istota pozostaje w przybliżeniu taka sama.
Liczba pasm
Element sterujący Pasma kontroluje sposób podziału sygnału audio na różne zakresy częstotliwości. Położenie tego pokrętła określa, na ile części zostanie podzielony sygnał modulatora. W odróżnieniu od programowych wokoderów i wtyczek, starsze urządzenia mają ograniczoną liczbę zakresów częstotliwości, na które można podzielić sygnał. Aby stworzyć tradycyjny dźwięk robota podobny do stylu Kraftwerk, zaleca się ustawienie parametru Bands w zakresie od 8 do 12 wartości.
Zakres częstotliwości
Parametr ten określa zakres częstotliwości, który zostanie wykorzystany w procesie przetwarzania sygnału operatorskiego. Podczas obsługi wokodera będą brane pod uwagę tylko częstotliwości z określonego przedziału, reszta będzie ignorowana. Aby poprawić klarowność dźwięku, zaleca się ustawienie górnego limitu powyżej 5 kHz.
Formant
Niektóre modele wokoderów posiadają funkcję regulacji formantu, często nazywaną „Shift”. Dzięki tej opcji użytkownik może zmienić szerokość lub wąskość pasm w celu filtrowania dźwięku. Zwiększenie formantów powoduje, że przetworzony sygnał staje się jaśniejszy, natomiast zmniejszenie powoduje, że przetworzony sygnał jest ciemniejszy i głębszy.
Zazwyczaj regulacja formantu służy do dostosowania wokodera do głosów żeńskich lub męskich, przy czym przesunięcie sprawia, że głos robota jest bardziej kobiecy lub męski. Niektóre modele wokoderów zamiast dostosowywać formanty mają parametr „Płeć”, który pozwala dostosować płeć powstałego głosu.
Bezdźwięczny
Mowie ludzkiej w dowolnym języku zawsze towarzyszą tak zwane dźwięki wybuchowe. Dźwięk wybuchowy pojawia się w momencie, gdy aby go wymówić konieczne jest przepuszczenie strumienia powietrza przez zamknięte usta, na przykład podczas wymawiania liter „P” i „B”. Głoski wybuchowe nie są dźwiękami wokalnymi, dlatego często nazywane są dźwiękami bezdźwięcznymi.
Dźwięki inne niż wokalne nie mają określonej wysokości i są szumem w całym zakresie częstotliwości, który wokoder ignoruje. Ale nie powinieneś się cieszyć z wykluczenia takich dźwięków: wyobraź sobie, jak znajomo brzmią słowa bez liter „P” i „B” („nawykowy” – „bogaty”, „problemowy” – „rolema”).
Aby zapobiec pomijaniu przez wokoder dźwięków wybuchowych i „połykaniu” liter w słowach, producenci dodają do sekcji ustawień specjalny parametr „Bezdźwięczny”. Sterowanie to jest połączone z generatorem szumu, który koryguje niedociągnięcia w działaniu wokodera: im bardziej obrócony jest parametr, tym silniejsza jest korekcja. Generator szumu odtwarza sygnał o kształcie fali dźwiękowej podobnej do sygnału operatora. Wszystkie beztonowe i przejściowe głosy wybuchowe pozostają w sygnale, litery w słowach są zachowywane, a mowa brzmi poprawnie po wokoderze.