Co to jest inscenizacja wzmocnienia

Co to jest inscenizacja wzmocnienia

Cyfrowy świat audio może wydawać się zagmatwany. Na przykład w fizyce dźwięku głośność mierzy się w decybelach i wartości są zawsze dodatnie, ale w cyfrowych stacjach roboczych (DAW) decybele nagle stają się ujemne. A co to za dziwna magia?

Kolejna zagadka: na ekranie DAW czasami widać poziomy sygnału powyżej zera, a czasami pojawiają się nawet „dodatnie” decybele. Co to wszystko oznacza? Pomóż mi zrozumieć! Terminy „głośność”, „wzmocnienie”, „poziom” nieustannie słyszymy wokół nas i na YouTube – ale jaka jest między nimi różnica?

Spróbujmy to zrozumieć bez skomplikowanych formuł. W końcu jesteśmy w większości muzykami, a nie inżynierami. A przy okazji nauczymy się jak prawidłowo organizować tzw. „level headroom” w naszych projektach muzycznych tworzonych za pomocą DAW.

W przypadku cyfrowego nagrywania dźwięku zasadniczo nie ma głośności. Czym są „naturalne” decybele

„Głośność” to coś więcej niż tylko słowo próbujące opisać intensywność ciśnienia akustycznego wywieranego na uszy. Dla każdej osoby ciche i głośne dźwięki są odbierane subiektywnie. To, co dla jednej osoby jest po prostu „głośne”, dla innej może być „strasznie głośne”.

Tworzenie muzyki zawsze wymaga uwzględnienia subiektywnych kryteriów, co czasami zakłóca porozumienie pomiędzy uczestnikami procesu twórczego. Dlatego ważne jest, aby podczas pracy nad projektami muzycznymi mieć bardziej obiektywne zrozumienie głośności.

W naturze nie ma bezpośredniego odpowiednika głośności, jak w świecie cyfrowym. Dźwięk rozchodzi się poprzez fale sprężyste w ośrodku gazowym, ciekłym lub stałym. Źródłem dźwięku jest ciało fizyczne podlegające wibracjom mechanicznym, np. struna lub ludzkie struny głosowe.

Spróbujmy sobie to wyobrazić wizualnie, choć niezbyt naukowo: po zabrzmieniu struna wibruje na boki (w przestrzeni trójwymiarowej) z określoną częstotliwością i amplitudą, tworząc wokół siebie fale sprężyste.

Fale te powodują powstawanie obszarów o wysokim i niskim ciśnieniu powietrza, które rozprzestrzeniają się w środowisku gazowym. Fizycy opisują te wibracje jako „ciśnienie akustyczne”.

Aby zmierzyć natężenie ciśnienia akustycznego, naukowcy opracowali wzór uwzględniający samo ciśnienie, impedancję akustyczną ośrodka i uśrednianie czasu. Pozwala to uzyskać średnią kwadratową wartości natężenia dźwięku w określonym punkcie czasu i przestrzeni.

W muzyce wibracje dźwięku mają głównie charakter okresowy, podobny do drgań struny. Czasami oceniamy ich intensywność, posługując się pojęciem „amplitudy ciśnienia akustycznego”, ale w rzeczywistości nie jest to tak istotne.

Naprawdę ważne jest to, że dodatnie decybele (oznaczone jako „+”) w fizyce odnoszą się do natężenia ciśnienia akustycznego, ale tylko w odniesieniu do określonego punktu na skali. Decybele są jednostkami względnymi, logarytmicznymi lub podwielokrotnymi i mają sens tylko wtedy, gdy istnieje „punkt początkowy”.

W fizyce punktem wyjścia jest poziom ciśnienia wynoszący 20 mikropaskali (µPa) – jest to średni próg słyszenia człowieka, gdy nie odbiera on jeszcze dźwięków i odczuwa ciszę. Chociaż kot prawdopodobnie by się z tym nie zgodził.

Stopień postrzeganej głośności przez osobę bada się osobno, stosując własne jednostki miary, takie jak fundusze, skład częstotliwości i inne czynniki. Ale podczas pracy z DAW te szczegóły nie są tak ważne. Najważniejsze dla nas jest, aby nie pomylić się z decybelami.

0 decybeli SPL (poziom ciśnienia akustycznego) oznacza dla człowieka ciszę. Poniżej znajduje się kilka typowych wartości do porównania:

  • 15 dB – „Ledwo słyszalne” – to jak szelest liści;
  • 35 dB – „Wyraźnie słyszalny” – np. stłumiona rozmowa, ciche otoczenie w bibliotece lub hałas w windzie;
  • 50 dB – „Wyraźnie słyszalne” – to jak rozmowa na średnim poziomie głośności, cicha ulica lub praca pralki;
  • 70 dB – „Hałas” – np. głośne rozmowy w odległości 1 m, hałas maszyny do pisania, hałaśliwa ulica czy pracujący odkurzacz w odległości 3 m;
  • 80 dB – „Bardzo głośno” – to jak głośny budzik w odległości 1 m, krzyk, dźwięk motocykla z tłumikiem lub dźwięk pracującego silnika ciężarówki. Długotrwałe słuchanie takich dźwięków może spowodować utratę słuchu;
  • 95 dB – „Bardzo głośno” – np. hałas wagonu metra w odległości 7 m lub głośna gra fortepianu w odległości 1 m;
  • 130 dB – „Ból” jest jak syrena, hałas nitujących kotłów, najgłośniejszy krzyk lub motocykl bez tłumika;
  • 160 dB – „Wstrząs” to poziom, przy którym istnieje duże prawdopodobieństwo pęknięcia błony bębenkowej, na przykład w wyniku wystrzału ze strzelby blisko ucha, zawodów w zakresie nagłośnienia samochodowego, fali uderzeniowej z naddźwiękowego samolotu lub eksplozji o mocy 0,002 megapaskala.

Nagrywanie dźwięku. Objętość i wzmocnienie

Kiedy nagrywamy dźwięk, musimy przekształcić okresowe wibracje dźwięku w powietrzu na drgania elektryczne. Od wynalezienia fonautografu w 1857 roku naukowcy i inżynierowie eksperymentowali z różnymi metodami rejestrowania dźwięku.

Okazuje się, że najskuteczniejszym i najtańszym sposobem jest zastosowanie urządzeń elektrycznych, takich jak mikrofony, przetworniki magnetyczne i piezoelektryczne (do instrumentów smyczkowych, a czasem także do instrumentów perkusyjnych, np. fortepianów).

Te urządzenia elektroakustyczne przechwytują wahania ciśnienia akustycznego powietrza (przetworniki magnetyczne rejestrują drgania strun, a czujniki piezoelektryczne rejestrują wibracje ciała) i przetwarzają je na analogowy sygnał elektryczny.

W momencie tej przemiany dźwięk dla nas „znika”. Potem podczas pracy mamy do czynienia jedynie z „cichymi” oscylacjami elektrycznymi.

To właśnie te wibracje przenoszone są wewnątrz sprzętu muzycznego – wzmacniaczy, efektów analogowych, magnetofonów itp. Aby te wibracje, czy to wzmocnione, przetworzone, czy po prostu nagrane na taśmie magnetycznej, ponownie zamieniły się w dźwięk, muszą zostać ponownie przetworzone w dźwięk za pomocą specjalnego urządzenia wibrującego powietrze. To urządzenie nazywa się głośnikiem.

Sygnał analogowy ma główną właściwość – jest ciągły w czasie i co milisekundę – a przynajmniej jedną milionową sekundy – ma określony parametr. Załóżmy, że w przypadku analogowej elektronicznej reprezentacji dźwięku może to być amplituda (największy rozrzut wartości od średniej).

Sygnał analogowy odbierany z mikrofonu pokazuje nam historię częstych zmian ciśnienia akustycznego w pewnym okresie czasu. Śpiewamy powiedzmy piosenkę, w której zaplanowaliśmy 2 minuty wokali w zwrotkach i refrenach, a podczas nagrywania dostajemy jakby kronikę zmian ciśnienia akustycznego na membranie mikrofonu.

Elektryczne sygnały analogowe uzyskane poprzez konwersję wibracji dźwięku najłatwiej przedstawić w postaci wykresów sinusoidalnych. Dźwięk muzyczny i niemuzyczny to tak naprawdę złożona suma sinusoid.

Ale może być też prosto – gdy analogowy generator tonów poda nam pojedynczą falę sinusoidalną o częstotliwości powiedzmy 440 Hz (nuta „A”), z głośnika usłyszymy wyraźny, ale nudny „pik”.

I w końcu dochodzimy do zysku. Słowo zysk oznacza zysk. Jego poziom ustalamy za pomocą regulatorów na wzmacniaczach i kartach dźwiękowych. Różni się to od pokręteł regulacji „głośności” lub „poziomu ciśnienia akustycznego” (Level) tym, że możemy wzmocnić sygnał poza granicę, powyżej której rozpoczyna się jego zniekształcenie.

Przyjrzyjmy się teraz bliżej: nasza sinusoida (pamiętajmy, że symbolizuje i wizualizuje dla nas sygnał analogowy wewnątrz urządzenia elektrycznego) to takie symetryczne okrągłe „wzgórza” i „doliny”, które okresowo się powtarzają.

Możemy zwiększać wysokość „wzgórz” i głębokość „dolin” (czyli amplitudę), czyli inaczej „wzmacniać sygnał”, „dodawać wzmocnienia” nie w nieskończoność.

Nie będziemy tutaj rozmawiać o budowie obwodów urządzeń, załóżmy na wiarę, że każde z nich ma fizyczną granicę, do której urządzenie może proporcjonalnie zwiększyć amplitudę sygnału – bez „łamania” go.

Kiedy wzmocnienie osiągnie punkt krytyczny i przekroczy dopuszczalne wartości, obwód fizyczny urządzenia zaczyna odcinać „góry” od góry i przycinać „doliny” od dołu.

W żargonie inżynierskim nazywa się to „obcinaniem analogowym”. W takim przypadku oprócz przydatnego sygnału dźwiękowego w głośnikach może być słyszalny świszczący oddech, grzechotanie i trzeszczenie. W inżynierii audio nazywa się to również „zniekształceniem nieliniowym”.

Teraz rozumiemy, że poziom głośności w technologii muzycznej to zmiana amplitudy sygnału PRZED granicą, powyżej której zaczyna się on zniekształcać. A „zysk” może z łatwością przekroczyć te granice.

Paradoks polega na tym, że gdy wzmocnienie zostanie zwiększone znacznie powyżej dopuszczalnej wartości, ciśnienie akustyczne wytwarzane przez głośniki (do których wyprowadzany jest przetworzony sygnał) nie zawsze wzrasta. Powyższe dotyczy cyfrowego przetwarzania dźwięku.

Powiedzmy, że w DAW, który wysyła przetworzony sygnał do karty dźwiękowej, podczas obcinania i zwiększania wzmocnienia na konsoli wirtualnej do strefy szalonych wartości, nie następuje rzeczywisty wzrost poziomu głośności. W głośnikach monitorów audio słychać jedynie dodatek coraz większych zniekształceń. Dzieje się tak za sprawą szczególnej reprezentacji dźwięku w „cyfry”, o czym powiemy kilka słów poniżej.

Na razie wróćmy do „ujemnych decybeli”. Pamiętaj, że dB to jednostki względne, które mają sens tylko wtedy, gdy są powiązane z jakimś punktem odniesienia.

W nagraniu dźwięku za taki punkt przyjmuje się poziom sygnału, powyżej którego rozpoczyna się zniekształcenie. Jest on oznaczony jako „zero”. Wszystko w strefie „do zera” to sygnał bez przesterowania, którego poziom jest oznaczony w dB z „minusem”. Wszystko powyżej to zniekształcony sygnał z odciętą amplitudą („szczyty i doliny”). I oznaczają to w dB z „plusem”.

Zwyczajowo wyświetla się poziom głośności w „ujemnych” decybelach zarówno na urządzeniach analogowych, jak i cyfrowych. Jest to wygodne i wizualne.

Co dzieje się z głośnością w trybie cyfrowym?

W naszych kartach dźwiękowych sygnał analogowy jest najpierw nieznacznie wzmacniany przez przedwzmacniacz, a następnie przepuszczany przez przetwornik analogowo-cyfrowy (ADC). Aby uprościć, oto co robi ADC:

    1. Odcina pasmo częstotliwości, usuwając niepotrzebne rzeczy, np. dźwięk poniżej 20 Hz, którego dana osoba nadal nie słyszy;
    2. ADC dzieli sygnał ciągły na określoną liczbę pojedynczych wartości (próbkowanie i kwantyzacja), czyli tak naprawdę zamienia naszą gładką falę sinusoidalną w ciąg „kolumn”.

Częstotliwość próbkowania określa liczbę takich „kolumn”. Głębia bitowa kwantyzacji lub „głębokość bitowa” określa dokładność reprezentacji każdej „kolumny”.

Im wyższa częstotliwość próbkowania (więcej pasków), tym sygnał cyfrowy jest bliższy oryginalnej gładkiej fali sinusoidalnej.

Głębia bitowa wpływa na dokładność pomiaru sygnału w określonym momencie. Im więcej bitów, tym mniejszy błąd. 16 bitów dla dźwięku nie jest złe, 24 bity są jeszcze lepsze.

  • ADC koduje lub „digitalizuje” każdą „kolumnę”, przedstawiając ją jako konkretny numer z numerem seryjnym.

W naszych cyfrowych stacjach audio dźwięk fizyczny, najpierw przetworzony na sygnał analogowy, a następnie na sygnał cyfrowy za pomocą przetwornika ADC, staje się zbiorem matematycznych abstrakcji. Ważne jest zrozumienie, że dźwięk to tylko matematyka. W przewodach i oprogramowaniu nie ma prawdziwego „dźwięku”.

Warunkowy jest także „zero” poziomu głośności w cyfrowej stacji audio, powyżej którego zaczynają się zniekształcenia. W przypadku 24-bitowego przetwornika ADC „cyfrowe zero” to po prostu 24 binarne „komórki”, z których każda zawiera wartość „1”.

Ponieważ brakuje 25. i wszystkich kolejnych komórek, sygnał przekraczający „zero” po prostu nie może zwiększyć głośności. Zamiast tego dodaje się do niego coraz więcej zniekształceń.

Podczas pracy z poziomami głośności w cyfrowych stacjach audio ważne jest, aby unikać zniekształceń. Ponieważ sygnał cyfrowy zebrany z szyn głównych naszej stacji audio jest przesyłany do przetwornika cyfrowo-analogowego (DAC), który wyprowadza go do monitorów audio lub słuchawek. Tutaj słyszymy zniekształcenia (przycinanie), które świadczą o uszkodzeniu ścieżki dźwiękowej. Czasami zniekształcenia mogą być przyjemne, na przykład po dodaniu niewielkiego zniekształcenia taśmy (taśmy), które inżynierowie dźwięku mogą celowo wykorzystać.

Jak obsługiwać poziomy głośności w DAW

Światowe wytwórnie zarówno na Zachodzie, jak i na Wschodzie, które zatrudniają inżynierów dźwięku lub zawierają z nimi umowy, zazwyczaj proszą o miksy i pochodzą od muzyków bez masteringu z poziomem głośności nie wyższym niż -6 dB w szczycie. Potrzebują tego, aby mieć „przestrzeń objętościową” do dalszego przetwarzania.

Ważne jest, aby zrozumieć, że mówimy o wartościach szczytowych, a nie o średnim poziomie ciśnienia akustycznego ścieżki dźwiękowej, mierzonym w RMS lub LUF (formalna średnia głośność połączona z głośnością postrzeganą).

Logika i doświadczenie podpowiadają, że nagrywając głosy, żywe instrumenty i syntezatory za pomocą karty dźwiękowej, możemy kontrolować poziom wzmocnienia na wejściu i zobaczyć poziom -dB w DAW.

Staraj się, aby szczyty rejestrowanego sygnału na wejściu nigdy nie przekraczały -6, akceptowalne jest -5 dB i nie pozwól, aby „dochód” osiągnął 0 dB.

Używając wirtualnych syntezatorów i samplowanych instrumentów w swoim DAW, możesz poczuć się trochę swobodniej. Konieczne jest jednak, aby na wyjściach instrumentów wirtualnych i wtyczkach przetwarzających zawsze był „prześwit” głośności.

Rozpoczynając aranżację w projekcie, zaleca się natychmiastowe ustawienie tłumików konsoli DAW dla wszystkich ścieżek na -10, a najlepiej -12 dB. Spowoduje to utworzenie rezerwy objętości.

Należy pamiętać, że ścieżka dźwiękowa zazwyczaj zawiera dramat. Wydarzenia muzyczne rozwijają się, prowadząc do kulminacji. A kiedy wiele instrumentów wejdzie na forte w tym samym czasie, całkowity poziom sygnału na szynie głównej z konieczności przekroczy poziom sygnału dowolnej konkretnej ścieżki. Dlatego też wytwórnia do ostatecznej obróbki (masteringu) powinna dostarczyć plik, w którym wartości szczytowe nie przekraczają -6 dB.

Lepiej unikać przekraczania tego poziomu na magistrali głównej podczas aranżacji i wstępnego miksowania, niż tracić czas na późniejsze obniżanie poziomu każdej ścieżki. Należy także zdawać sobie sprawę z możliwości automatyzacji wolumenów, co może prowadzić do dodatkowych problemów. Wskazane jest, aby we wstępnym miksie uzyskać ten sam obraz, który był pierwotnie zamierzony.

Obawy, że miks będzie brzmiał „cicho”, są często bezpodstawne. Dźwięk w DAW nigdy nie jest naprawdę „cichy” – to po prostu matematyczna abstrakcja. Inżynier wytwórni, który otrzyma łodygi lub suchą mieszankę o wartościach szczytowych -8 lub nawet -10 dB, nie będzie zawiedziony. Sam dokona wszystkich niezbędnych dostosowań.

Pracując z poziomami głośności w DAW, należy przestrzegać kilku zasad, które pomogą uniknąć większości problemów.

  • Patrick Stevensen: DJ i producent muzyczny. Od ponad 5 lat zajmuje się profesjonalnie tworzeniem EDM i DJingiem. Posiada wykształcenie muzyczne w klasie fortepianu. Tworzy własne bity i miksuje muzykę. Regularnie występuje w setach DJ-skich w różnych klubach. Jest jednym z autorów artykułów o muzyce na blogu Amped Studio.

Darmowa rejestracja

Zarejestruj się za darmo i otrzymaj jeden projekt za darmo