Co je Gain Staging
Digitální audio svět se může zdát matoucí. Například ve fyzice zvuku se hlasitost měří v decibelech a hodnoty jsou vždy kladné, ale v digitálních pracovních stanicích (DAW) se decibely náhle stanou zápornými. A co je to za zvláštní kouzlo?
Další záhada: na obrazovce DAW můžete někdy vidět úrovně signálu, které jsou nad nulou, a někdy se objeví i „pozitivní“ decibely. co to všechno znamená? Pomozte mi pochopit! Pojmy „hlasitost“, „zisk“, „úroveň“ jsou kolem nás a na YouTube neustále slyšet – jaký je však mezi nimi rozdíl?
Zkusme to pochopit bez složitých vzorců. Koneckonců jsme většinou muzikanti, ne inženýři. A zároveň se naučíme, jak správně organizovat tzv. “level headroom” v našich hudebních projektech vytvořených pomocí DAW.
V digitálním záznamu zvuku není v podstatě žádná hlasitost. Co jsou „přirozené“ decibely
„Hlasitost“ je více než jen slovo, které se pokouší popsat intenzitu akustického tlaku působícího na uši. Pro každého člověka jsou tiché a hlasité zvuky vnímány subjektivně. To, co je pro jednoho „hlasité“, může být pro jiného „strašně hlasité“.
Tvorba hudby vždy vyžaduje zohlednění subjektivních kritérií, což někdy narušuje porozumění mezi účastníky tvůrčího procesu. Proto je důležité mít při práci na hudebních projektech objektivnější chápání hlasitosti.
V přírodě neexistuje přímá analogie objemu, jako v digitálním světě. Zvuk se šíří elastickými vlnami v plynném, kapalném nebo pevném prostředí. Zdrojem zvuku je fyzické tělo, které zažívá mechanické vibrace, jako je struna nebo lidské hlasivky.
Zkusme si to představit vizuálně, i když ne příliš vědecky: po zaznění struny se rozvibruje do stran (v trojrozměrném prostoru) s určitou frekvencí a amplitudou a vytváří kolem sebe elastické vlny.
Tyto vlny způsobují oblasti vysokého a nízkého tlaku vzduchu, které se šíří plynným prostředím. Fyzici tyto vibrace popisují jako „zvukový tlak“.
Pro měření intenzity akustického tlaku vyvinuli vědci vzorec, který bere v úvahu samotný tlak, akustickou impedanci média a časové průměrování. To nám umožňuje získat střední kvadratickou hodnotu intenzity zvuku v určitém bodě v čase a prostoru.
V hudbě jsou zvukové vibrace převážně periodické, podobně jako vibrace struny. Někdy hodnotíme jejich intenzitu pomocí konceptu „amplitudy akustického tlaku“, ale ve skutečnosti to není tak důležité.
Skutečně důležité je, že kladné decibely (označené „+“) ve fyzice odkazují na intenzitu akustického tlaku, ale pouze ve vztahu k určitému bodu na stupnici. Decibely jsou relativní, logaritmické nebo vícenásobné jednotky a mají smysl pouze v případě, že existuje „výchozí bod“.
Ve fyzice je tímto výchozím bodem tlaková hladina 20 mikropascalů (µPa) – to je průměrný práh lidského sluchu, když ještě nevnímá zvuky a cítí ticho. I když kočka by s tím asi nesouhlasila.
Stupeň hlasitosti vnímané osobou je studován samostatně pomocí vlastních jednotek měření, jako jsou fondy, její frekvenční složení a další faktory. Ale při práci s DAW nejsou tyto detaily tak důležité. Jde nám hlavně o to, abychom se nespletli s decibely.
0 decibelů SPL (hladina akustického tlaku) znamená pro člověka ticho. Níže jsou uvedeny některé typické hodnoty pro srovnání:
- 15 dB – „Sotva slyšitelné“ – je to jako šustění listí;
- 35 dB – „Jasně slyšitelné“ – například tlumená konverzace, tiché prostředí v knihovně nebo hluk ve výtahu;
- 50 dB – „Jasně slyšitelné“ – to je jako konverzace při střední hlasitosti, tichá ulice nebo provoz pračky;
- 70 dB – „Hlučný“ – například hlasité hovory na vzdálenost 1 m, hluk psacího stroje, hlučná ulice nebo fungující vysavač na vzdálenost 3 m;
- 80 dB – „Velmi hlučné“ – to je jako hlasitý budík na vzdálenost 1 m, křik, zvuk motocyklu s tlumičem nebo zvuk běžícího motoru náklaďáku. Poslouchání takových zvuků po dlouhou dobu může způsobit ztrátu sluchu;
- 95 dB – „Velmi hlučné“ – např. hluk vagonu metra ve vzdálenosti 7 m nebo hlasité piano hrající ve vzdálenosti 1 m;
- 130 dB – „Bolest“ je jako siréna, hluk nýtovacích kotlů, nejhlasitější křik nebo motorka bez tlumiče;
- 160 dB – „Šok“ je úroveň, při které pravděpodobně dojde k protržení ušního bubínku, jako je výbuch brokovnice blízko ucha, soutěž o ozvučení auta nebo rázová vlna z nadzvukového letadla nebo exploze 0,002 megapascalu.
Nahrávání zvuku. Objem a zisk
Když zaznamenáváme zvuk, musíme převést periodické zvukové vibrace ve vzduchu na elektrické. Od vynálezu fonautografu v roce 1857 vědci a inženýři experimentovali s různými metodami záznamu zvuku.
Ukazuje se, že nejúčinnějším a nejlevnějším způsobem je použití elektrických zařízení, jako jsou mikrofony, magnetické a piezoelektrické snímače (pro smyčce a někdy i bicí nástroje, jako jsou klavíry).
Tato elektroakustická zařízení zachycují kolísání akustického tlaku vzduchu (magnetické snímače zaznamenávají vibrace strun a piezoelektrické snímače zaznamenávají vibrace těla) a převádějí je na analogový elektrický signál.
V okamžiku této transformace pro nás zvuk „zmizí“. Poté se během naší práce zabýváme pouze „tichými“ elektrickými oscilacemi.
Právě tyto vibrace se přenášejí uvnitř hudebních zařízení – zesilovače, analogové efekty, magnetofony atd. Aby se tyto vibrace, ať už zesílené, zpracované nebo jednoduše zaznamenané na magnetofonový pásek, opět proměnily ve zvuk, je nutné je převést zpět do zvuku pomocí speciálního zařízení vzduchové vibrace. Toto zařízení se nazývá reproduktor.
Analogový signál má hlavní vlastnost – je spojitý v čase a v každé milisekundě – nebo alespoň jedné miliontině sekundy – má určitý parametr. Řekněme, že v případě analogové elektronické reprezentace zvuku by to mohla být amplituda (největší rozptyl hodnot od průměru).
Analogový signál přijímaný z mikrofonu nám ukazuje historii častých změn akustického tlaku za určité časové období. Zpíváme řekněme písničku, ve které máme naplánované 2 minuty zpěvu ve slokách a refrénech a při nahrávání dostáváme jakoby kroniku změn akustického tlaku na membráně mikrofonu.
Elektrické analogové signály získané převodem zvukových vibrací jsou nejsnáze znázorněny ve formě sinusových grafů. Hudební a nehudební zvuk jsou ve skutečnosti komplexním součtem sinusoid.
Ale může to být také jednoduché – když nám analogový tónový generátor dá jednu jedinou sinusovku s frekvencí řekněme 440 Hertzů (pozn. „A“), slyšíme z reproduktoru jasné, ale nudné „pípnutí“.
A konečně se dostáváme k zisku. Slovo zisk znamená zisk. Jeho úroveň nastavujeme regulátory na zesilovačích a zvukových kartách. To se liší od ovládacích knoflíků „hlasitost“ nebo „hladina akustického tlaku“ (Level) v tom, že můžeme signál zesílit až za hranici, za kterou začíná jeho zkreslení.
Nyní se podívejme blíže: naše sinusoida (nezapomeňte, že pro nás symbolizuje a vizualizuje analogový signál uvnitř elektrického spotřebiče) jsou takové symetrické oblé „kopce“ a „údolí“, které se periodicky opakují.
Výšku „kopců“ a hloubku „údolí“ (tedy amplitudu) nebo jinými slovy „zesílit signál“, „přidat zisk“ můžeme zvyšovat ne donekonečna.
Nebudeme se zde bavit o obvodovém návrhu zařízení, vezměme si jen víru, že každé z nich má fyzikální limit, do kterého může zařízení úměrně zvýšit amplitudu signálu – aniž by ji „rozbilo“.
Když zisk dosáhne kritického bodu a překročí přípustné hodnoty, fyzický obvod zařízení začne odřezávat „hory“ shora a ořezávat „údolí“ zdola.
V inženýrském jazyce se tomu říká „analogové ořezávání“. V tomto případě může být z reproduktorů kromě užitečného zvukového signálu slyšet sípání, chrastění a praskání. V audiotechnice se tomu také říká „nelineární zkreslení“.
Nyní můžeme pochopit, že úroveň hlasitosti v hudební technologii je změnou amplitudy signálu PŘED limitem, za kterým se začne zkreslovat. A „zisk“ může snadno překročit tyto limity.
Paradoxem je, že když je zesílení zvýšeno výrazně nad přípustnou hodnotu, ne vždy se zvýší akustický tlak vytvářený reproduktory (do kterých je vyveden zpracovaný signál). Výše uvedené platí pro digitální zpracování zvuku.
Řekněme, že uvnitř DAW, který posílá zpracovaný signál na zvukovou kartu, při ořezávání a zvyšování gainu na virtuální konzoli do pásma šílených hodnot nedochází k žádnému skutečnému zvýšení úrovně hlasitosti. V reproduktorech audio monitorů slyšíme pouze přidávání dalšího a dalšího zkreslení. To je způsobeno speciální reprezentací zvuku v „digitálním formátu“, o kterém si řekneme pár slov níže.
Prozatím se vraťme k „záporným decibelům“. Pamatujte, že dB jsou relativní jednotky, které mají smysl pouze tehdy, pokud se vztahují k nějakému referenčnímu bodu.
Při záznamu zvuku se za takový bod považuje úroveň signálu, za kterou začíná zkreslení. Označuje se jako „nula“. Vše v zóně „to zero“ je signál bez ořezu, jehož úroveň je indikována v dB se „mínusem“. Vše výše uvedené je zkreslený signál s omezením amplitudy („vrcholy a údolí“). A označují to v dB se „plus“.
Na analogových i digitálních zařízeních je obvyklé zobrazovat úroveň hlasitosti v „záporných“ decibelech. Je to pohodlné a vizuální.
Co se stane s hlasitostí v digitálu?
U našich zvukových karet je analogový signál nejprve mírně zesílen předzesilovačem a poté prochází analogově-digitálním převodníkem (ADC). Pro zjednodušení ADC dělá toto:
-
- Odřízne frekvenční pásmo, odstraní nepotřebné věci, například zvuk pod 20 Hz, který člověk stále neslyší;
- ADC rozděluje spojitý signál na určitý počet jednotlivých hodnot (vzorkování a kvantování), to znamená, že vlastně promění naši hladkou sinusovku na sekvenci „sloupců“.
Vzorkovací frekvence určuje počet takových „sloupců“. Kvantizační bitová hloubka neboli „bitová hloubka“ určuje přesnost reprezentace každého „sloupce“.
Čím vyšší je vzorkovací frekvence (více čárek), tím blíže je digitální signál původní hladké sinusovce.
Bitová hloubka ovlivňuje přesnost měření signálu v určitém okamžiku. Čím více bitů, tím menší chyba. 16 bitů pro zvuk není špatné, 24 bitů je ještě lepší.
- ADC zakóduje nebo „digitalizuje“ každý „sloupec“ a představuje jej jako konkrétní číslo se sériovým číslem.
V našich digitálních audio stanicích se fyzický zvuk, nejprve převedený na analogový signál a poté na digitální signál pomocí ADC, stává souborem matematických abstrakcí. Důležité je pochopit, že zvuk je jen matematika. V kabelech nebo softwaru není žádný skutečný „zvuk“.
„Nulová“ úroveň hlasitosti v digitální audio stanici, za kterou začíná zkreslení, je také podmíněna. Pro 24bitovou hloubku ADC je „digitální nula“ pouze 24 binárních „buněk“, z nichž každá obsahuje hodnotu „1“.
Protože chybí 25. a všechny následující buňky, signál přesahující „nulu“ jednoduše nemůže zvýšit hlasitost. Místo toho se k tomu přidává další a další zkreslení.
Při práci s úrovněmi hlasitosti v digitálních audio stanicích je důležité zabránit zkreslení. Protože digitální signál shromážděný z hlavních sběrnic naší audio stanice je posílán do digitálně-analogového převodníku (DAC), který jej vysílá na audio monitory nebo sluchátka. Zde slyšíme zkreslení (ořezávání), které značí poškození zvukové stopy. Někdy může potěšit zkreslení, např. při přidání mírného páskového (páskového) zkreslení, čehož mohou zvukaři účelově využít.
Jak zacházet s úrovněmi hlasitosti ve vašem DAW
Světové labely jak na Západě, tak na Východě, které mají ve svých řadách zvukaře nebo s nimi uzavírají smlouvy, obvykle požadují mixy a stem od hudebníků bez masteringu s úrovní hlasitosti maximálně -6 dB. Potřebují to, aby měli „objemový prostor“ pro další zpracování.
Je důležité pochopit, že mluvíme o špičkách, nikoli o průměrné hladině akustického tlaku zvukové stopy, která se měří v RMS nebo LUF (formální průměrná hlasitost kombinovaná s vnímanou hlasitostí).
Logika a zkušenost velí, že při nahrávání hlasů, živých nástrojů a syntezátorů přes zvukovou kartu můžeme ovládat úroveň zisku na vstupu a vidět úroveň -dB uvnitř DAW.
Snažte se zajistit, aby špičky zaznamenaného signálu na vstupu nikdy nepřekročily -6, -5 dB je přijatelné, a nedovolte, aby „příjem“ dosáhl 0 dB.
Použitím virtuálních syntezátorů a samplovaných nástrojů uvnitř vašeho DAW se můžete cítit o něco svobodněji. Je však nutné, aby na výstupech virtuálních nástrojů a zpracovatelských zásuvných modulech byl vždy „headroom“ v objemu.
Při spouštění aranžmá v projektu se doporučuje okamžitě nastavit fadery DAW konzole pro všechny stopy na -10, nejlépe -12 dB. Tím se vytvoří objemová rezerva.
Je důležité si uvědomit, že soundtrack obvykle obsahuje drama. Rozvíjejí se hudební události, které vedou k vyvrcholení. A když do forte vstoupí mnoho nástrojů současně, celková úroveň signálu na hlavní sběrnici nutně překročí úroveň signálu jakékoli konkrétní stopy. Proto by štítek pro konečné zpracování (mastering) měl poskytovat soubor, ve kterém špičky nepřesahují -6 dB.
Je lepší se vyhnout překročení této úrovně na hlavní sběrnici během aranžování a předmixování, než ztrácet čas pozdějším snižováním úrovně každé stopy. Měli byste si být také vědomi možnosti automatizace hlasitosti, která může vést k dalším problémům. Je vhodné dostat do předběžného mixu stejný obrázek, který byl původně zamýšlen.
Obavy, že mix bude znít „klidně“, jsou často neopodstatněné. Zvuk v DAW není nikdy skutečně „tichý“ – je to jen matematická abstrakce. Technik labelu, který dostane stopky nebo suchou směs s -8 nebo dokonce -10 dB vrcholy, nebude zklamán. Všechny potřebné úpravy provede sám.
Při práci s úrovněmi hlasitosti ve vašem DAW je třeba dodržovat několik pravidel, která vám pomohou vyhnout se většině problémů.