Wat is Gain Staging

Auteur

Antony Tornver

Gepubliceerd

April 27, 0024

De wereld van digitale audio kan verwarrend zijn. In de fysica van geluid wordt luidheid bijvoorbeeld gemeten in decibel, en de waarden zijn altijd positief, maar in digitale werkstations (DAW's) worden decibel plotseling negatief. Wat is dit voor vreemde magie?

Nog een mysterie: op het DAW-scherm zie je soms signaalniveaus die boven nul liggen, en soms verschijnen er zelfs 'positieve' decibels. Wat betekent dit allemaal? Help me het te begrijpen! De termen 'volume', 'gain' en 'level' horen we voortdurend om ons heen en op YouTube, maar wat is het verschil tussen deze termen?

Laten we proberen dit te begrijpen zonder ingewikkelde formules. We zijn tenslotte vooral muzikanten, geen ingenieurs. Tegelijkertijd leren we hoe we de zogenaamde 'level headroom' in onze muzikale projecten die met een DAW zijn gemaakt, goed kunnen organiseren.

In digitale audio-opnames is er in wezen geen volume. Wat zijn 'natuurlijke' decibel

'Loudness' is meer dan alleen een woord dat de intensiteit van de geluidsdruk op de oren probeert te beschrijven. Voor elke persoon worden zachte en luide geluiden subjectief waargenomen. Wat voor de ene persoon gewoon 'luid' is, kan voor een ander 'verschrikkelijk luid' zijn.

Bij het maken van muziek moet altijd rekening worden gehouden met subjectieve criteria, wat soms het begrip tussen deelnemers aan het creatieve proces in de weg staat. Daarom is het belangrijk om een objectiever begrip van volume te hebben bij het werken aan muziekprojecten.

In de natuur bestaat er geen directe analogie voor volume, zoals in de digitale wereld. Geluid verspreidt zich via elastische golven in een gasvormig, vloeibaar of vast medium. De bron van geluid is een fysiek lichaam dat mechanische trillingen ondergaat, zoals een snaar of menselijke stembanden.

Laten we dit eens visueel voorstellen, hoewel niet erg wetenschappelijk: nadat de snaar klinkt, trilt deze zijwaarts (in een driedimensionale ruimte) met een bepaalde frequentie en amplitude, waardoor er elastische golven omheen ontstaan.

Deze golven veroorzaken gebieden met hoge en lage luchtdruk die zich door de gasvormige omgeving voortplanten. Natuurkundigen omschrijven deze trillingen als "geluidsdruk".

Om de intensiteit van de geluidsdruk te meten, hebben wetenschappers een formule ontwikkeld die rekening houdt met de druk zelf, de akoestische impedantie van het medium en de tijdgemiddelde. Hierdoor kunnen we de kwadratische gemiddelde waarde van de geluidsintensiteit op een bepaald moment in tijd en ruimte verkrijgen.

In de muziek zijn geluidstrillingen voornamelijk periodiek, vergelijkbaar met de trillingen van een snaar. Soms beoordelen we hun intensiteit aan de hand van het concept 'geluidsdrukamplitude', maar in werkelijkheid is dit niet zo belangrijk.

Wat echt belangrijk is, is dat positieve decibels (aangeduid met een '+') in de natuurkunde verwijzen naar de intensiteit van de geluidsdruk, maar alleen ten opzichte van een specifiek punt op een schaal. Decibels zijn relatieve, logaritmische of submultiple eenheden en hebben alleen betekenis als er een 'startpunt' is.

In de natuurkunde is dit startpunt een drukniveau van 20 micropascal (µPa) – dit is de gemiddelde drempel van het menselijk gehoor wanneer het nog geen geluiden waarneemt en stilte voelt. Hoewel de kat het hier waarschijnlijk niet mee eens zou zijn.

De mate waarin een persoon geluid waarneemt, wordt apart bestudeerd, met behulp van eigen meeteenheden, zoals fondsen, de frequentiesamenstelling en andere factoren. Maar bij het werken met een DAW zijn deze details niet zo belangrijk. Het belangrijkste voor ons is dat we niet in de war raken met decibels.

0 decibel SPL (geluidsdrukniveau) betekent stilte voor een mens. Hieronder staan enkele typische waarden ter vergelijking:

15 dB – "Nauwelijks hoorbaar" – het is als het ritselen van bladeren;
35 dB – "Duidelijk hoorbaar" – bijvoorbeeld een gedempt gesprek, een rustige omgeving in een bibliotheek of geluid in een lift;
50 dB – "Duidelijk hoorbaar" – dit is zoals een gesprek op gemiddeld volume, een rustige straat of het geluid van een wasmachine;
70 dB – "Luidruchtig" – bijvoorbeeld luide gesprekken op een afstand van 1 m, het geluid van een typemachine, een drukke straat of een werkende stofzuiger op een afstand van 3 m;
80 dB – "Zeer luidruchtig" – dit is vergelijkbaar met een luide wekker op een afstand van 1 m, een schreeuw, het geluid van een motorfiets met een uitlaatdemper of het geluid van een draaiende vrachtwagenmotor. Langdurig luisteren naar dergelijke geluiden kan gehoorverlies veroorzaken;
95 dB – 'Zeer luidruchtig' – bijvoorbeeld het geluid van een metro op een afstand van 7 m of een luid bespeelde piano op een afstand van 1 m;
130 dB – 'Pijn' is vergelijkbaar met een sirene, het geluid van klinkende boilers, de luidste schreeuw of een motorfiets zonder uitlaatdemper;
160 dB – 'Schok': het niveau waarbij het trommelvlies waarschijnlijk scheurt, zoals een geweerschot dicht bij het oor, een wedstrijd tussen autosoundsystemen of de schokgolf van een supersonisch vliegtuig of een explosie van 0,002 megapascal.

Geluidsopname. Volume en versterking

Wanneer we geluid opnemen, moeten we periodieke geluidstrillingen in de lucht omzetten in elektrische trillingen. Sinds de uitvinding van de fonautograaf in 1857 hebben wetenschappers en ingenieurs geëxperimenteerd met verschillende methoden om geluid op te nemen.

De meest effectieve en goedkoopste manier blijkt het gebruik van elektrische apparaten te zijn, zoals microfoons, magnetische en piëzo-elektrische pickups (voor snaren en soms percussie-instrumenten zoals piano's).

Deze elektro-akoestische apparaten vangen schommelingen in de luchtgeluidsdruk op (magnetische pickups registreren snaartrillingen en piëzo-elektrische sensoren registreren lichaamstrillingen) en zetten deze om in een analoog elektrisch signaal.

Op het moment van deze omzetting 'verdwijnt' het geluid voor ons. Daarna hebben we tijdens ons werk alleen nog maar te maken met 'stille' elektrische oscillaties.

Het zijn deze trillingen die worden doorgegeven in muziekapparatuur – versterkers, analoge effecten, bandrecorders, enz. Om deze trillingen, of ze nu worden versterkt, verwerkt of gewoon op magnetische band worden opgenomen, weer in geluid om te zetten, moeten ze met behulp van een speciaal apparaat weer worden omgezet in geluid. Dit apparaat wordt een luidspreker genoemd.

Een analoog signaal heeft als belangrijkste eigenschap dat het continu is in de tijd en dat het elke milliseconde – of ten minste een miljoenste van een seconde – een bepaalde parameter heeft. Laten we zeggen dat dit in het geval van een analoge elektronische weergave van geluid de amplitude kan zijn (de grootste spreiding van waarden ten opzichte van het gemiddelde).

Het analoge signaal dat we van de microfoon ontvangen, toont ons een geschiedenis van frequente veranderingen in de geluidsdruk gedurende een bepaalde periode. We zingen bijvoorbeeld een liedje waarin we 2 minuten zang hebben gepland in de coupletten en refreinen, en bij het opnemen krijgen we als het ware een kroniek van veranderingen in de geluidsdruk op het membraan van de microfoon.

Elektrische analoge signalen die worden verkregen door geluidstrillingen om te zetten, kunnen het gemakkelijkst worden weergegeven in de vorm van sinusachtige grafieken. Muzikale en niet-muzikale geluiden zijn in feite een complexe som van sinusoïden.

Maar het kan ook eenvoudig zijn: wanneer de analoge toongenerator ons één enkele sinusgolf geeft met een frequentie van bijvoorbeeld 440 Hertz (noot "A"), horen we een heldere maar saaie "piep" uit de luidspreker.

En tot slot komen we bij de versterking. Het woord gain betekent versterking. We stellen het niveau in met regelaars op versterkers en geluidskaarten. Dit verschilt van de regelknoppen voor 'volume' of 'geluidsdrukniveau' (Level) in die zin dat we het signaal kunnen versterken tot voorbij de grens waarboven vervorming optreedt.

Laten we dit nu eens nader bekijken: onze sinusgolf (onthoud dat deze voor ons een analoog signaal in een elektrisch apparaat symboliseert en visualiseert) bestaat uit symmetrische ronde 'heuvels' en 'dalen' die zich periodiek herhalen.

We kunnen de hoogte van de 'heuvels' en de diepte van de 'dalen' (dat wil zeggen de amplitude) verhogen, of met andere woorden, het signaal versterken, versterking toevoegen, maar niet oneindig.

We zullen hier niet ingaan op het circuitontwerp van de apparaten, maar gaan er gewoon vanuit dat elk apparaat een fysieke limiet heeft tot waar het de amplitude van het signaal proportioneel kan verhogen – zonder het te "breken".

Wanneer de versterking een kritiek punt bereikt en de toegestane waarden overschrijdt, begint het fysieke circuit van het apparaat de 'bergen' van bovenaf af te snijden en de 'dalen' van onderaf bij te snijden.

In technisch jargon wordt dit "analoge clipping" genoemd. In dit geval kunnen er naast het bruikbare geluidssignaal ook piepende, ratelende en krakende geluiden uit de luidsprekers komen. In de audiotechniek wordt dit ook wel "niet-lineaire vervorming" genoemd.

Nu kunnen we begrijpen dat het volumeniveau in de muziektechnologie een verandering is in de amplitude van het signaal VOORDAT de grens wordt overschreden waarboven het begint te vervormen. En 'versterking' kan deze grenzen gemakkelijk overschrijden.

De paradox is dat wanneer de versterking aanzienlijk wordt verhoogd tot boven de toegestane waarde, de geluidsdruk die door de luidsprekers wordt gecreëerd (waarnaar het verwerkte signaal wordt uitgevoerd) niet altijd toeneemt. Het bovenstaande geldt voor digitale audioverwerking.

Stel dat in een DAW die het verwerkte signaal naar de geluidskaart stuurt, bij clipping en het verhogen van de versterking op de virtuele console tot waanzinnige waarden, er geen echte toename van het volumeniveau optreedt. In de luidsprekers van audiomonitors horen we alleen maar steeds meer vervorming. Dit komt door de speciale weergave van geluid in 'digitaal', waarover we hieronder nog iets zullen zeggen.

Laten we voorlopig terugkeren naar "negatieve decibels". Vergeet niet dat dB relatieve eenheden zijn die alleen zin hebben als ze betrekking hebben op een referentiepunt.

Bij geluidsopnames wordt als referentiepunt het signaalniveau genomen waarboven vervorming begint. Dit wordt aangeduid als 'nul'. Alles in de 'nul'-zone is een signaal zonder clipping, waarvan het niveau wordt aangegeven in dB met een 'min'. Alles daarboven is een vervormd signaal met een afsnijding in amplitude ('pieken en dalen'). Dit wordt aangeduid in dB met een 'plus'.

Het is gebruikelijk om het volumeniveau in 'negatieve' decibel weer te geven op zowel analoge als digitale apparaten. Dat is handig en visueel.

Wat gebeurt er met het volume in digitaal?

In onze geluidskaarten wordt het analoge signaal eerst licht versterkt door een voorversterker en vervolgens door een analoog-naar-digitaal-omzetter (ADC) geleid. Om het eenvoudig te houden, is dit wat een ADC doet:

1. Hij snijdt een frequentieband af en verwijdert onnodige zaken, bijvoorbeeld geluid onder 20 Hertz, dat een mens nog steeds niet kan horen;
2. De ADC splitst een continu signaal op in een bepaald aantal afzonderlijke waarden (sampling en kwantisering), dat wil zeggen dat hij onze vloeiende sinusgolf omzet in een reeks 'kolommen'.

De samplingfrequentie bepaalt het aantal van dergelijke 'kolommen'. De kwantisatiebitdiepte, of 'bitdiepte', bepaalt de nauwkeurigheid van elke 'kolom'-weergave.

Hoe hoger de bemonsteringsfrequentie (meer balken), hoe dichter het digitale signaal bij de oorspronkelijke vloeiende sinusgolf ligt.

De bitdiepte beïnvloedt de nauwkeurigheid van de signaalmeting op een bepaald moment. Hoe meer bits, hoe kleiner de fout. 16 bits voor audio is niet slecht, 24 bits is nog beter.

De ADC codeert of "digitaliseert" elke "kolom" en geeft deze weer als een specifiek getal met een serienummer.

In onze digitale audiostations wordt fysiek geluid, dat eerst wordt omgezet in een analoog signaal en vervolgens in een digitaal signaal met behulp van een ADC, een reeks wiskundige abstracties. Het is belangrijk om te begrijpen dat geluid slechts wiskunde is. Er is geen echt 'geluid' in de kabels of software.

Het 'nul'-volumelevel in een digitaal audiostation, waarboven vervorming begint, is ook voorwaardelijk. Voor een ADC-diepte van 24 bits is de 'digitale nul' slechts 24 binaire 'cellen', die elk de waarde '1' bevatten.

Aangezien de 25e en alle volgende cellen ontbreken, kan een signaal dat 'nul' overschrijdt eenvoudigweg niet in volume toenemen. In plaats daarvan wordt er steeds meer vervorming aan toegevoegd.

Bij het werken met volumeniveaus in digitale audiostations is het belangrijk om vervorming te voorkomen. Het digitale signaal dat wordt verzameld uit de masterbussen van ons audiostation wordt namelijk naar een digitaal-naar-analoog-omzetter (DAC) gestuurd, die het naar audiomonitors of koptelefoons stuurt. Hier horen we vervorming (clipping), wat duidt op schade aan de audiotrack. Soms kan vervorming aangenaam zijn, zoals bij het toevoegen van lichte tape (band)vervorming, die geluidstechnici doelbewust kunnen gebruiken.

Hoe ga je om met volumeniveaus in je DAW

Wereldlabels in zowel het Westen als het Oosten, die geluidstechnici in dienst hebben of contracten met hen aangaan, vragen meestal mixen en stems van muzikanten zonder mastering met volumeniveaus die niet hoger zijn dan -6 dB bij piek. Ze hebben dit nodig om een "volume headroom" te hebben voor verdere verwerking.

Het is belangrijk om te begrijpen dat we het hier hebben over pieken, niet over het gemiddelde geluidsdrukniveau van een soundtrack, dat wordt gemeten in RMS of LUF's (formele gemiddelde luidheid gecombineerd met waargenomen luidheid).

Logica en ervaring leren ons dat wanneer we stemmen, live-instrumenten en synthesizers opnemen via een geluidskaart, we het versterkingsniveau op de ingang kunnen regelen en het -dB-niveau in de DAW kunnen zien.

Probeer ervoor te zorgen dat de pieken van het opgenomen signaal aan de ingang nooit hoger zijn dan -6, -5 dB is acceptabel, en laat 'inkomsten' niet 0 dB bereiken.

Door virtuele synthesizers en gesamplede instrumenten in je DAW te gebruiken, kun je je wat vrijer voelen. Het is echter noodzakelijk dat er altijd een 'headroom' in volume is aan de uitgangen van virtuele instrumenten en verwerkingsplug-ins.

Wanneer je begint met een arrangement in een project, is het aan te raden om de DAW-consolefaders voor alle tracks onmiddellijk in te stellen op -10, of bij voorkeur -12 dB. Dit creëert een volumereserve.

Het is belangrijk om te onthouden dat de soundtrack meestal drama bevat. Muzikale gebeurtenissen ontwikkelen zich en leiden tot climaxen. En wanneer veel instrumenten tegelijkertijd het forte ingaan, zal het totale signaalniveau op de masterbus noodzakelijkerwijs het signaalniveau van een bepaalde track overschrijden. Daarom moet het label voor de uiteindelijke verwerking (mastering) een bestand leveren waarin de pieken niet hoger zijn dan -6 dB.

Het is beter om tijdens het arrangeren en pre-mixen te voorkomen dat dit niveau op de masterbus wordt overschreden, dan later tijd te verspillen aan het verlagen van het niveau van elke track. Houd ook rekening met de mogelijkheid van volumeautomatisering, wat tot extra problemen kan leiden. Het is raadzaam om in de voorlopige mix hetzelfde beeld te krijgen als oorspronkelijk bedoeld was.

De angst dat een mix 'stil' zal klinken, is vaak ongegrond. Geluid in een DAW is nooit echt 'stil' – het is slechts een wiskundige abstractie. Een labeltechnicus die een stems of dry mix krijgt met pieken van -8 of zelfs -10 dB, zal niet teleurgesteld zijn. Hij zal zelf alle nodige aanpassingen doen.

Wanneer je met volumeniveaus in je DAW werkt, zijn er een paar regels die je kunt volgen om de meeste problemen te voorkomen.

Auteur

Antony Tornver

Gepubliceerd

April 27, 0024