Was ist Gain Staging?

Die Welt der digitalen Audiotechnik kann verwirrend sein. In der Physik wird die Lautstärke beispielsweise in Dezibel gemessen, wobei die Werte immer positiv sind, aber in digitalen Workstations (DAWs) werden Dezibel plötzlich negativ. Was hat es mit dieser seltsamen Magie auf sich?
Ein weiteres Rätsel: Auf dem DAW-Bildschirm sieht man manchmal Signalpegel, die über Null liegen, und manchmal erscheinen sogar „positive” Dezibel. Was bedeutet das alles? Helfen Sie mir, das zu verstehen! Die Begriffe „Lautstärke”, „Verstärkung” und „Pegel” hört man ständig um sich herum und auf YouTube – aber was ist der Unterschied zwischen ihnen?
Versuchen wir, dies ohne komplizierte Formeln zu verstehen. Schließlich sind wir meist Musiker und keine Ingenieure. Gleichzeitig lernen wir, wie wir den sogenannten „Level Headroom“ in unseren mit einer DAW erstellten Musikprojekten richtig organisieren können.
Bei digitalen Audioaufnahmen gibt es im Wesentlichen keine Lautstärke. Was sind „natürliche“ Dezibel?
„Lautstärke“ ist mehr als nur ein Wort, das versucht, die Intensität des auf die Ohren einwirkenden Schalldrucks zu beschreiben. Für jeden Menschen werden leise und laute Töne subjektiv wahrgenommen. Was für den einen nur „laut“ ist, kann für den anderen „furchtbar laut“ sein.
Bei der Musikproduktion müssen immer subjektive Kriterien berücksichtigt werden, was manchmal das Verständnis zwischen den Teilnehmern des kreativen Prozesses beeinträchtigt. Daher ist es wichtig, bei der Arbeit an Musikprojekten ein objektiveres Verständnis von Lautstärke zu haben.
In der Natur gibt es kein direktes Analogon zur Lautstärke, wie es in der digitalen Welt der Fall ist. Schall breitet sich durch elastische Wellen in einem gasförmigen, flüssigen oder festen Medium aus. Die Schallquelle ist ein physikalischer Körper, der mechanische Schwingungen erfährt, wie beispielsweise eine Saite oder die menschlichen Stimmbänder.
Versuchen wir uns dies visuell vorzustellen, wenn auch nicht sehr wissenschaftlich: Nachdem die Saite erklingt, schwingt sie seitlich (im dreidimensionalen Raum) mit einer bestimmten Frequenz und Amplitude und erzeugt um sich herum elastische Wellen.
Diese Wellen verursachen Bereiche mit hohem und niedrigem Luftdruck, die sich durch die gasförmige Umgebung ausbreiten. Physiker bezeichnen diese Schwingungen als „Schalldruck”.
Um die Intensität des Schalldrucks zu messen, haben Wissenschaftler eine Formel entwickelt, die den Druck selbst, die akustische Impedanz des Mediums und die zeitliche Mittelung berücksichtigt. Auf diese Weise erhalten wir den quadratischen Mittelwert der Schallintensität zu einem bestimmten Zeitpunkt und an einem bestimmten Ort.
In der Musik sind Schallschwingungen hauptsächlich periodisch, ähnlich wie die Schwingungen einer Saite. Manchmal bewerten wir ihre Intensität anhand des Konzepts der „Schalldruckamplitude”, aber in Wirklichkeit ist dies nicht so wichtig.
Wichtig ist vielmehr, dass positive Dezibel (mit einem „+“ gekennzeichnet) in der Physik die Intensität des Schalldrucks bezeichnen, jedoch nur relativ zu einem bestimmten Punkt auf einer Skala. Dezibel sind relative, logarithmische oder submultiple Einheiten und nur dann sinnvoll, wenn es einen „Ausgangspunkt“ gibt.
In der Physik ist dieser Ausgangspunkt ein Druckpegel von 20 Mikropascal (µPa) – dies ist die durchschnittliche Schwelle des menschlichen Gehörs, bei der es noch keine Geräusche wahrnimmt und Stille empfindet. Obwohl die Katze dem wahrscheinlich nicht zustimmen würde.
Der Grad der wahrgenommenen Lautstärke durch eine Person wird separat untersucht, wobei eigene Maßeinheiten wie Fonds, die Frequenzzusammensetzung und andere Faktoren verwendet werden. Bei der Arbeit mit einer DAW sind diese Details jedoch nicht so wichtig. Für uns ist es vor allem wichtig, sich nicht mit Dezibel zu verwirren.
0 Dezibel SPL (Schalldruckpegel) bedeutet für einen Menschen Stille. Nachfolgend finden Sie einige typische Werte zum Vergleich:
- 15 dB – „kaum hörbar“ – etwa wie das Rascheln von Blättern;
- 35 dB – „Deutlich hörbar“ – zum Beispiel ein gedämpftes Gespräch, eine ruhige Umgebung in einer Bibliothek oder Geräusche in einem Aufzug;
- 50 dB – „Deutlich hörbar“ – das entspricht einer Unterhaltung mit mittlerer Lautstärke, einer ruhigen Straße oder dem Betrieb einer Waschmaschine;
- 70 dB – „Laut“ – zum Beispiel laute Gespräche in einer Entfernung von 1 m, das Geräusch einer Schreibmaschine, eine laute Straße oder ein laufender Staubsauger in einer Entfernung von 3 m;
- 80 dB – „Sehr laut“ – dies entspricht einem lauten Wecker in 1 m Entfernung, einem Schrei, dem Geräusch eines Motorrads mit Schalldämpfer oder dem Geräusch eines laufenden Lkw-Motors. Das längere Hören solcher Geräusche kann zu Hörverlust führen;
- 95 dB – „Sehr laut“ – zum Beispiel das Geräusch eines U-Bahn-Wagens in einer Entfernung von 7 m oder ein lautes Klavier in einer Entfernung von 1 m;
- 130 dB – „Schmerz“ – entspricht etwa einer Sirene, dem Geräusch von Nietkesseln, einem lauten Schrei oder einem Motorrad ohne Schalldämpfer;
- 160 dB – „Schock“ ist der Pegel, bei dem das Trommelfell wahrscheinlich reißt, z. B. durch einen Schuss aus einer Schrotflinte in Ohrnähe, einen Car-Audio-Wettbewerb oder die Schockwelle eines Überschallflugzeugs oder einer Explosion mit 0,002 Megapascal.
Tonaufzeichnung. Lautstärke und Verstärkung
Wenn wir Ton aufnehmen, müssen wir periodische Schallschwingungen in der Luft in elektrische Schwingungen umwandeln. Seit der Erfindung des Phonautographen im Jahr 1857 haben Wissenschaftler und Ingenieure mit verschiedenen Methoden der Tonaufnahme experimentiert.
Es hat sich herausgestellt, dass die effektivste und kostengünstigste Methode die Verwendung elektrischer Geräte wie Mikrofone, magnetische und piezoelektrische Tonabnehmer (für Saiteninstrumente und manchmal auch für Schlaginstrumente wie Klaviere) ist.
Diese elektroakustischen Geräte fangen Schwankungen des Luftschalldrucks auf (magnetische Tonabnehmer zeichnen Saitenschwingungen auf, piezoelektrische Sensoren Körpervibrationen) und wandeln sie in ein analoges elektrisches Signal um.
Im Moment dieser Umwandlung „verschwindet“ der Klang für uns. Danach haben wir es bei unserer Arbeit nur noch mit „leisen“ elektrischen Schwingungen zu tun.
Es sind diese Schwingungen, die innerhalb von Musikgeräten – Verstärkern, analogen Effekten, Tonbandgeräten usw. – übertragen werden. Damit diese Schwingungen, ob verstärkt, verarbeitet oder einfach auf Magnetband aufgezeichnet, wieder zu Klang werden, müssen sie mit einem speziellen Gerät, dem Lautsprecher, wieder in Schall umgewandelt werden.
Ein analoges Signal hat die Haupteigenschaft, dass es zeitlich kontinuierlich ist und in jeder Millisekunde – oder zumindest in einer Millionstel Sekunde – einen bestimmten Parameter hat. Nehmen wir an, im Falle einer analogen elektronischen Darstellung von Ton könnte dies die Amplitude sein (die größte Streuung der Werte vom Mittelwert).
Das vom Mikrofon empfangene analoge Signal zeigt uns eine Historie häufiger Änderungen des Schalldrucks über einen bestimmten Zeitraum. Wir singen beispielsweise ein Lied, in dem wir 2 Minuten Gesang in den Strophen und Refrains geplant haben, und bei der Aufnahme erhalten wir sozusagen eine Chronik der Änderungen des Schalldrucks auf der Mikrofonmembran.
Elektrische analoge Signale, die durch die Umwandlung von Schallschwingungen gewonnen werden, lassen sich am einfachsten in Form von sinusförmigen Grafiken darstellen. Musikalische und nicht-musikalische Klänge sind in Wirklichkeit eine komplexe Summe von Sinuskurven.
Es kann aber auch einfach sein – wenn der analoge Tongenerator uns eine einzige Sinuswelle mit einer Frequenz von beispielsweise 440 Hertz (Ton „A”) liefert, hören wir einen klaren, aber langweiligen „Piep” aus dem Lautsprecher.
Und schließlich kommen wir zur Verstärkung. Das Wort „Gain” bedeutet Verstärkung. Wir stellen ihren Pegel mit Reglern an Verstärkern und Soundkarten ein. Dies unterscheidet sich von den Reglern für „Lautstärke” oder „Schalldruckpegel” (Level) dadurch, dass wir das Signal über die Grenze hinaus verstärken können, ab der es zu Verzerrungen kommt.
Schauen wir uns das nun genauer an: Unsere Sinuskurve (denken Sie daran, dass sie für uns ein analoges Signal in einem Elektrogerät symbolisiert und visualisiert) besteht aus symmetrischen runden „Hügeln” und „Tälern”, die sich periodisch wiederholen.
Wir können die Höhe der „Hügel“ und die Tiefe der „Täler“ (d. h. die Amplitude) erhöhen oder, mit anderen Worten, „das Signal verstärken“, „Verstärkung hinzufügen“, jedoch nicht unbegrenzt.
Wir werden hier nicht auf die Schaltungsauslegung der Geräte eingehen, sondern einfach davon ausgehen, dass jedes Gerät eine physikalische Grenze hat, bis zu der es die Amplitude des Signals proportional erhöhen kann – ohne es zu „zerstören“.
Wenn die Verstärkung einen kritischen Punkt erreicht und die zulässigen Werte überschreitet, beginnt die physikalische Schaltung des Geräts, die „Berge“ von oben abzuschneiden und die „Täler“ von unten zu trimmen.
In der Fachsprache der Technik wird dies als „analoges Clipping“ bezeichnet. In diesem Fall sind zusätzlich zum nützlichen Tonsignal möglicherweise Pfeif-, Rassel- und Knackgeräusche aus den Lautsprechern zu hören. In der Tontechnik wird dies auch als „nichtlineare Verzerrung“ bezeichnet.
Jetzt können wir verstehen, dass der Lautstärkepegel in der Musiktechnologie eine Änderung der Amplitude des Signals VOR der Grenze ist, ab der es zu Verzerrungen kommt. Und die „Verstärkung“ kann diese Grenzen leicht überschreiten.
Das Paradoxe daran ist, dass bei einer deutlichen Erhöhung der Verstärkung über den zulässigen Wert hinaus der von den Lautsprechern (an die das verarbeitete Signal ausgegeben wird) erzeugte Schalldruck nicht immer zunimmt. Das oben Gesagte gilt für die digitale Audioverarbeitung.
Nehmen wir an, in einer DAW, die das verarbeitete Signal an die Soundkarte sendet, kommt es beim Clipping und Aufdrehen der Verstärkung auf der virtuellen Konsole in den Bereich irrsinniger Werte zu keiner wirklichen Erhöhung des Lautstärkepegels. In den Lautsprechern der Audiomonitore hören wir nur die Zunahme von immer mehr Verzerrungen. Dies ist auf die spezielle Darstellung von Klang in „digital“ zurückzuführen, auf die wir weiter unten noch kurz eingehen werden.
Kehren wir nun zu den „negativen Dezibel” zurück. Denken Sie daran, dass dB relative Einheiten sind, die nur dann Sinn ergeben, wenn sie sich auf einen Referenzpunkt beziehen.
Bei Tonaufnahmen wird als solcher Punkt der Signalpegel genommen, ab dem Verzerrungen auftreten. Er wird als „Null” bezeichnet. Alles im Bereich „bis Null” ist ein Signal ohne Clipping, dessen Pegel in dB mit einem „Minus” angegeben wird. Alles darüber ist ein verzerrtes Signal mit einer Amplitudenbegrenzung („Spitzen und Täler”). Und sie bezeichnen es in dB mit einem „Plus”.
Es ist üblich, den Lautstärkepegel sowohl bei analogen als auch bei digitalen Geräten in „negativen“ Dezibel anzuzeigen. Das ist praktisch und anschaulich.
Was passiert mit der Lautstärke in digitalen Geräten?
In unseren Soundkarten wird das analoge Signal zunächst durch einen Vorverstärker leicht verstärkt und dann durch einen Analog-Digital-Wandler (ADC) geleitet. Vereinfacht gesagt, macht ein ADC Folgendes:
- Er schneidet ein Frequenzband ab und entfernt unnötige Dinge, zum Beispiel Töne unter 20 Hertz, die ein Mensch noch nicht hören kann.
- Der ADC teilt ein kontinuierliches Signal in eine bestimmte Anzahl einzelner Werte auf (Abtastung und Quantisierung), d. h. er wandelt unsere glatte Sinuswelle in eine Folge von „Säulen“ um.
Die Abtastfrequenz bestimmt die Anzahl dieser „Spalten”. Die Quantisierungsbit-Tiefe oder „Bit-Tiefe” bestimmt die Genauigkeit der Darstellung jeder „Spalte”.
Je höher die Abtastrate (mehr Balken), desto näher kommt das digitale Signal der ursprünglichen glatten Sinuswelle.
Die Bit-Tiefe beeinflusst die Genauigkeit der Signalmessung zu einem bestimmten Zeitpunkt. Je mehr Bits, desto geringer der Fehler. 16 Bit für Audio sind nicht schlecht, 24 Bit sind noch besser.
- Der ADC codiert oder „digitalisiert“ jede „Spalte“ und stellt sie als eine bestimmte Zahl mit einer Seriennummer dar.
In unseren digitalen Audiostationen wird physischer Schall, der zunächst in ein analoges Signal und dann mithilfe eines ADC in ein digitales Signal umgewandelt wird, zu einer Reihe mathematischer Abstraktionen. Es ist wichtig zu verstehen, dass Schall nur Mathematik ist. In den Kabeln oder der Software gibt es keinen echten „Schall“.
Der „Null”-Lautstärkepegel in einer digitalen Audiostation, ab dem Verzerrungen auftreten, ist ebenfalls bedingt. Bei einer ADC-Tiefe von 24 Bit besteht die „digitale Null” lediglich aus 24 binären „Zellen”, die jeweils den Wert „1” enthalten.
Da die 25. und alle folgenden Zellen fehlen, kann ein Signal, das „Null“ überschreitet, einfach nicht lauter werden. Stattdessen wird es zunehmend verzerrt.
Bei der Arbeit mit Lautstärkepegeln in digitalen Audiostationen ist es wichtig, Verzerrungen zu vermeiden. Denn das von den Master-Bussen unserer Audiostation gesammelte digitale Signal wird an einen Digital-Analog-Wandler (DAC) gesendet, der es an Audiomonitore oder Kopfhörer ausgibt. Hier hören wir Verzerrungen (Clipping), die auf eine Beschädigung der Audiospur hinweisen. Manchmal können Verzerrungen angenehm sein, beispielsweise wenn leichte Bandverzerrungen hinzugefügt werden, die Tontechniker gezielt einsetzen können.
Umgang mit Lautstärken in Ihrer DAW
Weltweite Labels sowohl im Westen als auch im Osten, die Toningenieure beschäftigen oder Verträge mit ihnen abschließen, verlangen von Musikern in der Regel Mixe und Stems ohne Mastering mit Lautstärken von maximal -6 dB bei Spitzenwerten. Sie benötigen dies, um einen „Lautstärke-Headroom” für die weitere Bearbeitung zu haben.
Es ist wichtig zu verstehen, dass es sich hierbei um Spitzenwerte handelt und nicht um den durchschnittlichen Schalldruckpegel einer Tonspur, der in RMS oder LUFs (formale durchschnittliche Lautstärke kombiniert mit wahrgenommener Lautstärke) gemessen wird.
Logik und Erfahrung zeigen, dass wir bei der Aufnahme von Stimmen, Live-Instrumenten und Synthesizern über eine Soundkarte den Gain-Pegel am Eingang steuern und den dB-Pegel in der DAW sehen können.
Achten Sie darauf, dass die Spitzenwerte des aufgenommenen Signals am Eingang niemals -6 überschreiten, -5 dB sind akzeptabel, und lassen Sie nicht zu, dass der „Eingang” 0 dB erreicht.
Durch die Verwendung von virtuellen Synthesizern und gesampelten Instrumenten in Ihrer DAW können Sie etwas freier agieren. Es ist jedoch notwendig, dass an den Ausgängen von virtuellen Instrumenten und Bearbeitungs-Plug-ins immer ein „Headroom” in der Lautstärke vorhanden ist.
Wenn Sie mit einem Arrangement in einem Projekt beginnen, empfiehlt es sich, die Fader der DAW-Konsole für alle Spuren sofort auf -10 oder besser -12 dB einzustellen. Dadurch schaffen Sie eine Lautstärkereserve.
Es ist wichtig, sich daran zu erinnern, dass der Soundtrack in der Regel dramatische Elemente enthält. Musikalische Ereignisse entwickeln sich und führen zu Höhepunkten. Und wenn viele Instrumente gleichzeitig forte einsetzen, überschreitet der Gesamtsignalpegel auf dem Master-Bus zwangsläufig den Signalpegel einer bestimmten Spur. Daher sollte das Label für die Endbearbeitung (Mastering) eine Datei bereitstellen, in der die Spitzenwerte -6 dB nicht überschreiten.
Es ist besser, diese Pegel überschreitung auf dem Master-Bus während des Arrangierens und Vorabmischens zu vermeiden, als später Zeit damit zu verschwenden, den Pegel jeder Spur zu senken. Sie sollten sich auch der Möglichkeit der Lautstärkeautomatisierung bewusst sein, die zu zusätzlichen Problemen führen kann. Es ist ratsam, im Vorabmix das gleiche Bild zu erhalten, das ursprünglich beabsichtigt war.
Befürchtungen, dass ein Mix „leise” klingen könnte, sind oft unbegründet. Der Klang in einer DAW ist niemals wirklich „leise” – es handelt sich lediglich um eine mathematische Abstraktion. Ein Label-Ingenieur, der einen Stems- oder Dry-Mix mit Spitzenwerten von -8 oder sogar -10 dB erhält, wird nicht enttäuscht sein. Er wird alle notwendigen Anpassungen selbst vornehmen.
Bei der Arbeit mit Lautstärken in Ihrer DAW gibt es ein paar Regeln zu beachten, mit denen Sie die meisten Probleme vermeiden können.








