it RU

Cos'è la stadiazione del guadagno

Cos'è la stadiazione del guadagno

Il mondo dell'audio digitale può sembrare confuso. Ad esempio, nella fisica del suono, il volume viene misurato in decibel e i valori sono sempre positivi, ma nelle workstation digitali (DAW) i decibel diventano improvvisamente negativi. E cos'è questa strana magia?

Un altro mistero: sullo schermo della DAW a volte puoi vedere livelli di segnale superiori allo zero, a volte compaiono anche decibel “positivi”. Che cosa significa tutto questo? Aiutami a capire! I termini “volume”, “guadagno”, “livello” si sentono costantemente intorno a noi e su YouTube – ma qual è la differenza tra loro?

Proviamo a capirlo senza formule complicate. Dopotutto, siamo per lo più musicisti, non ingegneri. E allo stesso tempo impareremo come organizzare correttamente il cosiddetto “level headroom” nei nostri progetti musicali realizzati utilizzando una DAW.

Essenzialmente non c'è volume nella registrazione audio digitale. Cosa sono i decibel “naturali”.

“Loudness” è più di una semplice parola che tenta di descrivere l’intensità della pressione sonora applicata alle orecchie. Per ogni persona, i suoni deboli e forti vengono percepiti soggettivamente. Ciò che è semplicemente “rumoroso” per una persona può essere “terribilmente rumoroso” per un’altra.

Fare musica richiede sempre di tenere conto di criteri soggettivi, che a volte interferiscono con la comprensione tra i partecipanti al processo creativo. Pertanto, è importante avere una comprensione più obiettiva del volume quando si lavora su progetti musicali.

In natura non esiste un analogo diretto del volume, come nel mondo digitale. Il suono viaggia attraverso onde elastiche in un mezzo gassoso, liquido o solido. La fonte del suono è un corpo fisico che sperimenta vibrazioni meccaniche, come una corda o corde vocali umane.

Proviamo a immaginarlo visivamente, anche se non molto scientificamente: dopo che la corda suona, vibra lateralmente (nello spazio tridimensionale) con una certa frequenza e ampiezza, creando attorno a sé onde elastiche.

Queste onde provocano aree di alta e bassa pressione atmosferica che si propagano attraverso l'ambiente gassoso. I fisici descrivono queste vibrazioni come “pressione sonora”.

Per misurare l'intensità della pressione sonora, gli scienziati hanno sviluppato una formula che tiene conto della pressione stessa, dell'impedenza acustica del mezzo e della media temporale. Ciò ci consente di ottenere il valore quadratico medio dell'intensità del suono in un determinato punto nel tempo e nello spazio.

Nella musica le vibrazioni del suono sono prevalentemente periodiche, simili alle vibrazioni di una corda. A volte valutiamo la loro intensità utilizzando il concetto di “ampiezza della pressione sonora”, ma in realtà questo non è così importante.

Ciò che è veramente importante è che i decibel positivi (indicati con un “+”) in fisica si riferiscono all'intensità della pressione sonora, ma solo rispetto a un punto specifico su una scala. I decibel sono unità relative, logaritmiche o sottomultiple e hanno senso solo se esiste un “punto di partenza”.

In fisica, questo punto di partenza è un livello di pressione di 20 micropascal (μPa) – questa è la soglia media dell'udito umano quando non percepisce ancora i suoni e sente il silenzio. Anche se probabilmente il gatto non sarebbe d'accordo.

Il grado di volume percepito da una persona viene studiato separatamente, utilizzando le proprie unità di misura, come i fondi, la composizione della frequenza e altri fattori. Ma quando si lavora con una DAW, questi dettagli non sono così importanti. La cosa principale per noi è non confonderci con i decibel.

0 decibel SPL (livello di pressione sonora) significa silenzio per una persona. Di seguito sono riportati alcuni valori tipici per il confronto:

  • 15 dB – “Appena udibile” – è come il fruscio delle foglie;
  • 35 dB – “Chiaramente udibile” – ad esempio, una conversazione ovattata, un ambiente tranquillo in una biblioteca o rumore in un ascensore;
  • 50 dB – “Chiaramente udibile” – è come una conversazione a volume medio, una strada tranquilla o il funzionamento di una lavatrice;
  • 70 dB – “Rumoroso” – ad esempio, conversazioni rumorose a una distanza di 1 m, il rumore di una macchina da scrivere, una strada rumorosa o un aspirapolvere funzionante a una distanza di 3 m;
  • 80 dB – “Molto rumoroso” – è come una sveglia forte a una distanza di 1 m, un urlo, il rumore di una motocicletta con la marmitta o il rumore del motore di un camion acceso. Ascoltare tali suoni per lungo tempo può causare la perdita dell'udito;
  • 95 dB – “Molto rumoroso” – ad esempio, il rumore di un vagone della metropolitana a una distanza di 7 m o di un pianoforte ad alto volume che suona a una distanza di 1 m;
  • 130 dB – Il “dolore” è come una sirena, il rumore di caldaie avvincenti, l'urlo più forte o una motocicletta senza marmitta;
  • 160 dB – “Shock” è il livello al quale è probabile che si rompa il timpano, come un colpo di fucile vicino all'orecchio, una competizione con l'impianto audio di un'auto o l'onda d'urto di un aereo supersonico o un'esplosione di 0,002 megapascal.

Registrazione del suono. Volume e guadagno

Quando registriamo il suono, dobbiamo convertire le vibrazioni sonore periodiche nell'aria in vibrazioni elettriche. Dall'invenzione del fonautografo nel 1857, scienziati e ingegneri hanno sperimentato vari metodi di registrazione del suono.

Si scopre che il modo più efficace ed economico è utilizzare dispositivi elettrici come microfoni, pickup magnetici e piezoelettrici (per archi e talvolta strumenti a percussione come i pianoforti).

Questi dispositivi elettroacustici intercettano le fluttuazioni della pressione sonora dell'aria (i pickup magnetici registrano le vibrazioni delle corde e i sensori piezoelettrici registrano le vibrazioni del corpo) e le convertono in un segnale elettrico analogico.

Nel momento di questa trasformazione, il suono “scompare” per noi. Successivamente durante il nostro lavoro ci occupiamo solo delle oscillazioni elettriche “silenziosi”.

Sono queste vibrazioni che vengono trasmesse all'interno delle apparecchiature musicali – amplificatori, effetti analogici, registratori, ecc. Affinché queste vibrazioni, siano esse amplificate, elaborate o semplicemente registrate su nastro magnetico, possano trasformarsi nuovamente in suono, devono essere riconvertite nel suono utilizzando le vibrazioni dell'aria di un dispositivo speciale. Questo dispositivo è chiamato altoparlante.

Un segnale analogico ha la proprietà principale – è continuo nel tempo e ad ogni millisecondo – o almeno un milionesimo di secondo – ha un determinato parametro. Diciamo che, nel caso di una rappresentazione elettronica analogica del suono, questa potrebbe essere l'ampiezza (la più ampia differenza di valori rispetto alla media).

Il segnale analogico ricevuto dal microfono ci mostra una storia di frequenti cambiamenti nella pressione sonora in un periodo di tempo. Cantiamo, diciamo, una canzone in cui abbiamo previsto 2 minuti di voce nelle strofe e nei ritornelli, e durante la registrazione otteniamo, per così dire, una cronaca dei cambiamenti nella pressione sonora sulla membrana del microfono.

I segnali elettrici analogici ottenuti convertendo le vibrazioni sonore sono più facilmente rappresentabili sotto forma di grafici sinusoidali. Il suono musicale e quello non musicale sono infatti una somma complessa di sinusoidi.

Ma può anche essere semplice: quando il generatore di toni analogico ci fornisce una singola onda sinusoidale con una frequenza, diciamo, di 440 Hertz (nota “LA”), sentiamo un chiaro ma noioso “bip” dall’altoparlante.

E finalmente arriviamo al guadagno. La parola guadagno significa guadagno. Ne impostiamo il livello con i regolatori su amplificatori e schede audio. Si differenzia dalle manopole di controllo del “volume” o del “livello di pressione sonora” (Level) in quanto possiamo amplificare il segnale oltre il limite oltre il quale inizia la sua distorsione.

Ora diamo uno sguardo più da vicino: la nostra sinusoide (ricordate che simboleggia e visualizza per noi un segnale analogico all'interno di un elettrodomestico) è “colline” e “valli” rotondi così simmetrici che si ripetono periodicamente.

Possiamo aumentare l'altezza delle “colline” e la profondità delle “valli” (cioè l'ampiezza) o, in altre parole, “rafforzare il segnale”, “aggiungere guadagno” non all'infinito.

Non parleremo qui della progettazione dei circuiti dei dispositivi, diamo per scontato che ognuno di essi abbia un limite fisico al quale il dispositivo può aumentare proporzionalmente l'ampiezza del segnale – senza “romperlo”.

Quando il guadagno raggiunge un punto critico e supera i valori consentiti, il circuito fisico del dispositivo inizia a tagliare le “montagne” dall'alto e a tagliare le “valli” dal basso.

In gergo ingegneristico questo si chiama “clipping analogico”. In questo caso, oltre al segnale acustico utile, dagli altoparlanti si possono sentire sibili, tintinnii e crepitii. Nell’ingegneria audio questa è anche chiamata “distorsione non lineare”.

Ora possiamo capire che il livello del volume nella tecnologia musicale è un cambiamento nell'ampiezza del segnale PRIMA del limite oltre il quale inizia a distorcere. E il “guadagno” può facilmente andare oltre questi limiti.

Il paradosso è che quando il guadagno viene aumentato di quantità significative oltre il valore consentito, la pressione sonora creata dagli altoparlanti (a cui viene emesso il segnale elaborato) non sempre aumenta. Quanto sopra è vero per l'elaborazione audio digitale.

Diciamo che all'interno di una DAW che invia il segnale elaborato alla scheda audio, quando si taglia e si aumenta il guadagno sulla console virtuale nella zona di valori folli, non si verifica alcun aumento reale del livello del volume. Negli altoparlanti dei monitor audio sentiamo solo l'aggiunta di sempre più distorsioni. Ciò è dovuto alla speciale rappresentazione del suono in “digitale”, sulla quale diremo qualche parola di seguito.

Per ora, torniamo ai “decibel negativi”. Ricorda che i dB sono unità relative che hanno senso solo se correlate a qualche punto di riferimento.

Nella registrazione del suono, tale punto viene considerato il livello del segnale oltre il quale inizia la distorsione. È designato come "zero". Tutto nella zona “a zero” è un segnale senza clip, il cui livello è indicato in dB con un “meno”. Tutto quanto sopra è un segnale distorto con un taglio in ampiezza (“picchi e valli”). E lo indicano in dB con un "più".

È consuetudine visualizzare il livello del volume in decibel “negativi” sia sui dispositivi analogici che digitali. È comodo e visivo.

Cosa succede al volume nel digitale?

Nelle nostre schede audio, il segnale analogico viene prima leggermente amplificato da un preamplificatore e poi fatto passare attraverso un convertitore analogico-digitale (ADC). Per semplificare, questo è ciò che fa un ADC:

  1. Si apre una casella di posta, un'ubicazione isolata, un esempio, non c'è più di 20 giorni, il cui popolo non si è fermato;
  2. АЦП rileva un segnale errato sulla raccolta dati errata (discretizazione e commutazione), ecc. ь, i fatti modificano la nostra buona sinusoide nella successiva "stolbikov".

La frequenza di campionamento determina il numero di tali “colonne”. La profondità di quantizzazione in bit, o “profondità di bit”, determina la precisione di ciascuna rappresentazione di “colonna”.

Maggiore è la frequenza di campionamento (più barre), più vicino è il segnale digitale all'onda sinusoidale uniforme originale.

La profondità di bit influisce sulla precisione della misurazione del segnale in un determinato momento. Maggiore è il numero di bit, minore è l'errore. 16 bit per l'audio non sono male, 24 bit è ancora meglio.

  • L'ADC codifica o “digitalizza” ciascuna “colonna”, rappresentandola come un numero specifico con un numero di serie.

Nelle nostre stazioni audio digitali, il suono fisico, convertito prima in segnale analogico e poi in segnale digitale tramite un ADC, diventa un insieme di astrazioni matematiche. Capire che il suono è solo matematica è importante. Non c'è un vero "suono" nei cavi o nel software.

Anche il livello del volume "zero" in una stazione audio digitale, oltre il quale inizia la distorsione, è condizionato. Per una profondità ADC a 24 bit, lo "zero digitale" è costituito da sole 24 "celle" binarie, ciascuna contenente il valore "1".

Poiché mancano la venticinquesima cella e tutte le successive, un segnale superiore a "zero" semplicemente non può aumentare di volume. Invece, ad esso si aggiunge sempre più distorsione.

Quando si lavora con i livelli di volume nelle stazioni audio digitali, è importante evitare la distorsione. Perché il segnale digitale raccolto dai bus principali della nostra stazione audio viene inviato a un convertitore digitale-analogico (DAC), che lo trasmette ai monitor audio o alle cuffie. Qui sentiamo una distorsione (clipping), che indica un danno alla traccia audio. A volte la distorsione può essere piacevole, ad esempio quando si aggiunge una leggera distorsione del nastro, che gli ingegneri del suono possono utilizzare intenzionalmente.

Come gestire i livelli di volume nella tua DAW

Le etichette mondiali sia occidentali che orientali, che hanno tecnici del suono in organico o stipulano contratti con loro, solitamente richiedono mix e stem ai musicisti senza mastering con livelli di volume non superiori a -6 dB di picco. Ne hanno bisogno per avere un “margine di volume” per ulteriori elaborazioni.

È importante capire che stiamo parlando di picchi, non del livello medio di pressione sonora di una colonna sonora, che viene misurato in RMS o LUF (volume medio formale combinato con volume percepito).

La logica e l'esperienza impongono che quando registriamo voci, strumenti dal vivo e sintetizzatori attraverso una scheda audio, possiamo controllare il livello di guadagno sull'ingresso e vedere il livello -dB all'interno della DAW.

Cercare di garantire che i picchi del segnale registrato in ingresso non superino mai i -6, -5 dB è accettabile e non consentano che il "reddito" raggiunga 0 dB.

Utilizzando sintetizzatori virtuali e strumenti campionati all'interno della tua DAW, puoi sentirti un po' più libero. Tuttavia, è necessario che ci sia sempre un “headroom” di volume sulle uscite degli strumenti virtuali e dei plug-in di elaborazione.

Quando si inizia un arrangiamento in un progetto, si consiglia di impostare immediatamente i fader della console DAW per tutte le tracce su -10, o preferibilmente -12 dB. Ciò creerà una riserva di volume.

È importante ricordare che la colonna sonora di solito contiene drammaticità. Si sviluppano eventi musicali che portano al climax. E quando molti strumenti entrano nel forte contemporaneamente, il livello totale del segnale sul bus master supererà necessariamente il livello del segnale di qualsiasi traccia particolare. Pertanto l'etichetta per l'elaborazione finale (mastering) dovrebbe fornire un file in cui i picchi non superino i -6 dB.

È meglio evitare di superare questo livello sul master bus durante l'arrangiamento e il pre-mix piuttosto che perdere tempo abbassando il livello di ciascuna traccia in un secondo momento. Dovresti anche essere consapevole della possibilità dell'automazione del volume, che può portare a ulteriori problemi. Si consiglia di ottenere nel mix preliminare la stessa immagine originariamente prevista.

I timori che un mix risulti “tranquillo” sono spesso infondati. Il suono in una DAW non è mai veramente “silenzioso” – è solo un'astrazione matematica. Un tecnico dell'etichetta a cui viene dato uno stem o un mix secco con picchi di -8 o addirittura -10 dB non rimarrà deluso. Farà lui stesso tutte le modifiche necessarie.

Quando lavori con i livelli di volume nella tua DAW, ci sono alcune regole da seguire che ti aiuteranno a evitare la maggior parte dei problemi.

Registrazione gratuita

Registrati gratuitamente e ottieni un progetto gratis