¿Qué es la puesta en escena de ganancias?
El mundo del audio digital puede parecer confuso. Por ejemplo, en la física del sonido, el volumen se mide en decibeles y los valores siempre son positivos, pero en las estaciones de trabajo digitales (DAW), los decibeles de repente se vuelven negativos. ¿Y qué es esta extraña magia?
Otro misterio: en la pantalla DAW a veces se pueden ver niveles de señal superiores a cero y, a veces, incluso aparecen decibelios "positivos". Qué significa todo esto? ¡Ayúdame a entender! Los términos “volumen”, “ganancia”, “nivel” se escuchan constantemente a nuestro alrededor y en YouTube, pero ¿cuál es la diferencia entre ellos?
Intentemos entender esto sin fórmulas complicadas. Después de todo, somos en su mayoría músicos, no ingenieros. Y al mismo tiempo aprenderemos a organizar correctamente el llamado “level headroom” en nuestros proyectos musicales creados con un DAW.
Básicamente, no hay volumen en la grabación de audio digital. ¿Qué son los decibelios “naturales”?
"Volumen" es más que una simple palabra que intenta describir la intensidad de la presión sonora aplicada a los oídos. Cada persona percibe subjetivamente los sonidos fuertes y bajos. Lo que es simplemente “ruidoso” para una persona puede ser “terriblemente ruidoso” para otra.
Hacer música siempre requiere tener en cuenta criterios subjetivos, lo que en ocasiones interfiere en el entendimiento entre los participantes en el proceso creativo. Por lo tanto, es importante tener una comprensión más objetiva del volumen cuando se trabaja en proyectos musicales.
En la naturaleza no existe un análogo directo del volumen, como en el mundo digital. El sonido viaja a través de ondas elásticas en un medio gaseoso, líquido o sólido. La fuente del sonido es un cuerpo físico que experimenta vibraciones mecánicas, como una cuerda o cuerdas vocales humanas.
Intentemos imaginar esto visualmente, aunque no de manera muy científica: después de que suena la cuerda, vibra lateralmente (en un espacio tridimensional) con una cierta frecuencia y amplitud, creando ondas elásticas a su alrededor.
Estas ondas provocan zonas de alta y baja presión del aire que se propagan por el ambiente gaseoso. Los físicos describen estas vibraciones como "presión sonora".
Para medir la intensidad de la presión sonora, los científicos han desarrollado una fórmula que tiene en cuenta la presión misma, la impedancia acústica del medio y el tiempo promedio. Esto nos permite obtener el valor cuadrático medio de la intensidad del sonido en un determinado punto en el tiempo y el espacio.
En la música, las vibraciones del sonido son principalmente periódicas, similares a las vibraciones de una cuerda. A veces evaluamos su intensidad utilizando el concepto de “amplitud de presión sonora”, pero en realidad esto no es tan importante.
Lo realmente importante es que los decibeles positivos (indicados por un “+”) en física se refieren a la intensidad de la presión sonora, pero sólo en relación con un punto específico en una escala. Los decibeles son unidades relativas, logarítmicas o submúltiplos y sólo tienen sentido si hay un “punto de partida”.
En física, el punto de partida es un nivel de presión de 20 micropascales (μPa): este es el umbral medio del oído humano cuando aún no percibe sonidos y siente el silencio. Aunque el gato probablemente no estaría de acuerdo con esto.
El grado de sonoridad percibida por una persona se estudia por separado, utilizando sus propias unidades de medida, como los medios, su composición de frecuencia y otros factores. Pero cuando se trabaja con una DAW, estos detalles no son tan importantes. Lo principal para nosotros es no confundirnos con los decibeles.
0 decibelios SPL (nivel de presión sonora) significa silencio para una persona. A continuación se muestran algunos valores típicos para comparar:
- 15 dB – “Apenas audible” – es como el susurro de las hojas;
- 35 dB – “Claramente audible” – por ejemplo, una conversación en voz baja, un ambiente tranquilo en una biblioteca o ruido en un ascensor;
- 50 dB – “Claramente audible” – es como una conversación a volumen medio, una calle tranquila o el funcionamiento de una lavadora;
- 70 dB – “ruidoso” – por ejemplo, conversaciones ruidosas a una distancia de 1 m, el ruido de una máquina de escribir, una calle ruidosa o una aspiradora en funcionamiento a una distancia de 3 m;
- 80 dB – “Muy ruidoso” – es como un despertador ruidoso a una distancia de 1 m, un grito, el sonido de una motocicleta con silenciador o el sonido del motor de un camión en marcha. Escuchar esos sonidos durante mucho tiempo puede provocar pérdida de audición;
- 95 dB – “Muy ruidoso” – por ejemplo, el ruido de un vagón de metro a una distancia de 7 m o el sonido de un piano a todo volumen a una distancia de 1 m;
- 130 dB – “Dolor” es como una sirena, el ruido de las calderas remachando, el grito más fuerte o una motocicleta sin silenciador;
- 160 dB – “Choque” es el nivel en el que es probable que se rompa el tímpano, como un disparo de escopeta cerca del oído, una competencia de sistemas de sonido de un automóvil o la onda de choque de un avión supersónico o una explosión de 0,002 megapascales.
Grabación de sonido. Volumen y ganancia
Cuando grabamos sonido, tenemos que convertir las vibraciones sonoras periódicas del aire en vibraciones eléctricas. Desde la invención del fonautógrafo en 1857, científicos e ingenieros han experimentado con diversos métodos de grabación de sonido.
Resulta que la forma más eficaz y económica es utilizar dispositivos eléctricos como micrófonos, pastillas magnéticas y piezoeléctricas (para instrumentos de cuerda y, a veces, de percusión como pianos).
Estos dispositivos electroacústicos interceptan las fluctuaciones de la presión del sonido del aire (las pastillas magnéticas registran las vibraciones de las cuerdas y los sensores piezoeléctricos registran las vibraciones del cuerpo) y las convierten en una señal eléctrica analógica.
En el momento de esta transformación, el sonido “desaparece” para nosotros. Después de esto, durante nuestro trabajo nos ocupamos únicamente de oscilaciones eléctricas "silenciosas".
Son estas vibraciones las que se transmiten dentro de los equipos musicales: amplificadores, efectos analógicos, grabadoras, etc. Para que estas vibraciones, ya sean amplificadas, procesadas o simplemente grabadas en cinta magnética, se conviertan nuevamente en sonido, es necesario volver a convertirlas. en sonido mediante un dispositivo especial de vibraciones del aire. Este dispositivo se llama altavoz.
Una señal analógica tiene la propiedad principal de ser continua en el tiempo y cada milisegundo, o al menos una millonésima de segundo, tiene un parámetro determinado. Digamos que, en el caso de una representación electrónica analógica del sonido, esto podría ser la amplitud (la mayor dispersión de valores del promedio).
La señal analógica recibida del micrófono nos muestra un historial de cambios frecuentes en la presión sonora durante un período de tiempo. Cantamos, digamos, una canción en la que hemos planeado 2 minutos de voz en los versos y estribillos, y al grabar obtenemos, por así decirlo, una crónica de los cambios en la presión del sonido en la membrana del micrófono.
Las señales eléctricas analógicas obtenidas al convertir vibraciones de sonido se representan más fácilmente en forma de gráficos sinusoidales. El sonido musical y no musical es, de hecho, una suma compleja de sinusoides.
Pero también puede ser simple: cuando el generador de tonos analógico nos proporciona una única onda sinusoidal con una frecuencia de, digamos, 440 Hertz (nota “A”), escuchamos un “bip” claro pero aburrido del altavoz.
Y finalmente aquí llegamos a la ganancia. La palabra ganancia significa ganancia. Establecemos su nivel con reguladores en amplificadores y tarjetas de sonido. Este se diferencia de los mandos de control de “volumen” o “nivel de presión sonora” (Level) en que podemos amplificar la señal más allá del límite a partir del cual comienza su distorsión.
Ahora echemos un vistazo más de cerca: nuestra sinusoide (recordemos que simboliza y visualiza para nosotros una señal analógica dentro de un aparato eléctrico) son “colinas” y “valles” redondas y simétricas que se repiten periódicamente.
Podemos aumentar la altura de las “colinas” y la profundidad de los “valles” (es decir, la amplitud) o, en otras palabras, “fortalecer la señal”, “agregar ganancia” no indefinidamente.
No hablaremos aquí sobre el diseño del circuito de los dispositivos, simplemente confíemos en que cada uno de ellos tiene un límite físico hasta el cual el dispositivo puede aumentar la amplitud de la señal proporcionalmente, sin "romperla".
Cuando la ganancia alcanza un punto crítico y va más allá de los valores permitidos, el circuito físico del dispositivo comienza a cortar las "montañas" desde arriba y a recortar los "valles" desde abajo.
En el lenguaje de ingeniería, esto se llama "recorte analógico". En este caso, además de la útil señal sonora, se pueden escuchar sibilancias, traqueteos y crujidos en los altavoces. En ingeniería de audio, esto también se denomina "distorsión no lineal".
Ahora podemos entender que el nivel de volumen en tecnología musical es un cambio en la amplitud de la señal ANTES del límite más allá del cual comienza a distorsionarse. Y la “ganancia” puede fácilmente ir más allá de estos límites.
La paradoja es que cuando la ganancia aumenta en cantidades significativas más allá del valor permitido, la presión sonora creada por los altavoces (a los que se envía la señal procesada) no siempre aumenta. Lo anterior es válido para el procesamiento de audio digital.
Digamos que dentro de una DAW que envía la señal procesada a la tarjeta de sonido, al recortar y subir la ganancia en la consola virtual a la zona de valores locos, no se produce ningún aumento real en el nivel de volumen. En los altavoces de los monitores de audio sólo escuchamos la adición de cada vez más distorsión. Esto se debe a la representación especial del sonido en “digital”, de la que diremos algunas palabras a continuación.
Por ahora, volvamos a los "decibeles negativos". Recuerda que los dB son unidades relativas que sólo tienen sentido si están relacionadas con algún punto de referencia.
En la grabación de sonido, dicho punto se considera el nivel de señal a partir del cual comienza la distorsión. Se designa como "cero". Todo lo que está en la zona "a cero" es una señal sin recorte, cuyo nivel se indica en dB con un "menos". Todo lo anterior es una señal distorsionada con un límite de amplitud (“picos y valles”). Y lo denotan en dB con un “más”.
Es habitual mostrar el nivel de volumen en decibeles "negativos" tanto en dispositivos analógicos como digitales. Es conveniente y visual.
¿Qué pasa con el volumen en digital?
En nuestras tarjetas de sonido, la señal analógica primero se amplifica ligeramente mediante un preamplificador y luego se pasa a través de un convertidor analógico a digital (ADC). Para simplificar, esto es lo que hace un ADC:
-
- Corta una banda de frecuencia, eliminando cosas innecesarias, por ejemplo, sonidos por debajo de 20 Hertz, que una persona aún no puede oír;
- El ADC divide una señal continua en una cierta cantidad de valores individuales (muestreo y cuantificación), es decir, en realidad convierte nuestra onda sinusoidal suave en una secuencia de "columnas".
La frecuencia de muestreo determina el número de dichas "columnas". La profundidad de bits de cuantificación, o “profundidad de bits”, determina la precisión de cada representación de “columna”.
Cuanto mayor sea la frecuencia de muestreo (más barras), más cerca estará la señal digital de la onda sinusoidal suave original.
La profundidad de bits afecta la precisión de la medición de la señal en un momento determinado. Cuantos más bits, menor será el error. 16 bits para audio no está mal, 24 bits es incluso mejor.
- El ADC codifica o “digitaliza” cada “columna”, representándola como un número específico con un número de serie.
En nuestras estaciones de audio digital, el sonido físico, primero convertido en señal analógica y luego en señal digital mediante un ADC, se convierte en un conjunto de abstracciones matemáticas. Es importante comprender que el sonido es sólo matemática. No hay ningún "sonido" real en los cables ni en el software.
El nivel de volumen "cero" en una estación de audio digital, más allá del cual comienza la distorsión, también es condicional. Para una profundidad de ADC de 24 bits, el "cero digital" son sólo 24 "celdas" binarias, cada una de las cuales contiene el valor "1".
Dado que faltan la celda 25 y todas las siguientes, una señal que excede "cero" simplemente no puede aumentar de volumen. En cambio, se le añade cada vez más distorsión.
Cuando se trabaja con niveles de volumen en estaciones de audio digital, es importante evitar la distorsión. Porque la señal digital recopilada de los buses maestros de nuestra estación de audio se envía a un convertidor de digital a analógico (DAC), que la envía a monitores de audio o auriculares. Aquí escuchamos distorsión (recorte), lo que indica daño a la pista de audio. A veces la distorsión puede resultar agradable, como cuando se añade una ligera distorsión de cinta (cinta), que los ingenieros de sonido pueden utilizar a propósito.
Cómo manejar los niveles de volumen en tu DAW
Los sellos discográficos mundiales, tanto de Occidente como de Oriente, que cuentan con ingenieros de sonido en plantilla o tienen contratos con ellos, suelen solicitar mezclas y temas a músicos sin masterización y con niveles de volumen no superiores a -6 dB en el pico. Lo necesitan para tener un "margen de volumen" para el procesamiento posterior.
Es importante entender que estamos hablando de picos, no del nivel de presión sonora promedio de una banda sonora, que se mide en RMS o LUF (sonoridad promedio formal combinada con el volumen percibido).
La lógica y la experiencia dictan que al grabar voces, instrumentos en vivo y sintetizadores a través de una tarjeta de sonido, podemos controlar el nivel de ganancia en la entrada y ver el nivel de -dB dentro del DAW.
Esfuércese por garantizar que los picos de la señal grabada en la entrada nunca superen los -6, -5 dB es aceptable y no permita que los "ingresos" alcancen los 0 dB.
Al utilizar sintetizadores virtuales e instrumentos sampleados dentro de tu DAW, puedes sentirte un poco más libre. Sin embargo, es necesario que siempre haya un "margen de volumen" en las salidas de los instrumentos virtuales y los complementos de procesamiento.
Al iniciar un arreglo en un proyecto, se recomienda configurar inmediatamente los atenuadores de la consola DAW para todas las pistas en -10, o preferiblemente -12 dB. Esto creará una reserva de volumen.
Es importante recordar que la banda sonora suele contener drama. Se desarrollan eventos musicales que conducen a clímax. Y cuando muchos instrumentos entran en vigor al mismo tiempo, el nivel de señal total en el bus maestro necesariamente excederá el nivel de señal de cualquier pista en particular. Por tanto, la etiqueta para el procesamiento final (masterización) debe proporcionar un archivo en el que los picos no superen los -6 dB.
Es mejor evitar exceder este nivel en el bus maestro durante los arreglos y la premezcla que perder el tiempo bajando el nivel de cada pista más tarde. También debe tener en cuenta la posibilidad de automatización del volumen, lo que puede provocar problemas adicionales. Es recomendable obtener en la mezcla preliminar la misma imagen que se pretendía originalmente.
Los temores de que una mezcla suene “tranquila” suelen ser infundados. El sonido en una DAW nunca es realmente “silencioso”, es sólo una abstracción matemática. Un ingeniero de etiquetas que reciba unas potencias o una mezcla seca con picos de -8 o incluso -10 dB no se sentirá decepcionado. Él mismo hará todos los ajustes necesarios.
Cuando trabaje con niveles de volumen en su DAW, existen algunas reglas a seguir que lo ayudarán a evitar la mayoría de los problemas.