¿Qué es el vocodificador?
El vocoder se inventó en la década de 1920 con fines de comunicación y comunicación. Sin embargo, su verdadero propósito se descubrió en la música electrónica, donde se convirtió en una herramienta clave para la creación de voces robóticas. Casi cien años después de su aparición, el vocoder se utiliza activamente en la industria de la música, pero no todo el mundo sabe cómo funciona este instrumento único y cómo utilizarlo. En este texto podrás aprender cómo la Segunda Guerra Mundial hizo populares los sintetizadores de voz, cómo funciona el vocoder y cómo utilizarlo correctamente.
El desarrollo del vocoder comenzó en 1928 gracias al trabajo de un ingeniero llamado Homer Dudley en Bell Labs. A finales de la década de 1930 se logró el resultado final y en noviembre de 1937 Dudley recibió la primera patente para su invento y, en 1939, la segunda. La idea principal de Dudley era recrear el aparato del habla humana utilizando la electrónica. Utilizando componentes y efectos electrónicos, el ingeniero buscó imitar lo más fielmente posible el funcionamiento de los órganos del habla humana, reproduciendo los sonidos creados por el paso del aire por diversas partes del cuerpo humano, como los pulmones y otros órganos.
En 1939, Bell Labs demostró al público un dispositivo de síntesis de voz llamado VODER (Voice Operating Demonstrator) a través de una serie de demostraciones en Nueva York y San Francisco. El dispositivo incluía un par de osciladores conmutables y un generador de ruido como fuente de audio. Una ruta vocal dedicada que constaba de filtros de diez bandas estaba vinculada a un teclado sensible a la velocidad que controlaba la intensidad del filtrado. El tono del sonido se cambió usando un pedal. Las teclas adicionales eran responsables de generar las letras “P”, “D”, “J”, así como las combinaciones de sonidos “JAW” y “CH”.
VODER era un dispositivo complejo que requería formación especializada y una formación que duraba varios meses para su uso. Para las demostraciones diarias, Bell Labs capacitó especialmente a 20 personas, quienes se turnaron para presentar el nuevo producto a todos los interesados. Durante la manifestación, VODER pronunció la frase “¡Buenas tardes audiencia de radio!”
En 1949, se desarrolló el convertidor de voz KO-6, que codificaba voz e información a una velocidad de 1200 bits por segundo. En 1953 apareció otro vocoder, el KY-9 THESEUS, que no sólo aumentó la velocidad de procesamiento a 1650 bits por segundo, sino que también utilizó diferentes componentes. Gracias a los materiales modificados, fue posible reducir el peso del vocoder de 55 toneladas para SIGSALY a 256 kilogramos para KY-9. Finalmente, en 1961, con el lanzamiento del convertidor HY-2, fue posible reducir el peso del vocoder a 45 kilogramos y también aumentar la velocidad de codificación a 2400 bits por segundo. El HY-2 fue el último codificador de voz industrial utilizado en sistemas de comunicaciones seguras, mientras que el instrumento permaneció en el sector de consumo.
En 1948, el científico alemán Werner Mayer-Eppler, que tenía especial interés en la síntesis de voz, publicó una disertación sobre la síntesis de voz y la música electrónica desde el punto de vista de la síntesis de sonido. Posteriormente, sus conocimientos jugaron un papel importante en la creación del Estudio de Música Electrónica de la Radio de Alemania Occidental (WDR) en Colonia en 1951.
El primer uso de un vocoder para crear música se produjo en 1959, también en Alemania. Entre 1956 y 1959, Siemens desarrolló el sintetizador Siemens, que podía convertir el sonido en voz. En 1968, Robert Moog, fundador de la empresa Moog, desarrolló uno de los primeros vocoders diseñado específicamente para su uso en la industria musical. Este vocoder fue encargado por la Universidad de Buffalo.
Desde entonces, la historia del vocoder ha evolucionado por sí sola y se ha vuelto ampliamente utilizado en todas las áreas del audio y el vídeo. El instrumento se dio a conocer entre el público en general gracias al grupo Kraftwerk, que montó de forma independiente un vocoder para sus experimentos y lo utilizó desde su fundación en 1970. El ejemplo más famoso y popular del uso de un vocoder fue el álbum de Kraftwerk "Trans-Europe Express". ”, que examinamos en detalle en una revisión de instrumentos musicales inusuales de artistas electrónicos alemanes.
¿Cómo funciona un vocoder?
Es mejor utilizar dos señales que una. El vocoder requiere dos fuentes de sonido para funcionar:
- Operador: señal sonora inicial;
- Modulador: señal con diferentes características armónicas que determinan el sonido del operador.
El sonido pasa a través de un "banco de filtros" especial que analiza la señal del modulador, la divide en bandas de frecuencia y aplica un filtro a cada banda. Los filtros siempre se ajustan para que el punto de corte esté exactamente en el centro de cada rango de la señal del modulador. Independientemente de la densidad de corte, la señal dentro de cada rango se filtra en el centro.
Luego, la señal del operador se suministra al modulador, que pasa a través de todos los filtros. El vocoder ajusta el punto de corte de cada filtro dependiendo de los armónicos y armónicos de la señal del modulador.
Para comprender el principio de funcionamiento de un vocoder, podemos hacer una analogía con la voz humana. El sonido de la voz está formado por las señales de operadores y moduladores. Cuando pronunciamos palabras, un flujo de aire pasa a través de las cuerdas vocales, creando la señal operadora original. Al mismo tiempo, otras partes del aparato vocal vibran generando una señal moduladora. Estas características afectan directamente al sonido de la voz.
Un vocoder funciona de manera similar: modifica la señal original debido a las características de la señal adicional.
Cualquier señal de audio puede ser un operador o un modulador. Los productores suelen utilizar sonidos sintetizados como operadores y la voz como modulador. Un ejemplo del uso de un vocoder en música es el tema “Trans-Europe Express” de Kraftwerk. El operador es la señal del sintetizador y el modulador es el habla ordinaria.
Un uso más experimental del vocoder se puede ver en el tema “Nightcall” de Kavinsky. Este efecto se puede recrear utilizando iZotope VocalSynth configurando el parche para generar acordes a partir de dos ondas sonoras y ruido blanco como operador, modulado por la voz.
Cómo utilizar un codificador de voz
Para que un vocoder suene tan impresionante como muchas grabaciones comerciales, el operador de la señal debe ser rico en armónicos. Cuanto más rico y variado sea el operador, más fuerte será el impacto del modulador.
Es mejor empezar a experimentar con parches que utilicen o se basen en la forma de onda del sonido en diente de sierra. Las señales de onda de rampa suelen ser cada vez más ricas que las ondas triangulares o sinusoidales. También es una buena práctica comprimir o saturar la señal del operador antes de introducirla en el vocodificador. Esto resaltará el efecto de la señal que pasa a través del banco de filtros.
La voz que actúa como moduladora requiere una atención especial. Al escribir palabras debes ser muy claro y preciso, enfatizando cada sonido. No importa qué tipo de voz tengas, es importante que la articulación sea pronunciada. Es la precisión y claridad lo que crea el característico efecto vocoder que da una voz robótica. Observe cómo en “Nightcall” de Kavinsky cada palabra se pronuncia clara y lentamente. Cuando se trabaja con un vocoder, es importante controlar la articulación para evitar distorsiones.
El tono de la voz no es tan importante cuando se utiliza un vocoder. Centrarse en otras características de la voz: timbre, profundidad, claridad y definición. En lugar de experimentar con el rango, es mejor trabajar la expresión y la entonación.
¿Qué parámetros controlan el funcionamiento del vocoder?
Tanto los codificadores de voz de hardware como de software (VST) suelen tener un conjunto similar de parámetros. En la mayoría de los casos, sus configuraciones son similares: aunque los nombres de los controles y parámetros pueden variar según el fabricante, su esencia sigue siendo aproximadamente la misma.
Número de bandas
El control Bandas controla cómo se divide la señal de audio en diferentes rangos de frecuencia. La posición de este control determina en cuántas partes se dividirá la señal del modulador. A diferencia de los vocoders y complementos de software, los dispositivos más antiguos tienen un límite en la cantidad de rangos de frecuencia en los que se puede dividir la señal. Para crear un sonido robótico tradicional similar al estilo Kraftwerk, se recomienda configurar el parámetro Bandas en el rango de 8 a 12 valores.
Rango de frecuencia
Este parámetro determina el rango de frecuencias que se utilizarán en el proceso de procesamiento de la señal del operador. Al operar el vocoder, solo se tendrán en cuenta las frecuencias dentro de este intervalo especificado, el resto se ignorará. Para mejorar la claridad del audio, se recomienda establecer el límite superior por encima de 5 kHz.
formante
Algunos modelos de vocoder tienen una función de ajuste de formantes, a menudo denominada "Shift". Con esta opción, el usuario puede cambiar el ancho o la estrechez de las bandas para filtrar el audio. Aumentar los formantes hace que la señal procesada sea más brillante, mientras que reducirlos hace que la señal procesada sea más oscura y profunda.
Normalmente, el ajuste de formantes se utiliza para ajustar el vocoder a voces femeninas o masculinas, y el cambio hace que la voz robótica sea más femenina o masculina. Algunos modelos de vocoder, en lugar de ajustar los formantes, tienen un parámetro “Género”, que permite ajustar el género de la voz resultante.
Acallado
El habla humana en cualquier idioma siempre va acompañada de los llamados sonidos explosivos. Un sonido explosivo se produce en el momento en que, para pronunciarlo, es necesario pasar un chorro de aire por los labios cerrados, por ejemplo, al pronunciar las letras “P” y “B”. Las oclusivas no son sonidos vocales, por lo que a menudo se les llama sonidos sordos.
Los sonidos no vocales no tienen un tono específico y son ruido en todo el rango de frecuencia que el vocoder ignora. Pero no debería alegrarse de la exclusión de tales ruidos: imagine cómo suenan las palabras familiares sin las letras "P" y "B" ("habitual" - "rico", "problema" - "rolema").
Para evitar que el vocoder pierda sonidos explosivos y "trague" letras en las palabras, los fabricantes agregan un parámetro especial "Sordo" a la sección de configuración. Este control está conectado a un generador de ruido, que corrige las deficiencias en el funcionamiento del vocoder: cuanto más se gira el parámetro, más fuerte es la corrección. El generador de ruido reproduce una señal con una forma de onda de sonido similar a la señal del operador. Todos los explosivos sin tono y de transición permanecen en la señal, las letras de las palabras se conservan y el habla suena correctamente después del vocoder.