Wat is Vocoder

Auteur

Antony Tornver

Gepubliceerd

April 27, 2024

De vocoder werd in de jaren twintig van de vorige eeuw uitgevonden voor communicatie- en communicatiedoeleinden. Het werkelijke doel ervan werd echter ontdekt in de elektronische muziek, waar het een belangrijk hulpmiddel werd voor het creëren van robotstemmen. Bijna honderd jaar na zijn verschijning wordt de vocoder nog steeds actief gebruikt in de muziekindustrie, maar niet iedereen weet hoe dit unieke instrument werkt en hoe het moet worden gebruikt. In deze tekst leest u hoe de Tweede Wereldoorlog spraaksynthesizers populair maakte, hoe de vocoder werkt en hoe u deze op de juiste manier gebruikt.

De ontwikkeling van de vocoder begon in 1928 door het werk van een ingenieur genaamd Homer Dudley bij Bell Labs. Tegen het einde van de jaren dertig was het eindresultaat bereikt en in november 1937 kreeg Dudley het eerste patent voor zijn uitvinding en in 1939 het tweede. Het belangrijkste idee van Dudley was om het menselijke spraakapparaat met behulp van elektronica na te bootsen. Met behulp van elektronische componenten en effecten probeerde de ingenieur de werking van de menselijke spraakorganen zo nauwkeurig mogelijk na te bootsen, door de geluiden te reproduceren die worden gecreëerd door de passage van lucht door verschillende delen van het menselijk lichaam, zoals de longen en andere organen.

In 1939 demonstreerde Bell Labs een spraaksyntheseapparaat genaamd VODER (Voice Operating Demonstrator) aan het publiek tijdens een reeks demonstraties in New York en San Francisco. Het apparaat beschikte over een paar schakelbare oscillatoren en een ruisgenerator als audiobron. Een speciaal spraakpad bestaande uit tienbandfilters was gekoppeld aan een snelheidsgevoelig toetsenbord dat de intensiteit van de filtering regelde. De toonhoogte van het geluid werd gewijzigd met behulp van een voetpedaal. Extra toetsen waren verantwoordelijk voor het genereren van de letters "P", "D", "J" en de klankcombinaties "JAW" en "CH".

VODER was een complex apparaat dat een gespecialiseerde opleiding en training van enkele maanden vereiste om te kunnen gebruiken. Voor dagelijkse demonstraties leidde Bell Labs speciaal 20 mensen op, die om beurten het nieuwe product aan alle geïnteresseerden presenteerden. Tijdens de demonstratie zei VODER de zin "Goedemiddag, radioluisteraars!".

In 1949 werd de KO-6-stemconverter ontwikkeld, die spraak en informatie codeerde met een snelheid van 1200 bits per seconde. In 1953 verscheen een andere vocoder, de KY-9 THESEUS, die niet alleen de verwerkingssnelheid verhoogde tot 1650 bits per seconde, maar ook andere componenten gebruikte. Dankzij de aangepaste materialen kon het gewicht van de vocoder worden teruggebracht van 55 ton voor SIGSALY tot 256 kilogram voor KY-9. Uiteindelijk kon in 1961, met de release van de HY-2-converter, het gewicht van de vocoder worden teruggebracht tot 45 kilogram en kon ook de coderingssnelheid worden verhoogd tot 2400 bits per seconde. De HY-2 was de laatste industriële vocoder die werd gebruikt in beveiligde communicatiesystemen, terwijl het instrument in de consumentensector bleef.

In 1948 publiceerde de Duitse wetenschapper Werner Mayer-Eppler, die een bijzondere interesse had in spraaksynthese, een proefschrift over spraaksynthese en elektronische muziek vanuit het oogpunt van geluidssynthese. Zijn kennis speelde later een belangrijke rol bij de oprichting van de West-Duitse Radio (WDR) Electronic Music Studio in Keulen in 1951.

Het eerste gebruik van een vocoder om muziek te maken vond plaats in 1959, eveneens in Duitsland. Tussen 1956 en 1959 ontwikkelde Siemens de Siemens Synthesizer, die geluid kon omzetten in spraak. In 1968 ontwikkelde Robert Moog, oprichter van het bedrijf Moog, een van de eerste vocoders die speciaal was ontworpen voor gebruik in de muziekindustrie. Deze vocoder werd gemaakt in opdracht van de Universiteit van Buffalo.

Sindsdien heeft de geschiedenis van de vocoder zich op eigen kracht ontwikkeld en wordt hij op grote schaal gebruikt in alle gebieden van audio en video. Het instrument werd bekend bij het grote publiek dankzij de groep Kraftwerk, die zelfstandig een vocoder in elkaar zette voor hun experimenten en deze sinds de oprichting in 1970 gebruikte. Het bekendste en populairste voorbeeld van het gebruik van een vocoder was het Kraftwerk-album "Trans-Europe Express", dat we in detail hebben onderzocht in een recensie van ongebruikelijke muziekinstrumenten van Duitse elektronische artiesten.

Hoe werkt een vocoder?

Het is beter om twee signalen te gebruiken dan één. De vocoder heeft twee geluidsbronnen nodig om te kunnen werken:

Operator: het oorspronkelijke geluidssignaal;
Modulator: een signaal met verschillende harmonische kenmerken die het geluid van de operator bepalen.

Het geluid gaat door een speciale "filterbank" die het modulatorsignaal analyseert, het in frequentiebanden verdeelt en een filter op elke band toepast. Filters worden altijd zo afgesteld dat het afsnijpunt precies in het midden van elk bereik in het modulatorsignaal ligt. Ongeacht de snijdichtheid wordt het signaal binnen elk bereik in het midden gefilterd.

Vervolgens wordt het operatorsignaal naar de modulator gestuurd, die door alle filters gaat. De vocoder past het afsnijpunt van elk filter aan, afhankelijk van de harmonischen en boventonen in het modulatorsignaal.

Om het werkingsprincipe van een vocoder te begrijpen, kunnen we een analogie maken met de menselijke stem. Het geluid van de stem wordt gevormd door de signalen van operators en modulators. Wanneer we woorden uitspreken, stroomt er lucht door de stembanden, waardoor het oorspronkelijke signaaloperator ontstaat. Tegelijkertijd trillen andere delen van het spraakapparaat, waardoor een modulatorsignaal wordt gegenereerd. Deze kenmerken hebben een directe invloed op het geluid van de stem.

Een vocoder werkt op een vergelijkbare manier: hij wijzigt het oorspronkelijke signaal op basis van de kenmerken van het extra signaal.

Elk audiosignaal kan een operator of een modulator zijn. Producenten gebruiken vaak gesynthetiseerde geluiden als operator en de stem als modulator. Een voorbeeld van het gebruik van een vocoder in muziek is het nummer "Trans-Europe Express" van Kraftwerk. De operator is het synthesizersignaal en de modulator is gewone spraak.

Een meer experimenteel gebruik van de vocoder is te horen in het nummer "Nightcall" van Kavinsky. Dit effect kan worden nagebootst met iZotope VocalSynth door de patch zo in te stellen dat akkoorden worden gegenereerd uit twee geluidsgolven en witte ruis als operator, gemoduleerd door de stem.

Hoe gebruik je een vocoder?

Om een vocoder net zo indrukwekkend te laten klinken als veel commerciële opnames, moet het signaal van de operator rijk zijn aan boventonen. Hoe rijker en gevarieerder de operator, hoe sterker de impact van de modulator.

Het is het beste om te beginnen met experimenteren met patches die gebruikmaken van of gebaseerd zijn op de zaagtandgeluidsgolfvorm. Rampgolfsignalen zijn doorgaans rijker en voller dan driehoekige of sinusgolven. Het is ook een goede gewoonte om het operatorsignaal te comprimeren of te verzadigen voordat het in de vocoder wordt ingevoerd. Dit benadrukt het effect van het signaal dat door de filterbank gaat.

De stem die als modulator fungeert, vereist speciale aandacht. Bij het schrijven van woorden moet je heel duidelijk en nauwkeurig zijn en elke klank benadrukken. Ongeacht het type stem dat je hebt, is het belangrijk dat de articulatie duidelijk is. Het zijn de precisie en duidelijkheid die het karakteristieke vocodereffect creëren dat een robotachtige stem oplevert. Let op hoe in Kavinsky's "Nightcall" elk woord duidelijk en langzaam wordt uitgesproken. Bij het werken met een vocoder is het belangrijk om de articulatie in de gaten te houden om vervorming te voorkomen.

De toonhoogte van de stem is niet zo belangrijk bij het gebruik van een vocoder. Concentreer je op andere kenmerken van de stem: klankkleur, diepte, helderheid en definitie. In plaats van te experimenteren met het bereik, kun je beter werken aan expressie en intonatie.

Welke parameters regelen de werking van de vocoder?

Zowel hardware- als software-vocoders (VST) hebben meestal een vergelijkbare set parameters. In de meeste gevallen zijn de instellingen vergelijkbaar: hoewel de namen van de bedieningselementen en parameters kunnen variëren afhankelijk van de fabrikant, blijft de essentie ongeveer hetzelfde.

Aantal banden

De Bands-regelaar bepaalt hoe het audiosignaal wordt verdeeld over verschillende frequentiebereiken. De positie van deze regelaar bepaalt in hoeveel delen het modulatorsignaal wordt verdeeld. In tegenstelling tot softwarevocoders en plug-ins hebben oudere apparaten een limiet voor het aantal frequentiebereiken waarin het signaal kan worden verdeeld. Om een traditioneel robotachtig geluid te creëren dat lijkt op de stijl van Kraftwerk, wordt aanbevolen om de parameter Bands in te stellen op een waarde tussen 8 en 12.

Frequentiebereik

Deze parameter bepaalt het frequentiebereik dat wordt gebruikt in het verwerkingsproces van het operatorsignaal. Bij het gebruik van de vocoder worden alleen frequenties binnen dit opgegeven interval in aanmerking genomen, de rest wordt genegeerd. Om de geluidskwaliteit te verbeteren, wordt aanbevolen om de bovengrens boven 5 kHz in te stellen.

Formant

Sommige vocodermodellen hebben een functie voor het aanpassen van formanten, vaak aangeduid als "Shift". Met deze optie kan de gebruiker de breedte of smalheid van de banden wijzigen om de audio te filteren. Door de formanten te verhogen, wordt het verwerkte signaal helderder, terwijl het verlagen ervan het verwerkte signaal donkerder en dieper maakt.

Formantaanpassing wordt doorgaans gebruikt om de vocoder aan te passen aan vrouwelijke of mannelijke stemmen, waarbij de verschuiving de robotstem vrouwelijker of mannelijker maakt. Sommige vocodermodellen hebben in plaats van formantaanpassing een 'Gender'-parameter, waarmee u het geslacht van de resulterende stem kunt aanpassen.

Onstem

Menselijke spraak in elke taal gaat altijd gepaard met zogenaamde plosieve klanken. Een plosieve klank ontstaat op het moment dat, om deze uit te spreken, een luchtstroom door gesloten lippen moet worden geleid, bijvoorbeeld bij het uitspreken van de letters "P" en "B". Plosieven zijn geen stemgeluiden, dus worden ze vaak stemloze klanken genoemd.

Niet-vocale klanken hebben geen specifieke toonhoogte en zijn ruis over het gehele frequentiebereik dat de vocoder negeert. Maar u moet zich niet verheugen over het uitsluiten van dergelijke ruis: stel u eens voor hoe bekende woorden klinken zonder de letters "P" en "B" ("habitual" – "rich", "problem" – "rolema").

Om te voorkomen dat de vocoder plosieve klanken mist en letters in woorden 'inslikt', voegen fabrikanten een speciale parameter 'Unvoiced' toe aan het instellingenmenu. Deze regelaar is gekoppeld aan een ruisgenerator, die tekortkomingen in de werking van de vocoder corrigeert: hoe meer de parameter wordt gedraaid, hoe sterker de correctie. De ruisgenerator reproduceert een signaal met een geluidsgolfvorm die vergelijkbaar is met het operatorsignaal. Alle toonhoogte- en overgangsplosieven blijven in het signaal behouden, letters in woorden blijven behouden en spraakgeluiden klinken correct na de vocoder.

Auteur

Antony Tornver

Gepubliceerd

April 27, 2024

audio effects