Wat is Vocoder
De vocoder werd in de jaren twintig uitgevonden voor communicatie- en communicatiedoeleinden. Het ware doel ervan werd echter ontdekt in de elektronische muziek, waar het een belangrijk hulpmiddel werd voor het creëren van robotstemmen. Bijna honderd jaar na zijn verschijning wordt de vocoder actief gebruikt in de muziekindustrie, maar niet iedereen weet hoe dit unieke instrument werkt en hoe je het moet gebruiken. In deze tekst leer je hoe de Tweede Wereldoorlog spraaksynthesizers populair maakte, hoe de vocoder functioneert en hoe je deze op de juiste manier gebruikt.
De ontwikkeling van de vocoder begon in 1928 door het werk van een ingenieur genaamd Homer Dudley bij Bell Labs. Tegen het einde van de jaren dertig werd het eindresultaat bereikt en in november 1937 ontving Dudley het eerste patent voor zijn uitvinding, en in 1939 het tweede. Dudley's belangrijkste idee was om het menselijke spraakapparaat opnieuw te creëren met behulp van elektronica. Met behulp van elektronische componenten en effecten probeerde de ingenieur de werking van de menselijke spraakorganen zo goed mogelijk na te bootsen, door de geluiden te reproduceren die werden gecreëerd door de luchtstroom door verschillende delen van het menselijk lichaam, zoals de longen en andere organen.
In 1939 demonstreerde Bell Labs een spraaksyntheseapparaat genaamd VODER (Voice Operating Demonstrator) aan het publiek via een reeks demonstraties in New York en San Francisco. Het apparaat had een paar schakelbare oscillatoren en een ruisgenerator als audiobron. Een speciaal vocaal pad bestaande uit tienbandsfilters werd gekoppeld aan een snelheidsgevoelig toetsenbord dat de intensiteit van de filtering regelde. De toonhoogte van het geluid werd gewijzigd met behulp van een voetpedaal. Extra toetsen waren verantwoordelijk voor het genereren van de letters “P”, “D”, “J”, evenals de klankcombinaties “JAW” en “CH”.
VODER was een complex apparaat waarvoor gespecialiseerde training en training van enkele maanden nodig was om te gebruiken. Voor dagelijkse demonstraties heeft Bell Labs twintig mensen speciaal opgeleid, die om de beurt het nieuwe product aan alle geïnteresseerden presenteerden. Tijdens de demonstratie zei VODER de zin “Goedemiddag, radiopubliek!”
In 1949 werd de KO-6 stemomzetter ontwikkeld, die spraak en informatie codeerde met een snelheid van 1200 bits per seconde. In 1953 verscheen een andere vocoder, de KY-9 THESEUS, die niet alleen de verwerkingssnelheid verhoogde tot 1650 bits per seconde, maar ook verschillende componenten gebruikte. Dankzij de aangepaste materialen was het mogelijk om het gewicht van de vocoder terug te brengen van 55 ton voor SIGSALY naar 256 kilogram voor KY-9. Eindelijk, in 1961, met de release van de HY-2-converter, was het mogelijk om het gewicht van de vocoder terug te brengen tot 45 kilogram, en ook de coderingssnelheid te verhogen tot 2400 bits per seconde. De HY-2 was de laatste industriële vocoder die werd gebruikt in beveiligde communicatiesystemen, terwijl het instrument in de consumentensector bleef.
In 1948 publiceerde de Duitse wetenschapper Werner Mayer-Eppler, die een bijzondere interesse had in stemsynthese, een proefschrift over spraaksynthese en elektronische muziek vanuit het oogpunt van geluidssynthese. Zijn kennis speelde later een belangrijke rol bij de oprichting van de West-Duitse Radio (WDR) Electronic Music Studio in Keulen in 1951.
Het eerste gebruik van een vocoder om muziek te maken vond plaats in 1959, ook in Duitsland. Tussen 1956 en 1959 ontwikkelde Siemens de Siemens Synthesizer, die geluid in spraak kon omzetten. In 1968 ontwikkelde Robert Moog, oprichter van het bedrijf Moog, een van de eerste vocoders die speciaal was ontworpen voor gebruik in de muziekindustrie. Deze vocoder is gemaakt in opdracht van de Universiteit van Buffalo.
Sindsdien is de geschiedenis van de vocoder vanzelf geëvolueerd en wordt deze op grote schaal gebruikt op alle gebieden van audio en video. Het instrument werd bekend bij het grote publiek dankzij de groep Kraftwerk, die voor hun experimenten onafhankelijk een vocoder samenstelde en deze sinds de oprichting in 1970 gebruikte. Het bekendste en populairste voorbeeld van het gebruik van een vocoder was het Kraftwerk-album “Trans-Europe Express ”, die we in detail hebben onderzocht in een recensie van ongebruikelijke muziekinstrumenten van Duitse elektronische artiesten.
Hoe werkt een vocoder?
Het is beter om twee signalen te gebruiken dan één. De vocoder heeft twee geluidsbronnen nodig om te kunnen werken:
- Operator: eerste geluidssignaal;
- Modulator: een signaal met verschillende harmonische kenmerken die het geluid van de operator bepalen.
Het geluid passeert een speciale “filterbank” die het modulatorsignaal analyseert, verdeelt in frequentiebanden en op elke band een filter toepast. Filters worden altijd zo aangepast dat het afsnijpunt precies in het midden van elk bereik in het modulatorsignaal ligt. Ongeacht de segmenteringsdichtheid wordt het signaal binnen elk bereik in het midden gefilterd.
Vervolgens wordt het operatorsignaal aan de modulator geleverd, die door alle filters gaat. De vocoder past het afsnijpunt van elk filter aan, afhankelijk van de harmonischen en boventonen in het modulatorsignaal.
Om het werkingsprincipe van een vocoder te begrijpen, kunnen we een analogie trekken met de menselijke stem. Het geluid van de stem wordt gevormd door de signalen van operators en modulators. Wanneer we woorden uitspreken, stroomt er een luchtstroom door de stembanden, waardoor de oorspronkelijke signaaloperator ontstaat. Tegelijkertijd trillen andere delen van het vocale apparaat, waardoor een modulatorsignaal wordt gegenereerd. Deze kenmerken hebben rechtstreeks invloed op het geluid van de stem.
Een vocoder werkt op een vergelijkbare manier: hij wijzigt het oorspronkelijke signaal vanwege de kenmerken van het aanvullende signaal.
Elk audiosignaal kan een operator of een modulator zijn. Producenten gebruiken vaak gesynthetiseerde geluiden als operators en de stem als modulator. Een voorbeeld van het gebruik van een vocoder in muziek is het nummer “Trans-Europe Express” van Kraftwerk. De operator is het synthesizersignaal en de modulator is gewone spraak.
Een meer experimenteel gebruik van de vocoder is te zien in het nummer “Nightcall” van Kavinsky. Dit effect kan worden nagebootst met behulp van iZotope VocalSynth door de patch zo in te stellen dat hij akkoorden genereert uit twee geluidsgolven en witte ruis als operator, gemoduleerd door de stem.
Hoe een vocoder te gebruiken
Wil een vocoder net zo indrukwekkend klinken als veel commerciële opnames, dan moet de signaaloperator rijk zijn aan boventonen. Hoe rijker en gevarieerder de operator, hoe sterker de impact van de modulator.
Het is het beste om te gaan experimenteren met patches die gebruik maken van of gebaseerd zijn op de zaagtandgeluidsgolfvorm. Hellingsgolfsignalen zijn doorgaans rijker en rijker dan driehoeks- of sinusgolven. Het is ook een goede gewoonte om het operatorsignaal te comprimeren of te verzadigen voordat het naar de vocoder wordt gestuurd. Dit zal het effect benadrukken van het signaal dat door de filterbank gaat.
De stem die als modulator fungeert, vereist speciale aandacht. Wanneer u woorden schrijft, moet u heel duidelijk en nauwkeurig zijn en elk geluid benadrukken. Welk type stem je ook hebt, het is belangrijk dat de articulatie uitgesproken is. Het zijn de precisie en helderheid die het karakteristieke vocodereffect creëren dat een robotstem oplevert. Merk op hoe in Kavinsky's 'Nachtroep' elk woord duidelijk en langzaam wordt uitgesproken. Wanneer u met een vocoder werkt, is het belangrijk om de articulatie in de gaten te houden om vervorming te voorkomen.
De stemhoogte is niet zo belangrijk bij het gebruik van een vocoder. Focus op andere kenmerken van de stem: timbre, diepte, helderheid en definitie. In plaats van te experimenteren met bereik, kun je beter aan expressie en intonatie werken.
Welke parameters regelen de werking van de vocoder?
Zowel hardware- als softwarevocoders (VST) hebben doorgaans een vergelijkbare set parameters. In de meeste gevallen zijn hun instellingen vergelijkbaar: hoewel de namen van de bedieningselementen en parameters kunnen variëren afhankelijk van de fabrikant, blijft hun essentie ongeveer hetzelfde.
Aantal banden
Met de Bands-regelaar regelt u hoe het audiosignaal in verschillende frequentiebereiken wordt verdeeld. De positie van deze regelaar bepaalt in hoeveel delen het modulatorsignaal wordt verdeeld. In tegenstelling tot softwarevocoders en plug-ins hebben oudere apparaten een limiet op het aantal frequentiebereiken waarin het signaal kan worden verdeeld. Om een traditioneel robotgeluid te creëren dat lijkt op de Kraftwerk-stijl, wordt aanbevolen om de parameter Bands in te stellen in een bereik van 8 tot 12 waarden.
Frequentiebereik
Deze parameter bepaalt het frequentiebereik dat wordt gebruikt in het operatorsignaalverwerkingsproces. Bij het bedienen van de vocoder wordt alleen rekening gehouden met frequenties binnen dit gespecificeerde interval, de rest wordt genegeerd. Om de audiohelderheid te verbeteren, wordt aanbevolen om de bovengrens boven 5 kHz in te stellen.
Formant
Sommige vocodermodellen hebben een formantaanpassingsfunctie, ook wel 'Shift' genoemd. Met deze optie kan de gebruiker de breedte of smalheid van de banden wijzigen om de audio te filteren. Het verhogen van de formanten maakt het verwerkte signaal helderder, terwijl het verminderen ervan het verwerkte signaal donkerder en dieper maakt.
Meestal wordt formantaanpassing gebruikt om de vocoder aan te passen aan vrouwen- of mannenstemmen, waarbij de verschuiving de robotstem vrouwelijker of mannelijker maakt. Sommige vocodermodellen hebben, in plaats van de formanten aan te passen, een parameter 'Gender', waarmee u het geslacht van de resulterende stem kunt aanpassen.
Stemloos
Menselijke spraak in welke taal dan ook gaat altijd gepaard met zogenaamde plosieve geluiden. Een explosief geluid ontstaat op het moment dat het, om het uit te spreken, nodig is om een luchtstroom door gesloten lippen te laten gaan, bijvoorbeeld bij het uitspreken van de letters "P" en "B". Plosieven zijn geen vocale geluiden en worden daarom vaak stemloze geluiden genoemd.
Niet-vocale geluiden hebben geen specifieke toonhoogte en zijn ruis over het gehele frequentiebereik die de vocoder negeert. Maar je moet je niet verheugen over de uitsluiting van dergelijke geluiden: stel je voor hoe bekende woorden klinken zonder de letters "P" en "B" ("gewoonte" - "rijk", "probleem" - "rolema").
Om te voorkomen dat de vocoder plosieve geluiden en letters in woorden mist, voegen fabrikanten een speciale parameter 'Unvoiced' toe aan het instellingengedeelte. Deze besturing is verbonden met een ruisgenerator, die tekortkomingen in de werking van de vocoder corrigeert: hoe meer aan de parameter wordt gedraaid, hoe sterker de correctie. De ruisgenerator reproduceert een signaal met een geluidsgolfvorm die vergelijkbaar is met het operatorsignaal. Alle toonloze en transitionele plosieven blijven in het signaal, letters in woorden blijven behouden en spraak klinkt correct na de vocoder.