什么是声码器
声码器发明于20世纪20年代,用于通讯和通讯目的。 然而,它的真正用途是在电子音乐中被发现的,它成为创造机器人声音的关键工具。 声码器出现近一百年后,在音乐行业中得到了积极的应用,但并不是每个人都知道这种独特的乐器如何工作以及如何使用它。 在本文中,您可以了解第二次世界大战如何使语音合成器变得流行、声码器的工作原理以及如何正确使用它。
声码器的开发始于 1928 年,贝尔实验室一位名叫 Homer Dudley 的工程师的工作。 到了 20 世纪 30 年代末,最终的成果得以实现,达德利于 1937 年 11 月获得了其发明的第一项专利,并于 1939 年获得了第二项专利。 达德利的主要想法是利用电子技术重建人类的言语装置。 使用电子元件和效果,工程师试图尽可能模仿人类发音器官的功能,再现空气通过人体各个部位(例如肺部和其他器官)时产生的声音。
1939年,贝尔实验室通过在纽约和旧金山的一系列演示向公众展示了一种名为VODER(语音操作演示器)的语音合成设备。 该设备具有一对可切换振荡器和一个作为音频源的噪声发生器。 由十频段滤波器组成的专用声音路径与控制滤波强度的力度敏感键盘相连。 使用脚踏板改变声音的音高。 附加按键负责生成字母“P”、“D”、“J”以及声音组合“JAW”和“CH”。
VODER 是一种复杂的设备,需要专门的培训和持续数月的培训才能使用。 对于日常演示,贝尔实验室专门培训了 20 名人员,他们轮流向每个感兴趣的人展示新产品。 在演示过程中,VODER 说了一句“广播听众下午好!”
1949年,开发了KO-6语音转换器,它以每秒1200位的速率对语音和信息进行编码。 1953年,出现了另一款声码器KY-9 THESEUS,它不仅将处理速度提高到每秒1650位,而且还使用了不同的组件。 由于材料的改进,声码器的重量可以从 SIGSALY 的 55 吨减少到 KY-9 的 256 公斤。 最后,在 1961 年,随着 HY-2 转换器的发布,声码器的重量得以减轻至 45 公斤,编码速度也提高至每秒 2400 位。 HY-2 是安全通信系统中使用的最后一款工业声码器,而该仪器仍保留在消费领域。
1948年,对语音合成有特殊兴趣的德国科学家Werner Mayer-Eppler从声音合成的角度发表了一篇关于语音合成和电子音乐的论文。 他的知识后来对 1951 年在科隆创建西德广播电台 (WDR) 电子音乐工作室发挥了重要作用。
第一次使用声码器来创作音乐发生在 1959 年,也是在德国。 1956年至1959年间,西门子开发了西门子合成器,可以将声音转换为语音。 1968 年,Moog 公司创始人 Robert Moog 开发了第一批专为音乐行业设计的声码器之一。 该声码器是由布法罗大学委托制作的。
从那时起,声码器的历史不断发展,并广泛应用于音频和视频的所有领域。 该乐器因 Kraftwerk 团体而为公众所知,该团体独立组装了声码器进行实验,并自 1970 年成立以来一直使用它。使用声码器最著名和最受欢迎的例子是 Kraftwerk 专辑“Trans-Europe Express” ”,我们在德国电子艺术家对不寻常乐器的评论中详细研究了这一点。
声码器如何工作?
使用两个信号比使用一个信号更好。 声码器需要两个声源才能运行:
- 操作员:初始声音信号;
- 调制器:具有不同谐波特性的信号,决定操作员的声音。
声音通过一个特殊的“滤波器组”,该滤波器组分析调制器信号,将其划分为频带并对每个频带应用滤波器。 滤波器始终经过调整,以便截止点恰好位于调制器信号中每个范围的中心。 无论切片密度如何,每个范围内的信号都会在中心被过滤。
然后,操作员信号被提供给调制器,调制器通过所有滤波器。 声码器根据调制器信号中的谐波和泛音调整每个滤波器的截止点。
为了理解声码器的工作原理,我们可以与人声进行类比。 语音的声音是由操作器和调制器的信号形成的。 当我们发音时,气流穿过声带,产生原始信号运算符。 与此同时,发声装置的其他部分振动,产生调制器信号。 这些特性直接影响声音的音质。
声码器的工作方式类似:它根据附加信号的特性修改原始信号。
任何音频信号都可以是运算符或调制器。 制作人经常使用合成声音作为操作符,使用语音作为调制器。 Kraftwerk 的歌曲“Trans-Europe Express”就是在音乐中使用声码器的一个例子。 算子是合成器信号,调制器是普通语音。
Kavinsky 的歌曲“Nightcall”中可以看到声码器的更具实验性的使用。 这种效果可以使用 iZotope VocalSynth 来重新创建,方法是将补丁设置为从两个声波和白噪声作为操作符生成和弦,并由声音进行调制。
如何使用声码器
为了使声码器听起来像许多商业录音一样令人印象深刻,信号运算符必须具有丰富的泛音。 操作员越丰富、越多样化,调制器的影响力就越强。
最好开始尝试使用或基于锯齿声音波形的音色。 斜波信号通常比三角波或正弦波信号更加丰富。 在将操作员信号输入声码器之前对其进行压缩或饱和也是一种很好的做法。 这将突出显示信号通过滤波器组的效果。
作为调制器的声音需要特别注意。 写字时,要非常清晰、准确,强调每个声音。 无论您的声音类型如何,发音清晰都很重要。 精确度和清晰度创造了特有的声码器效果,从而发出机器人的声音。 请注意卡文斯基的《Nightcall》中每个单词的发音是如何清晰而缓慢的。 使用声码器时,监控发音以避免失真非常重要。
使用声码器时,音高并不那么重要。 关注声音的其他特征:音色、深度、清晰度和清晰度。 与其尝试音域,不如在表达和语调上下功夫。
哪些参数控制声码器的操作?
硬件和软件 (VST) 声码器通常具有一组相似的参数。 在大多数情况下,它们的设置是相似的:尽管控件和参数的名称可能因制造商而异,但它们的本质仍然大致相同。
频段数量
频段控件控制如何将音频信号划分为不同的频率范围。 该控件的位置决定了调制器信号将被分为多少部分。 与软件声码器和插件不同,旧设备对信号可划分的频率范围数量有限制。 要创建类似于 Kraftwerk 风格的传统机器人声音,建议将 Bands 参数设置在 8 到 12 值范围内。
频率范围
该参数确定操作员信号处理过程中使用的频率范围。 当操作声码器时,仅考虑该指定间隔内的频率,其余的将被忽略。 为了提高音频清晰度,建议将上限设置为 5 kHz 以上。
共振峰
一些声码器模型具有共振峰调整功能,通常称为“Shift”。 使用此选项,用户可以更改频带的宽度或窄度以过滤音频。 增加共振峰使处理后的信号更亮,而减少共振峰则使处理后的信号更暗更深。
通常,共振峰调整用于将声码器调整为女性或男性声音,这种转变使机器人声音更加女性化或男性化。 某些声码器模型具有“性别”参数,而不是调整共振峰,它允许您调整生成的声音的性别。
清音
任何语言的人类讲话总是伴随着所谓的爆破音。 当为了发音而需要使气流通过闭合的嘴唇时,例如在发音字母“P”和“B”时,会发生爆炸性声音。 爆破音不是有声声音,因此通常被称为清音。
非声音没有特定的音高,是声码器忽略的整个频率范围内的噪声。 但你不应该因为排除了这些噪音而感到高兴:想象一下,如果没有字母“P”和“B”(“习惯”-“丰富”,“问题”-“角色”),单词听起来是多么熟悉。
为了防止声码器丢失爆破音和“吞掉”单词中的字母,制造商在设置部分添加了一个特殊的“清音”参数。 该控制连接到噪声发生器,该噪声发生器纠正了声码器操作中的缺点:参数转动得越多,校正越强。 噪声发生器再现具有与操作员信号类似的声音波形的信号。 所有无音调和过渡爆破音都保留在信号中,单词中的字母被保留,并且语音在声码器后听起来是正确的。