vi RU

Bộ mã hóa âm thanh là gì

Bộ phát âm VST

Bộ phát âm được phát minh vào những năm 1920 với mục đích liên lạc và liên lạc. Tuy nhiên, mục đích thực sự của nó được phát hiện là trong âm nhạc điện tử, nơi nó trở thành công cụ chính để tạo ra giọng nói của robot. Gần một trăm năm sau khi xuất hiện, bộ phát âm được sử dụng tích cực trong ngành công nghiệp âm nhạc, nhưng không phải ai cũng biết loại nhạc cụ độc đáo này hoạt động như thế nào và cách sử dụng nó. Trong văn bản này, bạn có thể tìm hiểu Chiến tranh thế giới thứ hai đã làm cho bộ tổng hợp giọng nói trở nên phổ biến như thế nào, chức năng của bộ mã hóa giọng nói và cách sử dụng nó một cách chính xác.

Sự phát triển của bộ mã hóa bắt đầu vào năm 1928 thông qua công việc của một kỹ sư tên là Homer Dudley tại Bell Labs. Đến cuối những năm 1930, kết quả cuối cùng đã đạt được và vào tháng 11 năm 1937, Dudley nhận được bằng sáng chế đầu tiên cho phát minh của mình, và vào năm 1939 – bằng sáng chế thứ hai. Ý tưởng chính của Dudley là tái tạo bộ máy phát âm của con người bằng thiết bị điện tử. Bằng cách sử dụng các thành phần và hiệu ứng điện tử, kỹ sư đã tìm cách bắt chước hoạt động của các cơ quan phát âm của con người càng gần càng tốt, tái tạo âm thanh được tạo ra khi không khí đi qua các bộ phận khác nhau của cơ thể con người, chẳng hạn như phổi và các cơ quan khác.

Năm 1939, Bell Labs đã trình diễn một thiết bị tổng hợp giọng nói có tên VODER (Trình diễn vận hành giọng nói) tới công chúng thông qua một loạt cuộc trình diễn ở New York và San Francisco. Thiết bị này có một cặp bộ dao động có thể chuyển đổi và một bộ tạo tiếng ồn làm nguồn âm thanh. Đường dẫn giọng hát chuyên dụng bao gồm các bộ lọc mười băng tần được liên kết với bàn phím nhạy cảm với vận tốc để kiểm soát cường độ lọc. Cao độ của âm thanh được thay đổi bằng bàn đạp chân. Các phím bổ sung chịu trách nhiệm tạo ra các chữ cái “P”, “D”, “J”, cũng như các tổ hợp âm thanh “JAW” và “CH”.

VODER là một thiết bị phức tạp cần được đào tạo và huấn luyện chuyên môn kéo dài vài tháng để sử dụng. Đối với các cuộc trình diễn hàng ngày, Bell Labs đã đào tạo đặc biệt 20 người, những người này lần lượt giới thiệu sản phẩm mới cho những người quan tâm. Trong cuộc biểu tình, VODER đã nói câu “Chào buổi chiều khán giả đài!”

Năm 1949, bộ chuyển đổi giọng nói KO-6 được phát triển, có khả năng mã hóa giọng nói và thông tin với tốc độ 1200 bit mỗi giây. Năm 1953, một bộ phát âm khác xuất hiện, KY-9 THESEUS, không chỉ tăng tốc độ xử lý lên 1650 bit mỗi giây mà còn sử dụng các thành phần khác nhau. Nhờ các vật liệu được sửa đổi, trọng lượng của bộ phát âm có thể giảm từ 55 tấn đối với SIGSALY xuống còn 256 kg đối với KY-9. Cuối cùng, vào năm 1961, với việc phát hành bộ chuyển đổi HY-2, người ta đã có thể giảm trọng lượng của bộ mã hóa xuống còn 45 kg, đồng thời tăng tốc độ mã hóa lên 2400 bit mỗi giây. HY-2 là thiết bị phát âm công nghiệp cuối cùng được sử dụng trong các hệ thống thông tin liên lạc an toàn, trong khi thiết bị này vẫn được sử dụng trong lĩnh vực tiêu dùng.

Năm 1948, nhà khoa học người Đức Werner Mayer-Eppler, người đặc biệt quan tâm đến tổng hợp giọng nói, đã xuất bản luận án về tổng hợp giọng nói và âm nhạc điện tử từ quan điểm tổng hợp âm thanh. Kiến thức của ông sau này đóng một vai trò quan trọng trong việc thành lập Phòng thu âm nhạc điện tử của Đài phát thanh Tây Đức (WDR) ở Cologne vào năm 1951.

Việc sử dụng bộ phát âm đầu tiên để tạo ra âm nhạc xảy ra vào năm 1959, cũng ở Đức. Giữa năm 1956 và 1959, Siemens đã phát triển Bộ tổng hợp Siemens, có thể chuyển đổi âm thanh thành giọng nói. Năm 1968, Robert Moog, người sáng lập công ty Moog, đã phát triển một trong những máy phát âm đầu tiên được thiết kế đặc biệt để sử dụng trong ngành công nghiệp âm nhạc. Bộ phát âm này được ủy quyền bởi Đại học Buffalo.

Kể từ đó, lịch sử của bộ phát âm đã tự phát triển và nó được sử dụng rộng rãi trong mọi lĩnh vực âm thanh và video. Nhạc cụ này được công chúng biết đến nhờ nhóm Kraftwerk, nhóm đã độc lập lắp ráp một bộ mã hóa cho các thí nghiệm của họ và sử dụng nó kể từ khi thành lập vào năm 1970. Ví dụ nổi tiếng và phổ biến nhất về việc sử dụng bộ mã hóa là album “Trans-Europe Express” của Kraftwerk. ”, mà chúng tôi đã xem xét chi tiết khi đánh giá các nhạc cụ khác thường của các nghệ sĩ điện tử Đức.

Bộ phát âm hoạt động như thế nào?

Tốt hơn là sử dụng hai tín hiệu hơn một. Bộ phát âm yêu cầu hai nguồn âm thanh để hoạt động:

  1. Toán tử: tín hiệu âm thanh ban đầu;
  2. Bộ điều biến: tín hiệu có các đặc tính hài hòa khác nhau quyết định âm thanh của người vận hành.

Âm thanh đi qua một “ngân hàng bộ lọc” đặc biệt để phân tích tín hiệu điều biến, chia nó thành các dải tần và áp dụng bộ lọc cho từng dải. Các bộ lọc luôn được điều chỉnh sao cho điểm cắt nằm chính xác ở trung tâm của từng phạm vi trong tín hiệu điều chế. Bất kể mật độ cắt như thế nào, tín hiệu trong mỗi phạm vi đều được lọc ở giữa.

Sau đó, tín hiệu vận hành được cung cấp cho bộ điều biến, tín hiệu này đi qua tất cả các bộ lọc. Bộ mã hóa âm thanh điều chỉnh điểm cắt của từng bộ lọc tùy thuộc vào hài âm và âm bội trong tín hiệu điều chế.

Để hiểu nguyên lý hoạt động của bộ phát âm, chúng ta có thể so sánh với giọng nói của con người. Âm thanh của giọng nói được hình thành bởi tín hiệu của người vận hành và bộ điều biến. Khi chúng ta phát âm các từ, một luồng không khí đi qua dây thanh âm, tạo ra toán tử tín hiệu ban đầu. Đồng thời, các bộ phận khác của bộ máy phát âm rung lên, tạo ra tín hiệu điều biến. Những đặc điểm này ảnh hưởng trực tiếp đến âm thanh của giọng nói.

Bộ mã hóa âm thanh hoạt động theo cách tương tự: nó sửa đổi tín hiệu gốc do đặc tính của tín hiệu bổ sung.

Bất kỳ tín hiệu âm thanh nào cũng có thể là toán tử hoặc bộ điều biến. Các nhà sản xuất thường sử dụng âm thanh tổng hợp làm toán tử và giọng nói làm bộ điều biến. Một ví dụ về việc sử dụng bộ mã hóa trong âm nhạc là bản nhạc “Trans-Europe Express” của Kraftwerk. Toán tử là tín hiệu tổng hợp và bộ điều biến là lời nói thông thường.

Bạn có thể thấy cách sử dụng bộ phát âm mang tính thử nghiệm hơn trong bản nhạc “Nightcall” của Kavinsky. Hiệu ứng này có thể được tạo lại bằng iZotope VocalSynth bằng cách cài đặt bản vá để tạo hợp âm từ hai sóng âm thanh và tiếng ồn trắng làm toán tử, được điều chế bằng giọng nói.

Cách sử dụng bộ mã hóa giọng nói

Để một bộ phát âm có âm thanh ấn tượng như nhiều bản ghi âm thương mại, bộ điều khiển tín hiệu phải có nhiều âm bội. Toán tử càng phong phú và đa dạng thì tác động của bộ điều biến càng mạnh.

Tốt nhất bạn nên bắt đầu thử nghiệm các bản vá sử dụng hoặc dựa trên dạng sóng âm thanh răng cưa. Tín hiệu sóng dốc thường ngày càng phong phú hơn sóng tam giác hoặc hình sin. Bạn cũng nên nén hoặc bão hòa tín hiệu của người vận hành trước khi đưa tín hiệu đó vào bộ phát âm. Điều này sẽ làm nổi bật tác dụng của tín hiệu đi qua dãy bộ lọc.

Giọng nói đóng vai trò là bộ điều biến cần được chú ý đặc biệt. Khi viết từ, bạn phải viết thật rõ ràng, chính xác, nhấn mạnh từng âm. Cho dù bạn có loại giọng nói nào, điều quan trọng là phát âm rõ ràng. Chính sự chính xác và rõ ràng đã tạo ra hiệu ứng bộ phát âm đặc trưng mang lại giọng nói robot. Hãy chú ý cách mỗi từ trong “Nightcall” của Kavinsky được phát âm rõ ràng và chậm rãi. Khi làm việc với bộ phát âm, điều quan trọng là phải theo dõi khả năng phát âm để tránh bị méo tiếng.

Cao độ giọng nói không quan trọng bằng khi sử dụng bộ mã hóa giọng nói. Tập trung vào các đặc điểm khác của giọng nói: âm sắc, độ sâu, độ rõ và độ nét. Thay vì thử nghiệm phạm vi, tốt hơn là bạn nên tập trung vào cách diễn đạt và ngữ điệu.

Những thông số nào kiểm soát hoạt động của bộ phát âm?

Cả bộ phát âm phần cứng và phần mềm (VST) thường có một bộ thông số tương tự nhau. Trong hầu hết các trường hợp, cài đặt của chúng tương tự nhau: mặc dù tên của các điều khiển và thông số có thể khác nhau tùy thuộc vào nhà sản xuất, nhưng bản chất của chúng vẫn gần giống nhau.

Số lượng ban nhạc

Kiểm soát Dải tần kiểm soát cách chia tín hiệu âm thanh thành các dải tần số khác nhau. Vị trí của điều khiển này xác định tín hiệu điều chế sẽ được chia thành bao nhiêu phần. Không giống như bộ phát âm và trình cắm phần mềm, các thiết bị cũ hơn có giới hạn về số dải tần mà tín hiệu có thể được chia vào. Để tạo âm thanh robot truyền thống tương tự như kiểu Kraftwerk, bạn nên đặt tham số Bands trong khoảng từ 8 đến 12 giá trị.

Dải tần số

Tham số này xác định dải tần số sẽ được sử dụng trong quá trình xử lý tín hiệu của người vận hành. Khi vận hành bộ phát âm, chỉ các tần số trong khoảng thời gian được chỉ định này mới được tính đến, phần còn lại sẽ bị bỏ qua. Để cải thiện độ rõ của âm thanh, bạn nên đặt giới hạn trên trên 5 kHz.

định dạng

Một số kiểu bộ mã hóa giọng nói có tính năng điều chỉnh biểu mẫu, thường được gọi là “Shift”. Với tùy chọn này, người dùng có thể thay đổi độ rộng hoặc độ hẹp của dải để lọc âm thanh. Việc tăng các chất định dạng làm cho tín hiệu được xử lý sáng hơn, trong khi giảm nó làm cho tín hiệu được xử lý tối hơn và sâu hơn.

Thông thường, điều chỉnh định dạng được sử dụng để điều chỉnh bộ phát âm theo giọng nữ hoặc nam, với sự thay đổi làm cho giọng nói của robot trở nên nữ tính hoặc nam tính hơn. Một số kiểu bộ mã hóa giọng nói, thay vì điều chỉnh các biểu mẫu, có tham số “Giới tính”, cho phép bạn điều chỉnh giới tính của giọng nói thu được.

Vô thanh

Lời nói của con người trong bất kỳ ngôn ngữ nào luôn đi kèm với cái gọi là âm thanh trầm. Một âm thanh bùng nổ xảy ra tại thời điểm khi để phát âm nó, cần phải truyền một luồng không khí qua môi khép kín, chẳng hạn như khi phát âm các chữ cái “P” và “B”. Âm trầm không phải là âm thanh nên chúng thường được gọi là âm thanh vô thanh.

Âm thanh không phải giọng nói không có cao độ cụ thể và là tạp âm trên toàn bộ dải tần mà bộ phát âm bỏ qua. Nhưng bạn không nên vui mừng khi loại trừ những tiếng động như vậy: hãy tưởng tượng những từ quen thuộc phát ra như thế nào nếu không có chữ cái “P” và “B” (“thói quen” – “giàu có”, “vấn đề” – “rolema”).

Để ngăn bộ phát âm bỏ sót các âm thanh trầm và các chữ cái “nuốt” trong từ, nhà sản xuất thêm một thông số đặc biệt “Không có giọng nói” vào phần cài đặt. Bộ điều khiển này được kết nối với một bộ tạo tiếng ồn, giúp khắc phục những thiếu sót trong hoạt động của bộ phát âm: tham số càng được xoay thì khả năng hiệu chỉnh càng mạnh. Bộ tạo nhiễu tái tạo tín hiệu có dạng sóng âm thanh tương tự như tín hiệu của người vận hành. Tất cả các âm thanh chuyển tiếp và không cao độ vẫn còn trong tín hiệu, các chữ cái trong từ được giữ nguyên và âm thanh giọng nói chính xác sau bộ phát âm.

Đăng ký miễn phí

Đăng ký miễn phí và nhận một dự án miễn phí