गेन स्टेजिंग क्या है?
डिजिटल ऑडियो दुनिया भ्रमित करने वाली लग सकती है। उदाहरण के लिए, ध्वनि की भौतिकी में, तीव्रता को डेसीबल में मापा जाता है, और मान हमेशा सकारात्मक होते हैं, लेकिन डिजिटल वर्कस्टेशन (डीएडब्ल्यू) में, डेसीबल अचानक नकारात्मक हो जाते हैं। और यह अजीब जादू क्या है?
एक और रहस्य: DAW स्क्रीन पर आप कभी-कभी शून्य से ऊपर सिग्नल स्तर देख सकते हैं, और कभी-कभी "सकारात्मक" डेसिबल भी दिखाई देते हैं। इस सबका क्या मतलब है? मुझे समझने में मदद करें! "वॉल्यूम", "लाभ", "स्तर" शब्द हमारे आसपास और यूट्यूब पर लगातार सुने जाते हैं - लेकिन उनके बीच क्या अंतर है?
आइए इसे जटिल सूत्रों के बिना समझने का प्रयास करें। आख़िरकार, हम ज़्यादातर संगीतकार हैं, इंजीनियर नहीं। और साथ ही, हम सीखेंगे कि DAW का उपयोग करके बनाई गई हमारी संगीत परियोजनाओं में तथाकथित "स्तरीय हेडरूम" को ठीक से कैसे व्यवस्थित किया जाए।
डिजिटल ऑडियो रिकॉर्डिंग में अनिवार्य रूप से कोई वॉल्यूम नहीं होता है। "प्राकृतिक" डेसिबल क्या हैं?
"तीव्र" केवल एक शब्द से कहीं अधिक है जो कानों पर लागू ध्वनि दबाव की तीव्रता का वर्णन करने का प्रयास करता है। प्रत्येक व्यक्ति के लिए, शांत और तेज़ आवाज़ को व्यक्तिपरक रूप से माना जाता है। जो चीज़ एक व्यक्ति के लिए केवल "ज़ोर से" है वह दूसरे के लिए "बहुत तेज़" हो सकती है।
संगीत बनाने के लिए हमेशा व्यक्तिपरक मानदंडों को ध्यान में रखना पड़ता है, जो कभी-कभी रचनात्मक प्रक्रिया में प्रतिभागियों के बीच समझ में हस्तक्षेप करता है। इसलिए, संगीत परियोजनाओं पर काम करते समय वॉल्यूम की अधिक वस्तुनिष्ठ समझ होना महत्वपूर्ण है।
प्रकृति में, डिजिटल दुनिया की तरह, वॉल्यूम का कोई प्रत्यक्ष एनालॉग नहीं है। ध्वनि किसी गैसीय, तरल या ठोस माध्यम में लोचदार तरंगों के माध्यम से यात्रा करती है। ध्वनि का स्रोत एक भौतिक शरीर है जो यांत्रिक कंपन का अनुभव करता है, जैसे कि तार या मानव स्वर रज्जु।
आइए इसे दृश्य रूप से कल्पना करने का प्रयास करें, हालांकि बहुत वैज्ञानिक रूप से नहीं: स्ट्रिंग बजने के बाद, यह एक निश्चित आवृत्ति और आयाम के साथ बग़ल में (त्रि-आयामी अंतरिक्ष में) कंपन करता है, जिससे अपने चारों ओर लोचदार तरंगें पैदा होती हैं।
ये तरंगें उच्च और निम्न वायु दबाव के क्षेत्रों का कारण बनती हैं जो गैसीय वातावरण में फैलती हैं। भौतिक विज्ञानी इन कंपनों को "ध्वनि दबाव" के रूप में वर्णित करते हैं।
ध्वनि दबाव की तीव्रता को मापने के लिए, वैज्ञानिकों ने एक सूत्र विकसित किया है जो दबाव, माध्यम की ध्वनिक प्रतिबाधा और समय के औसत को ध्यान में रखता है। यह हमें समय और स्थान में एक निश्चित बिंदु पर ध्वनि की तीव्रता का मूल माध्य वर्ग मान प्राप्त करने की अनुमति देता है।
संगीत में, ध्वनि कंपन मुख्य रूप से एक तार के कंपन के समान, आवधिक होते हैं। कभी-कभी हम "ध्वनि दबाव आयाम" की अवधारणा का उपयोग करके उनकी तीव्रता का मूल्यांकन करते हैं, लेकिन वास्तव में यह इतना महत्वपूर्ण नहीं है।
जो वास्तव में महत्वपूर्ण है वह यह है कि भौतिकी में सकारात्मक डेसिबल ("+" द्वारा दर्शाया गया) ध्वनि दबाव की तीव्रता को संदर्भित करता है, लेकिन केवल पैमाने पर एक विशिष्ट बिंदु के सापेक्ष। डेसीबल सापेक्ष, लघुगणकीय या उपगुणक इकाइयाँ हैं और केवल तभी समझ में आती हैं जब कोई "प्रारंभिक बिंदु" हो।
भौतिकी में, यह प्रारंभिक बिंदु 20 माइक्रोपास्कल (µPa) का दबाव स्तर है - यह मानव श्रवण की औसत सीमा है जब वह अभी तक ध्वनियों को नहीं समझता है और मौन महसूस करता है। हालाँकि बिल्ली शायद इस बात से सहमत नहीं होगी.
किसी व्यक्ति द्वारा महसूस की जाने वाली ध्वनि की मात्रा का माप की अपनी इकाइयों, जैसे कि फंड, इसकी आवृत्ति संरचना और अन्य कारकों का उपयोग करके अलग से अध्ययन किया जाता है। लेकिन DAW के साथ काम करते समय, ये विवरण इतने महत्वपूर्ण नहीं होते हैं। हमारे लिए मुख्य बात डेसीबल से भ्रमित नहीं होना है।
0 डेसिबल एसपीएल (ध्वनि दबाव स्तर) का मतलब किसी व्यक्ति के लिए मौन है। तुलना के लिए नीचे कुछ विशिष्ट मान दिए गए हैं:
- 15 डीबी - "मुश्किल से सुनाई देने योग्य" - यह पत्तियों की सरसराहट की तरह है;
- 35 डीबी - "स्पष्ट रूप से श्रव्य" - उदाहरण के लिए, दबी हुई बातचीत, लाइब्रेरी में शांत वातावरण या लिफ्ट में शोर;
- 50 डीबी - "स्पष्ट रूप से श्रव्य" - यह मध्यम ध्वनि, शांत सड़क या वॉशिंग मशीन के संचालन पर बातचीत की तरह है;
- 70 डीबी - "शोर" - उदाहरण के लिए, 1 मीटर की दूरी पर तेज़ बातचीत, टाइपराइटर का शोर, शोर भरी सड़क या 3 मीटर की दूरी पर काम कर रहे वैक्यूम क्लीनर;
- 80 डीबी - "बहुत शोर" - यह 1 मीटर की दूरी पर एक तेज़ अलार्म घड़ी, एक चीख, मफलर के साथ मोटरसाइकिल की आवाज़ या चलने वाले ट्रक इंजन की आवाज़ की तरह है। लंबे समय तक ऐसी आवाजें सुनने से सुनने की क्षमता में कमी आ सकती है;
- 95 डीबी - "बहुत शोर" - उदाहरण के लिए, 7 मीटर की दूरी पर सबवे कार का शोर या 1 मीटर की दूरी पर तेज पियानो बजने का शोर;
- 130 डीबी - "दर्द" एक सायरन की तरह है, रिवेटिंग बॉयलर का शोर, सबसे तेज़ चीख या बिना मफलर वाली मोटरसाइकिल;
- 160 डीबी - "शॉक" वह स्तर है जिस पर कान का पर्दा फटने की संभावना होती है, जैसे कि कान के करीब शॉटगन विस्फोट, कार ध्वनि प्रणाली प्रतियोगिता, या सुपरसोनिक विमान से शॉक वेव या 0.002 मेगापास्कल विस्फोट।
ध्वनि मुद्रण। मात्रा और लाभ
जब हम ध्वनि रिकॉर्ड करते हैं, तो हमें हवा में आवधिक ध्वनि कंपन को विद्युत कंपन में परिवर्तित करना होता है। 1857 में फोनोटोग्राफ के आविष्कार के बाद से, वैज्ञानिकों और इंजीनियरों ने ध्वनि रिकॉर्ड करने के विभिन्न तरीकों का प्रयोग किया है।
यह पता चला है कि सबसे प्रभावी और सस्ता तरीका माइक्रोफोन, चुंबकीय और पीजोइलेक्ट्रिक पिकअप (स्ट्रिंग्स और कभी-कभी पियानो जैसे पर्कशन उपकरणों के लिए) जैसे विद्युत उपकरणों का उपयोग करना है।
ये इलेक्ट्रोकॉस्टिक उपकरण वायु ध्वनि दबाव में उतार-चढ़ाव (चुंबकीय पिकअप स्ट्रिंग कंपन रिकॉर्ड करते हैं, और पीजोइलेक्ट्रिक सेंसर शरीर कंपन रिकॉर्ड करते हैं) को रोकते हैं और उन्हें एनालॉग विद्युत सिग्नल में परिवर्तित करते हैं।
इस परिवर्तन के क्षण में, ध्वनि हमारे लिए "गायब" हो जाती है। इसके बाद हम अपने काम के दौरान केवल "शांत" विद्युत दोलनों से निपटते हैं।
यह वे कंपन हैं जो संगीत उपकरणों के अंदर प्रसारित होते हैं - एम्पलीफायर, एनालॉग प्रभाव, टेप रिकॉर्डर, आदि। इन कंपनों के लिए, चाहे वे प्रवर्धित हों, संसाधित हों, या बस चुंबकीय टेप पर रिकॉर्ड किए गए हों, फिर से ध्वनि में बदल जाएं, उन्हें वापस परिवर्तित किया जाना चाहिए एक विशेष उपकरण वायु कंपन का उपयोग करके ध्वनि में। इस उपकरण को स्पीकर कहा जाता है।
एक एनालॉग सिग्नल की मुख्य संपत्ति होती है - यह समय में निरंतर होती है और प्रत्येक मिलीसेकंड - या कम से कम एक सेकंड के दस लाखवें हिस्से पर - इसका एक निश्चित पैरामीटर होता है। मान लीजिए, ध्वनि के एनालॉग इलेक्ट्रॉनिक प्रतिनिधित्व के मामले में, यह आयाम (औसत से मूल्यों का सबसे बड़ा प्रसार) हो सकता है।
माइक्रोफ़ोन से प्राप्त एनालॉग सिग्नल हमें समय-समय पर ध्वनि दबाव में लगातार बदलाव का इतिहास दिखाता है। हम गाते हैं, कहते हैं, एक गीत जिसमें हमने छंदों और कोरस में 2 मिनट के गायन की योजना बनाई है, और जब रिकॉर्डिंग करते हैं तो हमें माइक्रोफ़ोन झिल्ली पर ध्वनि दबाव में परिवर्तन का एक इतिहास मिलता है।
ध्वनि कंपन को परिवर्तित करके प्राप्त विद्युत एनालॉग संकेतों को साइन-जैसे ग्राफ़ के रूप में सबसे आसानी से दर्शाया जाता है। संगीतमय और गैर-संगीतमय ध्वनि, वास्तव में, साइनसोइड्स का एक जटिल योग है।
लेकिन यह सरल भी हो सकता है - जब एनालॉग टोन जनरेटर हमें 440 हर्ट्ज़ (नोट "ए") की आवृत्ति के साथ एक एकल साइन तरंग देता है, तो हम स्पीकर से एक स्पष्ट लेकिन उबाऊ "बीप" सुनते हैं।
और अंततः, यहाँ हम लाभ तक पहुँचते हैं। लाभ शब्द का अर्थ लाभ है। हम एम्पलीफायरों और साउंड कार्डों पर नियामकों के साथ इसका स्तर निर्धारित करते हैं। यह "वॉल्यूम" या "ध्वनि दबाव स्तर" (स्तर) नियंत्रण घुंडी से भिन्न होता है जिसमें हम सिग्नल को उस सीमा से परे बढ़ा सकते हैं जिसके आगे इसकी विकृति शुरू होती है।
आइए अब करीब से देखें: हमारा साइनसॉइड (याद रखें कि यह हमारे लिए एक विद्युत उपकरण के अंदर एक एनालॉग सिग्नल का प्रतीक और कल्पना करता है) ऐसी सममित गोल "पहाड़ियों" और "घाटियों" है जो समय-समय पर दोहराई जाती हैं।
हम "पहाड़ियों" की ऊंचाई और "घाटियों" की गहराई (यानी, आयाम) बढ़ा सकते हैं या, दूसरे शब्दों में, "सिग्नल को मजबूत कर सकते हैं", "लाभ जोड़ सकते हैं" अनिश्चित काल तक नहीं।
हम यहां उपकरणों के सर्किट डिजाइन के बारे में बात नहीं करेंगे, आइए बस यह विश्वास रखें कि उनमें से प्रत्येक की एक भौतिक सीमा है जिसके लिए डिवाइस आनुपातिक रूप से सिग्नल के आयाम को बढ़ा सकता है - इसे "तोड़े" बिना।
जब लाभ एक महत्वपूर्ण बिंदु तक पहुंच जाता है और अनुमेय मूल्यों से परे चला जाता है, तो डिवाइस का भौतिक सर्किट ऊपर से "पहाड़ों" को काटना और नीचे से "घाटियों" को काटना शुरू कर देता है।
इंजीनियरिंग भाषा में इसे "एनालॉग क्लिपिंग" कहा जाता है। इस मामले में, उपयोगी ध्वनि संकेत के अलावा, स्पीकर से घरघराहट, खड़खड़ाहट और कर्कश ध्वनि सुनी जा सकती है। ऑडियो इंजीनियरिंग में इसे "नॉनलाइनियर डिस्टॉर्शन" भी कहा जाता है।
अब हम समझ सकते हैं कि संगीत प्रौद्योगिकी में वॉल्यूम स्तर उस सीमा से पहले सिग्नल के आयाम में बदलाव है जिसके आगे यह विकृत होना शुरू हो जाता है। और "लाभ" आसानी से इन सीमाओं से परे जा सकता है।
विरोधाभास यह है कि जब लाभ अनुमेय मूल्य से अधिक महत्वपूर्ण मात्रा में बढ़ जाता है, तो स्पीकर (जिस पर संसाधित सिग्नल आउटपुट होता है) द्वारा बनाया गया ध्वनि दबाव हमेशा नहीं बढ़ता है। उपरोक्त डिजिटल ऑडियो प्रोसेसिंग के लिए सत्य है।
मान लीजिए, एक DAW के अंदर जो संसाधित सिग्नल को साउंड कार्ड पर भेजता है, जब वर्चुअल कंसोल पर लाभ को क्लिपिंग और पागल मूल्यों के क्षेत्र में बदल दिया जाता है, तो वॉल्यूम स्तर में कोई वास्तविक वृद्धि नहीं होती है। ऑडियो मॉनिटर के स्पीकर में हम केवल अधिक से अधिक विरूपण सुनते हैं। यह "डिजिटल" में ध्वनि के विशेष प्रतिनिधित्व के कारण है, जिसके बारे में हम नीचे कुछ शब्द कहेंगे।
अभी के लिए, आइए "नकारात्मक डेसिबल" पर वापस लौटें। याद रखें कि डीबी सापेक्ष इकाइयाँ हैं जिनका अर्थ केवल तभी होता है जब वे किसी संदर्भ बिंदु से संबंधित हों।
ध्वनि रिकॉर्डिंग में, ऐसे बिंदु को सिग्नल स्तर माना जाता है जिसके आगे विकृति शुरू हो जाती है। इसे "शून्य" के रूप में नामित किया गया है। "टू ज़ीरो" ज़ोन में सब कुछ बिना क्लिपिंग के एक सिग्नल है, जिसका स्तर "माइनस" के साथ डीबी में इंगित किया गया है। उपरोक्त सभी चीजें आयाम ("चोटियों और घाटियों") में कटऑफ के साथ एक विकृत संकेत है। और वे इसे dB में "प्लस" से दर्शाते हैं।
एनालॉग और डिजिटल दोनों उपकरणों पर वॉल्यूम स्तर को "नकारात्मक" डेसिबल में प्रदर्शित करने की प्रथा है। यह सुविधाजनक और दर्शनीय है.
डिजिटल में वॉल्यूम का क्या होता है?
हमारे साउंड कार्ड में, एनालॉग सिग्नल को पहले प्रीएम्प्लीफायर द्वारा थोड़ा बढ़ाया जाता है और फिर एनालॉग-टू-डिजिटल कनवर्टर (एडीसी) के माध्यम से पारित किया जाता है। सरल बनाने के लिए, ADC यही करता है:
-
- यह फ़्रीक्वेंसी बैंड को काट देता है, अनावश्यक चीज़ों को हटा देता है, उदाहरण के लिए, 20 हर्ट्ज़ से नीचे की ध्वनि, जिसे कोई व्यक्ति अभी भी नहीं सुन सकता है;
- एडीसी एक निरंतर सिग्नल को एक निश्चित संख्या में व्यक्तिगत मूल्यों (नमूनाकरण और परिमाणीकरण) में विभाजित करता है, यानी, यह वास्तव में हमारी चिकनी साइन लहर को "कॉलम" के अनुक्रम में बदल देता है।
नमूनाकरण आवृत्ति ऐसे "स्तंभों" की संख्या निर्धारित करती है। परिमाणीकरण बिट गहराई, या "बिट गहराई", प्रत्येक "कॉलम" प्रतिनिधित्व की सटीकता निर्धारित करती है।
नमूनाकरण दर (अधिक बार) जितनी अधिक होगी, डिजिटल सिग्नल मूल चिकनी साइन तरंग के उतना ही करीब होगा।
बिट गहराई एक निश्चित समय पर सिग्नल माप की सटीकता को प्रभावित करती है। जितने अधिक बिट, त्रुटि उतनी ही छोटी। ऑडियो के लिए 16 बिट ख़राब नहीं है, 24 बिट और भी बेहतर है।
- एडीसी प्रत्येक "कॉलम" को एनकोड या "डिजिटाइज़" करता है, इसे एक सीरियल नंबर के साथ एक विशिष्ट संख्या के रूप में दर्शाता है।
हमारे डिजिटल ऑडियो स्टेशनों में, भौतिक ध्वनि, पहले एक एनालॉग सिग्नल में परिवर्तित होती है और फिर एडीसी का उपयोग करके डिजिटल सिग्नल में, गणितीय अमूर्तता का एक सेट बन जाती है। यह समझना महत्वपूर्ण है कि ध्वनि केवल गणित है। तारों या सॉफ़्टवेयर में कोई वास्तविक "ध्वनि" नहीं है।
डिजिटल ऑडियो स्टेशन में "शून्य" वॉल्यूम स्तर, जिसके आगे विकृति शुरू होती है, भी सशर्त है। 24-बिट एडीसी गहराई के लिए, "डिजिटल शून्य" केवल 24 बाइनरी "सेल" है, प्रत्येक में मान "1" होता है।
चूँकि 25वीं और उसके बाद की सभी कोशिकाएँ गायब हैं, "शून्य" से अधिक का सिग्नल आसानी से मात्रा में वृद्धि नहीं कर सकता है। बल्कि उसमें और अधिक विकृति जुड़ती जाती है।
डिजिटल ऑडियो स्टेशनों में वॉल्यूम स्तरों के साथ काम करते समय, विरूपण से बचना महत्वपूर्ण है। क्योंकि हमारे ऑडियो स्टेशन की मास्टर बसों से एकत्रित डिजिटल सिग्नल डिजिटल-टू-एनालॉग कनवर्टर (डीएसी) को भेजा जाता है, जो इसे ऑडियो मॉनिटर या हेडफ़ोन पर आउटपुट करता है। यहां हमें विकृति (क्लिपिंग) सुनाई देती है, जो ऑडियो ट्रैक के क्षतिग्रस्त होने का संकेत देती है। कभी-कभी विरूपण सुखद हो सकता है, जैसे कि मामूली टेप (टेप) विरूपण जोड़ते समय, जिसे ध्वनि इंजीनियर उद्देश्यपूर्ण ढंग से उपयोग कर सकते हैं।
अपने DAW में वॉल्यूम लेवल को कैसे संभालें
पश्चिम और पूर्व दोनों में विश्व लेबल, जिनके कर्मचारियों में ध्वनि इंजीनियर होते हैं या उनके साथ अनुबंध में प्रवेश करते हैं, आम तौर पर संगीतकारों से मिश्रण और उपज का अनुरोध करते हैं, जो चरम स्तर पर -6 डीबी से अधिक के वॉल्यूम स्तर में महारत हासिल किए बिना होते हैं। आगे की प्रक्रिया के लिए "वॉल्यूम हेडरूम" रखने के लिए उन्हें इसकी आवश्यकता है।
यह समझना महत्वपूर्ण है कि हम चोटियों के बारे में बात कर रहे हैं, न कि साउंडट्रैक के औसत ध्वनि दबाव स्तर के बारे में, जिसे आरएमएस या एलयूएफ (औपचारिक औसत ध्वनि को अनुमानित तीव्रता के साथ मिलाकर) में मापा जाता है।
तर्क और अनुभव यह निर्देश देते हैं कि साउंड कार्ड के माध्यम से आवाजें, लाइव उपकरण और सिंथ रिकॉर्ड करते समय, हम इनपुट पर लाभ के स्तर को नियंत्रित कर सकते हैं और DAW के अंदर -dB स्तर देख सकते हैं।
यह सुनिश्चित करने का प्रयास करें कि इनपुट पर रिकॉर्ड किए गए सिग्नल की चोटियां -6, -5 डीबी से अधिक न हों, स्वीकार्य है, और "आय" को 0 डीबी तक पहुंचने की अनुमति न दें।
अपने DAW के अंदर वर्चुअल सिंथ और सैंपल किए गए उपकरणों का उपयोग करके, आप थोड़ा मुक्त महसूस कर सकते हैं। हालाँकि, यह आवश्यक है कि वर्चुअल उपकरणों और प्रोसेसिंग प्लग-इन के आउटपुट पर वॉल्यूम में हमेशा "हेडरूम" हो।
किसी प्रोजेक्ट में व्यवस्था शुरू करते समय, सभी ट्रैक के लिए DAW कंसोल फ़ेडर्स को तुरंत -10, या अधिमानतः -12 dB पर सेट करने की अनुशंसा की जाती है। इससे वॉल्यूम रिजर्व तैयार हो जाएगा.
यह याद रखना महत्वपूर्ण है कि साउंडट्रैक में आमतौर पर नाटक होता है। संगीतमय कार्यक्रम विकसित होते हैं, जो चरमोत्कर्ष की ओर ले जाते हैं। और जब एक ही समय में कई उपकरण फ़ोरटे में प्रवेश करते हैं, तो मास्टर बस पर कुल सिग्नल स्तर आवश्यक रूप से किसी विशेष ट्रैक के सिग्नल स्तर से अधिक हो जाएगा। इसलिए, अंतिम प्रसंस्करण (मास्टरिंग) के लिए लेबल को एक फ़ाइल प्रदान करनी चाहिए जिसमें चोटियाँ -6 डीबी से अधिक न हों।
बाद में प्रत्येक ट्रैक के स्तर को कम करने में समय बर्बाद करने की तुलना में व्यवस्था और पूर्व-मिश्रण के दौरान मास्टर बस पर इस स्तर से अधिक होने से बचना बेहतर है। आपको वॉल्यूम ऑटोमेशन की संभावना के बारे में भी पता होना चाहिए, जिससे अतिरिक्त समस्याएं हो सकती हैं। यह सलाह दी जाती है कि प्रारंभिक मिश्रण में वही चित्र प्राप्त करें जो मूल रूप से अभिप्रेत था।
यह डर कि मिश्रण "शांत" लगेगा, अक्सर निराधार होते हैं। DAW में ध्वनि वास्तव में कभी भी "शांत" नहीं होती - यह सिर्फ एक गणितीय अमूर्तता है। एक लेबल इंजीनियर को -8 या यहां तक कि -10 डीबी शिखर के साथ तने या सूखा मिश्रण दिया जाएगा, वह निराश नहीं होगा। वह सभी आवश्यक समायोजन स्वयं करेगा।
आपके DAW में वॉल्यूम स्तरों के साथ काम करते समय, कुछ नियमों का पालन करना होगा जो आपको अधिकांश समस्याओं से बचने में मदद करेंगे।