شاید بیاهمیت به نظر برسد، اما برای ضبط موزیک، ساخت پادکست یا مرتبکردن کالکشن موزیک خود باید یاد بگیرید که محتوای فایلهای صوتی چیست و چگونه میتوان سایز آنها را کاهش داد.
ما در این مقاله به بررسی عوامل مختلفی که بر کیفیت صدا و سایز فایل صوتی تاثیر میگذارند، میپردازیم. بدست آوردن یک تعادل کامل بین این دو عامل اصلا آسان نیست، اما باید آن را یاد بگیرید تا بهترین نتیجه را برای فایلهای صوتی خود اعمال کنید.
1. سمپل ریت (Sample Rate)
در جهان فیزیکی، صدا یک موج شناخته میشود. وقتی کسی صحبت میکند یا دستش را بهم میکوبد، تغییر فشاری است که در هوا حرکت کرده و در نهایت به پرده گوش شما برخورد میکند.
اما این موج را چگونه میتوان ضبط و آن را به فایل دیجیتال تبدیل میکنند؟ ما موج کامل صدا را نمیتوانیم همانطور که هست ضبط کنیم و به جای آن باید به مرور زمان از صدا عکسهای فوری (snapshots) بگیریم. وقتی همه این عکسها را به ترتیب پخش کنید، بازآفرینی تقریبی از صدای اصلی را دریافت خواهید کرد.
هر عکس از صدا، سمپل نام دارد و فاصله زمانی بین هر عکس را سمپل ریت میگویند. به طور کلی، سمپل ریت، به تعداد عکسهای دیجیتالی است که در هر ثانیه از یک فایل صوتی توسط مبدل آنالوگ به دیجیتال گرفته میشود. سمپل ریت بر حسب هرتز اندازهگیری میشود و میتوان آن را به صورت فرکانس بیان کرد.
هرچه فاصله کمتر باشد، فرکانس بیشتر است. فرکانسهای بیشتر، فایل صوتی باکیفیتتری تولید میکنند، اما برای ذخیره هر ثانیه فایل صوتی به دادههای بیشتری نیز نیاز است.
به عنوان مثال، صدای با کیفیت CD از فرکانس سمپل 44.1 کیلوهرتز (یا 44100 سمپل در ثانیه) استفاده میکند، در حالی که صدای با کیفیت تلویزیون و DVD از فرکانس نمونه 48 کیلوهرتز استفاده میکند. به عنوان مثال، 10 دقیقه فایل صوتی فشرده نشده مونو با کیفیت اول ممکن است 51.7 مگابایت باشد در حالی که با کیفیت دومی 56.3 مگابایت است.
برای فایل صوتی یک سخنرانی میتوانید فرکانس را تا 32 کیلوهرتز کاهش دهید تا کیفیت آن را از دست ندهید، اما در صورت اضافه شدن موزیک به فایل یا نیاز کیفیت، باید به 44.1 کیلوهرتز بسنده کنید. کاهش فرکانس به 22.05 کیلوهرتز، کیفیت را به رادیو با موج AM نزدیکتر میکند.
2. بیتریت (Bitrate)
بیتریت شباهتی با سمپل ریت ندارد. بسیاری از افراد میگویند که این دو یک معنی میدهند، اما اصلا اینطور نیست. اگر سمپل ریت تعداد دفعات عکسها از موج صدا باشد، پس بیتریت میزان اطلاعاتی است که در طول هر عکس ضبط میشود.
برای مثال، یک موج صوتی را به عنوان یک جریان آب تصور کرده و سعی کنید آب را در یک سطل آب نگه دارید (یا ضبط کنید). سمپل ریت، تعداد دفعاتی است که سطل خود را در جریان آب فرو میبرید و بیتریت اندازه سطل شما خواهد بود. اندازه گیری عمق بیت، بر حسب بیتس (bits) خواهد بود. به ازای افزایش هر یک بیت، دقت (کیفیت) ضبط دو برابر خواهد شد.
هر چه عمق بیت بیشتر باشد، اطلاعات بیشتری در هر سمپل ریت گرفته شده و باعث ایجاد ضبط دقیقتر صدا خواهد شد.
اما اگر عمق بیت را بیش از حد کاهش دهید، اطلاعات صوتی از بین میروند. سیدیهای صوتی از 16 بیت در هر سمپل استفاده میکنند، در حالی که دیسکهای DVD و Blu-ray از 24 بیت برای هر سمپل استفاده میکنند.
بیتریت به معنی این است که چه مقدار دیتا واقعی از صدا پردازش شده است (بر حسب کیلوبیت در ثانیه). برای بدست آوردن بیتریت، سمپل ریت را در عمق بیت ضرب میکنند. یک فایل صوتی CD با سمپل ریت 44.1 کیلوهرتز و عمق 16 بیتی، دارای بیتریت فشرده نشده 44100 × 16، یعنی 705.6 کیلوبیت بر ثانیه است.
برای اینکه تفاوت سایز فایل را کاملا درک کنید، اجازه دهید یک آهنگ فشرده پنج دقیقهای ضبط شده در یک استریو دو کاناله را در نظر بگیریم.
44.1 کیلوهرتز/16 بیت: 44100 × 16 × 2 = 1411200 بیت در ثانیه (1.4 مگابیت بر ثانیه)
192 کیلوهرتز/24 بیت: 192000 × 24 × 2 = 9216000 بیت در ثانیه (9.2 مگابیت در ثانیه)
با استفاده از بیتریت محاسبه شده، آن را در تعداد ثانیه فایل صوتی ضرب کنید
1.4 × 300 = 420 Mb یا 52.5 مگابایت
9.2 × 300 = 2760 Mb یا 345 مگابایت
بنابراین، فایل صوتی ضبط شده در 192 کیلوهرتز/24 بیت، شش برابر فضای بیشتری را اشغال میکند، اما همه اینها به چیزی که ضبط میکنید بستگی دارد.
گاهی اوقات (مثل وقتی که سکوت را ضبط میکنید)، بیتریت کامل در یک عکس (snapshot) نیاز نیست. در این صورت، میتوانید از بیتریت متغیر (VBR) که با MP3، OGG، AAC و WMA ساپورت میشود، استفاده کنید. در گذشته، فرمت VBR به طور گسترده ساپورت نمیشد، اما امروزه چنین نیست.
3. استریو و مونو
این نکته بسیار ساده بوده و میتوان به اختصار آن را بیان کرد. مونو (Mono) به معنای یک کانال و استریو (Stereo) به معنای دو کانال است. دو کانال موجود در یک فایل صوتی استریو را میتوان به عنوان کانال چپ و راست نام برد.
با یک بلندگو هدفون، میتوانید یکی از کانالهای استریو را گوش دهید و دیگر کانال استریو را در گوش خود میشنوید. هنگام گوش دادن به یک فایل صوتی مونو، فقط یک کانال را در هر دو گوش خواهید شنید.
فایل های صوتی استریو در اصل دو فایل صوتی مونو در یک فایل هستند. با فرض یکسان بودن سمپل ریت، بیتریت، صدا و غیره، سایز یک فایل صوتی استریو همیشه دو برابر یک فایل صوتی مونو خواهد بود. پس سادهترین روش برای کاهش سایز یک فایل صوتی، تبدیل آن از استریو به مونو است.
برای ضبط صدای یک فرد، همیشه مونو ترجیح داده میشود، چون صدا را قدرتمند و واضحتر میکند. اما اگر میخواهید صدای دو یا چند خواننده را در یک اتاق ضبط کنید، باید صدا را استریو ضبط کنید.
ضبط پادکست نیز میتواند مونو باشد. اما در ضبطهای موزیک، استریو باعث میشود بسیاری از موزیکها سه بعدی به نظر برسند؛ گویی موزیک در اطراف شما پخش میشود.
4. فشردهسازی
اگر با فایلهای WAV کار میکنید، تنها راه برای کاهش حجم فایل، انجام یکی از تنظیمات بالا (سمپل ریت، بیتریت یا تعداد کانالها) است. اما اگر از فرمت دیگری استفاده میکنید، فشردهسازی بزرگترین عامل در اندازه فایل صوتی است. دو نوع فشردهسازی وجود دارد:
فشردهسازی بااتلاف، دادههای غیر ضروری را از صدا حذف میکند، مانند صداهایی که فراتر از محدوده شنوایی اکثر افراد است. پس از فشردهسازی، این دادههای حذف شده قابل بازیابی نیستند.
فشردهسازی بیاتلاف یک فایل صوتی را با استفاده از الگوریتمهای ریاضی تا حد امکان حجم آن را کاهش میدهد، اما باید در زمان پخش از حالت فشرده خارج شود. در این نوع از فشردهسازی، هیچ دادهای از فایل صوتی از بین نخواهد رفت.
نوع حالت فشردهسازی که استفاده میکنید بستگی به استفاده فایل صوتی دارد. اگر میخواهید یک کپی کامل از فایل صوتی را ذخیره کنید، باید فشرده سازی بیاتلاف را انتخاب کنید و اگر فقط یک کپی بیکیفیت برای شما کافی است، فشردهسازی بااتلاف را انتخاب کنید.
به عنوان مثال، ممکن است بخواهید محتویات سیدیهای قدیمی خود را به عنوان فایل FLAC ذخیره کنید و یا از فایل MP3 برای ذخیره آنها در گوشی بهرهمند شوید.
5. فرمت فایل
وقتی فشردهسازی بااتلاف را برای فایل صوتی مورد نظر انجام دادید، باید تصمیم بگیرید که کدام فرمت فایل برای شما مناسب است. در حال حاضر، سه فرمت MP3، OGG و AAC بسیار محبوب و کارآمد هستند.
فرمت MP3 محبوبترین بین فرمتهاست و دلیل آن این است که قدیمیتر از دو فرمت بالایی میباشد. فرمت AAC از نظر فنی بهتر از MP3 است اما استفاده از آن به MP3 نمیرسد. فرمت OGG نیز خوب است، اما دستگاههای زیادی آن را ساپورت نمیکنند، پس بهتر است از فرمتهای MP3 یا AAC استفاده کنید.
پس از انتخاب فرمت، فایل صوتی شما بدون توجه به نوع آن، به بیتریت مشخصی فشرده میشود. اگر فرض کنیم که شما از فرمت MP3 استفاده میکنید، پنج بیتریت رایج در حال حاضر وجود دارد:
64 کیلوبیت بر ثانیه که با کیفیت رادیویی AM یکسان است. این بیتریت برای پادکستهایی که مکالمهها را پخش میکنند انتخاب عالی بوده چون صداها به پیچیدگی موزیک نیستند.
96 کیلوبیت بر ثانیه که با کیفیت رادیو FM یکسان است. کیفیت موزیک را خوب پخش میکند، اما متوجه کامل نبودن کیفیت خواهید شد که دلیل آن حذف شدن فرکانسهای خاص از فایل صوتی است.
128 کیلوبیت بر ثانیه که کیفیت صدای سیدی است. این کیفیت اندازه استاندارد است. موزیک برای اکثر مردم با این میزان کیفیت “به اندازه کافی خوب” به نظر میرسد.
256 کیلوبیت بر ثانیه کیفیت صوتی بالایی دارد. ممکن است متوجه صداها و سازهای خاصی در فایلهای صوتی شوید که با نرخ بیت پایینتر قابل تشخیص نیستند.
320 کیلوبیت بر ثانیه بهترین کیفیت صدا است. شما میتوانید کیفیت بالاتر را تجربه کنید، اما احتمالا نمیتوانید تفاوتی را تشخیص دهید.
از نظر کاهش سایز فایل، MP3 فشرده شده تا 128 کیلوبیت بر ثانیه تقریبا 90 درصد از دادههای صدای اصلی را از دست میدهد، در حالی که MP3 فشرده شده تا 320 کیلوبیت بر ثانیه تنها حدود 60 درصد از دادهها را از دست خواهد داد.
اگر فایل MP3 و AAC هر دو با بیتریت یکسان فشرده شده باشند، فایل AAC اغلب کیفیت صدای بهتری خواهد داشت چون از روش فشردهسازی پیشرفتهتری استفاده میکند. این بدان معناست که شما میتوانید با فرمت AAC کیفیت بیشتری را در هر مگابایت نسبت به MP3 دریافت کنید.
سایز فایلهای صوتی را کمتر کنید
درک این پنج عامل به شما کمک میکند بهترین روش را برای ضبط و فشردهسازی موزیک و یا پادکستهایی که ساختید را انتخاب کنید. این مقاله به شما کمک میکند تا در انتخاب فرمتهای موزیکی که دانلود میکنید مطمئن باشید.