5 روش برای کاهش سایز فایل‌های صوتی

توسط رامین جعفری
8 minutes read
5 روش برای کاهش سایز فایل‌های صوتی

شاید بی‌اهمیت به نظر برسد، اما برای ضبط موزیک، ساخت پادکست یا مرتب‌کردن کالکشن موزیک خود باید یاد بگیرید که محتوای فایل‌های صوتی چیست و چگونه می‌توان سایز آن‌ها را کاهش داد.

ما در این مقاله به بررسی عوامل مختلفی که بر کیفیت صدا و سایز فایل صوتی تاثیر می‌گذارند، می‌پردازیم. بدست آوردن یک تعادل کامل بین این دو عامل اصلا آسان نیست، اما باید آن را یاد بگیرید تا بهترین نتیجه را برای فایل‌های صوتی خود اعمال کنید.

1. سمپل ریت (Sample Rate)

در جهان فیزیکی، صدا یک موج شناخته می‌شود. وقتی کسی صحبت می‌کند یا دستش را بهم می‌کوبد، تغییر فشاری است که در هوا حرکت کرده و در نهایت به پرده گوش شما برخورد می‌کند.

اما این موج را چگونه می‌توان ضبط و آن را به فایل دیجیتال تبدیل می‌کنند؟ ما موج کامل صدا را نمی‌توانیم همانطور که هست ضبط کنیم و به جای آن باید به مرور زمان از صدا عکس‌های فوری (snapshots) بگیریم. وقتی همه این عکس‌ها را به ترتیب پخش کنید، بازآفرینی تقریبی از صدای اصلی را دریافت خواهید کرد.

audio file size sample rate.png?q=50&fit=crop&w=750&dpr=1

هر عکس از صدا، سمپل نام دارد و فاصله زمانی بین هر عکس را سمپل ریت می‌گویند. به طور کلی، سمپل ریت، به تعداد عکس‌های دیجیتالی است که در هر ثانیه از یک فایل صوتی توسط مبدل آنالوگ به دیجیتال گرفته می‌شود. سمپل ریت بر حسب هرتز اندازه‌گیری می‌شود و می‌توان آن را به صورت فرکانس بیان کرد.

هرچه فاصله کمتر باشد، فرکانس بیشتر است. فرکانس‌های بیشتر، فایل صوتی باکیفیت‌تری تولید می‌کنند، اما برای ذخیره هر ثانیه فایل صوتی به داده‌های بیشتری نیز نیاز است.

به عنوان مثال، صدای با کیفیت CD از فرکانس سمپل 44.1 کیلوهرتز (یا 44100 سمپل در ثانیه) استفاده می‌کند، در حالی که صدای با کیفیت تلویزیون و DVD از فرکانس نمونه 48 کیلوهرتز استفاده می‌کند. به عنوان مثال، 10 دقیقه فایل صوتی فشرده نشده مونو با کیفیت اول ممکن است 51.7 مگابایت باشد در حالی که با کیفیت دومی 56.3 مگابایت است.

برای فایل صوتی یک سخنرانی می‌توانید فرکانس را تا 32 کیلوهرتز کاهش دهید تا کیفیت آن را از دست ندهید، اما در صورت اضافه شدن موزیک به فایل یا نیاز کیفیت، باید به 44.1 کیلوهرتز بسنده کنید. کاهش فرکانس به 22.05 کیلوهرتز، کیفیت را به رادیو با موج AM نزدیک‌تر می‌کند.

2. بیتریت (Bitrate)

بیتریت شباهتی با سمپل ریت ندارد. بسیاری از افراد می‌گویند که این دو یک معنی می‌دهند، اما اصلا اینطور نیست. اگر سمپل ریت تعداد دفعات عکس‌ها از موج صدا باشد، پس بیتریت میزان اطلاعاتی است که در طول هر عکس ضبط می‌شود.

برای مثال، یک موج صوتی را به عنوان یک جریان آب تصور کرده و سعی کنید آب را در یک سطل آب نگه دارید (یا ضبط کنید). سمپل ریت، تعداد دفعاتی است که سطل خود را در جریان آب فرو می‌برید و بیتریت اندازه سطل شما خواهد بود. اندازه گیری عمق بیت، بر حسب بیتس (bits) خواهد بود. به ازای افزایش هر یک بیت، دقت (کیفیت) ضبط دو برابر خواهد شد.

audio file size bit depth.png?q=50&fit=crop&w=750&dpr=1

هر چه عمق بیت بیشتر باشد، اطلاعات بیشتری در هر سمپل ریت گرفته شده و باعث ایجاد ضبط دقیق‌تر صدا خواهد شد.

اما اگر عمق بیت را بیش از حد کاهش دهید، اطلاعات صوتی از بین می‌روند. سی‌دی‌های صوتی از 16 بیت در هر سمپل استفاده می‌کنند، در حالی که دیسک‌های DVD و Blu-ray از 24 بیت برای هر سمپل استفاده‌ می‌کنند.

بیتریت به معنی این است که چه مقدار دیتا واقعی از صدا پردازش شده است (بر حسب کیلوبیت در ثانیه). برای بدست آوردن بیتریت، سمپل ریت را در عمق بیت ضرب می‌کنند. یک فایل صوتی CD با سمپل ریت 44.1 کیلوهرتز و عمق 16 بیتی، دارای بیتریت فشرده نشده 44100 × 16، یعنی 705.6 کیلوبیت بر ثانیه است.

برای اینکه تفاوت سایز فایل را کاملا درک کنید، اجازه دهید یک آهنگ فشرده پنج دقیقه‌ای ضبط شده در یک استریو دو کاناله را در نظر بگیریم.

44.1 کیلوهرتز/16 بیت: 44100 × 16 × 2 = 1411200 بیت در ثانیه (1.4 مگابیت بر ثانیه)

192 کیلوهرتز/24 بیت: 192000 × 24 × 2 = 9216000 بیت در ثانیه (9.2 مگابیت در ثانیه)

با استفاده از بیتریت محاسبه شده، آن را در تعداد ثانیه فایل صوتی ضرب کنید

1.4 × 300 = 420 Mb یا 52.5 مگابایت

9.2 × 300 = 2760 Mb یا 345 مگابایت

بنابراین، فایل صوتی ضبط شده در 192 کیلوهرتز/24 بیت، شش برابر فضای بیشتری را اشغال می‌کند، اما همه این‌ها به چیزی که ضبط می‌کنید بستگی دارد.

گاهی اوقات (مثل وقتی که سکوت را ضبط می‌کنید)، بیتریت کامل در یک عکس (snapshot) نیاز نیست. در این صورت، می‌توانید از بیتریت متغیر (VBR) که با MP3، OGG، AAC و WMA ساپورت می‌شود، استفاده کنید. در گذشته، فرمت VBR به طور گسترده ساپورت نمی‌شد، اما امروزه چنین نیست.

3. استریو و مونو

این نکته بسیار ساده بوده و می‌توان به اختصار آن را بیان کرد. مونو (Mono) به معنای یک کانال و استریو (Stereo) به معنای دو کانال است. دو کانال موجود در یک فایل صوتی استریو را می‌توان به عنوان کانال چپ و راست نام برد.

با یک بلندگو هدفون، می‌توانید یکی از کانال‌های استریو را گوش دهید و دیگر کانال استریو را در گوش خود می‌شنوید. هنگام گوش دادن به یک فایل صوتی مونو، فقط یک کانال را در هر دو گوش خواهید شنید.

audacity split channels stereo.jpg?q=50&fit=crop&w=750&dpr=1

فایل های صوتی استریو در اصل دو فایل صوتی مونو در یک فایل هستند. با فرض یکسان بودن سمپل ریت، بیتریت، صدا و غیره، سایز یک فایل صوتی استریو همیشه دو برابر یک فایل صوتی مونو خواهد بود. پس ساده‌ترین روش برای کاهش سایز یک فایل صوتی، تبدیل آن از استریو به مونو است.

برای ضبط‌ صدای یک فرد، همیشه مونو ترجیح داده می‌شود، چون صدا را قدرتمند و واضح‌تر می‌کند. اما اگر می‌خواهید صدای دو یا چند خواننده را در یک اتاق ضبط کنید، باید صدا را استریو ضبط کنید.

ضبط پادکست نیز می‌تواند مونو باشد. اما در ضبط‌های موزیک، استریو باعث می‌شود بسیاری از موزیک‌‌ها سه بعدی‌ به نظر برسند؛ گویی موزیک در اطراف شما پخش می‌شود.

4. فشرده‌سازی

اگر با فایل‌های WAV کار می‌کنید، تنها راه برای کاهش حجم فایل، انجام یکی از تنظیمات بالا (سمپل ریت، بیتریت یا تعداد کانال‌ها) است. اما اگر از فرمت دیگری استفاده می‌کنید، فشرده‌سازی بزرگترین عامل در اندازه فایل صوتی است. دو نوع فشرده‌سازی وجود دارد:

فشرده‌سازی با‌اتلاف، داده‌های غیر ضروری را از صدا حذف می‌کند، مانند صداهایی که فراتر از محدوده شنوایی اکثر افراد است. پس از فشرده‌سازی، این داده‌های حذف شده قابل بازیابی نیستند.

فشرده‌سازی بی‌اتلاف یک فایل صوتی را با استفاده از الگوریتم‌های ریاضی تا حد امکان حجم آن را کاهش می‌دهد، اما باید در زمان پخش از حالت فشرده خارج شود. در این نوع از فشرده‌سازی، هیچ داده‌ای از فایل صوتی از بین نخواهد رفت.

نوع حالت فشرده‌سازی که استفاده می‌کنید بستگی به استفاده فایل صوتی دارد. اگر می‌خواهید یک کپی کامل از فایل صوتی را ذخیره کنید، باید فشرده سازی بی‌اتلاف را انتخاب کنید و اگر فقط یک کپی بی‌کیفیت برای شما کافی است، فشرده‌سازی بااتلاف را انتخاب کنید.

به عنوان مثال، ممکن است بخواهید محتویات سی‌دی‌های قدیمی خود را به عنوان فایل FLAC ذخیره کنید و یا از فایل MP3 برای ذخیره آن‌ها در گوشی بهره‌مند شوید.

5. فرمت فایل

وقتی فشرده‌سازی بااتلاف را برای فایل صوتی مورد نظر انجام دادید، باید تصمیم بگیرید که کدام فرمت فایل برای شما مناسب است. در حال حاضر، سه فرمت MP3، OGG و AAC بسیار محبوب و کارآمد هستند.

فرمت MP3 محبوب‌ترین بین فرمت‌هاست و دلیل آن این است که قدیمی‌تر از دو فرمت بالایی می‌باشد. فرمت AAC از نظر فنی بهتر از MP3 است اما استفاده از آن به MP3 نمی‌رسد. فرمت OGG نیز خوب است، اما دستگاه‌های زیادی آن را ساپورت نمی‌کنند، پس بهتر است از فرمت‌های MP3 یا AAC استفاده کنید.

پس از انتخاب فرمت، فایل صوتی شما بدون توجه به نوع آن، به بیتریت مشخصی فشرده می‌شود. اگر فرض کنیم که شما از فرمت MP3 استفاده می‌کنید، پنج بیتریت رایج در حال حاضر وجود دارد:

64 کیلوبیت بر ثانیه که با کیفیت رادیویی AM یکسان است. این بیتریت برای پادکست‌هایی که مکالمه‌ها را پخش می‌کنند انتخاب عالی بوده چون صداها به پیچیدگی موزیک نیستند.

96 کیلوبیت بر ثانیه که با کیفیت رادیو FM یکسان است. کیفیت موزیک را خوب پخش می‌کند، اما متوجه کامل نبودن کیفیت خواهید شد که دلیل آن حذف‌ شدن فرکانس‌های خاص از فایل صوتی است.

128 کیلوبیت بر ثانیه که کیفیت صدای سی‌دی است. این کیفیت اندازه استاندارد است. موزیک برای اکثر مردم با این میزان کیفیت “به اندازه کافی خوب” به نظر می‌رسد.

256 کیلوبیت بر ثانیه کیفیت صوتی بالایی دارد. ممکن است متوجه صداها و سازهای خاصی در فایل‌های صوتی شوید که با نرخ بیت پایین‌تر قابل تشخیص نیستند.

320 کیلوبیت بر ثانیه بهترین کیفیت صدا است. شما می‌توانید کیفیت بالاتر را تجربه کنید، اما احتمالا نمی‌توانید تفاوتی را تشخیص دهید.

از نظر کاهش سایز فایل، MP3 فشرده شده تا 128 کیلوبیت بر ثانیه تقریبا 90 درصد از داده‌های صدای اصلی را از دست می‌دهد، در حالی که MP3 فشرده شده تا 320 کیلوبیت بر ثانیه تنها حدود 60 درصد از داده‌ها را از دست خواهد داد.

اگر فایل MP3 و AAC هر دو با بیتریت یکسان فشرده شده باشند، فایل AAC اغلب کیفیت صدای بهتری خواهد داشت چون از روش فشرده‌سازی پیشرفته‌تری استفاده می‌کند. این بدان معناست که شما می‌توانید با فرمت AAC کیفیت بیشتری را در هر مگابایت نسبت به MP3 دریافت کنید.

سایز فایل‌های صوتی را کمتر کنید

درک این پنج عامل به شما کمک می‌کند بهترین روش را برای ضبط و فشرده‌سازی موزیک و یا پادکست‌هایی که ساختید را انتخاب کنید. این مقاله به شما کمک می‌کند تا در انتخاب فرمت‌های موزیکی که دانلود می‌کنید مطمئن باشید.

مطالب مرتبط

دیدگاه شما چیست؟