۵ روش برای کاهش سایز فایل‌های صوتی

by رامین جعفری
5 روش برای کاهش سایز فایل‌های صوتی

شاید بی‌اهمیت به نظر برسد، اما برای ضبط موزیک، ساخت پادکست یا مرتب‌کردن کالکشن موزیک خود باید یاد بگیرید که محتوای فایل‌های صوتی چیست و چگونه می‌توان سایز آن‌ها را کاهش داد.

ما در این مقاله به بررسی عوامل مختلفی که بر کیفیت صدا و سایز فایل صوتی تاثیر می‌گذارند، می‌پردازیم. بدست آوردن یک تعادل کامل بین این دو عامل اصلا آسان نیست، اما باید آن را یاد بگیرید تا بهترین نتیجه را برای فایل‌های صوتی خود اعمال کنید.

۱. سمپل ریت (Sample Rate)

در جهان فیزیکی، صدا یک موج شناخته می‌شود. وقتی کسی صحبت می‌کند یا دستش را بهم می‌کوبد، تغییر فشاری است که در هوا حرکت کرده و در نهایت به پرده گوش شما برخورد می‌کند.

اما این موج را چگونه می‌توان ضبط و آن را به فایل دیجیتال تبدیل می‌کنند؟ ما موج کامل صدا را نمی‌توانیم همانطور که هست ضبط کنیم و به جای آن باید به مرور زمان از صدا عکس‌های فوری (snapshots) بگیریم. وقتی همه این عکس‌ها را به ترتیب پخش کنید، بازآفرینی تقریبی از صدای اصلی را دریافت خواهید کرد.

audio file size sample rate.png?q=50&fit=crop&w=750&dpr=1

هر عکس از صدا، سمپل نام دارد و فاصله زمانی بین هر عکس را سمپل ریت می‌گویند. به طور کلی، سمپل ریت، به تعداد عکس‌های دیجیتالی است که در هر ثانیه از یک فایل صوتی توسط مبدل آنالوگ به دیجیتال گرفته می‌شود. سمپل ریت بر حسب هرتز اندازه‌گیری می‌شود و می‌توان آن را به صورت فرکانس بیان کرد.

هرچه فاصله کمتر باشد، فرکانس بیشتر است. فرکانس‌های بیشتر، فایل صوتی باکیفیت‌تری تولید می‌کنند، اما برای ذخیره هر ثانیه فایل صوتی به داده‌های بیشتری نیز نیاز است.

به عنوان مثال، صدای با کیفیت CD از فرکانس سمپل ۴۴.۱ کیلوهرتز (یا ۴۴۱۰۰ سمپل در ثانیه) استفاده می‌کند، در حالی که صدای با کیفیت تلویزیون و DVD از فرکانس نمونه ۴۸ کیلوهرتز استفاده می‌کند. به عنوان مثال، ۱۰ دقیقه فایل صوتی فشرده نشده مونو با کیفیت اول ممکن است ۵۱.۷ مگابایت باشد در حالی که با کیفیت دومی ۵۶.۳ مگابایت است.

برای فایل صوتی یک سخنرانی می‌توانید فرکانس را تا ۳۲ کیلوهرتز کاهش دهید تا کیفیت آن را از دست ندهید، اما در صورت اضافه شدن موزیک به فایل یا نیاز کیفیت، باید به ۴۴.۱ کیلوهرتز بسنده کنید. کاهش فرکانس به ۲۲.۰۵ کیلوهرتز، کیفیت را به رادیو با موج AM نزدیک‌تر می‌کند.

۲. بیتریت (Bitrate)

بیتریت شباهتی با سمپل ریت ندارد. بسیاری از افراد می‌گویند که این دو یک معنی می‌دهند، اما اصلا اینطور نیست. اگر سمپل ریت تعداد دفعات عکس‌ها از موج صدا باشد، پس بیتریت میزان اطلاعاتی است که در طول هر عکس ضبط می‌شود.

برای مثال، یک موج صوتی را به عنوان یک جریان آب تصور کرده و سعی کنید آب را در یک سطل آب نگه دارید (یا ضبط کنید). سمپل ریت، تعداد دفعاتی است که سطل خود را در جریان آب فرو می‌برید و بیتریت اندازه سطل شما خواهد بود. اندازه گیری عمق بیت، بر حسب بیتس (bits) خواهد بود. به ازای افزایش هر یک بیت، دقت (کیفیت) ضبط دو برابر خواهد شد.

audio file size bit depth.png?q=50&fit=crop&w=750&dpr=1

هر چه عمق بیت بیشتر باشد، اطلاعات بیشتری در هر سمپل ریت گرفته شده و باعث ایجاد ضبط دقیق‌تر صدا خواهد شد.

اما اگر عمق بیت را بیش از حد کاهش دهید، اطلاعات صوتی از بین می‌روند. سی‌دی‌های صوتی از ۱۶ بیت در هر سمپل استفاده می‌کنند، در حالی که دیسک‌های DVD و Blu-ray از ۲۴ بیت برای هر سمپل استفاده‌ می‌کنند.

بیتریت به معنی این است که چه مقدار دیتا واقعی از صدا پردازش شده است (بر حسب کیلوبیت در ثانیه). برای بدست آوردن بیتریت، سمپل ریت را در عمق بیت ضرب می‌کنند. یک فایل صوتی CD با سمپل ریت ۴۴.۱ کیلوهرتز و عمق ۱۶ بیتی، دارای بیتریت فشرده نشده ۴۴۱۰۰ × ۱۶، یعنی ۷۰۵.۶ کیلوبیت بر ثانیه است.

برای اینکه تفاوت سایز فایل را کاملا درک کنید، اجازه دهید یک آهنگ فشرده پنج دقیقه‌ای ضبط شده در یک استریو دو کاناله را در نظر بگیریم.

۴۴.۱ کیلوهرتز/۱۶ بیت: ۴۴۱۰۰ × ۱۶ × ۲ = 1411200 بیت در ثانیه (۱.۴ مگابیت بر ثانیه)

۱۹۲ کیلوهرتز/۲۴ بیت: ۱۹۲۰۰۰ × ۲۴ × ۲ = 9216000 بیت در ثانیه (۹.۲ مگابیت در ثانیه)

با استفاده از بیتریت محاسبه شده، آن را در تعداد ثانیه فایل صوتی ضرب کنید

۱.۴ × ۳۰۰ = 420 Mb یا ۵۲.۵ مگابایت

۹.۲ × ۳۰۰ = 2760 Mb یا ۳۴۵ مگابایت

بنابراین، فایل صوتی ضبط شده در ۱۹۲ کیلوهرتز/۲۴ بیت، شش برابر فضای بیشتری را اشغال می‌کند، اما همه این‌ها به چیزی که ضبط می‌کنید بستگی دارد.

گاهی اوقات (مثل وقتی که سکوت را ضبط می‌کنید)، بیتریت کامل در یک عکس (snapshot) نیاز نیست. در این صورت، می‌توانید از بیتریت متغیر (VBR) که با MP3، OGG، AAC و WMA ساپورت می‌شود، استفاده کنید. در گذشته، فرمت VBR به طور گسترده ساپورت نمی‌شد، اما امروزه چنین نیست.

۳. استریو و مونو

این نکته بسیار ساده بوده و می‌توان به اختصار آن را بیان کرد. مونو (Mono) به معنای یک کانال و استریو (Stereo) به معنای دو کانال است. دو کانال موجود در یک فایل صوتی استریو را می‌توان به عنوان کانال چپ و راست نام برد.

با یک بلندگو هدفون، می‌توانید یکی از کانال‌های استریو را گوش دهید و دیگر کانال استریو را در گوش خود می‌شنوید. هنگام گوش دادن به یک فایل صوتی مونو، فقط یک کانال را در هر دو گوش خواهید شنید.

audacity split channels stereo.jpg?q=50&fit=crop&w=750&dpr=1

فایل های صوتی استریو در اصل دو فایل صوتی مونو در یک فایل هستند. با فرض یکسان بودن سمپل ریت، بیتریت، صدا و غیره، سایز یک فایل صوتی استریو همیشه دو برابر یک فایل صوتی مونو خواهد بود. پس ساده‌ترین روش برای کاهش سایز یک فایل صوتی، تبدیل آن از استریو به مونو است.

برای ضبط‌ صدای یک فرد، همیشه مونو ترجیح داده می‌شود، چون صدا را قدرتمند و واضح‌تر می‌کند. اما اگر می‌خواهید صدای دو یا چند خواننده را در یک اتاق ضبط کنید، باید صدا را استریو ضبط کنید.

ضبط پادکست نیز می‌تواند مونو باشد. اما در ضبط‌های موزیک، استریو باعث می‌شود بسیاری از موزیک‌‌ها سه بعدی‌ به نظر برسند؛ گویی موزیک در اطراف شما پخش می‌شود.

۴. فشرده‌سازی

اگر با فایل‌های WAV کار می‌کنید، تنها راه برای کاهش حجم فایل، انجام یکی از تنظیمات بالا (سمپل ریت، بیتریت یا تعداد کانال‌ها) است. اما اگر از فرمت دیگری استفاده می‌کنید، فشرده‌سازی بزرگترین عامل در اندازه فایل صوتی است. دو نوع فشرده‌سازی وجود دارد:

فشرده‌سازی با‌اتلاف، داده‌های غیر ضروری را از صدا حذف می‌کند، مانند صداهایی که فراتر از محدوده شنوایی اکثر افراد است. پس از فشرده‌سازی، این داده‌های حذف شده قابل بازیابی نیستند.

فشرده‌سازی بی‌اتلاف یک فایل صوتی را با استفاده از الگوریتم‌های ریاضی تا حد امکان حجم آن را کاهش می‌دهد، اما باید در زمان پخش از حالت فشرده خارج شود. در این نوع از فشرده‌سازی، هیچ داده‌ای از فایل صوتی از بین نخواهد رفت.

نوع حالت فشرده‌سازی که استفاده می‌کنید بستگی به استفاده فایل صوتی دارد. اگر می‌خواهید یک کپی کامل از فایل صوتی را ذخیره کنید، باید فشرده سازی بی‌اتلاف را انتخاب کنید و اگر فقط یک کپی بی‌کیفیت برای شما کافی است، فشرده‌سازی بااتلاف را انتخاب کنید.

به عنوان مثال، ممکن است بخواهید محتویات سی‌دی‌های قدیمی خود را به عنوان فایل FLAC ذخیره کنید و یا از فایل MP3 برای ذخیره آن‌ها در گوشی بهره‌مند شوید.

۵. فرمت فایل

وقتی فشرده‌سازی بااتلاف را برای فایل صوتی مورد نظر انجام دادید، باید تصمیم بگیرید که کدام فرمت فایل برای شما مناسب است. در حال حاضر، سه فرمت MP3، OGG و AAC بسیار محبوب و کارآمد هستند.

فرمت MP3 محبوب‌ترین بین فرمت‌هاست و دلیل آن این است که قدیمی‌تر از دو فرمت بالایی می‌باشد. فرمت AAC از نظر فنی بهتر از MP3 است اما استفاده از آن به MP3 نمی‌رسد. فرمت OGG نیز خوب است، اما دستگاه‌های زیادی آن را ساپورت نمی‌کنند، پس بهتر است از فرمت‌های MP3 یا AAC استفاده کنید.

پس از انتخاب فرمت، فایل صوتی شما بدون توجه به نوع آن، به بیتریت مشخصی فشرده می‌شود. اگر فرض کنیم که شما از فرمت MP3 استفاده می‌کنید، پنج بیتریت رایج در حال حاضر وجود دارد:

۶۴ کیلوبیت بر ثانیه که با کیفیت رادیویی AM یکسان است. این بیتریت برای پادکست‌هایی که مکالمه‌ها را پخش می‌کنند انتخاب عالی بوده چون صداها به پیچیدگی موزیک نیستند.

۹۶ کیلوبیت بر ثانیه که با کیفیت رادیو FM یکسان است. کیفیت موزیک را خوب پخش می‌کند، اما متوجه کامل نبودن کیفیت خواهید شد که دلیل آن حذف‌ شدن فرکانس‌های خاص از فایل صوتی است.

۱۲۸ کیلوبیت بر ثانیه که کیفیت صدای سی‌دی است. این کیفیت اندازه استاندارد است. موزیک برای اکثر مردم با این میزان کیفیت “به اندازه کافی خوب” به نظر می‌رسد.

۲۵۶ کیلوبیت بر ثانیه کیفیت صوتی بالایی دارد. ممکن است متوجه صداها و سازهای خاصی در فایل‌های صوتی شوید که با نرخ بیت پایین‌تر قابل تشخیص نیستند.

۳۲۰ کیلوبیت بر ثانیه بهترین کیفیت صدا است. شما می‌توانید کیفیت بالاتر را تجربه کنید، اما احتمالا نمی‌توانید تفاوتی را تشخیص دهید.

از نظر کاهش سایز فایل، MP3 فشرده شده تا ۱۲۸ کیلوبیت بر ثانیه تقریبا ۹۰ درصد از داده‌های صدای اصلی را از دست می‌دهد، در حالی که MP3 فشرده شده تا ۳۲۰ کیلوبیت بر ثانیه تنها حدود ۶۰ درصد از داده‌ها را از دست خواهد داد.

اگر فایل MP3 و AAC هر دو با بیتریت یکسان فشرده شده باشند، فایل AAC اغلب کیفیت صدای بهتری خواهد داشت چون از روش فشرده‌سازی پیشرفته‌تری استفاده می‌کند. این بدان معناست که شما می‌توانید با فرمت AAC کیفیت بیشتری را در هر مگابایت نسبت به MP3 دریافت کنید.

سایز فایل‌های صوتی را کمتر کنید

درک این پنج عامل به شما کمک می‌کند بهترین روش را برای ضبط و فشرده‌سازی موزیک و یا پادکست‌هایی که ساختید را انتخاب کنید. این مقاله به شما کمک می‌کند تا در انتخاب فرمت‌های موزیکی که دانلود می‌کنید مطمئن باشید.

You may also like

Leave a Comment