شرکت نرمافزاری ElevenLabs قابلیت جدیدی به نام Speech to Speech (STS) را به مدل هوش مصنوعی تولید صدا Speech Synthesis خود اضافه کرد. این ابزار میتواند صدای شما را به شخصیتهای مختلف با لهجههای متنوع تغییر دهد و حتی جنسیت صدا را هم عوض کند.
این ابزار از زبان فارسی نیز پشتیبانی میکند و نتایج تقریباً قابلقبول هستند. طبق توضیحات ارائهشده، STS محتوا و سبک گفتار موجود در فایل آپلود یا ضبط شده شما را بهدرستی درک میکند و سپس صدای آن را تغییر میدهد.
برای تغییر صدای شما، چندین مدل مختلف وجود دارد که هر کدام صدای شما را با حالات مختلفی ازجمله نگران و هیجانزده بیان میکنند. همچنین صداها براساس موارد استفاده مختلف مانند بازیهای ویدیویی، انیمیشن و داستانخوانی مشخص شدهاند. علاوهبراین، تنظیماتی برای کاربران ارائه شده است تا بتوانند صدای خود را بهطور کامل کنترل کنند.
در حال حاضر، این ابزار از زبان فارسی پشتیبانی میکند، اما طبق بررسیهای دیجیاتو، هوش مصنوعی ElevenLabs در بیان برخی کلمات مشکل دارد و نتیجه نهایی هم با لهجه تقریباً عجیبی در اختیارتان قرار میگیرد. بنابراین برای زبان فارسی باید به آن بیشتر بهعنوان یک ابزار سرگرمی نگاه کنید.
ElevenLabs وعده داده که در اواخر این هفته تغییراتی را برای صداهای پیشفرض Speech Synthesis ایجاد خواهد کرد. بهطور کلی در هفتههای آینده بیش از 20 صدا به آن اضافه خواهد شد، اما برخی از آنها نیز حذف میشوند. درنهایت، تا پیش از پایان سال 2023 ویژگیهای اشتراکگذاری این پلتفرم هوش مصنوعی تغییر صدا بهبود خواهند یافت.
راحی هست که بفهمیم صدا برای خود شخص هست یا هوش مصنوعی (Speech to Speech)؟