روکیداروکیداروکیدا
  • اخبار فناوری
  • آموزش
  • گجت‌ها
    • اخبار موبایل و گجت ها
    • گجت های پوشیدنی
    • نقد و بررسی تخصصی گجت ها
    • راهنمای خرید
  • فیلم و سریال
  • نرم افزار و اپلیکیشن
  • موفقیت و پیشرفت
  • خودرو
  • تبلیغات در روکیدا
  • تماس با ما
می‌خوانید: رایانه چطور به صدای شما گوش می دهد؟ 2 قدم و تمام ماجرا
اطلاع‌رسانی آپدیت‌ها
تغییر اندازه فونتAa
تغییر اندازه فونتAa
روکیداروکیدا
  • اخبار فناوری
  • آموزش
  • گجت‌ها
  • فیلم و سریال
  • نرم افزار و اپلیکیشن
  • موفقیت و پیشرفت
  • خودرو
  • تبلیغات در روکیدا
  • تماس با ما
Search
  • اخبار فناوری
  • آموزش
  • گجت‌ها
    • اخبار موبایل و گجت ها
    • گجت های پوشیدنی
    • نقد و بررسی تخصصی گجت ها
    • راهنمای خرید
  • فیلم و سریال
  • نرم افزار و اپلیکیشن
  • موفقیت و پیشرفت
  • خودرو
  • تبلیغات در روکیدا
  • تماس با ما
© تمامی حقوق برای رسانه روکیدا محفوظ است.

روکیدا - آموزش

آموزش

رایانه چطور به صدای شما گوش می دهد؟ 2 قدم و تمام ماجرا

امیرحسین حیدرزاده
امیرحسین حیدرزاده
Avatar photo
توسطامیرحسین حیدرزاده
Follow:
انتشار: چهارشنبه , ۱۲ آبان ۱۴۰۰ ساعت ۳:۱۰
5 دقیقه
bQttsYAKmrwusDNeEaNGnC 970 80.jpeg

برخی از مردم رویا پردازی می‌کنند و برخی دیگر رویاها را به واقعیت می‌رسانند. درک شدن یکی از ویژگی‌های انسان است. این مساله که رایانه بتواند درک کند و به سوالات ما پاسخ دهد یک رویا بود.

عنوان‌ها
1. اولین رایانه‌ها که گوش می‌کردند2. در سطح مصرف کننده

امروز در جیب هر کدام از ما یک تلفن هوشمند وجود دارد. یک رایانه کوچک که هر روز قدرتمندتر می‌شود. تلفن هوشمند می‌تواند کلماتی که می‌گوییم را به خوبی تشخیص دهد.

آیا از آیفون 13 استفاده می‌کنید؟ سیری به کمک تراشه قدرتمند آیفون کلمات را بهتر از هر زمان تشخیص می‌دهد. شاید باور نکنید اما فناوری تشخیص گفتار از دهه 1950 در حال توسعه بوده است.

برای آشنایی با دنیای تشخیص گفتار چند قدم با روکیدا همراه شوید.

1. اولین رایانه‌ها که گوش می‌کردند

DptzXTvui9FRiCEUjzErDF 970 80.jpg

آن‌ها در دهه 1950 تا 1980 میلادی ساخته شدند. یک بازی بزرگ با نام‌های بزرگ گره خورده است. بِل را می‌شناسید؟ این شرکت با “آدری” پیشتاز ماجرا شد.

سیستم آدری اعداد را با دقت 97 تا 99 درصد تشخیص داد. دسترسی به آن ساده نبود. یک رایانه غول پیکر را با هزینه‌های سرسام آور تصور کنید. استفاده از آن حتی برای موارد تخصصی گران بود.

آی‌بی‌ام در سال 1962 با “شوباکس” وارد شد. سیستم او اعداد و اصطلاحات ساده ریاضی را تشخیص می‌داد. ژاپنی‌ها رویای بزرگ‌تری داشتند. رایانه آن‌ها برای بخش بندی یک خط از گفتار تلاش می‌کرد.

فناوری آن‌ها هدف تشخیص انواع صدا را دنبال کرد. وزارت دفاع آمریکا در دهه 1970 با طرح SUR وارد شد. تامین مالی سنگین آن انجام شد و نتیجه کار “هارپی” نام داشت. هارپی 1011 کلمه را تشخیص داد.

رایانه چطور به صدای شما گوش می دهد؟ 2 قدم و تمام ماجرا

توان درک نسخه آمریکایی‌ها درست مانند یک کودک سه ساله بود. تشخیص گفتار بسیار جذاب است و پتانسیل بزرگی داشت اما دسترسی به آن هیچ گاه ساده نبود.

مدل‌های پنهان مارکوف منبع قدرت هارپی بود. آن‌ مدل‌ها در ادامه باعث پیشرفت و توسعه تشخیص گفتار شد. اولین مورد قابل اجرا تانگورا از آی‌بی‌ام بود. تانگورا یاد می‌گرفت.

به کمک یادگیری مناسب، 20 هزار کلمه را تشخیص داد. تانگورا تمام آن 20 هزار کلمه را به زمان انگلیسی تشخیص داده و تایپ می‌کند. آیا رایانه آی‌بی‌ام کافی بود؟ برای استفاده در دنیای تجاری کافی نبود.

2. در سطح مصرف کننده

از دهه 1990 تا 2010 اتفاق افتاد. مبتکر و متخصص آی‌بی‌ام گفت: ما فکر می‌کردیم تقلید ماشین از مردم اشتباه است. در نهایت اگر یک خودرو مجبور به حرکت باشد، این کار را با چرخ‌ها انجام می‌دهد. او راه نمی‌رود.

تجزیه و تحلیل آماری باعث پیشرفت فناوری تشخیص گفتار شد. در سال 1990 نرم افزار “دراگون دیکتِیت” راه اندازی شد: اولین نرم افزار تشخیص گفتار تجاری.

برای خرید آن باید 8000 دلار پرداخت می‌کردیم. تا به‌روزرسانی بعدی دراگون در سال 1997، کاربران باید بین هر سه کلمه صبر می‌کردند.

پروژه تشخیص گفتار گوگل از سال 2004 آغاز شد. جست و جوی صوتی گوگل از سال 2007 در دسترس کاربران قرار گرفت. سیستم گوگل هم‌چنان در حال یادگیری است.

اپل با سیری و مایکروسافت با کورتانا بازی را دنبال کردند. در سال 2010 با معرفی یادگیری عمیق و شبکه عصبی (RNN) یک جهش بزرگ اتفاق افتاد. به عبارتی محاسبات ارزان شد.

رایانه چطور به صدای شما گوش می دهد؟ 2 قدم و تمام ماجرا

پیشرفت حداکثری تشخیص گفتار در 5 سال اخیر اتفاق افتاده است. آن را حتی در یک بلندگو هوشمند ارزان قیمت مشاهده می‌کنیم. رایانش ابری برای هرچه ساده‌تر شدن پردازش وارد بازی شد.

امروز شما می‌توانید دستگاه خود را با صدای خودتان آموزش دهید. تشخیص صدا آنقدر دقیق شده است که می‌توانید قفل آیفون خود را به کمک آن باز کنید.

بر اساس نظر کارشناسان تا پایان دهه 2020 تشخیص گفتار به اوج خود می‌رسد. 99 درصد کار را رایانه‌ها انجام می‌دهند و تنها کار انسان‌ها کنترل آن است.

rendered

ایجاد یک نسخه  از متن پادکست‌ها کار دشواری نخواهد بود. جلسات کاری امروز مجازی برگذار می‌شوند، یک نسخه کاغذی لازم ندارید؟ هر آنچه گفته می‌شود را می‌توانیم به زبان کلمات در لحظه دنبال کنیم.

روند قانونی خودکار را تصور کنید. تبدیل گفتار به متن اگر قابل اعتماد باشد می‌تواند ایجاد اسناد را از آب خوردن، آسان‌تر کند. تصمیم گیری آسان را دوست ندارید؟ فناوری دیگر در انحصار بزرگان نیست.

منبع: techradar.com

برچسب‌ها:تکنولوژی به زبان ساده
مطلب قبلی یک پهپاد چطور پرواز می کند؟ 4 قدم تا آسمان یک پهپاد چطور پرواز می کند؟ 4 قدم تا آسمان
مطلب بعدی مرسدس AMG سری SL مدل 2022 رونمایی از مرسدس AMG سری SL مدل 2022
بدون دیدگاه

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

جدیدترین مطالب

اپل با شعار Sleek Peek کاربران را برای WWDC 2025 هیجان زده کرد
اپل با شعار Sleek Peek کاربران را برای WWDC 2025 هیجان زده کرد
4 دقیقه
پشتیبانی Galaxy Z Fold 7 از شارژ بی سیم Qi2 تایید شد
پشتیبانی Galaxy Z Fold 7 از شارژ بی سیم Qi2 تایید شد
3 دقیقه
همه چیز درباره iOS 26 و قابلیت های جدید آیفون
همه چیز درباره iOS 26 و قابلیت های جدید آیفون
6 دقیقه
۷ راهکار برای بیدار ماندن بعد از یک شب بی خوابی
۷ راهکار برای بیدار ماندن بعد از یک شب بی خوابی
7 دقیقه
همه چیز درباره macOS 26 Tahoe و آنچه باید از اپل انتظار داشته باشیم
همه چیز درباره macOS 26 Tahoe و آنچه باید از اپل انتظار داشته باشیم
8 دقیقه
قابلیت ساخت چت بات هوش مصنوعی در واتساپ اندروید در راه است
قابلیت ساخت چت بات هوش مصنوعی در واتساپ اندروید در راه است
4 دقیقه
تویوتا Aygo X مدل 2025 با نسخه GR Sport معرفی شد
تویوتا Aygo X مدل 2025 با نسخه GR Sport معرفی شد
5 دقیقه
با این ترفند ساده، ChatGPT را تبدیل به دستیار شخصی خودتان کنید
با این ترفند ساده، ChatGPT را تبدیل به دستیار شخصی خودتان کنید
6 دقیقه
نام نسخه بعدی macOS احتمالا Tahoe خواهد بود
نام نسخه بعدی macOS احتمالا Tahoe خواهد بود
4 دقیقه
نسخه قدرتمند Snapdragon X2 Elite با پردازنده 18 هسته ای و رم 64 گیگابایتی در حال تست است
نسخه قدرتمند Snapdragon X2 Elite با پردازنده 18 هسته ای و رم 64 گیگابایتی در حال تست است
4 دقیقه

پربازدید‌ترین‌ها

ترفند جدید اپل نوت با یک دکمه ساده دو قابلیت پنهان را فعال می کند
ترفند جدید اپل نوت با یک دکمه ساده دو قابلیت پنهان را فعال می کند
3 دقیقه
آیفون 17 با همان پردازنده آیفون 16 عرضه می شود
آیفون 17 با همان پردازنده آیفون 16 عرضه می شود
4 دقیقه
متا قصد دارد ارزیابی ریسک محصولات را به هوش مصنوعی بسپارد
متا قصد دارد ارزیابی ریسک محصولات را به هوش مصنوعی بسپارد
4 دقیقه
دکمه های لمسی به آیفون و اپل واچ می آیند
دکمه های لمسی به آیفون و اپل واچ می آیند
3 دقیقه
ویژگی امنیتی جدید اندروید 16 زودتر از انتظار فعال شد1
ویژگی امنیتی جدید اندروید 16 زودتر از انتظار فعال شد
4 دقیقه
آپدیت One UI 7 برای گوشی گلکسی A05s منتشر شد
آپدیت One UI 7 برای گوشی گلکسی A05s منتشر شد
2 دقیقه
مقایسه کامل گلکسی S25 Edge و S25 FE
مقایسه کامل گلکسی S25 Edge و S25 FE
7 دقیقه
آیفون 17 بدون تغییرات مهم فقط کمی بزرگ تر شده
آیفون 17 بدون تغییرات مهم فقط کمی بزرگ تر شده
3 دقیقه
همه چیز درباره شایعات جدید آیفون 17 scaled
همه چیز درباره شایعات جدید آیفون 17
3 دقیقه
هوش مصنوعی Grok وارد تلگرام شد
هوش مصنوعی Grok وارد تلگرام شد
5 دقیقه
پایان راه برای فورد فوکوس
پایان راه برای فورد فوکوس ST
3 دقیقه
پردازنده Ryzen AI Max Pro 385 با هشت هسته روی گیک بنچ دیده شد
پردازنده Ryzen AI Max Pro 385 با هشت هسته روی گیک بنچ دیده شد
4 دقیقه
این 5 تمرین ساده روند پیری را معکوس می کند
این 5 تمرین ساده روند پیری را معکوس می کند
7 دقیقه
آیفون 17 معمولی بدون تراشه جدید و رم 12 گیگابایتی عرضه می شود scaled
آیفون 17 معمولی بدون تراشه جدید و رم 12 گیگابایتی عرضه می شود
4 دقیقه

جالب از سراسر وب

محافظ برق

برقکار شبانه روزی

بیمه موبایل معلم

سرور مجازی ایران

خرید جم فری فایر

آموزش مکانیک خودرو

داکر

خرید سی پی فوری

هاست ووکامرس ارزان

آموزش مکانیک خودرو

تعمیر تلویزیون هیمالیا

خرید رمان انگلیسی زبان اصلی

مرتبط با همین مطلب

اپل در WWDC 2025 ممکن است خبری از هوش مصنوعی ندهد
اخبار موبایل و گجت ها

اپل در WWDC 2025 ممکن است خبری از هوش مصنوعی ندهد

4 دقیقه
۵ روش فوق العاده برای استفاده بهتر از ChatGPT
آموزش

۵ روش فوق العاده برای استفاده بهتر از ChatGPT

6 دقیقه
آموزش کامل استفاده از Quick Share در اندروید
آموزش

آموزش کامل استفاده از Quick Share در اندروید

5 دقیقه
اپل احتمالا از iOS 26 در رویداد WWDC 2025 رونمایی می کند
اخبار موبایل و گجت ها

اپل احتمالا از iOS 26 در رویداد WWDC 2025 رونمایی می کند

4 دقیقه
روکیداروکیدا
© تمامی حقوق برای رسانه روکیدا محفوظ است.
Welcome Back!

Sign in to your account

Username or Email Address
Password

رمز عبور را فراموش کرده اید؟