روکیداروکیداروکیدا
  • اخبار فناوری
  • آموزش
  • گجت‌ها
    • اخبار موبایل و گجت ها
    • گجت های پوشیدنی
    • نقد و بررسی تخصصی گجت ها
    • راهنمای خرید
  • فیلم و سریال
  • نرم افزار و اپلیکیشن
  • موفقیت و پیشرفت
  • خودرو
  • تبلیغات در روکیدا
  • تماس با ما
می‌خوانید: رایانه چطور به صدای شما گوش می دهد؟ ۲ قدم و تمام ماجرا
اطلاع‌رسانی آپدیت‌ها
تغییر اندازه فونتAa
تغییر اندازه فونتAa
روکیداروکیدا
  • اخبار فناوری
  • آموزش
  • گجت‌ها
  • فیلم و سریال
  • نرم افزار و اپلیکیشن
  • موفقیت و پیشرفت
  • خودرو
  • تبلیغات در روکیدا
  • تماس با ما
Search
  • اخبار فناوری
  • آموزش
  • گجت‌ها
    • اخبار موبایل و گجت ها
    • گجت های پوشیدنی
    • نقد و بررسی تخصصی گجت ها
    • راهنمای خرید
  • فیلم و سریال
  • نرم افزار و اپلیکیشن
  • موفقیت و پیشرفت
  • خودرو
  • تبلیغات در روکیدا
  • تماس با ما
© تمامی حقوق برای رسانه روکیدا محفوظ است.

روکیدا - آموزش

آموزش

رایانه چطور به صدای شما گوش می دهد؟ ۲ قدم و تمام ماجرا

امیرحسین حیدرزاده
امیرحسین حیدرزاده
Avatar photo
توسطامیرحسین حیدرزاده
Follow:
انتشار: 12 آبان 1400 ساعت 3:10
5 دقیقه
bQttsYAKmrwusDNeEaNGnC 970 80.jpeg

برخی از مردم رویا پردازی می‌کنند و برخی دیگر رویاها را به واقعیت می‌رسانند. درک شدن یکی از ویژگی‌های انسان است. این مساله که رایانه بتواند درک کند و به سوالات ما پاسخ دهد یک رویا بود.

عنوان‌ها
۱. اولین رایانه‌ها که گوش می‌کردند۲. در سطح مصرف کننده

امروز در جیب هر کدام از ما یک تلفن هوشمند وجود دارد. یک رایانه کوچک که هر روز قدرتمندتر می‌شود. تلفن هوشمند می‌تواند کلماتی که می‌گوییم را به خوبی تشخیص دهد.

آیا از آیفون ۱۳ استفاده می‌کنید؟ سیری به کمک تراشه قدرتمند آیفون کلمات را بهتر از هر زمان تشخیص می‌دهد. شاید باور نکنید اما فناوری تشخیص گفتار از دهه ۱۹۵۰ در حال توسعه بوده است.

برای آشنایی با دنیای تشخیص گفتار چند قدم با روکیدا همراه شوید.

۱. اولین رایانه‌ها که گوش می‌کردند

DptzXTvui9FRiCEUjzErDF 970 80.jpg

آن‌ها در دهه ۱۹۵۰ تا ۱۹۸۰ میلادی ساخته شدند. یک بازی بزرگ با نام‌های بزرگ گره خورده است. بِل را می‌شناسید؟ این شرکت با “آدری” پیشتاز ماجرا شد.

سیستم آدری اعداد را با دقت ۹۷ تا ۹۹ درصد تشخیص داد. دسترسی به آن ساده نبود. یک رایانه غول پیکر را با هزینه‌های سرسام آور تصور کنید. استفاده از آن حتی برای موارد تخصصی گران بود.

آی‌بی‌ام در سال ۱۹۶۲ با “شوباکس” وارد شد. سیستم او اعداد و اصطلاحات ساده ریاضی را تشخیص می‌داد. ژاپنی‌ها رویای بزرگ‌تری داشتند. رایانه آن‌ها برای بخش بندی یک خط از گفتار تلاش می‌کرد.

فناوری آن‌ها هدف تشخیص انواع صدا را دنبال کرد. وزارت دفاع آمریکا در دهه ۱۹۷۰ با طرح SUR وارد شد. تامین مالی سنگین آن انجام شد و نتیجه کار “هارپی” نام داشت. هارپی ۱۰۱۱ کلمه را تشخیص داد.

رایانه چطور به صدای شما گوش می دهد؟ 2 قدم و تمام ماجرا

توان درک نسخه آمریکایی‌ها درست مانند یک کودک سه ساله بود. تشخیص گفتار بسیار جذاب است و پتانسیل بزرگی داشت اما دسترسی به آن هیچ گاه ساده نبود.

مدل‌های پنهان مارکوف منبع قدرت هارپی بود. آن‌ مدل‌ها در ادامه باعث پیشرفت و توسعه تشخیص گفتار شد. اولین مورد قابل اجرا تانگورا از آی‌بی‌ام بود. تانگورا یاد می‌گرفت.

به کمک یادگیری مناسب، ۲۰ هزار کلمه را تشخیص داد. تانگورا تمام آن ۲۰ هزار کلمه را به زمان انگلیسی تشخیص داده و تایپ می‌کند. آیا رایانه آی‌بی‌ام کافی بود؟ برای استفاده در دنیای تجاری کافی نبود.

۲. در سطح مصرف کننده

از دهه ۱۹۹۰ تا ۲۰۱۰ اتفاق افتاد. مبتکر و متخصص آی‌بی‌ام گفت: ما فکر می‌کردیم تقلید ماشین از مردم اشتباه است. در نهایت اگر یک خودرو مجبور به حرکت باشد، این کار را با چرخ‌ها انجام می‌دهد. او راه نمی‌رود.

تجزیه و تحلیل آماری باعث پیشرفت فناوری تشخیص گفتار شد. در سال ۱۹۹۰ نرم افزار “دراگون دیکتِیت” راه اندازی شد: اولین نرم افزار تشخیص گفتار تجاری.

برای خرید آن باید ۸۰۰۰ دلار پرداخت می‌کردیم. تا به‌روزرسانی بعدی دراگون در سال ۱۹۹۷، کاربران باید بین هر سه کلمه صبر می‌کردند.

پروژه تشخیص گفتار گوگل از سال ۲۰۰۴ آغاز شد. جست و جوی صوتی گوگل از سال ۲۰۰۷ در دسترس کاربران قرار گرفت. سیستم گوگل هم‌چنان در حال یادگیری است.

اپل با سیری و مایکروسافت با کورتانا بازی را دنبال کردند. در سال ۲۰۱۰ با معرفی یادگیری عمیق و شبکه عصبی (RNN) یک جهش بزرگ اتفاق افتاد. به عبارتی محاسبات ارزان شد.

رایانه چطور به صدای شما گوش می دهد؟ 2 قدم و تمام ماجرا

پیشرفت حداکثری تشخیص گفتار در ۵ سال اخیر اتفاق افتاده است. آن را حتی در یک بلندگو هوشمند ارزان قیمت مشاهده می‌کنیم. رایانش ابری برای هرچه ساده‌تر شدن پردازش وارد بازی شد.

امروز شما می‌توانید دستگاه خود را با صدای خودتان آموزش دهید. تشخیص صدا آنقدر دقیق شده است که می‌توانید قفل آیفون خود را به کمک آن باز کنید.

بر اساس نظر کارشناسان تا پایان دهه ۲۰۲۰ تشخیص گفتار به اوج خود می‌رسد. ۹۹ درصد کار را رایانه‌ها انجام می‌دهند و تنها کار انسان‌ها کنترل آن است.

rendered

ایجاد یک نسخه  از متن پادکست‌ها کار دشواری نخواهد بود. جلسات کاری امروز مجازی برگذار می‌شوند، یک نسخه کاغذی لازم ندارید؟ هر آنچه گفته می‌شود را می‌توانیم به زبان کلمات در لحظه دنبال کنیم.

روند قانونی خودکار را تصور کنید. تبدیل گفتار به متن اگر قابل اعتماد باشد می‌تواند ایجاد اسناد را از آب خوردن، آسان‌تر کند. تصمیم گیری آسان را دوست ندارید؟ فناوری دیگر در انحصار بزرگان نیست.

منبع: techradar.com

برچسب‌ها:تکنولوژی به زبان ساده
مطلب قبلی یک پهپاد چطور پرواز می کند؟ 4 قدم تا آسمان یک پهپاد چطور پرواز می کند؟ ۴ قدم تا آسمان
مطلب بعدی مرسدس AMG سری SL مدل 2022 رونمایی از مرسدس AMG سری SL مدل ۲۰۲۲
بدون دیدگاه

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

جدیدترین مطالب

شروع توسعه iOS 27 برای تجربه کاربری بی نقص در آیفون تاشو اپل
شروع توسعه iOS 27 برای تجربه کاربری بی نقص در آیفون تاشو اپل
30 تیر 1404 ساعت 12:02
نمونه های حافظه HBM4 سامسونگ به زودی به دست انویدیا و ای ام دی می رسد 1
نمونه های حافظه HBM4 سامسونگ به زودی به دست انویدیا و ای ام دی می رسد
30 تیر 1404 ساعت 11:55
قابلیت پیام رسانی مخفی در اپلیکیشن Notes آیفون
قابلیت پیام رسانی مخفی در اپلیکیشن Notes آیفون
30 تیر 1404 ساعت 11:32
عرضه اسنپدراگون 8 الایت 2 و دیمنسیتی 9500 بدون افزایش قیمت
عرضه اسنپدراگون ۸ الایت ۲ و دیمنسیتی ۹۵۰۰ بدون افزایش قیمت
30 تیر 1404 ساعت 11:24
ظرفیت باتری آیفون فولد احتمالا بزرگ تر از همه گوشی های تاشو اس
ظرفیت باتری آیفون فولد احتمالا بزرگ تر از همه گوشی های تاشو است
30 تیر 1404 ساعت 11:14
احتمال قطع همکاری اپل با تامین کننده اصلی نمایشگر آیفون
احتمال قطع همکاری اپل با تامین کننده اصلی نمایشگر آیفون
30 تیر 1404 ساعت 11:07
آیفون تاشو اپل با قطعات سامسونگ و طراحی شبیه گلکسی زد فولد1
آیفون تاشو اپل با قطعات سامسونگ و طراحی شبیه گلکسی زد فولد
30 تیر 1404 ساعت 10:57
عرضه ردمی توربو 5 در اوایل 2026 محتمل است1
عرضه ردمی توربو ۵ در اوایل ۲۰۲۶ محتمل است
30 تیر 1404 ساعت 10:46

پربیننده‌ترین مطالب امروز

ابزارهایی که سبک زندگی‌ را تغییر دادند از گجت‌های پوشیدنی تا شخصی
ابزارهایی که سبک زندگی‌ را تغییر دادند از گجت‌های پوشیدنی تا شخصی
9 دقیقه
تغییر برند در اپلیکیشن گوگل مسیجز در راه است
تغییر برند در اپلیکیشن گوگل مسیجز در راه است
3 دقیقه
شارژ سریع تر از حد انتظار در گلکسی S25 FE سامسونگ
شارژ سریع تر از حد انتظار در گلکسی S25 FE سامسونگ
4 دقیقه
پیکسل 10 پرو فولد گوگل می تواند گلکسی زد فولد 7 سامسونگ را در دو بخش مهم شکست دهد
پیکسل ۱۰ پرو فولد گوگل می تواند گلکسی زد فولد ۷ سامسونگ را در دو بخش مهم شکست دهد
5 دقیقه
ایده محصول برای فروش در اینستاگرام و فیسبوک؛ 9 ایده پولساز و سودآور
ایده محصول برای فروش در اینستاگرام و فیسبوک؛ ۹ ایده پولساز و سودآور!
11 دقیقه
قابلیت های رایگان Galaxy AI سامسونگ برای همیشه رایگان می مانند
قابلیت های رایگان Galaxy AI سامسونگ برای همیشه رایگان می مانند
3 دقیقه
آنر X70 با باتری 8300 میلی آمپر ساعت و تراشه اسنپدراگون 6 نسل 4 معرفی شد
آنر X70 با باتری ۸,۳۰۰ میلی آمپر ساعت و تراشه اسنپدراگون ۶ نسل ۴ معرفی شد
5 دقیقه
چگونه اندروید را شبیه آی او اس 26 کنیم؟ 1 e1752575611714
چگونه اندروید را شبیه آی او اس ۲۶ کنیم؟
5 دقیقه

جالب از سراسر وب

محافظ برق

برقکار شبانه روزی

بیمه موبایل معلم

سرور مجازی ایران

خرید جم فری فایر

داکر

خرید آی پی ثابت

ویدئووال

کرم گاتیو

خرید فالوور

ساخت عکس هوش مصنوعی

فالوور واقعی اینستاگرام

خرید رمان انگلیسی زبان اصلی

مرتبط با همین مطلب

چرا اجرای ترمینال لینوکس در فلیپ 7 امکان پذیر شده است
اخبار موبایل و گجت ها

مزیت ویژه گلکسی زد فلیپ ۷ در میان گوشی های تاشو

4 دقیقه
به جای 10 هزار قدم در روز، این کار را انجام دهید تا بدنتان سالم تر شود
زندگی

به جای ۱۰ هزار قدم در روز، این کار را انجام دهید تا بدنتان سالم تر شود

6 دقیقه
بررسی ایجنت های هوش مصنوعی و قدرت آن ها 2
نرم افزار و اپلیکیشن

بررسی ایجنت های هوش مصنوعی و قدرت آن ها

7 دقیقه
قابلیت های جدید Gemini 2.5 Pro و Deep Search به حالت هوش مصنوعی گوگل آمد
نرم افزار و اپلیکیشن

قابلیت های جدید Gemini 2.5 Pro و Deep Search به حالت هوش مصنوعی گوگل آمد

4 دقیقه
روکیداروکیدا
© تمامی حقوق برای رسانه روکیدا محفوظ است.
Welcome Back!

Sign in to your account

Username or Email Address
Password

رمز عبور را فراموش کرده اید؟