دیپ مایند به دو چیز اشاره میکند: فناوری مسئول پروژه هوش مصنوعی گوگل و شرکتی که مدیریت آن را بر عهده دارد. شرکت دیپ مایند زیر مجموعه شرکت مادر گوگل یعنی آلفابت است.
فناوری هوش مصنوعی دیپ مایند گوگا در مجموعه وسیعی از دستگاهها و پروژههای غول دنیای اینترنت استفاده شده است. اگر به عنوان مثال از گوگل اسیستنت یا گوگل هوم استفاده میکنید، زندگی شما در حال حاضر به نوعی درگیر دیپ مایند است.
در این مطلب میخواهیم به صورت کامل و واضح به سوال دیپ مایند چیست؟ بازدیدکنندگان عزیز روکیدا پاسخ دهیم. بنابراین تا انتها همراه ما باشید.
گوگل چطور و چرا شرکت دیپ مایند را خرید؟
شرکت دیپ مایند در سال 2011 با هدف «راه حل هوشمندانه و سپس استفاده از آن برای حل تمامی مسائل» بنیانگذاری شد. بنیانگذاران این شرکت با استفاده از اطلاعاتی که در زمینه علوم عصبی داشتند با مشکلات یادگیری ماشینی برخورد کردند.
هدف آنها ایجاد الگوریتمهای قدرتمند با اهداف کلی بود که بتوانند یاد بگیرند و خودشان را برنامهریزی کنند، به جای این که به برنامهریزی دستی توسط انسانها نیاز داشته باشند.
چندین شرکت بزرگ فعال در زمینه هوش مصنوعی تحت تاثیر استعداد تیم دیپ مایند قرار گرفتند فیسبوک سعی کرد این شرکت را بخرد. این معامله جوش نخورد، اما گوگل پا به میان گذاشت و شرکت دیپ مایند را در سال 2014 به قیمت 500 میلیون دلار خرید.
دیپ مایند سپس طی سازماندهی متفاوت و شرکتی گوگل در سال 2015 به یک زیر مجموعه از آلفابت تبدیل شد.
دلیل اصلی گوگل برای خرید این شرکت شروع با قدرتتر طرح هوش مصنوعی آن بود. با آن که دفتر مرکزی اصلی دیپ مایند در لندن باقی ماند، یک تیم از آن به دفتر مرکزی گوگل در کالیفرنیا نقل مکان کرد. مسئولیت این تیم استفاده از هوش مصنوعی دیپ مایند در محصولات گوگل بود.
پروژه دیپ مایند گوگل چه اهدافی دارد؟
هدف شرکت دیپ مایند برای راه حل هوشمندانه زمانی که تحت کنترل گوگل قرار گرفت، تغییر نکرد. کار روی یادگیری عمیق ادامه پیدا کرد که نوعی از طرح کلی یادگیری ماشینی است.
عملکرد آن در مقایسه با هوش مصنوعیهای قبلی مانند کامپیوتر دیپ بلو قرار میگیرد که در سال 1996 و در آن رقابت مشهور توانست استاد بزرگ شطرنج گری کاسپاروف را شکست دهد.
چنین کامپیوترهایی در انجام وظایف مربوط به یک حوزه خاص عالی بودند ولی خارج از آن حوزهها عملکرد کمتر مفیدی داشتند. پروژه دیپ مایند از طرف دیگر برای یادگیری از تجربیات طراحی شده بود.
هوش مصنوعی دیپ مایند گوگل نحوه انجام بازیهای ویدئویی مانند Breakout را بهتر از بازیکنان انسانی یاد گرفته است. در سال 2016، یک برنامه کامپیوتری به اسم AlphaGo که از فناوری دیپ مایند استفاده میکرد توانست قهرمان جهان بازی Go را شکست دهد که یک موفقیت عظیم بود چون این بازی به مراتب از شطرنج پیچیدهتر است.
علاوه بر این، گوگل تنها برای تحقیقات محض هوش مصنوعی دیپ مایند را در دستگاههای موبایل و جستجو پرچمدار خود از جمله گوگل هوم و اندروید ادغام کرد.
پروژه دیپ مایند گوگل روی زندگی روزمره افراد چه تاثیری دارد؟
ابزارهای یادگیری عمیق دیپ مایند گوگل در مجموعه وسیعی از سرویسها و محصولات گوگل استفاده شدند. اگر از محصولات گوگل استفاده میکنید، به احتمال زیاد به نحوی با دیپ مایند تعامل داشتید.
بعضی از شایعترین کاربردهای هوش مصنوعی دیپ مایند گوگل شامل تشخیص گفتار، تشخیص تصویر، تشخیص جعل، شناسایی اسپم، تشخیص دستخط، ترجمه، قابلیت استریت ویو اپلیکیشن گوگل مپس و جستجوی محلی میشود.
تشخیص گفتار فوقالعاده دقیق گوگل
تشخیص گفتار یا توانایی یک کامپیوتر در تفسیر فرامین بیان شده سابقه طولانی دارد. دستیارهای صوتی مانند سیری، کورتانا، الکسا و گوگل اسیستنت به زندگی روزمره ما معنای دیگری بخشیدهاند.
یادگیری عمیق روی فناوری تشخیص صدای گوگل تاثیر بسیار عظیمی داشته است. یادگیری ماشینی به فناوری تشخیص صدای گوگل اجازه داده است به یک سطح دقت شگفتانگیز برای زبان انگلیسی تا جایی برسد که دقت آن در حد یک شنونده انسانی باشد.
اگر یک دستگاه ساخت گوگل مانند یک گوشی هوشمند اندرویدی یا اسپیکر هوشمند گوگل هوم دارید، تاثیر مستقیم آن را روی زندگی خود حس میکنید. هر زمان که عبارت «اوکی، گوگل» را میگویید و سپس یک سوال میپرسید، دیپ مایند قدرت خود را نشان میدهد تا به گوگل اسیستنت در درک صحبت شما کمک کند. برخلاف اسپیکر آمازون اکو که برای درک فرامین صوتی از 8 میکروفون استفاده میکند.، سیستم تشخیص صدای گوگل هوم که از دیپ مایند استفاده میکند تنها به دو میکروفون نیاز دارد.
گوگل هوم و ایجاد صدای اسیستنت
سیستم قدیمی سنتز گفتار از روش به اصطلاح تبدیل متن به گفتار (TTS) به شیوه الحاقی استفاده میکند. زمانی که با دستگاهی تعامل برقرار میکنید که از این روش برای سنتز گفتار استفاده میکند، با دیتابیس کاملی از قطعات گفتاری مشورت میکند و آنها را به شکل کلمات و جملات سرهمبندی میکند.
نتیجه یک الگوی گفتار منحرف شده است که معمولا انسان نبودن گوینده مشخص است.
دیپ مایند با موضوع ایجاد صدا با پروژهای به اسم WaveNet نزدیک شد که هدف از آن ایجاد صداهای ایجاد شده مصنوعی بود که طبیعیتر به نظر برسند.
WaveNet تکیه به استفاده از نمونه گفتارهای انسانی دارد ولی از این نمونهها برای سنتز صداهای جدید استفاده نمیکند، بلکه این پروژه نمونه گفتار انسانی را تحلیل میکند تا یاد بگیرد اشکال موج خام صدا چطور کار میکنند.
این کار به برنامه اجازه میدهد به زبانهای گوناگون صحبت کند، از لهجه استفاده کند یا حتی یاد بگیرد چطور صدایی مانند یک فرد خاص داشته باشد. WaveNet برخلاف سایر سیستمهای TTS صداهای غیر گفتاری مانند تنفس و صدای ملچ ملوچ را ایجاد میکند تا حتی یک پروفایل صوتی واقعگرایانهتر به وجود آورد.
اگر میخواهید تفاوت بین یک صدای ایجاد شده از طریق روش تبدیل متن به گفتار به شیوه الحاقی و WaveNet را بشنوید، سایت شرکت دیپ مایند یکسری نمونه صوتی جالب در این لینک دارد.
یادگیری عمیق و جستجو تصویر گوگل
جستجو برای تصاویر بدون وجود هوش مصنوعی تکیه به استفاده از سرنخهای زمینهای مانند تگها، متن مجاور و نام فایلها دارد. بخش جستجو تصویر گوگل به کمک ابزارهای یادگیری عمیق دیپ مایند توانست یاد بگیرد افراد و اشیاء گوناگون به چه شکل هستند، بنابراین به کاربر اجازه میدهد تصاویر خود را جستجو کند و بدون تگگذاری نتایج مرتبط را به دست آورد.
به عنوان مثال، اگر عبارت «سگ» را جستجو کنید، گوگل تصاویری را که از سگتان گرفتید نشان خواهد داد، حتی اگر آنها را برچسب نزده باشید. دلیل این جا است که الگوریتم جستجو به کمک پروژه دیپ مایند گوگل توانسته است یاد بگیرد سگها به چه شکلی هستند، تا حد زیادی به همان شکلی که انسانها یاد میگیرند اشیاء چه شکلی هستند.
از طرفی برخلاف برنامه بینایی رایانهای رویای عمیق گوگل، دقت الگوریتم جدید در شناسایی انواع تصاویر مختلف بیشتر از 90 درصد است.
استفاده از دیپ مایند در گوگل لنز و جستجو تصویری
یکی از شگفتانگیزترین دستاوردهای پروژه دیپ مایند گوگل لنز است، یک موتور جستجوی تصویری که به کاربر اجازه میدهد در دنیای واقعی تصویر یک شیء را بگیرد و فورا اطلاعات مربوط به آن را نشان دهد.
با آن که نحوه اجرا متفاوت است، ولی عملکرد این ابزار شبیه به یادگیری ماشینی است که در موتور جستجو تصویر گوگل استفاده میشود.
زمانی که یک عکس میگیرید، گوگل لنز میتواند به آن نگاه کند و شیء مربوطه را تشخیص دهد. گوگل لنز براساس این دادهها میتواند یک سری کارهای پیشرفته انجام دهد.
به عنوان مثال، اگر از یک منطقه گردشگری مشهور عکس بگیرید، اطلاعات مربوط به آن جا را به شما نشان خواهد داد. اگر از یک فروشگاه محلی عکس بگیرید، اطلاعات مربوط به آن فروشگاه را دریافت خواهید کرد. اگر عکس شامل یک شماره تلفن باشد، گوگل لنز میتواند اطلاعات را شناسایی کند و گزینه تماس با آن تلفن را برایتان بیاورد.