با پروژه دیپ مایند گوگل آشنا شوید

توسط محمد امین نعمتی
6 دقیقه

دیپ مایند به دو چیز اشاره می‌کند: فناوری مسئول پروژه هوش مصنوعی گوگل و شرکتی که مدیریت آن را بر عهده دارد. شرکت دیپ مایند زیر مجموعه شرکت مادر گوگل یعنی آلفابت است.

فناوری هوش مصنوعی دیپ مایند گوگا در مجموعه وسیعی از دستگاه‌ها و پروژه‌های غول دنیای اینترنت استفاده شده است. اگر به عنوان مثال از گوگل اسیستنت یا گوگل هوم استفاده می‌کنید، زندگی شما در حال حاضر به نوعی درگیر دیپ مایند است.

در این مطلب می‌خواهیم به صورت کامل و واضح به سوال دیپ مایند چیست؟ بازدیدکنندگان عزیز روکیدا پاسخ دهیم. بنابراین تا انتها همراه ما باشید.

با پروژه دیپ مایند گوگل آشنا شوید

گوگل چطور و چرا شرکت دیپ مایند را خرید؟

شرکت دیپ مایند در سال 2011 با هدف «راه حل هوشمندانه و سپس استفاده از آن برای حل تمامی مسائل» بنیان‌گذاری شد. بنیان‌گذاران این شرکت با استفاده از اطلاعاتی که در زمینه علوم عصبی داشتند با مشکلات یادگیری ماشینی برخورد کردند.

هدف آن‌ها ایجاد الگوریتم‌های قدرتمند با اهداف کلی بود که بتوانند یاد بگیرند و خودشان را برنامه‌ریزی کنند، به جای این که به برنامه‌ریزی دستی توسط انسان‌ها نیاز داشته باشند.

چندین شرکت بزرگ فعال در زمینه هوش مصنوعی تحت تاثیر استعداد تیم دیپ مایند قرار گرفتند فیس‌بوک سعی کرد این شرکت را بخرد. این معامله جوش نخورد، اما گوگل پا به میان گذاشت و شرکت دیپ مایند را در سال 2014 به قیمت 500 میلیون دلار خرید.

دیپ مایند سپس طی سازماندهی متفاوت و شرکتی گوگل در سال 2015 به یک زیر مجموعه از آلفابت تبدیل شد.

دلیل اصلی گوگل برای خرید این شرکت شروع با قدرت‌تر طرح هوش مصنوعی آن بود. با آن که دفتر مرکزی اصلی دیپ مایند در لندن باقی ماند، یک تیم از آن به دفتر مرکزی گوگل در کالیفرنیا نقل مکان کرد. مسئولیت این تیم استفاده از هوش مصنوعی دیپ مایند در محصولات گوگل بود.

پروژه دیپ مایند گوگل چه اهدافی دارد؟

هدف شرکت دیپ مایند برای راه حل هوشمندانه زمانی که تحت کنترل گوگل قرار گرفت، تغییر نکرد. کار روی یادگیری عمیق ادامه پیدا کرد که نوعی از طرح کلی یادگیری ماشینی است.

عملکرد آن در مقایسه با هوش مصنوعی‌های قبلی مانند کامپیوتر دیپ بلو قرار می‌گیرد که در سال 1996 و در آن رقابت مشهور توانست استاد بزرگ شطرنج گری کاسپاروف را شکست دهد.

چنین کامپیوترهایی در انجام وظایف مربوط به یک حوزه خاص عالی بودند ولی خارج از آن حوزه‌ها عملکرد کمتر مفیدی داشتند. پروژه دیپ مایند از طرف دیگر برای یادگیری از تجربیات طراحی شده بود.

هوش مصنوعی دیپ مایند گوگل نحوه انجام بازی‌های ویدئویی مانند Breakout را بهتر از بازیکنان انسانی یاد گرفته است. در سال 2016، یک برنامه کامپیوتری به اسم AlphaGo که از فناوری دیپ مایند استفاده می‌کرد توانست قهرمان جهان بازی Go را شکست دهد که یک موفقیت عظیم بود چون این بازی به مراتب از شطرنج پیچیده‌تر است.

علاوه بر این، گوگل تنها برای تحقیقات محض هوش مصنوعی دیپ مایند را در دستگاه‌های موبایل و جستجو پرچم‌دار خود از جمله گوگل هوم و اندروید ادغام کرد.

پروژه دیپ مایند گوگل روی زندگی روزمره افراد چه تاثیری دارد؟

ابزارهای یادگیری عمیق دیپ مایند  گوگل در مجموعه وسیعی از سرویس‌ها و محصولات گوگل استفاده شدند. اگر از محصولات گوگل استفاده می‌کنید، به احتمال زیاد به نحوی با دیپ مایند تعامل داشتید.

بعضی از شایع‌ترین کاربردهای هوش مصنوعی دیپ مایند گوگل شامل تشخیص گفتار، تشخیص تصویر، تشخیص جعل، شناسایی اسپم، تشخیص دست‌خط، ترجمه، قابلیت استریت ویو اپلیکیشن گوگل مپس و جستجوی محلی می‌شود.

تشخیص گفتار فوق‌العاده دقیق گوگل

تشخیص گفتار یا توانایی یک کامپیوتر در تفسیر فرامین بیان شده سابقه طولانی دارد. دستیارهای صوتی مانند سیری، کورتانا، الکسا و گوگل اسیستنت به زندگی روزمره ما معنای دیگری بخشیده‌اند.

یادگیری عمیق روی فناوری تشخیص صدای گوگل تاثیر بسیار عظیمی داشته است. یادگیری ماشینی به فناوری تشخیص صدای گوگل اجازه داده است به یک سطح دقت شگفت‌انگیز برای زبان انگلیسی تا جایی برسد که دقت آن در حد یک شنونده انسانی باشد.

اگر یک دستگاه ساخت گوگل مانند یک گوشی هوشمند اندرویدی یا اسپیکر هوشمند گوگل هوم دارید، تاثیر مستقیم آن را روی زندگی خود حس می‌کنید. هر زمان که عبارت «اوکی، گوگل» را می‌گویید و سپس یک سوال می‌پرسید، دیپ مایند قدرت خود را نشان می‌دهد تا به گوگل اسیستنت در درک صحبت شما کمک کند. برخلاف اسپیکر آمازون اکو که برای درک فرامین صوتی از 8 میکروفون استفاده می‌کند.، سیستم تشخیص صدای گوگل هوم که از دیپ مایند استفاده می‌کند تنها به دو میکروفون نیاز دارد.

گوگل هوم و ایجاد صدای اسیستنت

سیستم قدیمی سنتز گفتار از روش به اصطلاح تبدیل متن به گفتار (TTS) به شیوه الحاقی استفاده می‌کند. زمانی که با دستگاهی تعامل برقرار می‌کنید که از این روش برای سنتز گفتار استفاده می‌کند، با دیتابیس کاملی از قطعات گفتاری مشورت می‌کند و آن‌ها را به شکل کلمات و جملات سرهم‌بندی می‌کند.

نتیجه یک الگوی گفتار منحرف شده است که معمولا انسان نبودن گوینده مشخص است.

دیپ مایند با موضوع ایجاد صدا با پروژه‌ای به اسم WaveNet نزدیک شد که هدف از آن ایجاد صداهای ایجاد شده مصنوعی بود که طبیعی‌تر به نظر برسند.

WaveNet تکیه به استفاده از نمونه گفتارهای انسانی دارد ولی از این نمونه‌ها برای سنتز صداهای جدید استفاده نمی‌کند، بلکه این پروژه نمونه گفتار انسانی را تحلیل می‌کند تا یاد بگیرد اشکال موج خام صدا چطور کار می‌کنند.

این کار به برنامه اجازه می‌دهد به زبان‌های گوناگون صحبت کند، از لهجه استفاده کند یا حتی یاد بگیرد چطور صدایی مانند یک فرد خاص داشته باشد. WaveNet برخلاف سایر سیستم‌های TTS صداهای غیر گفتاری مانند تنفس و صدای ملچ ملوچ را ایجاد می‌کند تا حتی یک پروفایل صوتی واقع‌گرایانه‎‌تر به وجود آورد.

اگر می‌خواهید تفاوت بین یک صدای ایجاد شده از طریق روش تبدیل متن به گفتار به شیوه الحاقی و WaveNet را بشنوید، سایت شرکت دیپ مایند یکسری نمونه صوتی جالب در این لینک دارد.

یادگیری عمیق و جستجو تصویر گوگل

جستجو برای تصاویر بدون وجود هوش مصنوعی تکیه به استفاده از سرنخ‌های زمینه‌ای مانند تگ‌ها، متن‌ مجاور و نام فایل‌ها دارد. بخش جستجو تصویر گوگل به کمک ابزارهای یادگیری عمیق دیپ مایند توانست یاد بگیرد افراد و اشیاء گوناگون به چه شکل هستند، بنابراین به کاربر اجازه می‌دهد تصاویر خود را جستجو کند و بدون تگ‌گذاری نتایج مرتبط را به دست آورد.

به عنوان مثال، اگر عبارت «سگ» را جستجو کنید، گوگل تصاویری را که از سگ‌تان گرفتید نشان خواهد داد، حتی اگر آن‌ها را برچسب نزده باشید. دلیل این جا است که الگوریتم جستجو به کمک پروژه دیپ مایند گوگل توانسته است یاد بگیرد سگ‌ها به چه شکلی هستند، تا حد زیادی به همان شکلی که انسان‌ها یاد می‌گیرند اشیاء چه شکلی هستند.

از طرفی برخلاف برنامه بینایی رایانه‌ای رویای عمیق گوگل، دقت الگوریتم جدید در شناسایی انواع تصاویر مختلف بیشتر از 90 درصد است.

استفاده از دیپ مایند در گوگل لنز و جستجو تصویری

یکی از شگفت‌انگیزترین دستاوردهای پروژه دیپ مایند گوگل لنز است، یک موتور جستجوی تصویری که به کاربر اجازه می‌دهد در دنیای واقعی تصویر یک شیء را بگیرد و فورا اطلاعات مربوط به آن را نشان دهد.

با آن که نحوه اجرا متفاوت است، ولی عملکرد این ابزار شبیه به یادگیری ماشینی است که در موتور جستجو تصویر گوگل استفاده می‌شود.

زمانی که یک عکس می‌گیرید، گوگل لنز می‌تواند به آن نگاه کند و شیء مربوطه را تشخیص دهد. گوگل لنز براساس این داده‌ها می‌تواند یک سری کارهای پیشرفته انجام دهد.

به عنوان مثال، اگر از یک منطقه گردشگری مشهور عکس بگیرید، اطلاعات مربوط به آن جا را به شما نشان خواهد داد. اگر از یک فروشگاه محلی عکس بگیرید، اطلاعات مربوط به آن فروشگاه را دریافت خواهید کرد. اگر عکس شامل یک شماره تلفن باشد، گوگل لنز می‌تواند اطلاعات را شناسایی کند و گزینه تماس با آن تلفن را برایتان بیاورد.

 

مطالب مرتبط

دیدگاه شما چیست؟