فهرست عنوانها
فیلم آخرین مبارز ستارهای سال 1984 داستان نوجوانی است که هدفش در زندگی ظاهرا چیزی جز بازی کردن بازیهای آرکید نیست. خوشبختانه، مهارت بالایی در این بازیها دارد.
او استاد یک بازی ویدئویی به اسم مبارز ستارهای است. در این بازی، بازیکن باید از خانه خود به اسم The Frontier در یک نبرد فضایی با Xur و Ko-Dan Armada محافظت کند.
اما پیچش داستانی فیلم زمانی است که بیننده متوجه میشود مبارز ستارهای یک بازی ساده نبوده، بلکه در واقع یک نوع تست است. جنگ با Ko-Dan Armada و Xur واقعی است و این بازی آرکید یک ابزار مخفی جذب سرباز است که مسئولان با آن قصد دارند بهترین بهترینها را به عنوان مبارزان ستارهای واقعی پیدا کنند.
بیش از 35 سال پس از اکران فیلم مبارز ستارهای، مهندسان موسسه هوش مصنوعی دانشگاه بوفالو نیویورک از سوی سازمان پروژههای تحقیقاتی پیشرفته دفاعی آمریکا (DARPA) بودجهای را دریافت کرده است تا تحقیقاتی را انجام دهد که با داستان این فیلم فوقالعاده شباهت دارد.
این بازی در زمان آنی استراتژی در حال حاضر نام ندارد و اگر بخواهیم مقایسه کنیم به سبک بازیهای StarCraft یا Stellaris است. در این بازی، بازیکن باید از منابعی که در اختیار دارد برای ساخت یگانهای دفاعی و شکست دشمنان استفاده کند و برای تکمیل اهداف ماموریتی خود در بازی تعداد زیادی از ایجنتهای روی صفحه را به کار بگیرد.
اما تجربه این بازی معمولی نیست. زمانی که افراد در دانشگاه بوفالو این بازی استراتژی جدید را انجام میدهند، آنها باید ابتدا موافقت کنند به فناوری الکتروانسفالوگرام (EEG) وصل شوند تا طراحان بازی بتوانند فعالیت مغزشان را ثبت کنند.
همانطور که آنها بازی میکنند، حرکات چشم آنها نیز توسط دوربینهای ویژه با سرعت فوقالعاده بالا ثبت میشود تا مشخص شود واکنش آنها به کاری که دارند انجام میدهند چیست.
سپس از این اطلاعات که با استفاده از الگوریتمهای یادگیری ماشینی میتواند به دست آورده شوند برای توسعه الگوریتمهای جدیدی استفاده میشود که میتواند به آموزش تعداد زیادی از رباتها در آینده کمک کند.
طراحان این بازی به ویژه امیدوار هستند که به دست آوردن اطلاعات در مورد فرآیند پیچیده تصمیمگیری میتواند به هماهنگی بین تیمهای بزرگی از رباتهای خودکار زمینی و هوایی کمک کند. به عبارت دیگر باید به بازی جان بخشید.
برای افرادی که با فیلمهایی مانند آخرین مبارزه ستارهای بزرگ شدند، این گفتهها باید به شکل عجیبی آشنا به نظر میرسد. گرچه این جا نیز پیچش وجود دارد. در آخرین مبارزه ستارهای (و سایر داستانهای علمی تخیلی که طرح داستانی مشابهی دارند مانند بازی اندر اورسن اسکات کارد و آرمادای ارنست کلاین) هدف آموزش انسانها است تا واکنشهای فوقالعاده سریعی داشته باشند که معمولا در یک دستگاه (ماشین) دیده میشود. ولی این جا موضوع متفاوت است.
هدف دانشگاه بوفالو از بازی جدید این نیست بازیکنان بیشتر شبیه به ماشین باشند. بلکه حقیقت ماجرا عکس آن است. آنها سعی دارند کاری کنند ماشینها بیشتر شبیه به انسانها فکر کنند.
آموزش رباتهای گروهی فردا در زمان حال
سوما چادهوری، دانشیار مهندسی هوافضا و مکانیک در مدرسه مهندسی و علوم کاربردی میگوید «ما سعی داریم شرکتکنندگانی را جذب کنیم که تجربه گیمینگ قوی دارند.»
چادهوری یکی از رهبران اصلی این پروژه است. او در ادامه صحبتهای خود میگوید «من خودم اصلا تجربه بازی ندارم. من اصلا طرف بازیهای کامپیوتری هم نرفتم. ولی بسیاری از دانشجویان ما خوره بازی هستند.»
زمینه مورد علاقه چادهوری هوش جمعی (ازدحامی) است، یک شاخه از علوم کامپیوتری که ریشه آن به دهه 80 میلادی بر میگردد. هوش جمعی در مورد رفتار جمعی سیستمهای مجازی و همچنین رباتیک تمرکززدا و خود سازمان یافته است.
او گفت «هوش جمعی واقعا موضوع داغی است. روبهروز بیشتر مشخص میشود به جای تنها یک ربات 1 میلیون دلاری با گروه بزرگی از رباتهای ارزانتر و سادهتر میتوان کارهای به مراتب زیادی انجام داد. این رباتها میتوانند زمینی، هوایی یا ترکیبی از هر دو باشند.»
برخی از محققانی که در زمینه رباتیک گروهی فعال هستند سعی به ایجاد گروههایی دارند که بتوانند کارهای پیچیده را با ایجاد دستی اعمال تمام ایجتهای مسئول انجام دهند؛ مانند شیوهای که ممکن است هر کدام از اعضای یک گروه رقص را مربیگری کنید تا آنها بتوانند روی انجام یک حرکت پیچیده تسلط پیدا کنند.
تمامی اعضای گروه را در کنار یکدیگر قرار میدهید تا نتیجه کار چیزی شبیه به همکاری جمعی باشد، گرچه در واقع مجموعهای از افراد دارند کار خود را انجام میدهند.
تفکر استفاده از هوش مصنوعی یادگیری ماشینی مدرن میتواند این توانایی را به گروههای رباتیک بدهد تا به یک شکل جمعی و معنادار وظایف خود را خودکارتر انجام دهند.
اما گفتن این حرفها از عمل به آن سادهتر است. آموزش یک ربات برای انجام یک کار نیاز به حجم بالایی از آموزش دارد. آموزش یک گروه به صورت بالقوه با قابلیتهای متفاوت برای انجام وظایف خود در محیطهای غیرقطعی و پیچیده به مراتب سختتر است.
معنای آن راهاندازی دهها هزار شبیهسازی است تا این فرآیند فوقالعاده هزینهبر و وقتگیر باشد. هدف از اجرای پروژه جدید این است که تماشای انسانها در حین بازی آموزش ماشینها را سادهتر خواهد کرد.
چادهوری گفت «تصور کنید وارد یک کلاس درس شدید که در آن معلمی وجود ندارد و بگویید بیایید جبر یاد بگیریم. میتوانید با استفاده از فقط تمرینها و کتاب درس این موضوع را یاد بگیرید. ولی این کار خیلی زمان میبرد. اگر یک معلم داشته باشید که بتوانید به او گوش کنید فرآیند یادگیری به مراتب سریعتر خواهد بود. در مورد این پروژه، ما میخواهیم ببینیم انسانها چطور این بازی را انجام میدهند و سپس از آن برای بالا بردن سرعت قابل توجه آموزش رفتار به هوش مصنوعی استفاده کنیم. قبل از این برای یادگیری به اجرای 10 هزار شبیهسازی نیاز بود. حالا شاید ما فقط باید هزار شبیهسازی اجرا کنیم و آن را با دادههای انسانی تقویت کنیم.»
این محققان عقیده دارند با مشاهده نوع تصمیمهای تاکتیکی و استراتژیکی که انسانها زمان انجام یک بازی استراتژیک میگیرند، امکان درک ویژگیها و رویدادهایی که انگیزه این اعمال را به وجود میآورد، وجود خواهد داشت.
آموزش ماشینها
چادهوری گفت «این پروژه با یک سرعت فوقالعاده بالا در حال جریان است. ما تقریبا در وسط راه هستیم.» در حال حاضر، آنها هنوز مرحله جمعآوری داده این پروژه را شروع نکردند، گرچه چادهوری در مورد نحوه انجام آن فکر خوبی دارد. نقشه او اجرای آزمایشها با حدود 25 شرکتکننده است.
هر شرکتکننده بین 6 تا 7 بازی با تنظیمات تصادفی و سطح سخت بودن متفاوت انجام میدهد. برخلاف بازیهایی مانند StarCraft که چندین ساعت میکشد، در این جا هر بازی تنها بین 5 و 10 دقیقه طول خواهد کشید. این مقدار برای سنجش استراتژیهای تصمیمگیری کافی خواهد بود و همچنین در این بازه زمانی قابلیتهای مورد نظر با استفاده از الگوریتمها و اسکریپتهای توسعه یافته توسط تیم تحقیقاتی استخراج میشوند.
چادهوری میگوید «در حال حاضر، اظهارنظر در مورر مقدار یا اندازه دادههایی که در نهایت جمعآوری خواهد شد سخت است.»
گرچه، هدف این تیم ظاهرا در نهایت آموزش نزدیک به 250 ربات زمینی و هوایی است که در موقعیتهای کاملا پیچیده کار کنند. یک مثال میتواند برخورد با افت قابل توجه دید به علت دود باشد. این تیم قصد توسعه الگوریتمهایی را برپایه رفتار انسانی دارد که به آنها اجازه دهد با چنین چالشهایی سازگار شوند.
چادهوری در ادامه صحبتهای خود میگوید «انسانها میتوانند از استراتژیهای بسیار بیهمتایی استفاده کنند که هوش مصنوعی هرگز ممکن نیست یاد بگیرد. هیاهوی زیادی که در زمینه هوش مصنوعی دیدهایم در زمینههای کاربردی است که در آنها محیط نسبتا قطعی است. ولی در زمینه استدلال زمینهای در یک محیط واقعی چطور؟ همه چیز در مراحل اولیه خود قرار دارد.»
انسانها استراتژی میسازند
روانشناس و اقتصاد برنده جایزه نوبل دانیل کانمن در کتاب آهسته و سریع سال 2011 خود دو نوع حالت متفاوت اندیشه را توصیف میکند. سیستم اول سریع و غریزی است که ما اسم آن را شهود میگذاریم. این حالت میتواند پیدا کردن منبع یک صدای خاص، کامل کردن جملات یا نابود کردن کشتیهای Ko-Dan در میانه هوا در بازی مبارز ستارهای باشد.
سیستم دوم آهستهتر، با تفکر بیشتر و منطقیتر است. محوریت آن روی تفگر آگاهانه است که در این مورد به خوبی میتواند به عنوان مثال استراتژی سازی باشد.
چادهوری در زمان صحبت در مورد این پروژه از تحقیقات کانمن حرفی نمیزند. ولی سخت میتوانیم به آن فکر نکنیم. او اشاره میکند، ماشینها در حال حاضر قادر به انجام یک تعداد قابلیت خودکار قابل توجه هستند. یک پهباد 10 هزار دلاری زمان مسیریابی بین موقعیتها رفتار هوشمندانه شگفتانگیزی از خود نشان میدهد.
همین قضیه در مورد ایجنتهای داخل یک بازی استراتژی صدق پیدا میکند. یگانهای مبارزه اغلب اوقات تحت هدایت قوانین سطح پایینی قرار دارند که به آنها اجازه میدهد نسبت به محیط اطرافشان واکنش نشان دهند.
این واکنش میتواند به معنای حمله یا دفاع در زمان مواجه شدن با یک دشمن باشد. ممکن است همچنین به معنای توانایی حفظ آرایشهای نظامی در زمان حرکت اطراف یک نقشه باشد. ولی در هر دو مورد، چیزی که دیده نمیشود استراتژی جامع برای انجام وظایف است.
چادهوری گفت «برای انجام کنترل سطح پایین یعنی کنترل هر ایجنت نیاز به یک انسان ندارید. ما به این موضوع توجه نداریم. آنها تکتک رباتها و محلی که به سمت آن میروند را کنترل نمیکنند. نقش انسان بیشتر از یک سرپرست یا یک متخصص فنون جنگی است. یک مثال خوب این است که در یک محیط واکنش به یک فاجعه شما یک سرپرست دارید. یک سرپرست ممکن است تحت هدایت خود تیمی از 100 نجاتدهنده داشته باشد. چنین چیزی یک سلسله مراتب است ولی سرپرست به هر کدام از اعضای تیم نمیگوید دقیقا چه کاری باید انجام دهند. اعضای تیم نجاتدهنده تصمیمهای مستقل فراوانی میگیرند ولی سرپرست تاکتیکهای کلی و نهایی را به وجود میآورد. این چیزی است که ما میخواهیم بسازیم.»
اگر چادهوری و تیم او به جایی که میخواهند برسند، رباتهای گروهی آینده به مراتب باهوشتر خواهند بود و بابت آن باید از گیمرها تشکر کنند.
منبع: digitaltrends.com