تماشا کنید: مهارت خیرهکننده ربات انساننمای چینی در بسکتبال

پژوهشگران میگویند نسخه جدید سامانه SkillMimic-V2 با تکیه بر ابزارهای پیشرفته هوش مصنوعی، به رباتها امکان میدهد از دادههای محدود و حتی ناقص، مهارتهای نرم و انعطافپذیر یاد بگیرند. در تازهترین آزمایش دانشگاه علوم و فناوری هنگکنگ (HKUST)، یک ربات انساننمای کوچک از شرکت Unitree با نام مستعار «سیبزمینی کوچولو» توانست یک لیآپ سهمرحلهای در ورزش بسکتبال را به شکلی بسیار عالی اجرا کند؛ حرکتی که آن را به یکی از پیشرفتهترین نمونههای رباتیک در زمینۀ عملکرد ورزشی تبدیل کرد.
ویدئوی منتشرشده از آزمایشگاه HKUST نشان میدهد این ربات جمعوجور با حرکات روان و کنترلشده در زمین حرکت میکند؛ توپ را دریبل میزند، پاس میدهد و پس از هزاران تمرین شبیهسازیشده، شوتهای موفق ثبت میکند. پژوهشگران میگویند این نخستین نمایش واقعی از بسکتبال یک ربات انساننما در محیط واقعی است.
در یکی از صحنهها، ربات برای اجرای یک لیآپ اقدام میکند، اما یک پژوهشگر توپ را بلاک میکند. با این حال، ربات فوراً تعادل خود را بازیافته و بازی را ادامه میدهد.
راز عملکرد روان ربات
مهارتهای این ربات مدیون چارچوب هوش مصنوعی SkillMimic است؛ سیستمی که حرکات انسان را با ویدئو و لباسهای حرکتی ثبت میکند و سپس آنها را در محیطهای شبیهسازیشده تمرین میدهد تا در دنیای واقعی قابل اجرا باشند.
این روش به ربات اجازه میدهد با یک الگوریتم واحد چندین مهارت مختلف، مثل دریبل، پاس و شوت، را یاد بگیرد و بتواند بهطور طبیعی و روان بین آنها جابهجا شود. پژوهشگران میگویند بخش تصمیمگیرنده اصلی ربات، یا همان کنترلر سطح بالا، میتواند با ترکیب این مهارتهای پایه، وظایف پیچیدهتر بسکتبال، مثل اجرای یک لیآپ یا حرکتهای ترکیبی، را به خوبی انجام دهد.
SkillMimic برای حل مشکل همیشگی یادگیری تقویتی، که دادههای واقعی معمولاً ناقص، محدود یا پرنویز هستند، از چند روش کلیدی استفاده میکند.
ابتدا وضعیتهای مشابه بدن در مهارتهای مختلف، مثل دریبل و لیآپ، شناسایی و به هم متصل میشوند تا مسیرهای انتقالی تازهای ایجاد شود که ربات قبلاً ندیده بود. سپس ربات هر بار تمرین را از نقطهای کمی متفاوت آغاز میکند و گاهی با اطلاعات ناقص یا بخشهایی از حرکت که پنهان شدهاند، روبهرو میشود تا یاد بگیرد چگونه از اشتباهات یا موقعیتهای ناپایدار به وضعیت عادی برگردد. در نهایت، سیستم روی لحظات دشوار و حساس تمرکز بیشتری میکند تا ربات در دنبالههای طولانی حرکت دچار خطا نشود.
ترکیب این روشها باعث میشود ربات مهارتهایی روان، پایدار و قابل استفاده در موقعیتهای مختلف یاد بگیرد؛ از لیآپهای متعادل گرفته تا گذارهای طبیعی میان دریبل و شوت.
آموزش در مقیاس عظیم
پژوهشگران سیستم خود را روی چهار مهارت پیشرفته آزمایش کردند و همه این مهارتها بر پایه حرکات اولیهای انجام شد که ربات قبلاً یاد گرفته بود؛ هفت مهارت پایهای مانند انواع دریبل، لیآپ، شوت و برداشتن توپ. مدل ربات با استفاده از SkillMimic حدود ۴.۵ میلیارد نمونه شبیهسازیشده تمرین کرده بود تا حرکاتش روان و طبیعی شود.
در مرحله بعد، تنها کنترلر سطح بالا، یعنی بخشی که تصمیم میگیرد کدام مهارت را چه زمانی استفاده کند، آموزش دید و حرکات پایه بدون تغییر باقی ماندند. برای انجام کارهای ساده، مثل حرکات کوتاه یا دریبل، ربات حدود ۰.۴ میلیارد گام آموزشی نیاز داشت، اما برای وظایف پیچیدهتر، مثل زدن گل و امتیازآوری، حدود ۱.۲ میلیارد گام آموزشی صرف شد تا به مهارت کافی برسد.
در آزمایشهای مقایسهای، روشهای قدیمی که یا از صفر آموزش داده شده بودند یا فقط با دادههای اولیه حرکتی کار میکردند، نتوانستند حرکات را بهدرستی یاد بگیرند و اغلب در تعامل با توپ شکست خوردند. حتی روشهایی که هم دادههای حرکات بدن و هم حرکت توپ را در نظر میگرفتند، به دلیل کنترل ضعیف توپ عملکرد خوبی نداشتند.
در مقابل، SkillMimic به ربات اجازه میدهد مهارتهایی قوی و قابل استفاده مجدد برای تعامل با توپ داشته باشد، و به همین دلیل نتایج بسیار بهتری ارائه میکند.
پژوهشگران میگویند هنوز راه زیادی باقی است از آموزش مدل برای کار با انواع اشیا گرفته تا اجرای مهارتها در رباتهای واقعی، شاید حتی در یک بازی کامل بسکتبال. این تازه آغاز ماجراست و رباتها برای زمین بازی واقعی آماده میشوند.





