نجح فريق من العلماء في إمبريال كوليدج لندن في تدريب ذراع روبوتية لتنفيذ 1000 مهمة مختلفة خلال يوم واحد فقط، بعد أن لم تتجاوز فترة تدريبه ثماني ساعات، وهو إنجاز يعتمد على أسلوب تعلّم جديد يُعرف بـ MT3 (Multi-Task Trajectory Transfer)، وهو نظام تعلّم بالمحاكاة يسمح للروبوت باكتساب مهارات معقّدة انطلاقًا من عرض واحد لكل مهمة.
الذراع الروبوتية المستخدمة في التجربة، وهي من طراز ساوير، تمكنت من أداء مهام متعددة شملت استخدام الأدوات، والتقاط ورفع أكثر من جسم في آن واحد، والتعامل مع أوضاع مختلفة للأجسام، دون الحاجة إلى إعادة تدريب موسّعة أو الاعتماد على قواعد بيانات ضخمة.
تعلّم من عرض واحد فقط
على عكس أساليب التعلّم التقليدية في الروبوتات التي تتطلب آلاف أو ملايين الأمثلة، يعتمد MT3 على مبدأ التعلّم بالمحاكاة من عرض واحد فقط. يشاهد الروبوت إنسانًا يؤدي المهمة مرة واحدة ثم يحلل الحركة ويقسّمها إلى مراحل يمكن إعادة استخدامها وتكييفها مع مهام أو أجسام جديدة، ما يقلل الزمن والموارد اللازمة لتدريب الروبوتات ويفتح باب استخدامها في بيئات واقعية متغيرة مثل المصانع والمستودعات وحتى المنازل.
تقسيم ذكي للحركة وفهم للسياق
وفقًا لتقرير، يعتمد MT3 على فصل كل مهمة إلى مرحلتين: المحاذاة والتفاعل. كما يستخدم آلية استرجاع ذكي للذاكرة تسمح باختيار أقرب عرض تدريبي سابق يتناسب مع المهمة الجديدة بناءً على وصف المهمة وبيئة الروبوت. هذه القدرة على اختيار الخبرة المناسبة تمنح الروبوت مرونة عالية في التكيف مع مواقف جديدة دون الوقوع في أخطاء سلوكية.
سلوك أكثر قابلية للفهم والثقة
لا يعتمد MT3 على نماذج التعلم العميق “الصندوق الأسود” كما هو شائع، وإنما يوفر سلوكًا واضحًا وقابلًا للتفسير، ما يجعل تصرفات الروبوت أكثر موثوقية للبشر. وتؤكد النتائج أن قابلية التفسير تمثل عنصرًا حاسمًا في اعتماد الروبوتات في بيئات حساسة مثل الرعاية الصحية أو خطوط الإنتاج، حيث لا مكان للأخطاء غير المتوقعة.
كفاءة عالية وتكيّف مع الأجسام المختلفة
أظهرت التجارب أن الذراع الروبوتية استطاعت تعلم مهام جديدة بسرعة كبيرة عبر التكيّف الحركي باستخدام تقدير الوضعية والتخطيط الحركي، وهو ما مكنها من أداء عمليات التقاط ونقل مختلفة بدقة حتى عند تغيير شكل أو موضع الأجسام. هذه القدرة على التعميم ضمن فئة واحدة من المهام تجعل MT3 متفوقًا على أساليب مثل Behavioral Cloning التي تفشل عند اختلاف بيئة أو أداة. ويتطلع الباحثون إلى تحسينات إضافية تسمح للروبوت بتعديل مساراته في مواجهة أشياء غير مألوفة، ما يقلل أوقات التدريب وتكاليفه ويدفع لاستخدامات أكثر مرونة وكفاءة في الواقع.



