تبرز حركة الشفاه المتزامنة مع الكلمات كأبرز عناصر الواقعية في الروبوتات فائقة الشبه بالبشر، فلا يكتفي الروبوت الجديد بمحاكاة هذه الحركة بل يمتلك القدرة على تدريب نفسه للتحدث بطريقة تحاكي البشر، عبر تقنيات تعلم متقدمة تركّز على الربط بين الصوت والحركة.
تصميم روبوت EMO
طور الطالب الدكتوراه في علم الروبوتات يوهانغ هو، بالتعاون مع البروفيسور هود ليبسون وفريق من جامعة كولومبيا، روبوت EMO، وهو رأس روبوتي مزود بـ26 محركاً صغيراً أسفل جلد مرن من السيليكون.
تعمل هذه المحركات بتوليفات مختلفة لإنتاج تعابير وجه متعددة، بما في ذلك أشكال متنوعة لحركة الشفاه، بحسب ما أُشير إليه.
التعلم عبر المراقبة والتجربة
بدأ الباحثون بتدريب الروبوت عبر وضعه أمام مرآة، فراقب نفسه وهو يؤدي آلاف التعابير الوجهية، ما مكنه من فهم العلاقة بين تنشيط المحركات والحركات الناتجة من خلال نموذج تعلم يعرف باسم من الرؤية إلى الفعل VLA.
لاحقاً شاهد الروبوت ساعات طويلة من مقاطع فيديو لأشخاص يتحدثون ويغنون ليتعلم حركات الفم المرتبطة بالأصوات المختلفة.
آفاق التطوير والتفاعل
تواجه التقنية صعوبات في نطق بعض الأصوات مثل ب و و، لكنها ستتحسن مع مزيد من التدريب.
يؤكد يوهانغ هو أن دمج مزامنة حركة الشفاه مع أنظمة ذكاء اصطناعي تفاعلية مثل شات جي بي تي وجيمينا قد يعزز التفاعل بين الروبوت والإنسان، ويجعل التعابير الوجهية أكثر دقة وحساسية لسياق المحادثة.



