روبوت EMO والتقارب بين الحركة والصوت
يظهر روبوت EMO، رأس روبوتي مزود بـ 26 محركاً صغيراً أسفل جلد مرن من السيليكون، كنتاج تعاون بين طالب الدكتوراه يوهانغ هو والبروفيسور هود ليبسون وفريق من جامعة كولومبيا.
تعمل المحركات بتوليفات مختلفة لإنتاج تعابير وجهية متعددة، وتتيح حركة شفاه تتنوع بحسب الكلام والمشاعر في سياق الحديث.
التعلم عبر المراقبة والتجربة
بدأ الباحثون بتدريب الروبوت بوضعه أمام مرآة لمراقبة تعابيره وهو يجري آلاف الحركات، واعتمدوا نموذجاً تعلمياً يسمى من الرؤية إلى الفعل VLA لفهم العلاقة بين تنشيط المحركات والحركات الناتجة.
لاحقاً شاهد الروبوت ساعات من مقاطع الفيديو لأشخاص يتحدثون ويغنون ليتعلم حركات الفم المرتبطة بالأصوات المختلفة.
آفاق التطوير والتفاعل
رغم أن التقنية ما تزال تواجه صعوبات في نطق بعض الأصوات مثل ب و و، يتوقع الباحثون تحسن الأداء مع مزيد من التدريب.
يوضح هو أن دمج مزامنة حركة الشفاه مع أنظمة ذكاء اصطناعي تفاعلية مثل شات جي بي تي وجيميناى يمكن أن يعزز تفاعل الروبوت مع الإنسان ويجعل التعابير الوجهية أكثر دقة وحساسية لسياق المحادثة.



