بيئات تفاعلية بدل البيانات الثابتة
تشير التقارير إلى أن كبرى شركات وادي السيليكون تعوّل بقوة على ما يعرف بالبيئات التفاعلية كآلية رئيسية لتدريب وكلاء الذكاء الاصطناعي. وتأتي هذه الخطوة في ظل إبداء بعض المحللين أن النماذج الحالية مثل ChatGPT أو Comet ما زالت محدودة القدرات في التعامل مع خطوات متعددة داخل التطبيقات البرمجية.
التعريف بالبيئات وتطبيقاتها
تُظهر الدراسات أن هذه البيئات تعمل كمساحات محاكاة رقمية تتيح للوكلاء التعلم عبر التجربة والخطأ، تمامًا كما حدث مع مجموعات البيانات المعلّمة في موجة الذكاء الاصطناعي السابقة. وفي هذه البيئات يمكن محاكاة استخدام متصفح Chrome أو إجراء عمليات شراء عبر الإنترنت لتقييم أداء الوكيل ومنحه مكافأة عند النجاح. لكن بناء هذه المحاكاة أصعب بكثير من إعداد قواعد بيانات ثابتة لأنها تتعامل مع أخطاء غير متوقعة وتطلب تغذية راجعة دقيقة.
صعود شركات ناشئة واستثمارات ضخمة
تشهد الساحة ارتفاعًا في استثمار شركات ناشئة مثل Mechanize وPrime Intellect، إضافة إلى لاعبين كبار في مجال وسم البيانات مثل Mercor وSurge. وتظهر تقارير أن Anthropic تدرس إنفاق أكثر من مليار دولار في هذا المجال خلال عام واحد. ويسعى هؤلاء لأن يكونوا بمثابة “Scale AI جديدة” في ميدان البيئات التفاعلية، على غرار ما حققته Scale AI في عصر تدريب روبوتات المحادثة.
تحديات ومخاطر أمام التوسع
ويواجه الخبراء تحديات ومخاطر أمام التوسع. فقد حذروا من أن هذه البيئات عرضة لظاهرة “التحايل على المكافآت” حيث قد يتعلم الوكيل خداع النظام بدل إنجاز المهمة. كما أن بناء بيئات واسعة وقابلة للتطوير يشكل تحديًا تقنيًا مكلفًا من حيث الحوسبة والموارد. حتى أندريه كارباتي، الداعم لفكرة البيئات التفاعلية، عبّر عن تشككه في أن تقنيات التعلم المعزز وحدها قادرة على دفع التقدم طويل الأمد في الذكاء الاصطناعي.



