إطار العمل في جمع بيانات التدريب
تتعاون OpenAI مع شركة هانداشِيك إيه آي المتخصصة في بيانات التدريب، وتطلب من متعاقدين خارجيين تحميل نماذج من أعمالهم السابقة كجزء من مساعيها لتجميع بيانات تدريب عالية الجودة لتطوير نماذج الذكاء الاصطناعي.
وتندرج هذه الخطوة ضمن استراتيجية أوسع يعتمدها قطاع الذكاء الاصطناعي حاليًا على إشراك مقاولين لإنتاج بيانات تدريب تعكس طبيعة العمل الفعلي، بهدف تمكين النماذج مستقبلًا من أتمتة مزيد من المهام المكتبية والمهنية.
وتوضح وثائق عرض قدمتها OpenAI أن المطلوب من المتعاقدين ليس مجرد وصف عام للمهام، بل رفع أمثلة من مخرجات عملهم الواقعية التي أنجزوها فعلاً، مثل مستندات وورد وملفات PDF وعروض باوربوينت وجداول إكسل وصور ومخازن برمجية.
وتؤكد الشركة ضرورة حذف أي بيانات شخصية أو معلومات محمية قبل رفع الملفات، كما يتم توجيه المتعاقدين لاستخدام أداة داخل تشات جي بي تي تعرف باسم “Superstar Scrubbing” لتنقية المحتوى من أي معلومات حساسة.
ورغم هذه الاحتياطات، حذر محامي الملكية الفكرية إيفان براون من أن هذه الممارسة تحمل مخاطر كبيرة، معتبرًا أنها تضع الشركة في موقف شديد الحساسية وتستلزم قدرًا عاليًا من الثقة في المتعاقدين لتحديد ما هو سري وما هو غير سري.



