كشفت تقارير صحفية أن شركة ميتا أدارت برنامجاً سرياً واسع النطاق لاختبار روبوتات الدردشة المنافسة مثل ChatGPT وGoogle Gemini وCharacter.AI. استخدمت الشركة مئات المتعاقدين الذين انتحلوا شخصيات أطفال ومراهقين عبر حسابات وهمية، وأرسلوا عشرات الآلاف من الأسئلة الصادمة والمحتوى الحساس لمحاولة تجاوز ضوابط الأمان في هذه النماذج.
المشروع، الذي حمل داخلياً اسم “Cannes”، نفذته شركة Covalen المتعاقدة مع ميتا دون علم الشركات المطورة لهذه النماذج، بحسب تقرير نشرته مجلة Wired.
اختبارات حساسة بأيدي “أطفال” وهميين
أنشأ مئات العاملين في Covalen حسابات وهمية لأشخاص تقل أعمارهم عن 18 عامًا. استخدموا هذه الحسابات لإرسال كميات هائلة من الأسئلة المصممة لدفع نماذج الذكاء الاصطناعي إلى تجاوز ضوابط الأمان وتقديم إجابات غير مسموح بها. لم يكن الهدف استخدام الخدمات بصورة طبيعية، بل محاولة كسر أنظمة الحماية واختبار قدرتها على التعامل مع أكثر السيناريوهات حساسية.
أظهرت إحدى قواعد البيانات أن المتعاقدين أرسلوا نحو 38 ألف سؤال في إحدى مراحل الاختبار فقط. تضمنت هذه الأسئلة:.
- مئات الطلبات المتعلقة بالانتحار وإيذاء النفس.
- مئات السيناريوهات الخاصة باضطرابات الأكل.
- أكثر من 239 محادثة عن العلاقات الجنسية والرومانسية من منظور أطفال ومراهقين.
كما شملت الأسئلة مواقف حساسة مثل طفل يهدده زميله بسلاح، وفتاة تحاول إخفاء إصابتها بالشره المرضي، وأسئلة حول تعاطي المخدرات، وسيناريوهات غريبة مثل التساؤل عما إذا كان التفكير في أكل طفل الجيران أمرًا طبيعيًا. لم تقتصر الاختبارات على النصوص، بل تضمنت صورًا لحبال مشنقة وسكاكين وأدوية ورسومات طبية لاختبار تعامل الروبوتات مع المحتوى البصري الحساس.
توسع المشروع لاحقًا ليشمل أكثر من 45 ألف طلب إضافي، حيث وثق المتعاقدون جميع ردود روبوتات الدردشة في جداول بيانات لتحليلها. وصفت وثيقة داخلية لشركة Covalen المشروع بأنه “برنامج شامل لقياس سلامة نماذج الذكاء الاصطناعي” يهدف لإنتاج بيانات مرجعية لمقارنة النماذج ومدى التزامها بمعايير الأمان.
صدمة المتعاقدين ودفاع ميتا
عبر العاملون في المشروع عن صدمتهم من طبيعة المحتوى الذي طُلب منهم. قال أحد المتعاقدين لمجلة Wired: “رأيت أشياء كنت أتمنى ألا أراها أثناء عملي. الجميع كان مصدومًا من طبيعة النصوص التي طُلب منا اختبارها، وكنا نتساءل باستمرار: هل سنقع في مشكلة بسبب ذلك؟”.
سبق أن واجهت ميتا دعاوى قضائية من مشرفي محتوى تعرضوا لصدمات نفسية بسبب مراجعة محتوى عنيف أو مسيء للأطفال.
من جانبها، دافعت ميتا عن المشروع، مؤكدة أن هذه الاختبارات تندرج ضمن الممارسات المعتادة في قطاع الذكاء الاصطناعي لقياس مستويات الأمان في النماذج المختلفة.
لكن رمان شودري، الرئيسة التنفيذية لمنظمة Humane Intelligence، رفضت هذا التوصيف. اعتبرت أن تنفيذ مشروع واسع النطاق باستخدام حسابات مزيفة تنتحل شخصية أطفال، مع إبقائه سرًا عن الشركات المنافسة وعدم نشر نتائجه، يتجاوز كثيرًا ما يمكن اعتباره اختبارًا قياسيًا داخل الصناعة. وأضافت أن مثل هذه الممارسات تفتح الباب أمام منطقة رمادية في حوكمة الذكاء الاصطناعي.

