مباشر
أين يمكنك متابعتنا

أقسام مهمة

Stories

34 خبر
  • العملية العسكرية الروسية في أوكرانيا
  • فيديوهات
  • خارج الملعب
  • العملية العسكرية الروسية في أوكرانيا

    العملية العسكرية الروسية في أوكرانيا

  • فيديوهات

    فيديوهات

  • خارج الملعب

    خارج الملعب

  • الحرب الإسرائيلية على لبنان

    الحرب الإسرائيلية على لبنان

  • غزة والضفة تحت النيران الإسرائيلية

    غزة والضفة تحت النيران الإسرائيلية

  • صاروخ أوريشنيك

    صاروخ أوريشنيك

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة

استخدم باحثو معهد ماساتشوستس للتكنولوجيا طريقة جديدة "تحاكي فضول الإنسان" لتدريب النماذج اللغوية الذكية على عدم إعطاء ردود "خطيرة" على الأسئلة المثيرة.

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة
صورة تعبيرية / Gettyimages.ru

ويطلق على الطريقة القائمة على التعلم الآلي، اسم "الفريق الأحمر القائم على الفضول" (CRT)، المصمم خصيصا لتوليد أسئلة إشكالية تؤدي إلى استجابات غير مرغوب فيها من روبوتات الدردشة.

وبعد ذلك، يمكن استخدام هذه الأسئلة لتحديد كيفية تصفية المحتوى الخطير من روبوت الدردشة، ما قد يغير قواعد اللعبة لتدريب الذكاء الاصطناعي على عدم إعطاء أجوبة سامة (خطيرة) وغير صالحة للمستخدم.

وعادة، يقوم الخبراء بإنشاء مجموعة من الأسئلة، التي من المحتمل أن تولد استجابات ضارة، عند تدريب نماذج اللغات المعقدة (LLMs)، مثل ChatGPT أو Claude 3 Opus، بهدف تقييد المحتوى الخطير أو الضار.

وأثناء عملية التدريب، يتم استخدام الأسئلة التي تثير محتوى خطيرا، لتدريب النظام على ما يجب تقييده عند طرحه أمام مستخدمين حقيقيين.

وطبّق العلماء التعلم الآلي على CRT ليولد تلقائيا نطاقا أوسع من الأسئلة التي يحتمل أن تكون خطيرة، مقارنة بفرق المشغلين البشريين. وأدى ذلك إلى عدد أكبر من الاستجابات السلبية الأكثر تنوعا.

ثم حفزوا نموذج CRT لتوليد المزيد من الأسئلة المتنوعة، بحيث يمكن أن تثير استجابة سامة من خلال "التعلم الآلي"، ونجح النظام في إثارة استجابة سامة موافقة للأسئلة، ما يمنح القدرة على إضافة التعديلات اللازمة لتقديم الإجابة المناسبة تبعا لجميع خيارات الأسئلة المريبة المحتملة.

وعندما اختبر العلماء طريقة CRT على نموذج LLaMA2 مفتوح المصدر، أنتج نموذج التعلم الآلي 196 سؤالا ينجم عنه محتوى ضار.

وقال الفريق إن النظام تفوق أيضا على أنظمة التدريب الآلية المنافسة.

المصدر: لايف ساينس

التعليقات

بوتين يحيّد القيادة البريطانية بصاروخه الجديد

زاخاروفا تعلق بسخرية على تهديد أمريكي للجنائية الدولية بشأن اعتقال نتنياهو وغالانت

زيلينسكي يشتكي من رد فعل "شركاء أوكرانيا الأعزاء" على ضربة "أوريشنيك"

زيلينسكي يثور غضبا على البرلمان بعد إلغاء اجتماعه إثر ضربة "أورويشنيك"

بعد ضربة "أوريشنيك".. وزير خارجية إيطاليا يطالب أوروبا بالسعي للسلام في أوكرانيا

محلل CNN بعد إطلاق "أوريشنيك" الروسي: "هل مات الردع للتو؟"

لوكاشينكو: العالم على شفير حرب عالمية ثالثة لم يغرق في أتونها بعد

لافروف: زيلينسكي يتهم أسياده بتركه أعزل

مدفيديف: روسيا تدعم قرارات الأمم المتحدة لحل الصراع الفلسطيني الإسرائيلي

ضابط أمريكي: "أوريشنيك" جزء من التهديد النووي وبوتين يريد به ردع واشنطن

كنايسل تنتقد ازدواجية المعايير لدى الغرب تجاه مذكرات الاعتقال الصادرة عن الجنائية الدولية

مدفيديف حول استخدام الأسلحة النووية: لا يوجد أشخاص مجانين في القيادة الروسية

"الغارديان": استخدام روسيا صاروخ "أوريشنيك" تهديد مباشر من بوتين لواشنطن ولندن

سلوفاكيا تعرب عن رفضها استخدام الأسلحة الأمريكية لضرب روسيا وتحذر من تصعيد دولي