مباشر
أين يمكنك متابعتنا

أقسام مهمة

Stories

25 خبر
  • العملية العسكرية الروسية في أوكرانيا
  • كأس أمم إفريقيا 2025
  • جنوب اليمن.. تصعيد عسكري وسياسي
  • العملية العسكرية الروسية في أوكرانيا

    العملية العسكرية الروسية في أوكرانيا

  • كأس أمم إفريقيا 2025

    كأس أمم إفريقيا 2025

  • جنوب اليمن.. تصعيد عسكري وسياسي

    جنوب اليمن.. تصعيد عسكري وسياسي

  • واشنطن تعتقل مادورو

    واشنطن تعتقل مادورو

  • 90 دقيقة

    90 دقيقة

  • فيديوهات

    فيديوهات

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة

استخدم باحثو معهد ماساتشوستس للتكنولوجيا طريقة جديدة "تحاكي فضول الإنسان" لتدريب النماذج اللغوية الذكية على عدم إعطاء ردود "خطيرة" على الأسئلة المثيرة.

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة
صورة تعبيرية / Gettyimages.ru

ويطلق على الطريقة القائمة على التعلم الآلي، اسم "الفريق الأحمر القائم على الفضول" (CRT)، المصمم خصيصا لتوليد أسئلة إشكالية تؤدي إلى استجابات غير مرغوب فيها من روبوتات الدردشة.

وبعد ذلك، يمكن استخدام هذه الأسئلة لتحديد كيفية تصفية المحتوى الخطير من روبوت الدردشة، ما قد يغير قواعد اللعبة لتدريب الذكاء الاصطناعي على عدم إعطاء أجوبة سامة (خطيرة) وغير صالحة للمستخدم.

وعادة، يقوم الخبراء بإنشاء مجموعة من الأسئلة، التي من المحتمل أن تولد استجابات ضارة، عند تدريب نماذج اللغات المعقدة (LLMs)، مثل ChatGPT أو Claude 3 Opus، بهدف تقييد المحتوى الخطير أو الضار.

وأثناء عملية التدريب، يتم استخدام الأسئلة التي تثير محتوى خطيرا، لتدريب النظام على ما يجب تقييده عند طرحه أمام مستخدمين حقيقيين.

وطبّق العلماء التعلم الآلي على CRT ليولد تلقائيا نطاقا أوسع من الأسئلة التي يحتمل أن تكون خطيرة، مقارنة بفرق المشغلين البشريين. وأدى ذلك إلى عدد أكبر من الاستجابات السلبية الأكثر تنوعا.

ثم حفزوا نموذج CRT لتوليد المزيد من الأسئلة المتنوعة، بحيث يمكن أن تثير استجابة سامة من خلال "التعلم الآلي"، ونجح النظام في إثارة استجابة سامة موافقة للأسئلة، ما يمنح القدرة على إضافة التعديلات اللازمة لتقديم الإجابة المناسبة تبعا لجميع خيارات الأسئلة المريبة المحتملة.

وعندما اختبر العلماء طريقة CRT على نموذج LLaMA2 مفتوح المصدر، أنتج نموذج التعلم الآلي 196 سؤالا ينجم عنه محتوى ضار.

وقال الفريق إن النظام تفوق أيضا على أنظمة التدريب الآلية المنافسة.

المصدر: لايف ساينس

التعليقات

اختر "الشخصية القيادية العربية الأكثر تأثيرا عام 2025"!

اختر "الشخصية القيادية العربية الأكثر تأثيرا عام 2025"!

موسكو: ضرب مواقع حيوية أوكرانية باستخدام صاروخ "أوريشنيك" ردا على هجوم كييف على مقر إقامة بوتين

سوريا.. دبابة تابعة للقوات الحكومية تدهس صحفيا أثناء بث مباشر (فيديو)

"قناة 13" العبرية: البحرية الإسرائيلية أطلقت النار على سفينة حربية مصرية دخلت المياه الإقليمية لغزة

الدفاع السورية: تدمير "الموقع 12" لـ"قسد" والعمال الكردستاني في حي الشيخ مقصود بمدينة حلب (فيديو)

رئيسة الدبلوماسية الأوروبية تتحدث عن رسائل للغرب حملتها الضربة الروسية الكبيرة بـ"أوريشنيك"

ماكرون يوجه اتهامات للولايات المتحدة ويتحدث عن "لعبة غريبة" وقع الفرنسيون والأوروبيون ضحية لها

الجيش السوري يعلن بدء عملية تمشيط حي الشيخ مقصود بحلب لطرد "قسد"

مظلوم عبدي: الاستمرار في نهج القتال ولغة الحرب لفرض حلول أحادية الجانب أمر غير مقبول

اليمن.. حل المجلس الانتقالي من الرياض وقيادات عدن ترفض البيان

الولايات المتحدة تستولي على ناقلة نفط أخرى في الكاريبي والجيش الأمريكي يصدر بيانا (فيديو)

الجيش السوري يعلن حي الشيخ مقصود منطقة عسكرية مغلقة

الجيش السوري يحذر أهالي حي الشيخ مقصود من مفخخات "قسد" و"العمال الكردستاني" (صور)