مباشر
أين يمكنك متابعتنا

أقسام مهمة

Stories

87 خبر
  • تبادل الضربات بين إسرائيل وإيران
  • اتفاق وقف إطلاق النار بين إسرائيل ولبنان
  • كأس العالم لكرة القدم
  • تبادل الضربات بين إسرائيل وإيران

    تبادل الضربات بين إسرائيل وإيران

  • اتفاق وقف إطلاق النار بين إسرائيل ولبنان

    اتفاق وقف إطلاق النار بين إسرائيل ولبنان

  • كأس العالم لكرة القدم

    كأس العالم لكرة القدم

  • هدنة وحصار المضيق

    هدنة وحصار المضيق

  • فيديوهات

    فيديوهات

  • العملية العسكرية الروسية في أوكرانيا

    العملية العسكرية الروسية في أوكرانيا

  • فنان أمريكي يقاضي "فيفا" ويطالب بـ25 مليون دولار

    فنان أمريكي يقاضي "فيفا" ويطالب بـ25 مليون دولار

  • نائب أوروبي يطالب بحرمان دول البلطيق من حماية "الناتو" جراء استفزازاتها ضد روسيا

    نائب أوروبي يطالب بحرمان دول البلطيق من حماية "الناتو" جراء استفزازاتها ضد روسيا

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة

استخدم باحثو معهد ماساتشوستس للتكنولوجيا طريقة جديدة "تحاكي فضول الإنسان" لتدريب النماذج اللغوية الذكية على عدم إعطاء ردود "خطيرة" على الأسئلة المثيرة.

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة
صورة تعبيرية / Gettyimages.ru

ويطلق على الطريقة القائمة على التعلم الآلي، اسم "الفريق الأحمر القائم على الفضول" (CRT)، المصمم خصيصا لتوليد أسئلة إشكالية تؤدي إلى استجابات غير مرغوب فيها من روبوتات الدردشة.

وبعد ذلك، يمكن استخدام هذه الأسئلة لتحديد كيفية تصفية المحتوى الخطير من روبوت الدردشة، ما قد يغير قواعد اللعبة لتدريب الذكاء الاصطناعي على عدم إعطاء أجوبة سامة (خطيرة) وغير صالحة للمستخدم.

وعادة، يقوم الخبراء بإنشاء مجموعة من الأسئلة، التي من المحتمل أن تولد استجابات ضارة، عند تدريب نماذج اللغات المعقدة (LLMs)، مثل ChatGPT أو Claude 3 Opus، بهدف تقييد المحتوى الخطير أو الضار.

وأثناء عملية التدريب، يتم استخدام الأسئلة التي تثير محتوى خطيرا، لتدريب النظام على ما يجب تقييده عند طرحه أمام مستخدمين حقيقيين.

وطبّق العلماء التعلم الآلي على CRT ليولد تلقائيا نطاقا أوسع من الأسئلة التي يحتمل أن تكون خطيرة، مقارنة بفرق المشغلين البشريين. وأدى ذلك إلى عدد أكبر من الاستجابات السلبية الأكثر تنوعا.

ثم حفزوا نموذج CRT لتوليد المزيد من الأسئلة المتنوعة، بحيث يمكن أن تثير استجابة سامة من خلال "التعلم الآلي"، ونجح النظام في إثارة استجابة سامة موافقة للأسئلة، ما يمنح القدرة على إضافة التعديلات اللازمة لتقديم الإجابة المناسبة تبعا لجميع خيارات الأسئلة المريبة المحتملة.

وعندما اختبر العلماء طريقة CRT على نموذج LLaMA2 مفتوح المصدر، أنتج نموذج التعلم الآلي 196 سؤالا ينجم عنه محتوى ضار.

وقال الفريق إن النظام تفوق أيضا على أنظمة التدريب الآلية المنافسة.

المصدر: لايف ساينس

التعليقات

"الأمن القومي" بالبرلمان الإيراني: سنرد على استهداف الضاحية.. ترقبوا سماء الأراضي المحتلة الليلة

ترامب يكشف تفاصيل الاتفاق المرتقب مع إيران و"مصير" مجتبى خامنئي

مخاوف إسرائيلية من صفقات عسكرية مصرية تركية قد تغير موازين القوى في المتوسط

بأوامر من نتنياهو وكاتس.. دمار كبير جراء استهداف الضاحية الجنوبية لبيروت (فيديوهات)

بعد الهجوم الإيراني نتنياهو أمام أخطر اختبار: رد قاس أو ثمن سياسي باهظ

"خاتم الأنبياء" يتوعد إسرائيل: ردنا سيكون مدمرا في حال قصفتم إيران.. سنوجه ضربة ساحقة لتل أبيب

نتنياهو يعقد اجتماعا عاجلا لبحث تهديد إيران بضرب إسرائيل الليلة

غضب إسرائيلي متصاعد: الليلة إيران أنهت دور إسرائيل في المنطقة وحولتها لـ"ملطشة" الشرق الأوسط

لبنان لحظة بلحظة.. وقف إطلاق نار شكلي بين "الحزب" وإسرائيل وضحايا بينهم ضباط لبنانيون

المنفذ السعودي.. حلول خليجية لإدارة أزمات المضائق في ظل مشكلة هرمز

"نيويورك تايمز": إسرائيل تتنصت على كبير مفاوضي ترامب ومسؤولين في البنتاغون

ضوء أخضر أمريكي.. تناقض في إسرائيل حول "الهدف الثمين" في الضاحية الجنوبية لبيروت (فيديو)

إسرائيل تترقب ردا إيرانيا وشيكا وتستعد لهجوم صاروخي محتمل واسع على تل أبيب خلال ساعات

الحرس الثوري: العدو الصهيوني استهداف مواقع داخل إيران بصواريخ باليستية جوية

السعودية.. سماع دوي انفجارات وبيان عاجل من منصة الإنذار المبكر في حالات الطوارئ

مسؤول أمريكي يكشف تفاصيل مكالمة ترامب مع نتنياهو

إصابة 4 جنود إسرائيليين استهدفتهم مسيرة في جنوب لبنان

قاليباف: القواعد والمصالح الأمريكية والإسرائيلية في المنطقة أهداف مشروعة لنا وقواتنا يدها طليقة للرد

عراقجي يبحث مع نظرائه في فرنسا وبريطانيا وتركيا وقائد الجيش الباكستاني قصف إيران لإسرائيل

الجيش الإسرائيلي يعلن تنفيذ غارات على أهداف عسكرية في غرب ووسط إيران