مباشر
أين يمكنك متابعتنا

أقسام مهمة

Stories

46 خبر
  • نبض الملاعب
  • هدنة وحصار المضيق
  • إسرائيل تواصل غاراتها على لبنان
  • نبض الملاعب

    نبض الملاعب

  • هدنة وحصار المضيق

    هدنة وحصار المضيق

  • إسرائيل تواصل غاراتها على لبنان

    إسرائيل تواصل غاراتها على لبنان

  • العملية العسكرية الروسية في أوكرانيا

    العملية العسكرية الروسية في أوكرانيا

  • فيديوهات

    فيديوهات

  • بالفيديو.. كريستيانو رونالدو يتفاعل مع بنزيما في الحرم المكي (صورة)

    بالفيديو.. كريستيانو رونالدو يتفاعل مع بنزيما في الحرم المكي (صورة)

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة

استخدم باحثو معهد ماساتشوستس للتكنولوجيا طريقة جديدة "تحاكي فضول الإنسان" لتدريب النماذج اللغوية الذكية على عدم إعطاء ردود "خطيرة" على الأسئلة المثيرة.

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة
صورة تعبيرية / Gettyimages.ru

ويطلق على الطريقة القائمة على التعلم الآلي، اسم "الفريق الأحمر القائم على الفضول" (CRT)، المصمم خصيصا لتوليد أسئلة إشكالية تؤدي إلى استجابات غير مرغوب فيها من روبوتات الدردشة.

وبعد ذلك، يمكن استخدام هذه الأسئلة لتحديد كيفية تصفية المحتوى الخطير من روبوت الدردشة، ما قد يغير قواعد اللعبة لتدريب الذكاء الاصطناعي على عدم إعطاء أجوبة سامة (خطيرة) وغير صالحة للمستخدم.

وعادة، يقوم الخبراء بإنشاء مجموعة من الأسئلة، التي من المحتمل أن تولد استجابات ضارة، عند تدريب نماذج اللغات المعقدة (LLMs)، مثل ChatGPT أو Claude 3 Opus، بهدف تقييد المحتوى الخطير أو الضار.

وأثناء عملية التدريب، يتم استخدام الأسئلة التي تثير محتوى خطيرا، لتدريب النظام على ما يجب تقييده عند طرحه أمام مستخدمين حقيقيين.

وطبّق العلماء التعلم الآلي على CRT ليولد تلقائيا نطاقا أوسع من الأسئلة التي يحتمل أن تكون خطيرة، مقارنة بفرق المشغلين البشريين. وأدى ذلك إلى عدد أكبر من الاستجابات السلبية الأكثر تنوعا.

ثم حفزوا نموذج CRT لتوليد المزيد من الأسئلة المتنوعة، بحيث يمكن أن تثير استجابة سامة من خلال "التعلم الآلي"، ونجح النظام في إثارة استجابة سامة موافقة للأسئلة، ما يمنح القدرة على إضافة التعديلات اللازمة لتقديم الإجابة المناسبة تبعا لجميع خيارات الأسئلة المريبة المحتملة.

وعندما اختبر العلماء طريقة CRT على نموذج LLaMA2 مفتوح المصدر، أنتج نموذج التعلم الآلي 196 سؤالا ينجم عنه محتوى ضار.

وقال الفريق إن النظام تفوق أيضا على أنظمة التدريب الآلية المنافسة.

المصدر: لايف ساينس

التعليقات

إيران تتهم دول الخليج والأردن بالمشاركة في الحرب الأمريكية عليها

مسؤولو الجيش والاستخبارات الأمريكية يلغون إجازاتهم وسط استعداد لاحتمال استئناف الحرب على إيران 

القناة 12 العبرية: تحسّب لتصعيد إيراني وحالة التأهب "قصوى"

حادث خطير يشعل الحدود.. إسرائيليون يتسللون إلى لبنان لالتقاط الصور والجيش يعتقلهم فورا

ترامب يجري بعد قليل اتصالا جماعيا مع قادة عرب لبحث المفاوضات مع إيران

سوريا.. القبض على ضابط رفيع في عهد الأسد

بوتين يعقد اجتماعا لمجلس الأمن الروسي لبحث الهجوم الأوكراني الإرهابي على لوغانسك

نيبينزيا حول مواقف أوروبية بشأن مجزرة لوغانسك: مقززة ويؤسفني أن أكتشف لؤمكم البغيض.. نشعر بالخذلان

"بلومبيرغ": إيران دمرت 20% من أخطر مسيرات واشنطن

لبنان لحظة بلحظة.. خسائر متبادلة جراء التصعيد و"حزب الله" يتمسك بسلاحه لمنع تثبيت الاحتلال

الجيش الإيراني: مستعدون للتضحية.. العالم سيشهد قريبا الخلاص من شر الولايات المتحدة والكيان الصهيوني

الدفاع الإيرانية: عدم الامتثال لمطالب شعبنا سيكبد ترامب وإسرائيل خسائر أكبر

رسالة غامضة جديدة.. ترامب "يغطي" إيران بالعلم الأمريكي (صورة)

حصيلة ضخمة لسفن إيرانية اعترضتها قوات "سنتكوم" الأمريكية

الخارجية الإيرانية: الاتفاق مع الولايات المتحدة ليس وشيكا الخلافات عميقة وكثيرة

ترامب: إيران تتوسل اتفاقا جديدا بعد أن وجهنا لها ضربات قاسية.. لم يكن هناك خيار آخر

سلطات لوغانسك: فرق الإنقاذ تواصل انتشال الأطفال من تحت الركام في موقع الهجوم الأوكراني بستاروبيلسك

السلام في الشرق الأوسط يسابق الزمن.. منير يغادر طهران بعد ثاني لقاء مع عراقجي في 24 ساعة

"أكسيوس": ترامب يدرس بجدية شن ضربات على إيران مجددا

السفارة الأمريكية في سوريا تحدد قطاعات واعدة للاستثمار بعد فتح الباب أمام الشركات الأمريكية

لحظة بلحظة.. الحرب مستمرة بين إسرائيل و"حزب الله" وعقوبات أمريكية على مسؤولين لبنانيين بينهم عسكريون

سوريا.. إلزام أئمة المساجد بـ"ميثاق الوسطية" ونبذ النعرات المذهبية