تريند 🔥

🤖 AI

OpenAI تطور تقنيات مبتكرة لمساعدة البشر في تدريب الذكاء الاصطناعي بأقل أخطاء بشرية!

منة الله سيد أحمد
منة الله سيد أحمد

3 د

أعلنت شركة OpenAI عن إضافة تحسينات جديدة تهدف إلى تعزيز فعالية مساعدي الذكاء الاصطناعي وجعلهم أكثر موثوقية، حيث تعتمد هذه التحسينات على إضافة المزيد من الذكاء الاصطناعي إلى عملية تدريب النماذج.

طورت OpenAI نموذج CriticGPT لتحسين تقييم الأكواد البرمجية، والذي أثبت قدرته على اكتشاف الأخطاء بشكل أفضل من المدربين البشريين.

تعتزم OpenAI توسيع استخدام التقنية الجديدة لتشمل مجالات أخرى، بهدف تعزيز موثوقية وأداء نماذج الذكاء الاصطناعي في مختلف التطبيقات.

أعلنت شركة OpenAI، المطورة لتقنيات الذكاء الاصطناعي، عن تحسينات جديدة تهدف إلى تعزيز فعالية مساعدي الذكاء الاصطناعي وجعلهم أكثر موثوقية. حيث تعتمد هذه التحسينات على إضافة المزيد من الذكاء الاصطناعي إلى عملية تدريب النماذج، وهي خطوة تهدف إلى مساعدة المدربين البشريين وتجاوز القيود الحالية التي تواجه نظام التعلم المعزز بمشاركة البشر.

إن أحد المكونات الأساسية التي جعلت ChatGPT ناجحًا هو جيش المدربين البشريين الذين قدموا لنموذج الذكاء الاصطناعي تعليمات حول ما يشكل النتائج الجيدة والسيئة. الآن تقول شركة OpenAI إن إضافة المزيد من الذكاء الاصطناعي إلى هذه العملية - لمساعدة المدربين البشريين - يمكن أن تساعد في جعل مساعدي الذكاء الاصطناعي أكثر ذكاءً وموثوقية.

أثناء تطوير ChatGPT، كانت OpenAI رائدة في استخدام تقنية التعلم المعزز بمشاركة البشر (Reinforcement Learning with Human Feedback أو RLHF). حيث تعتمد هذه التقنية على مساهمات المختبرين البشريين لضبط نموذج الذكاء الاصطناعي، بحيث يتم تقييم مخرجاته لتكون أكثر تماسكًا وأقل إثارة للاعتراضات وأكثر دقة. ويتم استخدام التقييمات التي يقدمها المدربون في خوارزمية توجه سلوك النموذج. وقد أثبتت هذه التقنية أهميتها في جعل الروبوتات أكثر موثوقية وفائدة، ومنعها من التصرف بطرق غير لائقة.

ومن جانبه، قال نات مكايلز، الباحث في OpenAI والمشارك في العمل الجديد: "يعمل نظام RLHF بشكل جيد للغاية، لكنه يحتوي على بعض القيود الأساسية". أولاً، يمكن أن تكون ردود فعل البشر متقلبة. ثانيًا، قد يكون من الصعب حتى على البشر المهرة تقييم المخرجات المعقدة للغاية، مثل الأكواد البرمجية المتقدمة. كما يمكن أن يعمل النظام على تحسين نموذج لإنتاج نتائج تبدو مقنعة بدلاً من أن تكون دقيقة.

لذا، طورت OpenAI نموذجًا جديدًا عبر ضبط أقوى نماذجها، GPT-4، لمساعدة المدربين البشريين المكلفين بتقييم الأكواد. وقد وجدت الشركة أن النموذج الجديد، المسمى CriticGPT، يمكنه اكتشاف الأخطاء التي فاتت على البشر. وستبحث OpenAI في تمديد الوصول إلى مجالات أخرى بخلاف الأكواد في المستقبل.

وقال مكايلز: "نحن نبدأ العمل على دمج هذه التقنية في مجموعة مناقشة RLHF الخاصة بنا". لكنه يلاحظ أن النهج ليس مثاليًا، إذ يمكن أن يرتكب CriticGPT  أخطاءً أيضًا من خلال الهلوسة، ولكنه يضيف أن التقنية يمكن أن تساعد في جعل نماذج OpenAI، وكذلك الأدوات مثل ChatGPT، أكثر دقة عبر تقليل أخطاء التدريب البشري.

وأشار إلى أن هذا قد يكون ضروريًا لمساعدة نماذج الذكاء الاصطناعي على أن تصبح أكثر ذكاءً، لأنه يمكن أن يسمح للبشر بمساعدة تدريب نموذج ذكاء اصطناعي يتجاوز قدراتهم الخاصة.

ومن جهته، قال ديلان هادفيلد-مينيل، الأستاذ في معهد ماساتشوستس للتكنولوجيا (MIT) الذي يبحث في طرق تقريب الذكاء الاصطناعي: "إن فكرة مساعدة نماذج الذكاء الاصطناعي في تدريب نماذج أكثر قوة كانت موجودة منذ فترة. هذا تطور طبيعي للغاية".

وأشار هادفيلد-مينيل إلى أن الباحثين الذين طوروا التقنيات المستخدمة في RLHF ناقشوا أفكارًا ذات صلة قبل عدة سنوات. قائلًا إن الأمر لا يزال قيد الاختبار لمعرفة مدى فعاليته وقوته بشكل عام.

ومن الجدير بالذكر أن هذه التقنية الجديدة تُعد واحدة من العديد من التقنيات التي يتم تطويرها الآن لتحسين النماذج اللغوية الكبيرة واستخراج المزيد من القدرات منها. وهي أيضًا جزء من جهد لضمان أن يتصرف الذكاء الاصطناعي بطرق مقبولة حتى مع زيادة قدراته.

ذو صلة

ففي وقت سابق من هذا الشهر، أعلنت شركة Anthropic، المنافسة لـ OpenAI والتي أسسها موظفون سابقون في OpenAI، عن إصدار أكثر قدرة من روبوت الدردشة الخاص بها، المسمى Claude، بفضل تحسينات على نظام تدريب النموذج والبيانات التي يتغذى عليها. وقد روجت Anthropic وOpenAI  مؤخرًا لطرق جديدة لفحص نماذج الذكاء الاصطناعي لفهم كيفية وصولها إلى مخرجاتها لمنع السلوك غير المرغوب فيه مثل الغش.

ويُذكر أيضًا أن التقنية الجديدة يمكن أن تساعدOpenAI  في تدريب نماذج ذكاء اصطناعي أكثر قوة، مما يضمن أن تكون مخرجاتها أكثر موثوقية وتتماشى مع القيم الإنسانية، خاصة إذا نجحت الشركة في تطبيقها في مجالات أكثر من الأكواد.

أحلى ماعندنا ، واصل لعندك! سجل بنشرة أراجيك البريدية

بالنقر على زر “التسجيل”، فإنك توافق شروط الخدمة وسياسية الخصوصية وتلقي رسائل بريدية من أراجيك

عبَّر عن رأيك

إحرص أن يكون تعليقك موضوعيّاً ومفيداً، حافظ على سُمعتكَ الرقميَّةواحترم الكاتب والأعضاء والقُرّاء.

ذو صلة