تريند 🔥

🤖 AI

جامعة طوكيو تطور روبوت Alter3 البشري لتحويل الأوامر اللغوية إلى أفعال روبوتية!

منة الله سيد أحمد
منة الله سيد أحمد

3 د

طور باحثون في جامعة طوكيو وشركة ألترنيتيف ماشين روبوتًا بشريًا يدعى ألتر3، يمكنه تحويل الأوامر باللغة الطبيعية إلى إجراءات روبوتية باستخدام نموذج GPT-4.

يستخدم ألتر3 إطارًا وكيلًا لتخطيط وتنفيذ الإجراءات المطلوبة، مع إمكانية تلقي وتصحيح الملاحظات البشرية لتحسين الأداء، مما يمكّنه من أداء مهام معقدة وتعلم سلوكيات جديدة.

تُظهر الأبحاث المتقدمة في مجال الروبوتات والنماذج الأساسية، مثل ألتر3، تقدمًا ملحوظًا في تحسين قدرة الروبوتات على تنفيذ المهام البشرية وتخطيط الإجراءات بدقة، مع التأكيد على أهمية البيانات والتحديات الأساسية في تطوير الروبوتات.

طور باحثون في جامعة طوكيو وشركة ألترنيتيف ماشين (Alternative Machine) نظام روبوت بشري يمكنه تحويل الأوامر باللغة الطبيعية مباشرة إلى إجراءات روبوتية. وقد أطلق على الروبوت اسم ألتر3 (Alter3)، وصُمم للاستفادة من المعرفة الواسعة التي تحتويها النماذج اللغوية الكبيرة مثل GPT-4  لتنفيذ مهام معقدة مثل التقاط صورة سيلفي أو التظاهر بأنه شبح.

يعد هذا الإنجاز الأحدث في سلسلة من الأبحاث التي تجمع بين قوة النماذج الأساسية (foundation models) وأنظمة الروبوتات. ورغم أن هذه الأنظمة لم تصل بعد إلى حلول تجارية قابلة للتوسيع، إلا أنها دفعت الأبحاث في مجال الروبوتات إلى الأمام في السنوات الأخيرة وأظهرت الكثير من الأمل.

فيديو يوتيوب

ويعتمد ألتر3 على نموذج GPT-4 كخلفية. حيث يستقبل النموذج تعليمات باللغة الطبيعية تصف إما إجراءً معينًا أو موقفًا يجب على الروبوت الاستجابة له. ثم يتم تخطيط سلسلة من الإجراءات التي يجب على الروبوت اتخاذها لتحقيق هدفه. في المرحلة الأولى، يعمل النموذج كمخطط يحدد الخطوات المطلوبة لتنفيذ الإجراء المطلوب.


بعد ذلك، يتم تمرير خطة العمل إلى وكيل البرمجة الذي يولد الأوامر اللازمة للروبوت لتنفيذ كل خطوة. ونظرًا لأن GPT-4 لم يُدرَّب على أوامر برمجة ألتر3، يستخدم الباحثون قدرته على التعلم في السياق (in-context learning) للتكيف مع واجهة برمجة التطبيقات (API) الخاصة بالروبوت. بعد ذلك، يربط النموذج كل خطوة بواحد أو أكثر من أوامر API التي يتم إرسالها لتنفيذ الروبوت.

وقد اختبر الباحثون ألتر3 على عدة مهام مختلفة، بما في ذلك الأعمال اليومية مثل التقاط صورة سيلفي وشرب الشاي وكذلك حركات التقليد مثل التظاهر بأنه شبح أو ثعبان. كما اختبروا قدرة النموذج على الاستجابة للمواقف التي تتطلب تخطيطًا معقدًا للإجراءات.

تغطي تدريب النماذج اللغوية الكبيرة مجموعة واسعة من التمثيلات اللغوية للحركات. حيث يمكن لـ GPT-4 مطابقة هذه التمثيلات بدقة مع جسم ألتر3، مما يجعله قادرًا على تنفيذ خطط سلوكية أكثر واقعية للروبوتات البشرية مثل ألتر3. وقد أظهرت تجارب الباحثين أنهم كانوا قادرين أيضًا على تقليد مشاعر مثل الإحراج والفرح في الروبوت.

كتب الباحثون: "وحتى من النصوص التي لا تعبر عن المشاعر بشكل صريح، يمكن للنموذج اللغوي الكبير استنتاج المشاعر المناسبة وعكسها في ردود الفعل الجسدية لألتر3".

ومن الجدير بالذكر أن شعبية استخدام النماذج الأساسية في أبحاث الروبوتات تزداد. فعلى سبيل المثال، تستخدم شركة فيغر (Figure)، التي تقدر قيمتها بـ2.6 مليار دولار، نماذج OpenAI لفهم تعليمات البشر وتنفيذها في العالم الحقيقي. ومع انتشار التعددية في النماذج الأساسية، ستصبح أنظمة الروبوتات مجهزة بشكل أفضل للتفكير في بيئاتها واختيار إجراءاتها.

ذو صلة

وتجدر الإشارة إلى أن ألتر3 ينتمي إلى فئة من المشاريع التي تستخدم النماذج الأساسية الجاهزة كأنظمة تفكير وتخطيط في أنظمة التحكم في الروبوتات. ولا يستخدم ألتر3 نسخة محسنة من GPT-4، كما يشير الباحثون إلى أن الكود يمكن استخدامه لروبوتات بشرية أخرى. بينما تستخدم مشاريع أخرى مثل RT-2-X  وOpenVLA   نماذج أساسية خاصة تم تصميمها لإنتاج أوامر روبوتية مباشرة. حيث تميل هذه النماذج إلى إنتاج نتائج أكثر استقرارًا وتعميمًا على مهام وبيئات أكثر، لكنها تتطلب أيضًا مهارات تقنية وتكون أكثر تكلفة في الإنشاء.

ويُذكر أيضًا أن أحد الأمور التي غالبًا ما يتم التغاضي عنها في هذه المشاريع هي التحديات الأساسية لإنشاء روبوتات يمكنها تنفيذ المهام الأولية مثل الإمساك بالأشياء، والحفاظ على توازنها، والتحرك. وقد أشار الباحث في الذكاء الاصطناعي والروبوتات، كريس باكستون، في مقابلة مع مجلة VentureBeat إلى أن هناك الكثير من الجهود الجوهرية التي لا تتعامل معها النماذج الحالية، وهو النوع من المهام التي يصعب تنفيذها بسبب نقص البيانات المتاحة في كثير من الأحيان.

أحلى ماعندنا ، واصل لعندك! سجل بنشرة أراجيك البريدية

بالنقر على زر “التسجيل”، فإنك توافق شروط الخدمة وسياسية الخصوصية وتلقي رسائل بريدية من أراجيك

عبَّر عن رأيك

إحرص أن يكون تعليقك موضوعيّاً ومفيداً، حافظ على سُمعتكَ الرقميَّةواحترم الكاتب والأعضاء والقُرّاء.

ذو صلة