في يوم الجمعة، ظهر مبتكر Claude Code، بوريس تشيرني، في مؤتمر Meta @Scale، ومن المثير للدهشة أن السؤال الأول من الجمهور كان حول الحلقات.
سأل السائل: “هل الحلقات مجرد دورة ضجيج أخرى، أم أنها موجودة بالفعل؟”
وكان رد تشيرني قاطعا: “نعم، إنهم موجودون حقا”.
وتابع: “قبل عامين، كنا نكتب الكود المصدري يدويًا. بدأنا في التحول، لذا يكتب الوكلاء الكود. والآن ننتقل إلى النقطة التي يطلب فيها الوكلاء من الوكلاء كتابة الكود بعد ذلك”. “بغض النظر عن حجم الخطوة من الكود المصدري إلى الوكلاء، فإن الحلقات لا تقل أهمية وكبيرة.”

لاحقًا في الخطاب (حوالي الساعة 32:00 في مقطع الفيديو أعلاه على اليوتيوب)، تحدث تشيرني بالتفصيل عن الحلقات التي يكررها في عمله. يبحث أحد الوكلاء باستمرار عن طرق لتحسين بنية التعليمات البرمجية، بينما يبحث آخر عن تجريدات مكررة يمكن توحيدها. إنهم يقدمون طلبات سحب مثل أي مطور آخر، ولأن الكود يتغير باستمرار، فإنهم لا يتوقفون عن العمل أبدًا.
إنها فكرة قوية، خاصة بالنظر إلى شخصية بارزة مثل شيرني. مع الانتقال إلى الذكاء الاصطناعي القائم على الوكيل، ركز معظم المستخدمين على إدارة وكلائهم بأفضل شكل ممكن: وضع أهداف واضحة، والتحقق من وحدات التقدم المنفصلة، ​​وعدم السماح لهم بالابتعاد كثيرًا عن المطالبات. وتذهب الحلقة إلى أبعد من ذلك من خلال السماح لمجموعة من الوكلاء بالعمل بشكل مستمر في الخلفية، إلى أجل غير مسمى. إن وضع ثقتك في الذكاء الاصطناعي يأتي مع قدر كبير من الثقة، ولكن مع تحسن النماذج بسرعة، قد تكون هذه هي الخطوة التالية نحو تمكين الذكاء الاصطناعي من القيام بعمل حقيقي.
أول شيء يجب ملاحظته هو أن هذا ليس جديدًا تمامًا. تعد الحلقات العودية – وهي الوظائف التي تدعو نفسها لتكرار إجراء ما، إلى جانب الشرط الذي يوقف الحلقة – عنصرًا أساسيًا في الدورات التمهيدية لعلوم الكمبيوتر. تتبع هذه الحلقات منطقًا غير حتمي – أي أن الوكيل الفرعي هو الذي يقرر متى يتم إيقاف الحلقة، وليس شرطًا صريحًا – ولكن يتم تطبيق نفس النهج الأساسي. بمجرد أن يبدأ المطورون في استخدام الذكاء الاصطناعي لأداء المهام، فمن المؤكد أن تظهر نسخة ما من الحلقة العودية، مع إشراف الذكاء الاصطناعي على الذكاء الاصطناعي.
على عكس المعالجة الكلاسيكية، يمكن أن تكون حلقات الوكيل بسيطة للغاية. واحدة من الحيل الأكثر شعبية هي حلقة رالف (سمي على اسم رالف ويغام) والذي يلخص بشكل أساسي كل العمل الذي قام به النموذج ويسأل عما إذا كان قد حقق هدفه. هذه طريقة للتعامل مع ضياع نماذج الذكاء الاصطناعي عند تشغيلها لفترة طويلة جدًا – مما يؤدي بشكل أساسي إلى ارتداد النموذج ذهابًا وإيابًا حتى تكتمل المهمة.
هناك طريقة أخرى للتفكير في الحلقات وهي التعبير عن الرغبة العامة في زيادة عدد العمليات الحسابية أثناء الاختبار. كما لاحظ الباحث في OpenAI نعوم براون في وقت سابق من هذا الشهريمكن للنماذج الحديثة أن تحل أي مشكلة تقريبًا إذا أجريت لها حسابات كافية. هذا يعني أن إحدى الطرق لضمان حل المشكلة هي الاستمرار في تحميلها بالحسابات حتى تنتهي. وينطبق هذا بشكل خاص على مشاكل التسلق مثل تحسين قاعدة التعليمات البرمجية، حيث يمكن للنموذج ببساطة إجراء تحسينات تدريجية حتى يصل إلى حد معين. أو، كما في مثال تشيرني، يمكنها ببساطة إجراء تحسينات تدريجية طالما أن هناك قوة حاسوبية كافية لدعمها.
إذا كان هذا يبدو باهظ الثمن، فإنه ينبغي أن يكون. مثل الذكاء الاصطناعي الوكيل من قبله، فإن حلقات الذكاء الاصطناعي تحرق الرموز المميزة بشكل أسرع بكثير من روبوتات الدردشة البسيطة للأسئلة والأجوبة – وبما أن الفكرة هي الحفاظ على تشغيل الحلقة طوال الوقت، فلا يوجد حد أعلى للمبلغ الذي يمكنك إنفاقه. وهذا أمر جيد بالنسبة لشركة Anthropic، التي تبيع الرموز في نهاية المطاف، ولكن بالنسبة لأي شخص آخر يمكن أن تكون طريقة عمل باهظة الثمن.
ومع ذلك، اعتمادًا على المشكلة التي تحاول حلقة الوكيل حلها والإعداد الصحيح الذي يسمح بالإشراف على إنفاق الرمز المميز والانجراف ومشكلات الذكاء الاصطناعي الكلاسيكية الأخرى، يمكن أن تكون الفوائد مذهلة بما يكفي لتفوق التكاليف.

عندما تقوم بالشراء من خلال الروابط الموجودة في مقالاتنا، قد نكسب عمولة صغيرة. وهذا لا يؤثر على استقلالنا التحريري.