في عام 2022، أسس باحثان سابقان في “غوغل ديب مايند” شركة صغيرة تحت اسم رمزي هو “ريفليكشن إيه آي” (Reflection AI).
لكن الاسم لا يقتصر على كونه علامة تجارية، بل هو تجسيد لفلسفة تقنية جديدة تهدف إلى تحويل مسار الذكاء الاصطناعي، وإرجاعه إلى فضاء الانفتاح والمعرفة المشتركة.
تسعى الشركة إلى استعادة جذور الذكاء الاصطناعي المفتوحة، لأن التعاون العلمي يُعتبر بقدر أهمية الابتكار التقني.
كما أن الإنترنت بُني على فكرة الانفتاح، وازدهر نظام “لينكس” بفضل المشاركة المجتمعية، فإن الشركة تؤمن أن الذكاء الفائق لن يتحقق إلا بوجود علم متاح للجميع.
تعتبر “ريفليكشن إيه آي” نفسها البديل المفتوح المصدر للمختبرات المغلقة مثل “أوبن إيه آي” و”أنثروبيك”، كما أنها النسخة الأميركية من “ديب سيك”.
من خلال وكلاء البرمجة المستقلين، تسعى الشركة لتحويل الذكاء الاصطناعي إلى نظام قادر على العمل الذاتي.
خلفية التأسيس والمؤسسين
تأسست الشركة على يد علمائي الذكاء الاصطناعي البارزين، ميشا لاسكين ويوانيس أنتونوغلو، حيث ساهم أنتونوغلو في تطوير “ألفا غو” (AlphaGo)، الذي هزم بطل العالم في لعبة “غو” (Go) في عام 2016 بحركة غير تقليدية عُرفت بـ”الحركة 37″.
تعتبر هذه الحركة دليلاً على قدرة الذكاء الاصطناعي على الإبداع، وبرزت كدليل عملي لقدرة الذكاء الاصطناعي على التفوق في المهام البشرية المعقدة.
طور أنتونوغلو أيضاً “ألفا زيرو” (AlphaZero) الذي أتقن الشطرنج والشوجي من خلال اللعب الذاتي، وكذلك “مو زيرو” (MuZero) الذي تغلب على ألعاب، مثل “غو” والشطرنج دون معرفة مسبقة بالقوانين.
في حين قاد لاسكين نمذجة المكافآت في مشروع “جيميناي” من “ديب مايند”، وركز على تحسين الأداء من خلال التعلم التعزيزي، مما جعل النماذج أكثر دقة وأماناً، ولعب دوراً محورياً في إطلاق النسختين “1” و”1.5″.
هدف الثنائي ضمن فريق “جيميناي” هو تطوير نماذج كبيرة تتكيف مع السيناريوهات عبر التعلم التعزيزي.
وإيماناً منهما بأن المؤسسة المستقلة يمكن أن تُسرع التطور، تأسست “ريفليكشن إيه آي” بهدف تطوير وكلاء مستقلين يمكنهم الارتقاء مستقبلاً إلى مستوى الذكاء الفائق.
لبلوغ هذا الهدف، اختارت الشركة نقطة انطلاق واضحة، وهي تركيز جهودها على وكيل برمجة مستقل، الذي تراه خطوة حيوية نحو الذكاء الفائق.
بدأت الشركة كناشئة، لكنها سرعان ما حققت قفزات في قيمتها السوقية بعد جولة تمويل كبيرة بقيادة شركة “إنفيديا”، ومشاركة إريك شميدت، الرئيس التنفيذي السابق لـ “غوغل”، مما يعكس الثقة في رؤيتها لبناء ذكاء فائق.
تركز “ريفليكشن إيه آي” على دمج التعلم التعزيزي مع النماذج اللغوية الكبيرة، لإنشاء أنظمة مستقلة يمكنها أداء المهام المعقدة دون تدخل بشري، مستمدة قوتها من ثروة الخبرة في مشاريع مثل “بالم” (PaLM) و”شات جي بي تي” (ChatGPT) و”ألفا كود” (AlphaCode) و”ألفا بروف” (AlphaProof) و”كاراكتر إيه آي” (Character AI).
وصفة الذكاء الفائق السحرية
من خلال تجارب “غوغل ديب مايند”، استخلص المؤسسان أن التعلم من التجارب قد يؤدي إلى أداء يتجاوز القدرات البشرية، وأن الانتقال من المهام المحددة إلى البيئات العامة يتطلب دمج العمق مع الاتساع.
رغم أن النماذج اللغوية الكبيرة حققت مجموعة واسعة من القدرات، إلا أن كفاءتها كانت سطحية، حيث عالجت مشكلة الاتساع دون أن تعالج العمق.
أصبح واضحاً أن هذين الاتجاهين البحثيين هما الأساس لبناء الذكاء الفائق، فإن النماذج اللغوية الكبيرة والتعلم التعزيزي هما المفتاح لخلق وكيل ذكاء فائق يترك أثراً.
يُساعد التعلم التعزيزي في تعزيز قدرة الوكيل على التحسن في مهام محددة عبر تقسيم المشكلات المعقدة إلى خطوات معالجة فعالة.
على عكس بيانات التدريب للنماذج السابقة، والتي قد تنفد، فإن بيانات التدريب في التعلم التعزيزي تتولد في الغالب بواسطة الوكيل نفسه خلال تفاعلاته مع البيئة.
وتماماً مثل التعلم من الأخطاء، ينجح الوكيل في بعض الأمور ويفشل في أخرى، مركّزاً على ما نجح فيه، مما يؤدي إلى سلوك يؤدي إلى الذكاء الفائق إذا ما تم تطبيقه بشكل صحيح.
يتشابه هذا النهج مع خاصية “ديب ريسيرش” من “غوغل” أو “أوبن إيه آي”، التي تفحص آلاف المصادر على الإنترنت لإنشاء تقارير شاملة حول أي موضوع تقريباً.
أسيموف.. وكيل البرمجة المستقل
يُخصص المبرمجون نحو 10% من الوقت لكتابة التعليمات البرمجية، بينما يقضون 70% في تعلم أدوات جديدة، وتصحيح الأخطاء، ومراجعة التعليمات البرمجية، وتحديث الوثائق.
تنظر الشركة إلى البرمجة كأفضل مجال لتطوير الذكاء الفائق، وتهدف إلى ابتكار وكلاء برمجة مستقلين قادرين على إنجاز المهام بدقة مع التركيز على الموثوقية.
نتيجة لذلك، تم تطوير “أسيموف” (Asimov)، وهو وكيل ذكاء اصطناعي مخصص لفهم التعليمات البرمجية لفرق الهندسة.
بينما تركز أدوات البرمجة الذكية الحالية على توليد التعليمات البرمجية بسرعة، تركز “ريفليكشن إيه آي” على تقديم موثوقية.
لا يُعتبر “أسيموف” مهندس برمجيات شاملاً، بل هو وكيل مصمم لفرق الهندسة للقيام بمجموعة محددة من المهام بكفاءة فعّالة.
تشمل هذه المهام قراءة وكتابة التعليمات البرمجية، وإدارة البنية التحتية، وإعادة تصميم التعليمات البرمجية القديمة، وإنشاء حالات اختبار وتشغيلها تلقائياً، وتحسين استخدام الذاكرة وغيرها.
تم تطبيق التعلم التعزيزي على “أسيموف”، لكن بدلاً من تعليمه كيفية لعب لعبة “غو”، تم التركيز على تحسين كفاءته في البرمجة من خلال استيعاب معرفة عميقة حول إنشاء التطبيق وسبب وجوده.
على عكس المساعدين التقليديين، لا يكتفي “أسيموف” بتوليد التعليمات البرمجية، بل يفهم السياق بأكمله، ويحلل البريد الإلكتروني، والمحادثات، والوثائق لبناء صورة شاملة عن وضع التطوير قبل كتابة أي سطر برمجي.
بحسب الشركة، فإن الذكاء الحقيقي لا يُنتج التعليمات البرمجية فقط، بل يدرك الأسباب وراء وجود هذه التعليمات البرمجية في الأصل.
مهمته تتضمن بناء ذاكرة دائمة عبر استيعاب المعلومات من كافة المصادر، فهو لا يكتفي بأن يكون مساعداً لإنهاء التعليمات البرمجية، بل يندمج في العمل ويتولى بشكل مستقل المهام على نطاق واسع.
يعتمد “أسيموف” على بنية معالجة متعددة الوكلاء مصممة للإدارة الفعالة لكميات ضخمة من المعلومات، حيث يُجمع الوكلاء الأصغر البيانات ذات الصلة، ويُقدم وكيل أكبر الإجابات المستندة إلى تلك المعلومات.
تتوقع الشركة أن يتحول “أسيموف” ليصبح مرشداً برمجياً للشركات، يستفيد من معرفته الشاملة لبناء برامج ومنتجات جديدة بشكل مستقل.
يُمَيز “أسيموف” نفسه من خلال تركيزه على الفهم، مستفيداً من منهج التعلم التعزيزي، ويهدف إلى إعادة تعريف مجال البرمجة كما فعل “ألفا غو” في عالم الألعاب.
ختاماً، من خلال دمج بناء وكلاء فائقي الكفاءة مع النماذج اللغوية الكبيرة والتعلم التعزيزي، تهدف “ريفليكشن إيه آي” إلى تحديد نقطة البداية الصحيحة، مع سعيها لتحويل البرمجة إلى بوابة نحو الذكاء الفائق الذي يُعزز شتى مجالات الحياة.
