حقق باحثون من جامعتي ستانفورد وواشنطن تقدمًا ملحوظًا في مجال الذكاء الاصطناعي من خلال تدريب نموذج «تفكير» منافس لنموذج o1 الخاص بـ OpenAI بتكلفة أقل من 50 دولار باستخدام رصيد الحوسبة السحابية.
كُشف عن النموذج، الذي يُعرف باسم s1، في ورقة بحثية صدرت الجمعة الماضية وهو متاح الآن على GitHub، إلى جانب البيانات والكود المستخدم في تدريبه.
ملامح النموذج s1
- أداء مماثل: يظهر نموذج s1 أداءً موازيًا لنماذج الذكاء الاصطناعي المتطورة مثل OpenAI o1 ونموذج DeepSeek R1 في اختبارات قياس مهارات الرياضيات والبرمجة.
- المنهجية: بدأ الفريق بنموذج أساسي جاهز، ومن ثم قام بتحسينه عبر تقنية «التقطير» (distillation)، وهي عملية استخراج قدرات «التفكير» من نموذج آخر عن طريق تدريبه على إجابات ذلك النموذج.
- مصدر التقطير: يستند s1 إلى أحد نماذج التفكير من جوجل، وهو Gemini 2.0 Flash Thinking Experimental، والذي يُستخلص «التفكير» منه.
- الجدوى الاقتصادية: يُظهر المشروع إمكانية إبداع نماذج ذكاء اصطناعي متطورة بميزانيات منخفضة؛ فقد تمكن الباحثون من تدريب s1 خلال أقل من 30 دقيقة باستخدام 16 من بطاقات Nvidia H100، مع تقدير تكلفة الحسابات اللازمة اليوم بحوالي 20-50 دولار.
التقنيات والطرق المستخدمة
- يستخدم s1 تقنية التقطير من خلال «التدريب الخاضع للإشراف» (Supervised Fine-Tuning – SFT)، حيث يتم توجيه النموذج لتقليد سلوكيات معينة من خلال مجموعة من 1,000 سؤال مجمعة بعناية، تتضمن الإجابات وكذلك الخطوات الفكرية وراء تلك الإجابات المأخوذة من نموذج Gemini.
- كما أظهر البحث طريقة مبتكرة لتحسين دقة النموذج: حيث تم إضافة كلمة «انتظر» أثناء عملية التفكير، ما ساعد النموذج على تمديد وقت «التفكير» والوصول إلى إجابات أكثر دقة.
تداعيات وتحديات
- التنافسية والسوق: يثير ظهور s1 تساؤلات حول كيفية بقاء حواجز الدخول (الموثوقية والتفرد) في تقنيات الذكاء الاصطناعي، إذ يمكن لفريق صغير بدون موارد مالية ضخمة نسخ ميزات نماذج تبلغ قيمتها ملايين الدولارات.
- ردود فعل المختبرات الكبرى: لم تتقبل المختبرات الكبرى مثل OpenAI الأمر بهدوء؛ فقد وجّهت OpenAI اتهامات إلى DeepSeek بشأن استخدام بيانات من API الخاص بها بطريقة غير مشروعة لأغراض التقطير.
- المستقبل الاستثماري: من المتوقع أن تستمر استثمارات عملاقة من قبل شركات مثل ميتا وجوجل ومايكروسوفت في الذكاء الاصطناعي خلال 2025، ما يشير إلى أن تطوير نماذج جديدة ستستمر رغم نجاح التقطير كطريقة اقتصادية لتجسيد قدرات النماذج القائمة.
في النهاية، يُظهر مشروع s1 أن بالإمكان تحقيق تقدم ملحوظ في قدرات «التفكير» في الذكاء الاصطناعي بتكاليف منخفضة نسبيًا، مما قد يستمر في تحويل الطريقة التي يتم بها تطوير نماذج AI مستقبلًا، مع بقاء الاستثمار الضخم كعامل رئيسي في دفع حدود الابتكار.