تظهر الاختبارات البرمجية والرياضية أن أداء S1 (اسم النموذج) يتساوى مع أداء نماذج الذكاء الاصطناعي المتطورة مثل o1 من OpenAI و R1 من DeepSeek.

والجدير بالذكر أن S1 هو نموذج مفتوح المصدر، ومتاح على مستودع GitHub ليتمكن أي شخص من الوصول إليه.

أشار فريق التطوير إلى أنهم بدأوا من نموذج أساسي متاح، ثم قاموا بتحسينه من خلال "التقطير" - عملية استخراج القدرة على "الاستدلال" من نموذج ذكاء اصطناعي آخر من خلال التدريب على إجاباته.

على وجه التحديد، تم استخلاص S1 من نموذج Gemini 2.0 Flash Thinking Experimental من Google. وتشبه عملية التقطير ما فعله العلماء في جامعة بيركلي لإنشاء نموذج يكلف حوالي 450 دولارا.

صور جيتي 1168836247 1.jpg.jpeg
DeepSeek يفتح السباق لتطوير الذكاء الاصطناعي الرخيص. الصورة: TechCrunch

توصل الباحثون وراء s1 إلى أبسط طريقة لتحقيق أداء قوي في التفكير و"التوسع أثناء الاختبار"، وهو ما يعني السماح لنموذج الذكاء الاصطناعي بالتفكير أكثر قبل الإجابة على سؤال ما.

وهذا أحد الإنجازات التي حققتها OpenAI في o1، والتي حاولت DeepSeek ومختبرات الذكاء الاصطناعي الأخرى تكرارها من خلال تقنيات مختلفة.

تظهر ورقة S1 أنه من الممكن تقطير نماذج التفكير باستخدام مجموعة بيانات صغيرة إلى حد ما من خلال عملية تسمى الضبط الدقيق الخاضع للإشراف (SFT)، حيث يتم توجيه نموذج الذكاء الاصطناعي بشكل صريح لمحاكاة سلوكيات معينة في مجموعة البيانات.

تعتبر تقنية SFT أرخص بشكل عام من نهج التعلم التعزيزي واسع النطاق الذي استخدمته DeepSeek لتدريب نموذج R1.

توفر Google إمكانية الوصول المجاني إلى Gemini 2.0 Flash Thinking Experimental، وإن كان مع حد تردد يومي، عبر منصة Google AI Studio.

ومع ذلك، تحظر شروط جوجل إجراء هندسة عكسية لنماذجها لتطوير خدمات تتنافس مع منتجات الذكاء الاصطناعي الخاصة بالشركة.

يعتمد S1 على نموذج ذكاء اصطناعي صغير متاح من مختبر الذكاء الاصطناعي Qwen التابع لشركة Alibaba، والذي يتوفر للتنزيل مجانًا. لتدريب S1، أنشأ الباحثون مجموعة بيانات مكونة من 1000 سؤال تم اختيارها بعناية، بالإضافة إلى الإجابات وعملية "التفكير" وراء كل إجابة من برنامج Gemini 2.0 Flash Thinking Experimental من Google.

استغرقت عملية التدريب هذه أقل من 30 دقيقة باستخدام 16 وحدة معالجة رسومية Nvidia H100، ومع ذلك فقد أنتجت نتائج قوية على العديد من معايير الذكاء الاصطناعي. وقال نيكلاس موينجوف، الباحث من جامعة ستانفورد، إن تكلفة استئجار قوة الحوسبة اللازمة تبلغ نحو 20 دولاراً فقط.

استخدم الباحثون خدعة لجعل S1 يتحقق من عمله ويمدد "وقت تفكيره"، مثل مطالبة النموذج بالانتظار من خلال إضافة كلمة "انتظار" إلى عملية التفكير، مما ساعد النموذج على التوصل إلى إجابة أكثر دقة.

بحلول عام 2025، تخطط Meta وGoogle وMicrosoft لاستثمار مئات المليارات من الدولارات في البنية التحتية للذكاء الاصطناعي، وسيتم استخدام جزء منها لتدريب نماذج الذكاء الاصطناعي من الجيل التالي. قد يكون هذا المستوى من الاستثمار لا يزال ضروريًا لدفع الابتكار في مجال الذكاء الاصطناعي.

لقد ثبت أن التقطير طريقة جيدة لتكرار قدرات نموذج الذكاء الاصطناعي بتكلفة منخفضة، لكنه لا يخلق نماذج ذكاء اصطناعي جديدة متفوقة على ما هو موجود اليوم.

(وفقا ل TechCrunch)

جوجل تطلق رسميًا برنامج Gemini 2.0 للتنافس مع الذكاء الاصطناعي الصيني أطلقت جوجل رسميًا للتو برنامج المحادثة الآلي من الجيل التالي، Gemini 2.0 مع العديد من الإصدارات والتحديثات.