Исследователи из Стэнфордского и Вашингтонского университетов потратили всего 50 долларов на создание модели рассуждающего искусственного интеллекта.
Тесты программирования и математики показывают, что S1 (название модели) работает наравне с современными моделями рассуждений ИИ, такими как o1 от OpenAI и R1 от DeepSeek.
Примечательно, что S1 — это модель с открытым исходным кодом, доступ к которой может получить любой желающий в репозитории GitHub.
Команда разработчиков рассказала, что они начали с базовой доступной модели, а затем усовершенствовали ее с помощью «дистилляции» — процесса извлечения способности «рассуждения» из другой модели ИИ путем обучения на ее ответах.
В частности, S1 представляет собой разработку на основе экспериментальной модели Gemini 2.0 Flash Thinking Experimental от Google. Процесс дистилляции аналогичен тому, который использовали ученые из Университета Беркли, создав модель стоимостью около 450 долларов.
Исследователи, стоящие за s1, нашли самый простой способ добиться высокой эффективности рассуждений и «масштабирования во время тестирования», что означает позволить модели ИИ больше думать, прежде чем ответить на вопрос.
Это одно из достижений OpenAI o1, которое DeepSeek и другие лаборатории ИИ пытались повторить с помощью различных методов.
В статье S1 показано, что модели рассуждений можно вычленить из довольно небольшого набора данных с помощью процесса, называемого контролируемой тонкой настройкой (SFT), в котором модели ИИ явно предписывается имитировать определенное поведение в наборе данных.
SFT, как правило, дешевле, чем крупномасштабный подход к обучению с подкреплением, который DeepSeek использовал для обучения модели R1.
Google предоставляет бесплатный доступ к Gemini 2.0 Flash Thinking Experimental, хотя и с ограничением по частоте посещений в день, через платформу Google AI Studio.
Однако условия Google запрещают обратную разработку своих моделей для разработки сервисов, которые конкурируют с продуктами компании в области искусственного интеллекта.
S1 создан на основе небольшой модели искусственного интеллекта, разработанной лабораторией искусственного интеллекта Qwen, принадлежащей Alibaba, которая доступна для бесплатной загрузки. Для обучения S1 исследователи создали набор данных из 1000 тщательно отобранных вопросов, а также ответы и «мыслительный» процесс, стоящий за каждым ответом, из экспериментальной модели Google Gemini 2.0 Flash Thinking Experimental.
Процесс обучения занял менее 30 минут с 16 графическими процессорами Nvidia H100, но при этом показал высокие результаты в нескольких тестах ИИ. Никлас Мюннихофф, исследователь из Стэнфорда, сообщил, что стоимость аренды необходимой вычислительной мощности составляет всего около 20 долларов.
Исследователи применили трюк, чтобы заставить S1 проверить свою работу и продлить ее «время обдумывания», например, попросив модель подождать, добавив слово «подождать» в ее процесс рассуждений, что помогло модели дать более точный ответ.
К 2025 году Meta, Google и Microsoft планируют инвестировать сотни миллиардов долларов в инфраструктуру ИИ, часть из которых будет использована для обучения моделей ИИ следующего поколения. Такой уровень инвестиций может все еще потребоваться для стимулирования инноваций в сфере ИИ.
Дистилляция оказалась хорошим способом воспроизведения возможностей моделей ИИ с низкими затратами, но она не создает новых моделей ИИ, превосходящих существующие сегодня.
(По данным TechCrunch)
Источник: https://vietnamnet.vn/he-lo-bi-mat-tao-ra-mo-hinh-ai-ly-luan-sieu-re-chua-den-2-trieu-dong-2369052.html
Comment (0)