Говорят, что стоимость эксплуатации модели искусственного интеллекта (ИИ) s1, созданной американскими исследователями, составляет всего 50 долларов США, но она обеспечивает возможности рассуждения, эквивалентные гораздо более дорогой модели o1 компании OpenAI. Появление s1 произошло после впечатляющего успеха DeepSeek, который в последние дни вызвал переполох в Кремниевой долине.
Война «дешевого ИИ» становится все более оживленной с появлением DeepSeek
Команда опубликовала исходный код s1 на GitHub вместе с кодом и данными, использованными для построения модели. В статье, опубликованной на прошлой неделе, объясняется процесс разработки этой модели, подчеркивая примененные в ней умные методы. Вместо того чтобы начинать с нуля с новой модели рассуждений, команда использовала существующую языковую модель и провела процесс «тонкой настройки», извлекая возможности рассуждений из экспериментальной модели Gemini 2.0 Flash Thinking Experimental от Google.
Эксплуатационные расходы ИИ составляют «менее 50 долларов»
Обучение модели s1 заняло всего 30 минут с использованием 16 графических процессоров Nvidia H100. Хотя каждый из этих графических процессоров стоит около 25 000 долларов США, стоимость их аренды для этого процесса составляет менее 50 долларов США благодаря сервисам облачных вычислений. В частности, команда обнаружила полезный трюк: она дала указание модели «подождать», прежде чем дать окончательный ответ, что улучшило ее рассуждения и привело к лучшим решениям.
Хотя s1 добился значительных результатов при низких затратах, все еще существуют опасения относительно масштабируемости этой модели. Использование модели Google в качестве «учителя» ставит под сомнение способность s1 конкурировать с ведущими современными моделями ИИ. Google, вероятно, будет внимательно следить за ситуацией, особенно с учетом продолжающегося судебного разбирательства между OpenAI и DeepSeek.
Источник: https://thanhnien.vn/my-tao-ra-mo-hinh-ai-sieu-re-hoat-dong-tuong-tu-gpt-o1-185250207182535164.htm
Comment (0)