Раскрыт новый «козырь» DeepSeek

Новый искусственный интеллект DeepSeek продолжает вызывать ажиотаж в мире технологий благодаря своей выдающейся производительности. Фото: SCMP .

DeepSeek официально представляет DeepSeek V3-0324, последнюю версию в серии больших языковых моделей (LLM) V3.

Как и предыдущие версии, эта модель распространяется с открытым исходным кодом бесплатно на платформе Hugging Face и содержит значительные улучшения по сравнению с предыдущими версиями, особенно в области рассуждений и программирования.

В частности, по данным OpenRouter, DeepSeek V3-0324 создан с использованием метода Mixture of Experts (MoE), который очень популярен в некоторых китайских моделях искусственного интеллекта и имеет 685 миллиардов параметров.

По первым отзывам, модель демонстрирует впечатляющую производительность при выполнении различных задач. Между тем, публикация на Reddit показывает, что DeepSeek V3-0324 догнал модель Sonnet 3.7 от Google в тесте генерации программного кода.

Источники также указывают, что DeepSeek V3-0324 способен генерировать длинные фрагменты кода без каких-либо ошибок. Компания AI Analytics Vidhya протестировала эту модель и зафиксировала ее способность бесперебойно генерировать 700 строк кода.

На X большой фурор также произвело приложение DeepSeek V3-0324. В качестве доказательства Дипаншу Шарма опубликовал видео, демонстрирующее, как эта модель искусственного интеллекта может без проблем сгенерировать полноценный веб-сайт, содержащий более 800 строк кода.

DeepSeek стала самой заметной китайской компанией в области искусственного интеллекта в декабре 2024 года, запустив DeepSeek-V3. Эта модель достигает производительности, сопоставимой с GPT-4o, но использует лишь малую часть вычислительных ресурсов.

Вскоре после этого DeepSeek продолжил выпуск модели рассуждений DeepSeek-R1. По данным TechCrunch , R1 превосходит OpenAI o1 в таких тестах, как AIME, MATH-500 и SWE-bench Verified.

В то же время цифра в 5,6 млн долларов на обучение финальной стадии модели DeepSeek также шокирует по сравнению с сотнями миллионов долларов, которые ведущим американским компаниям приходится тратить на обучение своих моделей.

Источник: https://znews.vn/at-chu-bai-moi-cua-deepseek-lo-dien-post1540831.html

Комментарий (0)