Vietnam.vn - Nền tảng quảng bá Việt Nam

Раскрыт новый «козырь» DeepSeek

Компания DeepSeek только что выпустила последнюю обновленную версию своей большой языковой модели под кодовым названием V3-0324 со значительными улучшениями в возможностях рассуждений и программирования.

Zing NewsZing News26/03/2025

Новый искусственный интеллект DeepSeek продолжает вызывать ажиотаж в мире технологий благодаря своей выдающейся производительности. Фото: SCMP .

DeepSeek официально представляет DeepSeek V3-0324, последнюю версию в серии больших языковых моделей (LLM) V3.

Как и предыдущие версии, эта модель распространяется с открытым исходным кодом бесплатно на платформе Hugging Face и содержит значительные улучшения по сравнению с предыдущими версиями, особенно в области рассуждений и программирования.

В частности, по данным OpenRouter, DeepSeek V3-0324 создан с использованием метода Mixture of Experts (MoE), который очень популярен в некоторых китайских моделях искусственного интеллекта и имеет 685 миллиардов параметров.

По первым отзывам, модель демонстрирует впечатляющую производительность при выполнении различных задач. Между тем, публикация на Reddit показывает, что DeepSeek V3-0324 догнал модель Sonnet 3.7 от Google в тесте генерации программного кода.

Источники также указывают, что DeepSeek V3-0324 способен генерировать длинные фрагменты кода без каких-либо ошибок. Компания AI Analytics Vidhya протестировала эту модель и зафиксировала ее способность бесперебойно генерировать 700 строк кода.

На X большой фурор произвело также приложение DeepSeek V3-0324. В качестве доказательства Дипаншу Шарма опубликовал видео, демонстрирующее, как эта модель искусственного интеллекта может без проблем сгенерировать полноценный веб-сайт, содержащий более 800 строк кода.

DeepSeek стала самой заметной китайской компанией в области искусственного интеллекта в декабре 2024 года, запустив DeepSeek-V3. Эта модель достигает производительности, сопоставимой с GPT-4o, но использует лишь малую часть вычислительных ресурсов.

Вскоре после этого DeepSeek продолжил выпуск модели рассуждений DeepSeek-R1. По данным TechCrunch , R1 превосходит OpenAI o1 в таких тестах, как AIME, MATH-500 и SWE-bench Verified.

В то же время цифра в 5,6 млн долларов на обучение финальной стадии модели DeepSeek также шокирует по сравнению с сотнями миллионов долларов, которые ведущим американским компаниям приходится тратить на обучение своих моделей.

Источник: https://znews.vn/at-chu-bai-moi-cua-deepseek-lo-dien-post1540831.html


Комментарий (0)

No data
No data

Та же категория

Женщины-коммандос репетируют парад в честь 50-летия воссоединения
Обзор церемонии открытия Национального года туризма 2025: Хюэ — древняя столица, новые возможности
Эскадрилья вертолетов с национальным флагом пролетает над Дворцом Независимости
Concert Brother преодолевает тысячу трудностей: «Пробив крышу, взлетев к потолку и прорвавшись сквозь небеса и землю»

Тот же автор

Наследство

Фигура

Бизнес

No videos available

Новости

Политическая система

Местный

Продукт