На мероприятии «День искусственного интеллекта 2023» на тему «ИИ — переосмысление реальности», которое пройдет 5 и 6 декабря, компания VinAI Artificial Intelligence Research and Application Company (корпорация Vingroup) анонсировала исследовательский проект с открытым исходным кодом по большой языковой модели для вьетнамского языка PhoGPT.
PhoGPT — это проект с открытым исходным кодом, а не проприетарное программное обеспечение, как, например, ChatGPT от OpenAI. Поскольку PhoGPT имеет открытый исходный код, коммерческих ограничений не существует, и все стороны могут использовать его для разработки собственных приложений, включая прикладные модули для коммерческих целей. Это означает, что это платформа, которая предоставляет сообществу возможность разрабатывать приложения, связанные с технологией ИИ в стране.
По словам доктора Буй Хай Хунга, генерального директора компании VinAI Artificial Intelligence Research and Application Company, ограничения вьетнамских моделей доказали, что эти модели не достигли оптимальной производительности и не имеют открытого исходного кода. Поэтому одной из неотложных задач, стоящих перед сообществом ИИ в целом и сообществом обработки естественного языка (NLP) в частности, является создание новой, более мощной модели, способной обрабатывать вьетнамский язык с высокой точностью и производительностью.
Эксперты в области искусственного интеллекта утверждают, что с помощью языковой модели больших данных с 7,5 миллиардами параметров, созданной на платформе декодирования Transformer, эта модель обучается с нуля, используя самые передовые доступные методы, такие как механизм Flash Attention, экстраполяция длины контекста AliBi...
Эти методы не только помогают модели глубже понять контекст, но и повышают способность PhoGPT вести диалог и взаимодействовать естественным образом. Это делает модель универсальным и многозадачным инструментом, способным удовлетворить широкий спектр языковых потребностей пользователей.
Доктор Буй Хай Хунг добавил, что PhoGPT разрабатывался компанией с самого начала, независимо от всех других моделей в мире. Благодаря модели с открытым исходным кодом сообщество во Вьетнаме может более эффективно ее использовать и совершенствовать. Публикация исходного кода PhoGPT и предоставление его пользователям помогают создать среду и сообщество пользователей, которые могут разрабатывать уникальные и индивидуальные приложения.
Одна из целей открытого исходного кода — заложить основу, чтобы людям не приходилось делать все заново, а организации могли и дальше развивать большую языковую модель PhoGPT. Это поможет обществу сформировать качественное сообщество разработчиков программного обеспечения с открытым исходным кодом для крупной вьетнамской языковой модели, что даст хороший эффект и позволит многим компаниям принять участие и применять ее в определенной области. Компания VinAI Artificial Intelligence Research and Application Company заявила, что с помощью PhoGPT у нее будет план по исследованию и разработке приложений для индивидуальных пользователей, а также специализированный пакет решений для поддержки предприятий на вьетнамском языке в таких областях, как здравоохранение, образование и т. д.
PhoGPT заложила первые основы для разработки высокопроизводительных моделей вьетнамского языка как основы для разработки практичных и эффективных приложений в соответствии с правительственной стратегией развития ИИ до 2030 года.
БА ТАН
Источник
Комментарий (0)