Покинув США и вернувшись домой, Нгуен Хоанг Куан и его коллеги из VILM разработали бесплатную систему искусственного интеллекта (ИИ), которую вьетнамцы могут использовать в сфере обслуживания клиентов. Ее скачивают более сотен тысяч раз в месяц.
В июне 2023 года 25-летний Нгуен Хоанг Куан и его коллеги 23-летний Фам Нхут Хуэй, инженер по искусственному интеллекту в ZaloAI, и 24-летний Дао Минь Зунг, аспирант Университета Корка, Ирландия, стали соучредителями некоммерческой организации VILM с целью помочь вьетнамцам освоить самые передовые технологии искусственного интеллекта наиболее оптимальным способом.
После почти 6 месяцев исследований и практического применения команда успешно разработала три бесплатные модели ИИ, включая OpenHermes, VinaLlama и Vistral. Это основополагающие исследования для разработки систем искусственного интеллекта, которые могут понимать намерения пользователя и действовать в соответствии с ними (модель больших действий). Эти модели применяются в таких областях технологий, как управление машинами, робототехника, помогающая людям с ограниченными возможностями лучше справляться без посторонней помощи, или помогающая программистам исправлять ошибки, виртуальные помощники, которые заботятся о клиентах или бесплатно отвечают на вопросы.
Число загрузок OpenHermes достигает 85 000 в месяц, что делает его одной из 10 самых загружаемых языковых моделей на HuggingFace (крупнейшем в мире сайте по обмену моделями ИИ). Скриншот
Модель OpenHermes — это крупная языковая модель, которая поддерживает английский язык, как ChatGPT, но с более высокими показателями. Они позволяют пользователям загружать модели на свои персональные компьютеры для использования без необходимости подключения к Интернету. Примечательно, что объем обучающих данных OpenHermes составляет всего 1/100 объема обучающих данных ChatGPT от OpenAI. В настоящее время приложение скачивают более 50 000 раз в месяц. OpenHermes-2.5 и OpenHermes-2.5-Vision используются более чем 40 стартапами в Кремниевой долине (США),
VinaLlama и Vistral — это две языковые модели, ориентированные на вьетнамский рынок и призванные помочь отечественным пользователям легче освоить самые передовые технологии искусственного интеллекта.
Хоанг Куан учился в США в течение 7 лет и работал в OpenAI инженером-исследователем по модели искусственного интеллекта ChatGPT, хотя он и не окончил университет. В 2022 году он работал инженером по обработке данных в продуктах Microsoft Bing Chat и OpenAI с доходом в тысячи долларов. К 2023 году, столкнувшись с волной увольнений в сфере технологий в США, Куан понял, что рынок труда для выпускников вузов весьма неблагоприятен, но, увидев возможности во Вьетнаме, он решил вернуться домой.
Нгуен Хоанг Куан. Фото: NVCC
В VILM Куан является главным инженером, отвечающим в первую очередь за исследование методов улучшения данных, а также за обучение искусственного интеллекта. В то время как Нят Хуэй берет на себя роль технического исследователя при обучении ИИ, а Минь Зунг предлагает новые методы теоретических исследований.
Куан объяснил, что современные крупные языковые модели, такие как ChatGPT (Large Language Model), могут обеспечивать только текстовый вывод, в то время как у людей есть много способов общаться и приобретать знания. Вот почему команда стремится создать систему, которая может гибко работать между различными типами ввода и вывода (может получать и выводить такие типы данных, как язык, изображения, видео, аудио), а не останавливаться только на уровне языка.
Чтобы достичь цели создания крупных моделей действий, команде пришлось преодолеть две проблемы: безопасность и скорость. Современные приложения ИИ в основном используют пользовательские данные и отправляют их на серверы таких компаний, как OpenAI, для обработки, что вызывает проблемы безопасности. Команда сосредоточилась на создании моделей ИИ, которые были бы достаточно маленькими и быстрыми для обработки непосредственно на мобильных устройствах, при этом обеспечивая баланс производительности и скорости, чтобы не влиять на пользовательский опыт.
Экспериментальная группа использовала данные, полученные от ИИ, чтобы позволить ИИ самостоятельно обучаться, вместо того чтобы пойти по пути использования данных из реальных источников. Поначалу у них возникли трудности с поиском вычислительных ресурсов (компьютеров для обучения ИИ), но позже им удалось убедить крупные компании и лаборатории по всему миру выступить их спонсорами.
Куан сказал, что создание этих продуктов в первую очередь помогает людям быстро и качественно получать доступ к приложениям ИИ, не уступающим ChatGPT или Bing Chat, а также упрощает исследование и создание моделей ИИ в будущем. Вместо использования ChatGPT, который ограничен вьетнамским языком и культурой, вьетнамские предприятия могут загрузить VinaLlama на вьетнамском языке.
Языковая модель VinaLlama легко решает математическую задачу на вьетнамском языке, на рисунке представлена демонстрация продукта VinaLlama по решению математических задач. Скриншот.
Г-н Данг Хай Лок, основатель платформы для создания чат-ботов на основе искусственного интеллекта Mindmaid, сказал, что с точки зрения разработчика приложений на основе искусственного интеллекта он обнаружил, что стоимость и конфиденциальность данных — это два вопроса, которые больше всего беспокоят компании при развертывании приложений на основе искусственного интеллекта. Наиболее удовлетворительным решением этой проблемы являются модели LLM с открытым исходным кодом, которые могут работать в корпоративной инфраструктуре и могут быть точно настроены с использованием собственных данных предприятия. Поэтому вьетнамские модели LLM с открытым исходным кодом, такие как VinaLlama, Vistral..., очень ценны для продвижения приложений ИИ во Вьетнаме.
«Эти модели с открытым исходным кодом также позволяют большему количеству программистов и энтузиастов технологий получить доступ к сфере инженеров ИИ, имея только MacBook, вместо того, чтобы вкладывать средства в дорогостоящую инфраструктуру GPU (графических карт). Это также будет способствовать развитию сил инженеров ИИ во Вьетнаме, а эта роль будет пользоваться большим спросом в ближайшем будущем», — сказал г-н Лок.
По словам Куана, вьетнамцы обладают очень хорошей базой в области научной теории, хороши в области искусственного интеллекта, и в ChatGPT также есть человеческие ресурсы, участвующие в исследованиях, но им сложнее быстро успевать за постоянно меняющейся волной технологий. «Вьетнамцам нужен опыт создания продуктов для конечных пользователей, чтобы по-настоящему понимать проблемы, с которыми они сталкиваются, и правильно направлять свои исследования», — сказал Куан о причине исследования бесплатных моделей ИИ для поддержки вьетнамцев в сфере технологий. Он сказал, что сотрудничал со многими международными группами и всегда готов сотрудничать с исследовательскими группами во Вьетнаме.
Нху Куинх
Ссылка на источник
Комментарий (0)