Вышеприведенная информация была предоставлена ​​профессором Ву Ха Ваном, научным директором VinBigdata, в ходе обсуждения с журналистами в кулуарах недавнего запуска ViGPT.

anhvuhavan.jpg
Профессор Ву Ха Ван, главный научный сотрудник VinBigdata.

ViGPT нуждается в участии технических специалистов и сообщества.

Профессор Ву Ха Ван сказал, что для крупных компаний, таких как Google, при разработке основных языков они выберут английский или французский в качестве основного языка. Хотя есть также вьетнамский, результаты поиска или поиск будут относительно медленными по сравнению с другими языками. В некоторой степени ответы этих больших языковых моделей на вопросы вьетнамцев не будут полными и точными.

Поэтому VinBigdata надеется, что со временем ViGPT превзойдет их по точности в вопросах, напрямую связанных с культурой, историей, географией... информацией с характеристиками и свойствами, уникальными для вьетнамского народа. Именно этого хотят и к чему стремятся создатели вьетнамской языковой модели в будущем, задавая вопросы вьетнамцам: это будет лучшим источником для сравнения, чем иностранные.

Если говорить более подробно, то директор по науке VinBigdata проанализировал, например, вопрос в «деликатный» политический период об истории Truong Sa и Hoang Sa. Нам очень сложно гарантировать, что ответ от Google или OpenAI не будет нести в себе политическую предвзятость основателей или людей, стоящих за этими компаниями. У нас есть другие варианты во Вьетнаме, было бы лучше, если бы мы подумали об этом.

«Наша цель при создании большой языковой модели для вьетнамцев — предоставить вьетнамцам наилучшие ответы, мы не можем знать их цели», — поделился профессор Ву Ха Ван.

Надо признать, что есть много вещей, которые ViGPT в настоящее время не может делать так же хорошо, как ChatGPT или Google Bard, поскольку уровень инвестиций этих предприятий и время, необходимое для их внедрения, в тысячи раз выше. Однако профессор Ву Ха Ван сказал, что на некоторые вопросы, предвзятые по отношению к Вьетнаму, например, «На чьем флаге вышиты шесть золотых слов?», ViGPT ответит, что это флаг Чан Куок Тоана, в то время как другие версии могут быть неверными. В будущем ViGPT будет работать эффективнее, если будут получены отзывы от отечественных пользователей, учитывая такие подробные вопросы.

«Если пользователи просто критикуют или думают, что эта большая языковая модель все еще глупа, когда мой 10-летний ребенок знает вопросы, которые он не знает, или задают каверзные вопросы, чтобы доказать, что мы умнее ИИ. Мы умнее ИИ, но это не для какой-то цели, мы не делаем продукт лучше, а делаем людей, которые его делают, грустнее. «Поэтому VinBigdata нуждается в совместном вкладе технического персонала и сообщества. Нам необходимо товарищество вьетнамцев в совершенствовании продукта, чтобы он был не только инструментом обслуживания, но и гордостью вьетнамского народа», — подчеркнул профессор Ву Ха Ван.

Готовы поддержать и сопровождать вьетнамскую языковую модель

В беседе с VietNamNet представители стартапов, работающих в сфере искусственного интеллекта во Вьетнаме, заявили, что готовы поддержать и сопровождать вьетнамскую языковую модель VinBigdata.

ViGPT.jpg
Поддержка и сопровождение ViGPT необходимы для разработки крупной модели вьетнамского языка.

Г-н Дин Тран Туан Линь, директор по технологиям Unikon Joint Stock Company, владельца платформы Aicontent.vn, сказал, что в настоящее время не так много стран в Азии предприняли усилия по успешному обучению собственных крупных языковых моделей, лидерами являются Китай, Корея и Япония. Поэтому ViGPT является важным сигналом для усилий вьетнамского народа по инвестированию в основные технологии. По словам г-на Диня Тран Туан Линя, каждое путешествие в тысячу миль должно начинаться с первых шагов. Будучи пионером в области применения ИИ, Unikon готов вносить свой вклад, тестировать, давать обратную связь и даже использовать ViGPT экспериментально в некоторых проектах подходящего масштаба.

Между тем, г-н Данг Ху Сон, соучредитель Lovinbot, заявил, что прислушивание VinBigdata к сообществу и комментариям экспертов — это очень хорошее дело для разработки большой языковой модели специально для вьетнамцев. Будучи техническим специалистом, г-н Данг Ху Сон также дал обратную связь технической команде VinBigdata после использования продукта.

По словам г-на Данг Хыу Сона, недавно запущенный продукт не может быть завершен немедленно, но он также не может получить полную поддержку со стороны сообщества немедленно, поскольку вьетнамцы долгое время считали, что Вьетнам не может реализовать эту технологию, поэтому для этого все еще нужно время. В то же время VinBigdata нуждается в конкретных инструкциях о том, как сообщество может лучше поддерживать и сопровождать друг друга.

Г-н Данг Ху Лок, основатель платформы Mindmaid, также поделился тем, что в настоящее время в мире очень мало стран, которые создали модель родного языка. Даже богатые страны с развитыми информационными технологиями, такие как Индия, или страны с более высоким ВВП, чем у Вьетнама, такие как Индонезия, страны Ближнего Востока... не могут сделать это просто потому, что они этого хотят, поскольку это также зависит от языковых характеристик. Таким образом, с более широкой точки зрения, Вьетнам имеет стратегическое преимущество в создании крупной модели языка коренных народов, и это станет стратегическим преимуществом для вьетнамского народа в плане конкурентоспособности на мировом рынке.

По словам г-на Данг Хыу Лока, любые усилия по созданию большой модели вьетнамского языка ценны и должны комментироваться особым образом, чтобы модель с каждым днем ​​становилась все более полной, а не сводить на нет все усилия отечественных технологических подразделений, используя некоторые текущие недостатки. Вьетнамцам также следует шире распространять информацию о важности технологии больших языков в эпоху искусственного интеллекта и больше обсуждать, как ее применять для создания ценности для себя и вьетнамского бизнеса, вместо того, чтобы сравнивать вьетнамские модели больших языков с лучшими моделями больших языков в мире на сегодняшний день. Поскольку большие языки представляют собой общий ИИ, они могут быть не очень хороши для решения одной проблемы, но могут подходить для решения другой конкретной проблемы. В частности, модель большого вьетнамского языка будет иметь большее преимущество в задачах, связанных с пониманием и генерацией вьетнамского языка.

Версия сообщества ViGPT будет предоставлена ​​бесплатно некоммерческим организациям . Версия сообщества ViGPT будет предоставлена ​​бесплатно некоммерческим организациям компанией VinBigdata. Однако подразделениям, использующим эту версию, придется оплачивать расходы на инфраструктуру, такую ​​как облако и другие ресурсы при развертывании.