Lors de l'événement Journée de l'intelligence artificielle 2023 sur le thème « IA - repenser la réalité » qui se déroulera les 5 et 6 décembre, VinAI Artificial Intelligence Research and Application Company (Vingroup Corporation) a annoncé un projet de recherche open source sur un grand modèle linguistique pour le vietnamien, PhoGPT.
PhoGPT est un projet open source plutôt qu'un logiciel propriétaire comme ChatGPT d'OpenAI. Parce qu'il est open source, il n'y a aucune limitation commerciale, toutes les parties peuvent utiliser PhoGPT pour développer leurs propres applications, y compris des unités d'application à des fins commerciales. Il s’agit d’une sorte de plateforme permettant à la communauté de développer des applications liées à la technologie de l’IA dans le pays.
Selon le Dr Bui Hai Hung, directeur général de VinAI Artificial Intelligence Research and Application Company, les limites des modèles vietnamiens ont prouvé que ces modèles n'ont pas atteint des performances optimales et manquent d'un ensemble de codes open source. Par conséquent, l’une des tâches urgentes auxquelles sont confrontées la communauté de l’IA en général et la communauté du traitement du langage naturel (NLP) en particulier est de construire un nouveau modèle plus puissant capable de traiter la langue vietnamienne avec une précision et des performances élevées.
Les experts en IA affirment qu'avec un modèle de langage Big Data avec 7,5 milliards de paramètres, construit sur la plateforme de décodage Transformer, ce modèle est formé à partir de zéro, en utilisant les techniques les plus avancées disponibles telles que le mécanisme Flash Attention, l'extrapolation de la longueur du contexte AliBi...
Ces techniques aident non seulement le modèle à acquérir une compréhension plus approfondie du contexte, mais augmentent également la capacité de PhoGPT à dialoguer et à interagir naturellement. Cela fait du modèle un outil polyvalent et multitâche, capable de répondre à un large éventail de besoins linguistiques des utilisateurs.
Le Dr Bui Hai Hung a ajouté que PhoGPT a été développé par la société dès le début, indépendamment de tous les autres modèles dans le monde. Avec le modèle open source, la communauté vietnamienne peut mieux l’utiliser et l’améliorer. Rendre le code source de PhoGPT public et disponible pour les utilisateurs contribue à créer un environnement et une communauté d'utilisateurs capables de développer des applications uniques et personnalisées.
L’un des objectifs de l’open source est de poser les bases pour que les gens n’aient pas à tout recommencer et que les organisations puissent développer davantage le grand modèle de langage PhoGPT. Cela aidera la société à disposer d'une communauté open source de qualité pour le grand modèle linguistique vietnamien, créant un bon effet pour que de nombreuses entreprises puissent participer et l'appliquer dans un certain domaine. Avec PhoGPT, la société de recherche et d'application en intelligence artificielle VinAI a déclaré qu'elle aurait un plan de recherche et de développement d'applications pour les utilisateurs individuels et un ensemble de solutions d'assistance spécialisées pour les entreprises vietnamiennes dans des domaines tels que la santé, l'éducation, etc.
PhoGPT a posé les premières bases du développement de modèles linguistiques vietnamiens de haute performance, comme base pour le développement d'applications pratiques et efficaces, conformément à la stratégie de développement de l'IA du gouvernement jusqu'en 2030.
BA-TAN
Source
Comment (0)