Le partage ci-dessus a été donné par le professeur Vu Ha Van, directeur scientifique de VinBigdata, lors d'une discussion avec des journalistes en marge du récent événement de lancement de ViGPT.
ViGPT a besoin des contributions des techniciens et de la communauté
Le professeur Vu Ha Van a déclaré que les grandes entreprises comme Google choisiront l'anglais ou le français comme langue principale pour développer des langues majeures. Bien qu'il existe également le vietnamien, les résultats de recherche ou les recherches seront relativement lents par rapport aux autres langues. Dans une certaine mesure, les réponses de ces grands modèles linguistiques aux questions du vietnamien ne seront pas complètes et précises.
C'est pourquoi VinBigdata espère qu'au fil du temps, ViGPT les surpassera en précision sur des questions directement liées à la culture, à l'histoire, à la géographie... des informations présentant des caractéristiques et des propriétés propres au peuple vietnamien. C'est ce que veulent et visent les créateurs du modèle linguistique vietnamien à l'avenir lorsqu'ils poseront des questions aux Vietnamiens, ce sera une meilleure source de comparaison que les sources étrangères.
En allant plus en profondeur, le directeur scientifique de VinBigdata a analysé, par exemple, une question dans une période politique « sensible » sur l'histoire de Truong Sa et Hoang Sa, il est très difficile pour nous de garantir que la réponse de Google ou d'OpenAI ne porte pas le parti pris politique des fondateurs ou des personnes derrière ces entreprises. Ici, nous avons d’autres options au Vietnam, il serait préférable que nous y réfléchissions.
« Notre objectif en construisant un grand modèle linguistique pour le peuple vietnamien est d'apporter les meilleures réponses au peuple vietnamien, nous ne pouvons pas connaître leur objectif », a partagé le professeur Vu Ha Van.
Certes, il y a beaucoup de choses que ViGPT ne peut actuellement pas faire aussi bien que ChatGPT ou Google Bard, car le taux d’investissement de ces entreprises et le temps qu’elles prennent pour les mettre en œuvre sont des milliers de fois plus élevés. Mais le professeur Vu Ha Van a déclaré que pour certaines questions biaisées en faveur du Vietnam, comme « Quel drapeau est brodé avec six mots d'or ? », ViGPT répondra qu'il s'agit de Tran Quoc Toan, tandis que les autres versions peuvent être erronées. À l’avenir, avec des questions approfondies comme celle-ci, ViGPT s’en sortira mieux s’il y a des retours des utilisateurs nationaux.
« Si les utilisateurs se contentent de critiquer, ou pensent que ce grand modèle de langage est toujours stupide alors que mon enfant de 10 ans connaît des questions qu'il ne connaît pas, ou pose des questions pièges pour prouver que nous sommes plus intelligents que l'IA. Nous sommes plus intelligents que l'IA, mais ce n'est pas pour une raison quelconque, ici nous n'améliorons pas le produit mais rendons les personnes qui fabriquent le produit plus tristes. "C'est pourquoi VinBigdata a besoin de la contribution conjointe du personnel technique et de la communauté. Nous avons besoin de la collaboration du peuple vietnamien pour perfectionner le produit afin qu'il ne soit pas seulement un outil de service, mais aussi la fierté du peuple vietnamien", a souligné le professeur Vu Ha Van.
Prêt à soutenir et accompagner le modèle linguistique vietnamien
S'adressant à VietNamNet , des représentants de startups travaillant sur l'IA au Vietnam ont déclaré qu'ils étaient prêts à soutenir et à accompagner le modèle linguistique vietnamien de VinBigdata.
Dinh Tran Tuan Linh, directeur technique de la société par actions Unikon, propriétaire de la plateforme Aicontent.vn, a déclaré qu'à l'heure actuelle, peu de pays d'Asie ont fait des efforts pour former avec succès leurs propres modèles linguistiques à grande échelle, la Chine, la Corée et le Japon étant les leaders. Par conséquent, ViGPT est un signal important pour les efforts du peuple vietnamien visant à investir dans la technologie de base. Selon M. Dinh Tran Tuan Linh, tout voyage de mille kilomètres doit commencer par les premiers pas. En tant que pionnier dans l'application de l'IA, Unikon est prêt à contribuer, à tester, à donner son avis et même à utiliser ViGPT de manière expérimentale dans certains projets d'une envergure appropriée.
Pendant ce temps, M. Dang Huu Son, co-fondateur de Lovinbot, a déclaré que l'écoute de la communauté et des commentaires des experts par VinBigdata est une très bonne chose pour développer un grand modèle linguistique spécifiquement pour le peuple vietnamien. En tant que technicien, M. Dang Huu Son a également donné son avis à l'équipe technique de VinBigdata après avoir utilisé le produit.
Selon M. Dang Huu Son, un produit nouvellement lancé ne peut pas être achevé immédiatement, mais il ne peut pas non plus recevoir immédiatement le soutien total de la communauté, car les Vietnamiens pensent depuis longtemps que le Vietnam ne peut pas faire cette technologie, il faut donc encore du temps. Dans le même temps, VinBigdata doit disposer d’instructions spécifiques sur la manière dont la communauté peut mieux se soutenir et s’accompagner.
M. Dang Huu Loc, fondateur de la plateforme Mindmaid, a également partagé qu'il existe actuellement très peu de pays dans le monde qui ont construit un modèle de langue maternelle. Même les pays riches dotés de solides technologies de l’information comme l’Inde, ou les pays avec un PIB plus élevé que le Vietnam comme l’Indonésie, le Moyen-Orient… ne peuvent pas le faire simplement parce qu’ils le veulent, car cela dépend aussi des caractéristiques linguistiques. Par conséquent, d’un point de vue plus large, le Vietnam dispose d’un avantage stratégique dans la construction d’un grand modèle de langue autochtone, et cela constituera un avantage stratégique pour que le peuple vietnamien puisse être compétitif à l’échelle mondiale.
Selon M. Dang Huu Loc, tout effort visant à construire un grand modèle de langue vietnamienne est précieux et doit être commenté de manière spécifique pour rendre le modèle plus complet chaque jour, au lieu d'utiliser certaines lacunes actuelles pour nier tous les efforts des unités technologiques nationales. Les Vietnamiens devraient également diffuser plus largement l’importance de la technologie du grand langage à l’ère de l’IA et discuter davantage de la manière de l’appliquer pour créer de la valeur pour eux-mêmes et les entreprises vietnamiennes, au lieu de comparer les modèles de grand langage vietnamiens avec les meilleurs modèles de grand langage du monde aujourd’hui. Parce que les grands langages sont de l’IA générale, ils peuvent ne pas être bons pour un problème, mais peuvent convenir à un autre problème spécifique. En particulier, le modèle de langue vietnamienne à grande échelle aura un meilleur avantage dans les problèmes liés à la compréhension et à la génération du vietnamien.
Source
Comment (0)