En quittant les États-Unis pour rentrer chez lui, Nguyen Hoang Quan et ses collègues de VILM ont développé un système d'intelligence artificielle (IA) gratuit que les Vietnamiens peuvent utiliser dans les domaines du service client, avec plus de centaines de milliers de téléchargements par mois.
En juin 2023, Nguyen Hoang Quan, 25 ans, et ses collègues Pham Nhut Huy, 23 ans, ingénieur en intelligence artificielle chez ZaloAI, et Dao Minh Dung, 24 ans, doctorant à l'Université de Cork, en Irlande, ont cofondé l'organisation à but non lucratif VILM, avec le désir d'aider les Vietnamiens à découvrir la technologie d'IA la plus avancée de la manière la plus optimale.
Après près de 6 mois de recherche et d’application, l’équipe a développé avec succès trois modèles d’IA gratuits, dont OpenHermes, VinaLlama et Vistral. Il s’agit des études fondamentales pour le développement de systèmes d’IA capables de comprendre et d’agir sur l’intention de l’utilisateur (modèle d’action à grande échelle). Ces modèles sont appliqués dans des domaines technologiques tels que le contrôle des machines, les robots pour mieux aider les personnes handicapées sans soignants, ou aider les programmeurs à corriger les erreurs, les assistants virtuels pour prendre soin des clients ou répondre gratuitement aux questions.
OpenHermes atteint 85 000 téléchargements par mois, atteignant le top 10 des modèles de langage les plus téléchargés sur HuggingFace (le plus grand site de partage de modèles d'IA au monde). Capture d'écran
Le modèle OpenHermes est un grand modèle de langage qui prend en charge l'anglais comme ChatGPT, mais avec des scores supérieurs. Ils permettent aux utilisateurs de télécharger des modèles sur leurs ordinateurs personnels pour les utiliser sans avoir besoin d'Internet. Notamment, le volume de données de formation d'OpenHermes ne représente que 1/100 du volume de données de formation de ChatGPT d'OpenAI. L'application reçoit actuellement plus de 50 000 téléchargements par mois. OpenHermes-2.5 et OpenHermes-2.5-Vision sont utilisés par plus de 40 startups de la Silicon Valley (USA),
VinaLlama et Vistral sont deux modèles linguistiques axés sur le marché vietnamien, visant à aider les utilisateurs nationaux à découvrir plus facilement la technologie d'IA la plus avancée.
Hoang Quan a étudié aux États-Unis pendant 7 ans et a travaillé chez OpenAI en tant qu'ingénieur de recherche pour le modèle d'intelligence artificielle ChatGPT, même s'il n'était pas diplômé universitaire. En 2022, il a travaillé comme ingénieur de données pour le produit Bing Chat de Microsoft et OpenAI avec un revenu de plusieurs milliers de dollars. En 2023, confronté à une vague de licenciements dans le secteur technologique aux États-Unis, Quan s'est rendu compte que le marché du travail après l'obtention du diplôme était très sombre, mais voyant des opportunités au Vietnam, il a décidé de rentrer chez lui.
Nguyen Hoàng Quan. Photo : NVCC
Chez VILM, Quan est ingénieur en chef, principalement chargé de la recherche sur les techniques d'amélioration des données ainsi que sur la formation de l'IA. Alors que Nhat Huy assume le rôle de chercheur technique lors de la formation de l'IA, Minh Dung propose de nouvelles méthodes dans la recherche théorique.
Quan a expliqué que les grands modèles de langage actuels tels que ChatGPT (Large Language Model) ne peuvent fournir qu'une sortie de texte, alors que les humains ont de nombreuses façons de communiquer et d'acquérir des connaissances. C'est pourquoi l'équipe vise à créer un système capable de fonctionner de manière flexible entre différents types d'entrée et de sortie (peut recevoir et sortir des types de données tels que la langue, les images, les vidéos, l'audio), sans s'arrêter uniquement au niveau de la langue.
Pour atteindre l’objectif de créer des modèles d’action de grande taille, l’équipe a dû surmonter deux problèmes : la sécurité et la rapidité. Les applications d’IA actuelles utilisent principalement les données des utilisateurs et les envoient aux serveurs d’entreprises comme OpenAI pour traitement, ce qui soulève des problèmes de sécurité. L’équipe s’est concentrée sur la création de modèles d’IA suffisamment petits et rapides pour être traités directement sur les appareils mobiles, tout en équilibrant les performances et la vitesse pour éviter d’impacter l’expérience utilisateur.
L’équipe expérimentale a utilisé les données générées par l’IA pour permettre à l’IA elle-même d’apprendre, au lieu de suivre la voie consistant à utiliser des données provenant de sources réelles. Au début, ils ont eu du mal à trouver des ressources informatiques (des ordinateurs pour former l’IA), mais ils ont ensuite convaincu de grandes entreprises et des laboratoires du monde entier de les sponsoriser.
Quan a déclaré que la fabrication de ces produits aide principalement les gens à accéder rapidement aux applications d'IA et avec une qualité non inférieure à ChatGPT ou Bing Chat et simplifie la recherche et la création de modèles d'IA à l'avenir. Au lieu d'utiliser ChatGPT qui est limité à la langue et à la culture vietnamiennes, les entreprises vietnamiennes peuvent télécharger VinaLlama en vietnamien.
Le modèle de langage VinaLlama gère facilement un problème mathématique en vietnamien, sur la photo se trouve une démonstration du produit VinaLlama pour résoudre des problèmes mathématiques. Capture d'écran.
M. Dang Hai Loc, fondateur de la plateforme de création de chatbots IA Mindmaid, a déclaré que du point de vue d'un développeur d'applications IA, il s'est rendu compte que le coût et la confidentialité des données sont les deux problèmes qui préoccupent le plus les entreprises lors du déploiement d'applications IA. La solution la plus satisfaisante à ce problème est l'utilisation de modèles LLM open source, qui peuvent fonctionner sur l'infrastructure de l'entreprise et peuvent apprendre (affiner) avec les propres données de l'entreprise. Par conséquent, les modèles LLM open source vietnamiens tels que VinaLlama, Vistral... sont très précieux pour promouvoir les applications d'IA au Vietnam.
« Ces modèles open source permettent également à davantage de programmeurs et de passionnés de technologie d'accéder au domaine de l'ingénierie IA avec un simple MacBook au lieu de devoir investir dans une infrastructure GPU (carte graphique) coûteuse. Cela favorisera également la force de l'ingénieur IA au Vietnam, un rôle très demandé dans un avenir proche », a déclaré M. Loc.
Selon Quan, les Vietnamiens ont de très bonnes bases en théorie scientifique, sont bons en IA et ChatGPT dispose également de ressources humaines participant à la recherche, mais ils ont plus de difficulté à rattraper rapidement la vague technologique en constante évolution. « Ce dont les Vietnamiens ont besoin, c'est d'une expérience dans la fabrication de produits pour que les utilisateurs finaux comprennent vraiment les problèmes qu'ils rencontrent afin d'orienter correctement leurs recherches », a déclaré Quan à propos de la raison de la recherche de modèles d'IA gratuits pour soutenir les Vietnamiens dans le domaine de la technologie. Il a déclaré avoir collaboré avec de nombreux groupes internationaux et être toujours prêt à collaborer avec des groupes de recherche au Vietnam.
Nhu Quynh
Lien source
Comment (0)