Après avoir travaillé pour une grande organisation d’intelligence artificielle aux États-Unis, pourquoi avez-vous décidé de rentrer chez vous pour rejoindre VinBigdata ?
Au cours de ma carrière aux États-Unis, bien que j’aie participé à de nombreux grands projets gouvernementaux, les résultats que j’ai obtenus n’étaient souvent que quelques étapes d’une vaste procédure de traitement. En fait, bien souvent, en raison des procédures de confidentialité très strictes des projets, je ne sais même pas comment les solutions que j'ai développées sont utilisées.
En 2017, je suis retourné au Vietnam alors que le pays était en phase de développement et qu’il y avait de nombreux problèmes liés au big data et à l’intelligence artificielle qui devaient être résolus. J'ai accepté l'invitation du professeur Vu Ha Van pour réaliser conjointement l'objectif de développer des solutions technologiques vietnamiennes pour servir la vie des Vietnamiens. Je trouve mon retour au Vietnam beaucoup plus significatif car je pourrai résoudre des problèmes avec plus d’impact.
Dans la stratégie de développement de l’intelligence artificielle, quel rôle et quelle influence jouent les big data, monsieur ?
Les données jouent un rôle énorme et précieux dans la formation de l’intelligence artificielle. La formation d’un modèle d’intelligence artificielle de haute qualité commence généralement par la formation d’un grand ensemble de données. Par conséquent, pour avoir une intelligence artificielle de qualité, il faut d’abord disposer de bonnes données.
De bonnes données doivent être de bonne qualité en termes de quantité et d’échelle, de qualité, de variété et d’universalité. Le processus de collecte et de traitement de milliers d’heures de données, depuis le nettoyage des données brutes jusqu’à la création de données de la plus haute qualité destinées à alimenter les modèles d’intelligence artificielle, est coûteux et complexe. Au contraire, pour analyser les big data, nous devons utiliser l'intelligence artificielle pour garantir la capacité de traiter les données avec précision à grande échelle, créant ainsi des résultats décisifs ou prédictifs. meilleurs.
Par exemple, dans le cadre du développement d'un produit d'assistant virtuel pour les Vietnamiens (ViVi), nous avons dû collecter et traiter des dizaines de milliers d'heures de données audio de haute qualité, provenant de centaines de milliers de voix provenant de différentes régions. en termes d'âge et de sexe, avec un contenu couvrant des centaines de domaines...
Ou plus récemment, le lancement de ViGPT - « La première version vietnamienne de ChatGPT pour les utilisateurs finaux » développée à partir du Large Language Model entièrement détenu par VinBigdata. Ce modèle est formé sur 600 Go de données vietnamiennes affinées provenant de divers domaines. Grâce à notre connaissance de la langue et des données vietnamiennes, nous avons trouvé une nouvelle approche pour raccourcir le temps de lancement de ViGPT en seulement 9 mois après la naissance de ChatGPT.
C’est la résonance entre le big data et l’intelligence artificielle.
Quel est votre point de vue sur la nécessité de lier la recherche à la valeur pratique pour servir la communauté ?
- Je crois que la recherche technologique n’est véritablement fructueuse que lorsqu’elle entre réellement dans la vie, résout les problèmes sociaux et améliore la vie des gens.
Pour créer des produits commerciaux pratiques qui résolvent les problèmes commerciaux et sociaux, nous devons toujours être attentifs et nous poser la question : quelle valeur les données apporteront-elles à la vie ?
Jusqu'à présent, nous avons recherché et développé une variété de produits et de solutions dans divers secteurs et domaines, notamment ViGPT, VinDr - fournissant des solutions d'IA dans le diagnostic d'imagerie médicale, VinBase - Generative Artificial Intelligence Platform, ou Vizone - une suite d'analyse d'image intelligente solutions.
La quatrième révolution industrielle se déroule à une échelle mondiale. Quels sont, selon vous, les avantages du Vietnam ?
Par rapport aux révolutions précédentes, je pense que le Vietnam dispose actuellement de nombreux atouts pour percer dans cette révolution industrielle 4.0, contribuant ainsi à améliorer la position du pays sur la carte du monde. Les deux clés pour atteindre cet objectif sont les données et les personnes.
Le Vietnam compte actuellement près de 100 millions d’habitants, dont une grande partie de jeunes utilisent des téléphones et des ordinateurs personnels. De plus, nous disposons d’experts réputés en intelligence artificielle et d’un personnel jeune et qualifié en technologies de l’information et avons de très bonnes bases en mathématiques.
Alors, quelles sont les limites ?
La première limitation évidente est que malgré une population importante, nous éprouvons encore des difficultés à maîtriser les données, notamment à les normaliser et à les synchroniser au niveau des installations et des postes commerciaux et administratifs.
En outre, nous sommes également confrontés à d’autres contraintes telles que des ressources d’investissement limitées, notamment dans les infrastructures de calcul haute performance.
Selon vous, quelle est l’importance du rôle de la maîtrise des données vietnamiennes dans le parcours de création et de maîtrise de la technologie au service de la vie des Vietnamiens ?
Il existe actuellement de nombreux produits d'intelligence artificielle de premier plan dans le monde, généralement des produits d'application d'IA générés sur la base de grands modèles de langage tels que ChatGPT d'OpenAI ou Bard de Google. Cependant, le vietnamien n’est pas le groupe linguistique principal pour le développement de ces produits.
Par conséquent, la qualité du contenu spécifique au vietnamien renvoyé aux utilisateurs est plus ou moins affectée et présente une forte possibilité d'erreurs, plus dangereusement, d'erreurs dans les connaissances de base.
En tant que Vietnamiens, nous avons l’avantage d’accéder à nos propres sources de données. Nous sommes les seuls à pouvoir comprendre les caractéristiques des données vietnamiennes, les besoins et les caractéristiques du peuple vietnamien. Par conséquent, la maîtrise des données vietnamiennes est véritablement la clé pour maîtriser les technologies de base, qui sont les technologies qui serviront le peuple vietnamien.
Comment accéder à des sources de données spécifiques, surtout lorsque la plupart des Vietnamiens utilisent aujourd’hui des sites de réseaux sociaux depuis l’étranger ?
Le fait est que la plus grande source de données humaines aujourd’hui (pas seulement les Vietnamiens) se trouve sur Internet et les réseaux sociaux. Cependant, nous pouvons toujours accéder et collecter des données à partir de différentes sources, en fonction de la compréhension des caractéristiques des données vietnamiennes, en fonction des caractéristiques définies par chaque projet.
Par exemple, les modèles GPT d’OpenAI comportent des centaines, voire des milliers de milliards de paramètres, sont entraînés sur des quantités massives de données et coûtent des milliards de dollars. Par rapport à eux, nous avons choisi une direction complètement différente basée sur nos recherches, nos capacités et nos ressources : c'est-à-dire la création d'un modèle de langue vietnamienne avec une architecture de seulement quelques milliards de paramètres, formé sur un ensemble de données vietnamiennes de 600 Go que nous avons collecté et affiné nous-mêmes, mais dispose de capacités de traitement vietnamiennes comparables. Les résultats montrent que notre architecture auto-développée peut s'auto-optimiser, raccourcir le temps de formation du modèle de langage, réduire les coûts tout en garantissant la qualité du modèle.
Quels sont les défis que vous et votre équipe avez rencontrés dans le processus de recherche et de développement de produits d’intelligence artificielle ?
Le premier défi est certainement le temps. La vague de technologie de l’intelligence artificielle arrive très vite et se trouve dans une période de boom. Partout dans le monde, les principales entreprises technologiques ont rapidement lancé des produits très complets, constamment mis à jour et améliorés. Si nous sommes lents et ne livrons pas les produits à temps, nous serons certainement en retard.
D’autre part, si nous voulons créer des produits qui peuvent être appliqués et résoudre des problèmes sociaux pratiques, nous devons également envisager de trouver et de développer les caractéristiques exceptionnelles, spéciales et uniques du produit.
En fait, de nombreuses personnes et organisations au Vietnam et dans le monde ont subi de lourdes pertes à cause des fuites de données. Comment voyez-vous les problèmes de sécurité des données ?
On peut dire que toute application aujourd’hui provient des données. Lorsque nous travaillons avec des données, nous devons d’une part garantir l’objectif d’appliquer les données pour créer la meilleure technologie pour la vie et, d’autre part, nous devons garantir la sécurité des données pour les individus et les organisations.
Le facteur humain est un maillon très important dans le processus de sécurité des données. Ils incluent des développeurs, des utilisateurs de produits et des utilisateurs. Pour les développeurs, la sensibilisation à la sécurité des données doit être présente dès le début de la collecte et du traitement des données.
Souvent, lorsque rien ne se passe, nous ne sommes pas conscients de l’importance de la sécurité des données. Mais si une violation de données se produit, les dégâts pourraient être énormes. Les violations de données peuvent survenir en raison de problèmes techniques ou d’attaques intentionnelles de vol de données. Lorsque des données sont divulguées, les informations des individus ou des organisations peuvent être utilisées par des malfaiteurs à des fins illégales, et les entreprises peuvent subir des pertes financières pour résoudre les problèmes liés, voire nuire à leur marque.
Après l'aspiration à maîtriser la technologie pour servir le peuple vietnamien, y aura-t-il des étapes pour progresser vers le monde ?
Toute organisation ou entreprise qui souhaite introduire ses produits sur le marché international doit se conformer aux normes internationales. VinBigdata dispose d'atouts en matière de solutions et de technologie, il est donc naturel de se fixer une vision pour conquérir le monde.
Bien entendu, pour déployer de nombreux produits et applications différents, il est nécessaire de bénéficier du soutien d'unités internationales disposant de nombreuses années d'expérience et de compréhension des utilisateurs du monde entier.
Merci!
Source : https://thanhnien.vn/ts-dao-duc-minh-lam-chu-du-lieu-viet-la-buoc-dau-phat-trien-va-nam-giu-cong-nghe-viet- 18524052710263732.htm
Comment (0)