« La maîtrise des données vietnamiennes est la première étape du développement et de la maîtrise de la technologie vietnamienne »

Báo Thanh niênBáo Thanh niên27/05/2024


TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 1.

Après avoir travaillé pour une grande organisation d’intelligence artificielle aux États-Unis, pourquoi avez-vous décidé de rentrer chez vous pour rejoindre VinBigdata ?

Au cours de ma carrière aux États-Unis, bien que j’aie participé à de nombreux grands projets gouvernementaux, les résultats que j’ai obtenus n’étaient souvent que quelques étapes d’une vaste procédure de traitement. En fait, bien souvent, en raison des procédures de confidentialité très strictes des projets, je ne sais même pas comment les solutions que j'ai développées sont utilisées.

En 2017, je suis retourné au Vietnam alors que le pays était en phase de développement et qu’il y avait de nombreux problèmes liés au big data et à l’intelligence artificielle qui devaient être résolus. J'ai accepté l'invitation du professeur Vu Ha Van pour réaliser conjointement l'objectif de développer des solutions technologiques vietnamiennes pour servir la vie des Vietnamiens. Je trouve mon retour au Vietnam beaucoup plus significatif car je pourrai résoudre des problèmes avec plus d’impact.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 2.

Dr Dao Duc Minh lors d'un atelier

Dans la stratégie de développement de l’intelligence artificielle, quel rôle et quelle influence jouent les big data, monsieur ?

Les données jouent un rôle énorme et précieux dans la formation de l’intelligence artificielle. La formation d’un modèle d’intelligence artificielle de haute qualité commence généralement par la formation d’un grand ensemble de données. Par conséquent, pour avoir une intelligence artificielle de qualité, il faut d’abord disposer de bonnes données.

De bonnes données doivent être de bonne qualité en termes de quantité et d’échelle, de qualité, de variété et d’universalité. Le processus de collecte et de traitement de milliers d’heures de données, depuis le nettoyage des données brutes jusqu’à la création de données de la plus haute qualité destinées à alimenter les modèles d’intelligence artificielle, est coûteux et complexe. Au contraire, pour analyser les big data, nous devons utiliser l'intelligence artificielle pour garantir la capacité de traiter les données avec précision à grande échelle, créant ainsi des résultats décisifs ou prédictifs. meilleurs.

Par exemple, dans le cadre du développement d'un produit d'assistant virtuel pour les Vietnamiens (ViVi), nous avons dû collecter et traiter des dizaines de milliers d'heures de données audio de haute qualité, provenant de centaines de milliers de voix provenant de différentes régions. en termes d'âge et de sexe, avec un contenu couvrant des centaines de domaines...

Ou plus récemment, le lancement de ViGPT - « La première version vietnamienne de ChatGPT pour les utilisateurs finaux » développée à partir du Large Language Model entièrement détenu par VinBigdata. Ce modèle est formé sur 600 Go de données vietnamiennes affinées provenant de divers domaines. Grâce à notre connaissance de la langue et des données vietnamiennes, nous avons trouvé une nouvelle approche pour raccourcir le temps de lancement de ViGPT en seulement 9 mois après la naissance de ChatGPT.

C’est la résonance entre le big data et l’intelligence artificielle.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 3.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 4.

Quel est votre point de vue sur la nécessité de lier la recherche à la valeur pratique pour servir la communauté ?

- Je crois que la recherche technologique n’est véritablement fructueuse que lorsqu’elle entre réellement dans la vie, résout les problèmes sociaux et améliore la vie des gens.

Pour créer des produits commerciaux pratiques qui résolvent les problèmes commerciaux et sociaux, nous devons toujours être attentifs et nous poser la question : quelle valeur les données apporteront-elles à la vie ?

Jusqu'à présent, nous avons recherché et développé une variété de produits et de solutions dans divers secteurs et domaines, notamment ViGPT, VinDr - fournissant des solutions d'IA dans le diagnostic d'imagerie médicale, VinBase - Generative Artificial Intelligence Platform, ou Vizone - une suite d'analyse d'image intelligente solutions.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 5.

Avec le personnel clé de VinBigdata lors d'un événement de Vingroup Corporation

La quatrième révolution industrielle se déroule à une échelle mondiale. Quels sont, selon vous, les avantages du Vietnam ?

Par rapport aux révolutions précédentes, je pense que le Vietnam dispose actuellement de nombreux atouts pour percer dans cette révolution industrielle 4.0, contribuant ainsi à améliorer la position du pays sur la carte du monde. Les deux clés pour atteindre cet objectif sont les données et les personnes.

Le Vietnam compte actuellement près de 100 millions d’habitants, dont une grande partie de jeunes utilisent des téléphones et des ordinateurs personnels. De plus, nous disposons d’experts réputés en intelligence artificielle et d’un personnel jeune et qualifié en technologies de l’information et avons de très bonnes bases en mathématiques.

Alors, quelles sont les limites ?

La première limitation évidente est que malgré une population importante, nous éprouvons encore des difficultés à maîtriser les données, notamment à les normaliser et à les synchroniser au niveau des installations et des postes commerciaux et administratifs.

En outre, nous sommes également confrontés à d’autres contraintes telles que des ressources d’investissement limitées, notamment dans les infrastructures de calcul haute performance.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 6.

Selon vous, quelle est l’importance du rôle de la maîtrise des données vietnamiennes dans le parcours de création et de maîtrise de la technologie au service de la vie des Vietnamiens ?

Il existe actuellement de nombreux produits d'intelligence artificielle de premier plan dans le monde, généralement des produits d'application d'IA générés sur la base de grands modèles de langage tels que ChatGPT d'OpenAI ou Bard de Google. Cependant, le vietnamien n’est pas le groupe linguistique principal pour le développement de ces produits.

Par conséquent, la qualité du contenu spécifique au vietnamien renvoyé aux utilisateurs est plus ou moins affectée et présente une forte possibilité d'erreurs, plus dangereusement, d'erreurs dans les connaissances de base.

En tant que Vietnamiens, nous avons l’avantage d’accéder à nos propres sources de données. Nous sommes les seuls à pouvoir comprendre les caractéristiques des données vietnamiennes, les besoins et les caractéristiques du peuple vietnamien. Par conséquent, la maîtrise des données vietnamiennes est véritablement la clé pour maîtriser les technologies de base, qui sont les technologies qui serviront le peuple vietnamien.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 7.

Formation interne pour les membres de VinBigdata

Comment accéder à des sources de données spécifiques, surtout lorsque la plupart des Vietnamiens utilisent aujourd’hui des sites de réseaux sociaux depuis l’étranger ?

Le fait est que la plus grande source de données humaines aujourd’hui (pas seulement les Vietnamiens) se trouve sur Internet et les réseaux sociaux. Cependant, nous pouvons toujours accéder et collecter des données à partir de différentes sources, en fonction de la compréhension des caractéristiques des données vietnamiennes, en fonction des caractéristiques définies par chaque projet.

Par exemple, les modèles GPT d’OpenAI comportent des centaines, voire des milliers de milliards de paramètres, sont entraînés sur des quantités massives de données et coûtent des milliards de dollars. Par rapport à eux, nous avons choisi une direction complètement différente basée sur nos recherches, nos capacités et nos ressources : c'est-à-dire la création d'un modèle de langue vietnamienne avec une architecture de seulement quelques milliards de paramètres, formé sur un ensemble de données vietnamiennes de 600 Go que nous avons collecté et affiné nous-mêmes, mais dispose de capacités de traitement vietnamiennes comparables. Les résultats montrent que notre architecture auto-développée peut s'auto-optimiser, raccourcir le temps de formation du modèle de langage, réduire les coûts tout en garantissant la qualité du modèle.

Quels sont les défis que vous et votre équipe avez rencontrés dans le processus de recherche et de développement de produits d’intelligence artificielle ?

Le premier défi est certainement le temps. La vague de technologie de l’intelligence artificielle arrive très vite et se trouve dans une période de boom. Partout dans le monde, les principales entreprises technologiques ont rapidement lancé des produits très complets, constamment mis à jour et améliorés. Si nous sommes lents et ne livrons pas les produits à temps, nous serons certainement en retard.

D’autre part, si nous voulons créer des produits qui peuvent être appliqués et résoudre des problèmes sociaux pratiques, nous devons également envisager de trouver et de développer les caractéristiques exceptionnelles, spéciales et uniques du produit.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 8.

Présentation à la Journée de l'intelligence artificielle du Vietnam (AI4VN 2023)

En fait, de nombreuses personnes et organisations au Vietnam et dans le monde ont subi de lourdes pertes à cause des fuites de données. Comment voyez-vous les problèmes de sécurité des données ?

On peut dire que toute application aujourd’hui provient des données. Lorsque nous travaillons avec des données, nous devons d’une part garantir l’objectif d’appliquer les données pour créer la meilleure technologie pour la vie et, d’autre part, nous devons garantir la sécurité des données pour les individus et les organisations.

Le facteur humain est un maillon très important dans le processus de sécurité des données. Ils incluent des développeurs, des utilisateurs de produits et des utilisateurs. Pour les développeurs, la sensibilisation à la sécurité des données doit être présente dès le début de la collecte et du traitement des données.

Souvent, lorsque rien ne se passe, nous ne sommes pas conscients de l’importance de la sécurité des données. Mais si une violation de données se produit, les dégâts pourraient être énormes. Les violations de données peuvent survenir en raison de problèmes techniques ou d’attaques intentionnelles de vol de données. Lorsque des données sont divulguées, les informations des individus ou des organisations peuvent être utilisées par des malfaiteurs à des fins illégales, et les entreprises peuvent subir des pertes financières pour résoudre les problèmes liés, voire nuire à leur marque.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 9.

Le Dr Dao Duc Minh et l'équipe VinBigdata lors d'un événement

Après l'aspiration à maîtriser la technologie pour servir le peuple vietnamien, y aura-t-il des étapes pour progresser vers le monde ?

Toute organisation ou entreprise qui souhaite introduire ses produits sur le marché international doit se conformer aux normes internationales. VinBigdata dispose d'atouts en matière de solutions et de technologie, il est donc naturel de se fixer une vision pour conquérir le monde.

Bien entendu, pour déployer de nombreux produits et applications différents, il est nécessaire de bénéficier du soutien d'unités internationales disposant de nombreuses années d'expérience et de compréhension des utilisateurs du monde entier.

Merci!



Source : https://thanhnien.vn/ts-dao-duc-minh-lam-chu-du-lieu-viet-la-buoc-dau-phat-trien-va-nam-giu-cong-nghe-viet- 18524052710263732.htm

Comment (0)

No data
No data
A l'occasion du Têt, libérer des animaux pour semer la compassion : Comment libérer correctement les animaux ?

A l'occasion du Têt, libérer des animaux pour semer la compassion : Comment libérer correctement les animaux ?

Event Calendar

Cùng chủ đề

La technologie vietnamienne ouvre de nouvelles opportunités

La technologie vietnamienne ouvre de nouvelles opportunités

Báo Thanh niên
Báo Thanh niên
30/01/2025
VinBigdata est dans le Top 10 mondial des technologies de reconnaissance faciale

VinBigdata est dans le Top 10 mondial des technologies de reconnaissance faciale

VietNamNet
VietNamNet
19/11/2024
L’IA crée une biologie « purement vietnamienne » et une opportunité en or pour l’accélération de l’économie

L’IA crée une biologie « purement vietnamienne » et une opportunité en or pour l’accélération de l’économie

Thời báo Ngân hàng
Thời báo Ngân hàng
28/10/2024
VinBigdata lance une solution d'IA pour la finance, la banque et l'assurance

VinBigdata lance une solution d'IA pour la finance, la banque et l'assurance

Báo Thanh niên
Báo Thanh niên
13/09/2024
VinBigdata lance une solution d'IA pour la banque, la finance et l'assurance

VinBigdata lance une solution d'IA pour la banque, la finance et l'assurance

VietNamNet
VietNamNet
12/09/2024
La solution Vizone Access de VinBigdata obtient une certification mondiale

La solution Vizone Access de VinBigdata obtient une certification mondiale

Báo điện tử VOV
Báo điện tử VOV
31/07/2024

Cùng chuyên mục

Le Premier ministre souhaite une bonne année et inspecte l'aéroport de Long Thanh

Le Premier ministre souhaite une bonne année et inspecte l'aéroport de Long Thanh

Báo Giao thông
Báo Giao thông
2 giờ trước
Réalisateur Mai Thanh Tung

Réalisateur Mai Thanh Tung

Báo Đô thị
Báo Đô thị
3 giờ trước
Déployer activement des activités sur les normes, les mesures et la propriété intellectuelle

Déployer activement des activités sur les normes, les mesures et la propriété intellectuelle

Báo Công thương
Báo Công thương
2 giờ trước
Les femmes générales talentueuses de l'armée de Tay Son

Les femmes générales talentueuses de l'armée de Tay Son

Người Lao Động
Người Lao Động
3 giờ trước
Les réfugiés birmans vivent dans la précarité en Thaïlande

Les réfugiés birmans vivent dans la précarité en Thaïlande

Công Luận
Công Luận
một giờ trước
VIDÉO : Célébration des 30 ans de relations diplomatiques entre les États-Unis

VIDÉO : Célébration des 30 ans de relations diplomatiques entre les États-Unis

Người Lao Động
Người Lao Động
2 giờ trước

Cùng tác giả

L'armée garde secrète l'identité d'une femme pilote d'hélicoptère

L'armée garde secrète l'identité d'une femme pilote d'hélicoptère

Báo Thanh niên
Báo Thanh niên
một giờ trước
Ouverture printanière attrayante à Thien Truong, en attendant que le « général » Phuc montre son talent

Ouverture printanière attrayante à Thien Truong, en attendant que le « général » Phuc montre son talent

Báo Thanh niên
Báo Thanh niên
một giờ trước
Le cercle vicieux du changement de « généraux » des équipes de la V-League

Le cercle vicieux du changement de « généraux » des équipes de la V-League

Báo Thanh niên
Báo Thanh niên
2 giờ trước
En plus de l'ao dai, les femmes devraient choisir un ensemble de chemise en brocart accrocheur.

En plus de l'ao dai, les femmes devraient choisir un ensemble de chemise en brocart accrocheur.

Báo Thanh niên
Báo Thanh niên
2 giờ trước
Apple Intelligence est sur le point d'ajouter plus de langues, mais le vietnamien n'est pas encore disponible

Apple Intelligence est sur le point d'ajouter plus de langues, mais le vietnamien n'est pas encore disponible

Báo Thanh niên
Báo Thanh niên
2 giờ trước
Les plats du Têt sont considérés comme une « guerre » extrêmement étrange

Les plats du Têt sont considérés comme une « guerre » extrêmement étrange

Báo Thanh niên
Báo Thanh niên
2 giờ trước
Happy VietNam

Tác phẩm Ngày hè

Chiffre

9 enseignants jouent au loup-garou avec leurs élèves pour concevoir des outils d'apprentissage uniques

9 enseignants jouent au loup-garou avec leurs élèves pour concevoir des outils d'apprentissage uniques

Báo Dân trí
Báo Dân trí
7 giờ trước
« Ancien du village » dans Bach Long Vi

« Ancien du village » dans Bach Long Vi

Báo Thanh niên
Báo Thanh niên
7 giờ trước
Le gardien de l'âme du métier d'apiculture à U Minh

Le gardien de l'âme du métier d'apiculture à U Minh

Báo Thanh niên
Báo Thanh niên
7 giờ trước
Une étudiante vietnamienne « 5 bonnes » années du Serpent dans le pays du Bélier

Une étudiante vietnamienne « 5 bonnes » années du Serpent dans le pays du Bélier

Báo Tiền Phong
Báo Tiền Phong
7 giờ trước
Deux beautés rendent la médecine vietnamienne célèbre

Deux beautés rendent la médecine vietnamienne célèbre

Báo Tiền Phong
Báo Tiền Phong
31/01/2025
Une jeune fille belge retourne à Ho Chi Minh-Ville pour retrouver sa mère et prend une décision qui choque tout le monde : le rêve du Nouvel An

Une jeune fille belge retourne à Ho Chi Minh-Ville pour retrouver sa mère et prend une décision qui choque tout le monde : le rêve du Nouvel An

Báo Thanh niên
Báo Thanh niên
31/01/2025
Têt dans les rêves : des sourires dans le « village de la ferraille »
Têt dans les rêves : des sourires dans le « village de la ferraille »
Ho Chi Minh-Ville vue d'en haut
Ho Chi Minh-Ville vue d'en haut
Belle image d'un champ de chrysanthèmes en saison de récolte
Belle image d'un champ de chrysanthèmes en saison de récolte
Les jeunes ont fait la queue dès 6h30 du matin et ont attendu 7 heures pour prendre des photos dans un ancien café.
Les jeunes ont fait la queue dès 6h30 du matin et ont attendu 7 heures pour prendre des photos dans un ancien café.

No videos available