Vietnam.vn - Nền tảng quảng bá Việt Nam

„Die Beherrschung vietnamesischer Daten ist der erste Schritt zur Entwicklung und Beherrschung vietnamesischer Technologie“

Báo Thanh niênBáo Thanh niên27/05/2024

[Anzeige_1]
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 1.

Nachdem Sie für eine große Organisation für künstliche Intelligenz in den USA gearbeitet hatten, warum haben Sie sich entschieden, in Ihre Heimat zurückzukehren und bei VinBigdata anzufangen?

Obwohl ich während meiner Zeit in den USA an vielen großen Regierungsprojekten mitwirkte, waren die Ergebnisse, die ich erzielte, oft nur wenige Schritte in einem großen Verarbeitungsprozess. Tatsächlich weiß ich aufgrund der sehr strengen Vertraulichkeitsverfahren der Projekte oft nicht einmal, wie die von mir entwickelten Lösungen verwendet werden.

Im Jahr 2017 kehrte ich nach Vietnam zurück, als sich das Land noch in der Entwicklungsphase befand und es viele Probleme im Zusammenhang mit Big Data und künstlicher Intelligenz gab, die gelöst werden mussten. Ich habe die Einladung von Professor Vu Ha Van angenommen, um gemeinsam das Ziel zu verwirklichen, vietnamesische Technologielösungen zu entwickeln, die dem Leben der Vietnamesen dienen. Für mich ist meine Rückkehr nach Vietnam viel bedeutsamer, weil ich dort Probleme mit größerer Wirkung angehen kann.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 2.

Dr. Dao Duc Minh in einem Workshop

Welche Rolle und welchen Einfluss spielen Big Data in der Strategie zur Entwicklung künstlicher Intelligenz, Sir?

Daten spielen beim Training künstlicher Intelligenz eine große und wertvolle Rolle. Das Training eines hochwertigen künstlichen Intelligenzmodells beginnt normalerweise mit dem Training eines großen Datensatzes. Um über hochwertige künstliche Intelligenz zu verfügen, benötigen wir daher zunächst gute Daten.

Gute Daten müssen hinsichtlich Quantität und Umfang, Qualität, Vielfalt und Universalität die richtige Qualität aufweisen. Der Prozess des Sammelns und Verarbeitens von Tausenden von Stunden an Daten, vom Schritt der Rohdatenbereinigung bis zur Erstellung von Daten höchster Qualität zur Einspeisung in Modelle der künstlichen Intelligenz, ist sehr teuer und komplex. Im Gegenteil: Um Big Data zu analysieren, müssen wir künstliche Intelligenz einsetzen, um die Fähigkeit sicherzustellen, Daten in großem Maßstab präzise zu verarbeiten und dadurch bessere Entscheidungs- oder Vorhersageergebnisse zu erzielen.

Beispielsweise mussten wir im Zuge der Entwicklung eines virtuellen Assistenten für Vietnamesen (ViVi) Zehntausende Stunden hochwertiger Audiodaten von Hunderttausenden Stimmen aus verschiedenen Regionen, unterschiedlichen Alters und Geschlechts und mit Inhalten aus Hunderten von Bereichen sammeln und verarbeiten ...

Oder zuletzt die Einführung von ViGPT – „der ersten vietnamesischen Version von ChatGPT für Endbenutzer“, entwickelt auf der Grundlage des Large Language Model, das vollständig im Besitz von VinBigdata ist. Dieses Modell wird anhand von 600 GB fein abgestimmter vietnamesischer Daten aus verschiedenen Bereichen trainiert. Mit unseren Kenntnissen der vietnamesischen Sprache und Daten haben wir einen neuen Ansatz gefunden, um die Startzeit von ViGPT innerhalb von nur 9 Monaten nach der Geburt von ChatGPT zu verkürzen.

Dies ist die Resonanz zwischen Big Data und künstlicher Intelligenz.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 3.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 4.

Wie stehen Sie dazu, Forschung mit praktischem Nutzen zu verknüpfen, um der Gemeinschaft zu dienen?

- Ich glaube, dass Technologieforschung nur dann wirklich erfolgreich ist, wenn sie tatsächlich ins Leben eintritt, soziale Probleme löst und das Leben der Menschen verbessert.

Um praktische kommerzielle Produkte zu schaffen, die geschäftliche und soziale Probleme lösen, müssen wir stets aufmerksam sein und die Frage stellen: Welchen Wert bringen Daten ins Leben?

Bisher haben wir eine Vielzahl von Produkten und Lösungen für verschiedene Branchen und Bereiche erforscht und entwickelt, insbesondere ViGPT, VinDr – Anbieter von KI-Lösungen für die medizinische Bilddiagnose, VinBase – eine Plattform für bio-künstliche Intelligenz – oder Vizone – eine Reihe intelligenter Bildanalyselösungen.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 5.

Mit Schlüsselpersonal von VinBigdata bei einer Veranstaltung der Vingroup Corporation

Die vierte industrielle Revolution findet weltweit in großem Ausmaß statt. Welche Vorteile hat Vietnam Ihrer Meinung nach?

Ich denke, dass Vietnam im Vergleich zu früheren Revolutionen derzeit über viele Vorteile verfügt, um in dieser industriellen Revolution 4.0 durchzubrechen und so die Position des Landes auf der Weltkarte zu verbessern. Die beiden Schlüssel zum Erreichen dieses Ziels sind Daten und Menschen.

Vietnam hat derzeit fast 100 Millionen Einwohner, von denen ein großer Anteil junge Menschen sind, die Telefone und PCs nutzen. Darüber hinaus verfügen wir über renommierte Experten im Bereich Künstliche Intelligenz und junges, qualifiziertes Personal im Bereich Informationstechnologie und haben eine sehr gute mathematische Grundlage.

Was sind also die Einschränkungen?

Die erste offensichtliche Einschränkung besteht darin, dass wir trotz unserer großen Bevölkerung immer noch Schwierigkeiten haben, Daten zu beherrschen, insbesondere mit der Standardisierung und Synchronisierung von Daten in Einrichtungen, Geschäftseinheiten und Verwaltungen.

Darüber hinaus sind wir mit weiteren Einschränkungen konfrontiert, beispielsweise begrenzten Investitionsmitteln, insbesondere bei Investitionen in die Infrastruktur für Hochleistungsrechner.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 6.

Wie wichtig ist Ihrer Meinung nach die Rolle der vietnamesischen Datenbeherrschung bei der Entwicklung und Beherrschung von Technologien, die dem Leben der Vietnamesen dienen?

Derzeit gibt es weltweit viele führende Produkte zur künstlichen Intelligenz, typischerweise KI-Anwendungsprodukte, die auf der Grundlage großer Sprachmodelle generiert werden, wie etwa ChatGPT von OpenAI oder Bard von Google. Allerdings ist Vietnamesisch nicht die Hauptsprachengruppe für die Entwicklung dieser Produkte.

Daher ist die Qualität der an die Benutzer zurückgegebenen vietnamesischspezifischen Inhalte mehr oder weniger beeinträchtigt und es besteht eine hohe Fehlerwahrscheinlichkeit, gefährlicher noch, Fehler in den Grundkenntnissen.

Als Vietnamesen haben wir den Vorteil, auf unsere eigenen Datenquellen zugreifen zu können. Nur wir sind in der Lage, die Besonderheiten vietnamesischer Daten sowie die Bedürfnisse und Eigenschaften der Vietnamesen zu verstehen. Daher ist die Beherrschung vietnamesischer Daten der Schlüssel zur Beherrschung von Kerntechnologien, also Technologien, die der vietnamesischen Bevölkerung von Nutzen sein werden.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 7.

Interne Schulung für VinBigdata-Mitglieder

Wie kann man auf bestimmte Datenquellen zugreifen, insbesondere wenn die meisten Vietnamesen heutzutage soziale Netzwerke aus dem Ausland nutzen?

Tatsache ist, dass die größte Quelle menschlicher Daten (nicht nur über Vietnamesen) heute das Internet und soziale Netzwerke sind. Wir können jedoch basierend auf unserem Verständnis der vietnamesischen Datenmerkmale und abhängig von den durch jedes Projekt festgelegten Merkmalen weiterhin auf Daten aus verschiedenen Quellen zugreifen und diese erfassen.

Beispielsweise verfügen die GPT-Modelle von OpenAI über Hunderte oder sogar Billionen von Parametern, werden anhand riesiger Datenmengen trainiert und kosten Milliarden von Dollar. Im Vergleich zu ihnen haben wir auf der Grundlage unserer Forschung, Fähigkeiten und Ressourcen eine völlig andere Richtung eingeschlagen: nämlich die Erstellung eines vietnamesischen Sprachmodells mit einer Architektur von nur wenigen Milliarden Parametern, das auf einem 600 GB großen vietnamesischen Datensatz trainiert wurde, den wir selbst gesammelt und verfeinert haben, das aber hinsichtlich der Verarbeitungskapazität für Vietnamesisch über gleichwertige Fähigkeiten verfügt. Die Ergebnisse zeigen, dass unsere selbst entwickelte Architektur sich selbst optimieren, die Trainingszeit für Sprachmodelle verkürzen und die Kosten senken kann, während gleichzeitig die Modellqualität gewährleistet bleibt.

Vor welchen Herausforderungen sind Sie und Ihr Team bei der Erforschung und Entwicklung von Produkten im Bereich der künstlichen Intelligenz gestoßen?

Die erste Herausforderung ist sicherlich die Zeit. Die Welle der künstlichen Intelligenz-Technologie kommt sehr schnell und befindet sich in einer Boomphase. Weltweit haben führende Technologieunternehmen schnell hochkomplette Produkte auf den Markt gebracht, die ständig aktualisiert und verbessert werden. Wenn wir langsam sind und Produkte nicht rechtzeitig liefern, geraten wir definitiv in Rückstand.

Wenn wir andererseits Produkte schaffen wollen, die anwendbar sind und praktische soziale Probleme lösen, müssen wir auch darüber nachdenken, die herausragenden, besonderen und einzigartigen Eigenschaften des Produkts zu finden und zu entwickeln.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 8.

Präsentation beim Vietnam Artificial Intelligence Day (AI4VN 2023)

Tatsächlich haben viele Einzelpersonen und Organisationen in Vietnam und auf der ganzen Welt durch Datenlecks große Verluste erlitten. Wie stehen Sie zu Fragen der Datensicherheit?

Man kann sagen, dass jede Anwendung heutzutage auf Daten basiert. Bei der Arbeit mit Daten müssen wir einerseits das Ziel sicherstellen, mithilfe der Daten die beste Technologie für das Leben zu schaffen, und andererseits die Datensicherheit für Einzelpersonen und Organisationen gewährleisten.

Der menschliche Faktor ist ein sehr wichtiges Bindeglied im Datensicherheitsprozess. Dazu gehören Entwickler, Produktbenutzer und Benutzer. Das Bewusstsein für die Datensicherheit muss bei Entwicklern von Beginn der Datenerfassung und -verarbeitung an vorhanden sein.

Oftmals ist uns die Bedeutung der Datensicherheit nicht bewusst, wenn nichts passiert. Kommt es jedoch zu einem Datenleck, kann der Schaden enorm sein. Datenpannen können aufgrund technischer Probleme oder aufgrund vorsätzlicher Datendiebstahlangriffe auftreten. Wenn Daten durchsickern, können die Informationen von Einzelpersonen oder Organisationen von Kriminellen für illegale Zwecke missbraucht werden, während Unternehmen bei der Behebung der damit verbundenen Probleme finanzielle Verluste erleiden und sogar ihrem Markennamen schaden können.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 9.

Dr. Dao Duc Minh und das VinBigdata-Team bei einer Veranstaltung

Wird es nach dem Bestreben, die Technologie zu beherrschen, um dem vietnamesischen Volk zu dienen, Schritte geben, um in die Welt vorzudringen?

Jede Organisation oder jedes Unternehmen, das seine Produkte auf den internationalen Markt bringen möchte, muss internationale Standards einhalten. VinBigdata hat Stärken in den Bereichen Lösungen und Technologie, daher ist es ganz natürlich, eine Vision zur Eroberung der Welt zu entwickeln.

Für den Einsatz in vielen verschiedenen Produkten und Anwendungen ist natürlich die Unterstützung internationaler Einheiten mit langjähriger Erfahrung und Verständnis für die Benutzer auf der ganzen Welt erforderlich.

Danke schön!


[Anzeige_2]
Quelle: https://thanhnien.vn/ts-dao-duc-minh-lam-chu-du-lieu-viet-la-buoc-dau-phat-trien-va-nam-giu-cong-nghe-viet-18524052710263732.htm

Kommentar (0)

No data
No data

Gleiches Thema

Gleiche Kategorie

Steigerung der Attraktivität Hanois durch Blumentourismus-Spots
Internationales Musikfestival „Road To 8Wonder – Die nächste Ikone“
Spektakulärer Start des vietnamesischen Filmmarktes im Jahr 2025
Phan Dinh Tung veröffentlicht vor dem Konzert ein neues Lied „Anh trai vu ngan cong gai“

Gleicher Autor

Erbe

Figur

Geschäft

No videos available

Nachricht

Politisches System

Lokal

Produkt