Trang chủNewsKhoa học - Công nghệPhở GPT ghi tên Việt Nam lên bản đồ công nghệ thế...

Phở GPT ghi tên Việt Nam lên bản đồ công nghệ thế giới


Phở GPT được viết tắt của Phở – Generative Pre-trained Transformer, là dự án mô hình ngôn ngữ lớn dành riêng cho tiếng Việt, do đội ngũ kỹ sư VinAI – thành viên của Tập đoàn Vingroup – thực hiện.

“Bắt kịp” nhịp công nghệ thế giới

Phở GPT sử dụng mã nguồn mở (Open-source) thay vì là phần mềm sở hữu riêng như ChatGPT của OpenAI. Nghĩa là mã nguồn của Phở GPT công khai, có sẵn và người sử dụng có thể đóng góp cho sự phát triển của Phở GPT thông qua những ứng dụng tuỳ chỉnh.

Theo giới thiệu của VinAI, Phở GPT có 7,5 tỷ tham số, được xây dựng trên nền tảng giải mã Transformer. Mô hình này được huấn luyện từ đầu, sử dụng những kỹ thuật tiên tiến nhất hiện có như cơ chế tập trung chớp nhoáng (Flash Attention) và ngoại suy độ dài ngữ cảnh AliBi.

Những kỹ thuật này không chỉ giúp Phở GPT hiểu sâu hơn về ngữ cảnh, mà còn làm tăng khả năng đối thoại, tương tác tự nhiên của ứng dụng trong quá trình sử dụng. Điều này giúp mô hình trở thành công cụ đa nhiệm và linh hoạt, có khả năng đáp ứng đa dạng nhu cầu ngôn ngữ của người sử dụng.

ông Bùi Hải Hưng, Tổng Giám đốc VinAI.

ông Bùi Hải Hưng, Tổng Giám đốc VinAI.

Chia sẻ về ý nghĩa của việc Phở GPT ra đời, ông Bùi Hải Hưng, Tổng Giám đốc VinAI, cho biết, mục tiêu của dự án là phát triển những mô hình tương tự ChatGPT cho tiếng Việt và văn hóa người Việt. Phở GPT có khả năng hiểu, viết văn phong tiếng Việt một cách vượt bậc so với các công nghệ về ngôn ngữ thế hệ trước. Mô hình cũng được huấn luyện từ đầu với tập dữ liệu tiếng Việt, không phụ thuộc bất cứ mô hình nào khác của thế giới, đảm bảo việc làm chủ công nghệ lõi tiên tiến cho Việt Nam.

Đáng nói, ngay khi thế giới đang xôn xao về sự ra đời của Chat GPT, một năm sau đó, Phở GPT đã xuất hiện tại Việt Nam. Theo chia sẻ của ông Bùi Hải Hưng, VinAI là đơn vị tiên phong tại Đông Nam Á cho ra mắt mô hình ngôn ngữ lớn với mã nguồn mở. Sau đó vài tuần, sản phẩm tương tự mới được ra mắt tại Singapore.

Nâng tầm AI Việt

Kết quả so sánh phiên bản Phở GPT-7B5-Instruct với ChatGPT mã nguồn đóng (GPT-3.5-turbo) và các mô hình mã nguồn mở khác cho thấy, Phở GPT đứng thứ hai, chỉ sau ChatGPT trong hầu hết mục đánh giá.

Phở GPT có nhiều điểm khác biệt so với những mô hình ngôn ngữ khác, đặc biệt là ChatGPT. Nó được thiết kế để hiểu và viết văn phong tiếng Việt một cách tự nhiên, phản ánh đúng ngữ cảnh, ngữ pháp, từ vựng, cách diễn đạt của người Việt. Nó có thể tương tác với người dùng theo chủ đề liên quan đến văn hoá, lịch sử, địa lý, xã hội, giải trí, thể thao… của Việt Nam.

Thêm nữa, Phở GPT sở hữu mã nguồn mở và linh hoạt. Người dùng có thể phát triển ứng dụng tùy chỉnh và độc đáo, đặc biệt là ứng dụng đòi hỏi sự bảo mật cao mà không phụ thuộc nguồn từ các phần mềm sở hữu riêng.

Đồng thời, điểm ưu tiên của Phở GPT còn là hiệu suất cao và tiết kiệm chi phí với việc được huấn luyện bằng kỹ thuật tối ưu hóa mới nhất, giúp giảm kích thước và tăng tốc độ của ứng dụng. Phở GPT cũng có thể chạy trên nền tảng tính toán nhỏ hơn, giúp giảm chi phí, tiết kiệm tài nguyên.

Được đào tạo với kho dữ liệu tiếng Việt có dung lượng lên đến 41GB, trong đó, 1GB văn bản Wikipedia và một biến thể 40GB đã loại bỏ phần trùng lặp từ tập dữ liệu tin tức, được huấn luyện cách sử dụng thư viện llm-foundry của Mosaicml llm, Phở GPT có thể sinh ra các đoạn văn bản theo yêu cầu của người dùng, như bài viết, thơ, bài hát, luận, bài phát biểu, giới thiệu… Phở GPT cũng có thể tạo ra nội dung sáng tạo, hài hước, như truyện ngắn, lời bình, châm ngôn, lời nhắn, tweet, meme… Đồng thời, nó còn đối thoại với người dùng theo chủ đề khác nhau như thời sự, giáo dục, sức khỏe, du lịch, ẩm thực, thể thao, giải trí… Bên cạnh đó, Phở GPT cũng có thể trả lời câu hỏi của người dùng, cung cấp thông tin, tư vấn, hỗ trợ, giải đáp thắc mắc…

Thêm nữa, Phở GPT có thể dịch các đoạn văn bản hoặc loại văn bản có tính chất khác nhau như văn bản chính thức, thương mại, học thuật, văn học… từ tiếng Việt sang ngôn ngữ khác và ngược lại.

Một tính năng nổi bật nữa đó là Phở GPT phân tích, xử lý các đoạn văn bản, như tóm tắt, phân loại, gán nhãn, trích xuất thông tin, phát hiện cảm xúc, phát hiện sai sót, cải thiện văn phong…

Trong tương lai, đội ngũ phát triển Phở GPT cho biết, họ tiếp tục cải tiến mô hình và mở rộng dự án cho ngôn ngữ khác, đặc biệt là trong khu vực Đông Nam Á.

“Việc Phở GPT ra đời đánh dấu lần đầu tiên Việt Nam có cơ hội “bắt kịp” thế giới trong mảng công nghệ tiến bộ này và sở hữu mô hình ngôn ngữ lớn với mã nguồn mở dành riêng cho người Việt, tối ưu với ngôn ngữ tiếng Việt, độc lập với thế giới. Đây chính là niềm tự hào của Vin AI nói riêng và người Việt nói chung”, đại diện VinAI nói thêm.

Nhận định về tiềm năng và cơ hội phát triển của Phở GPT thời gian tới, ông Trần Duy Đông, Thứ trưởng Bộ Kế hoạch và Đầu tư, nhấn mạnh: “AI sẽ là một trong những lĩnh vực mà Việt Nam có nhiều tiềm năng để phát triển mạnh mẽ và sớm bắt kịp trình độ thế giới. Bộ sẽ luôn ủng hộ, đồng hành cùng cộng đồng AI nói riêng, cộng đồng khoa học công nghệ nói chung, để phát triển một hệ sinh thái đổi mới sáng tạo toàn diện, năng động, đóng góp cho sự phát triển chung của đất nước”.





Nguồn

Cùng chủ đề

Apple mất ngôi công ty lớn nhất thế giới vào tay Nvidia

Nvidia là nhà cung cấp các bộ xử lý đồ họa (GPU)- phần cứng dùng để triển khai các phần mềm AI tiên tiến như ChatGPT- số 1 thế giới. Trong 5 năm qua, cổ phiếu của hãng tăng hơn 2.700% và doanh thu đều đặn. Đặc biệt, trong năm 2024, cổ phiếu Nvidia tăng gần gấp 3 giá trị khi các nhà đầu tư tiếp tục đặt trọn niềm tin vào khả năng duy trì tăng trưởng của...

Cục An toàn thông tin khuyến nghị mạo danh Open AI gửi email để lừa đánh cắp thông tin

(CLO) Ngày 4/11, Cục An toàn thông tin cho biết, công ty an ninh mạng Barracuda Networks (Hoa Kỳ) mới đây đã có cảnh báo về thủ đoạn lừa đảo giả mạo tập đoàn công nghệ Open AI, đánh cắp thông tin cá nhân của những người sử dụng phần mềm...

ChatGPT được tích hợp tìm kiếm trên web để cạnh tranh với Copilot, Gemini

Theo doanh nghiệp công nghệ Trí tuệ Nhân tạo (AI) OpenAI, với việc tích hợp tìm kiếm trên web, ChatGPT đang cạnh tranh với các đối thủ như Microsoft Copilot và Google Gemini. Người dùng đăng ký gói ChatGPT Plus hoặc nằm trong danh sách chờ SearchGPT sẽ ngay lập tức được sử dụng tính năng cung cấp thông tin theo thời gian thực, trong các cuộc trò chuyện. ChatGPT không được thiết kế như một sản...

ChatGPT có thêm tính năng tìm kiếm AI mới

(CLO) Hôm 31/10, OpenAI đã tích hợp tính năng tìm kiếm mới vào chatbot ChatGPT, thay vì ra mắt một sản phẩm tìm kiếm riêng. ...

ChatGPT được tích hợp tính năng tìm kiếm mới để cạnh tranh với Google, Microsoft

DNVN - Công ty OpenAI đã ra mắt tính năng tìm kiếm mới cho ChatGPT, đánh dấu một bước tiến quan trọng trong cuộc đua với các đối thủ lớn như Google, Microsoft Bing và Perplexity. ...

Nổi bật

Mới nhất

Cùng tác giả

Bài đọc nhiều

Cập nhật sinh trắc học để bảo vệ ví tiền online

Tội phạm công nghệ gia tăng đột biếnGọi điện kết bạn qua Zalo, Facebook là hình thức lừa đảo thường được các ngân hàng cảnh báo đến khách hàng. Kẻ xấu thường mạo danh cán bộ ngân hàng, liên hệ với nạn nhân qua các mạng xã hội để hướng dẫn, thu thập thông tin sinh trắc học.Một số khác có thể lập các tài khoản ảo, sử dụng tên gọi dễ gây nhầm lẫn như “Nhân viên...

Thành Cát Tư Hãn có bao nhiêu con cháu?

Thành Cát Tư Hãn mở rộng đế chế Mông Cổ từ Thái Bình Dương tới sông Danube trong suốt thời gian từ cuối thế kỷ 12 tới đầu thế kỷ 13. Để lại vô số chiến trường đẫm máu trên đường chinh phạt, vị vua này cũng để lại di sản con cháu đáng kinh ngạc. Ước tính khoảng 16 triệu người hiện nay là hậu duệ của Thành Cát Tư Hãn.Trong nghiên cứu xuất bản trên Tạp...

Hướng dẫn cách tự động điền mã xác minh trên điện thoại Android

Việc kiểm tra tin nhắn, nhớ mã và điền mã xác minh trên điện thoại Android đó có thể tốn nhiều thời gian. Vì vậy, bài viết dưới đây sẽ hướng dẫn bạn cách bật tính năng tự động điền mã xác minh trên Android nhanh và đơn giản nhất.Chỉ cần thực hiện 2 bước trên là bạn có thể tự động điền mã OTP trên Android một cách dễ dàng. Tính năng này sẽ giúp bạn tiết...

Chọn độ phân giải camera an ninh sao cho phù hợp

Khi lắp đặt hệ thống camera an ninh, một trong những yếu tố quan trọng nhất mà bạn cần cân nhắc chính là độ phân giải của camera. Hiểu về độ phân giảiĐộ phân giải của camera an ninh là chỉ số cho biết mức độ chi tiết mà camera có thể ghi lại. Đơn vị đo thường được biểu thị bằng pixel, ví dụ như 720p, 1080p, 2K, 4K, v.v. Độ phân giải càng cao, hình ảnh càng...

Điện máy Xanh cùng 6 nhãn hàng máy lọc nước mang nước sạch đến mọi gia đình Việt

Việc hợp tác với các thương hiệu máy lọc nước uy tín trong và ngoài nước như Kangaroo, Karofi, Sunhouse, Hòa Phát, Mutosi, Toshiba... giúp Điện máy Xanh mang đến cho khách hàng nhiều sự lựa chọn đa dạng về mẫu mã, công nghệ và mức giá khác nhau.Dù đây là con số lớn, song ông Đoàn Văn Hiểu Em - CEO của Điện máy Xanh - vẫn bày tỏ sự tin tưởng nhờ vào tăng trưởng mạnh...

Cùng chuyên mục

Hướng dẫn cài đặt font chữ trên iPhone

Đối với người dùng iPhone, hệ điều hành iOS cho phép tùy chỉnh font chữ thông qua một số bước đơn giản. Tại sao cài đặt font chữ lại quan trọng?Việc thay đổi font chữ không chỉ giúp điện thoại của bạn trở nên độc đáo mà còn cải thiện khả năng đọc. Một font chữ phù hợp có thể làm cho văn bản dễ nhìn hơn, từ đó giúp bạn giảm bớt căng thẳng mắt khi đọc thông...

Thị trường bán dẫn Việt Nam dự kiến đạt 7,01 tỷ USD vào năm 2028

Việt Nam đang đứng trước cơ hội tham gia sâu vào ngành công nghiệp bán dẫn và đã thể hiện rõ khát vọng trở thành một mắt xích trong chuỗi cung ứng bán dẫn toàn cầu.Hiệp hội bán dẫn toàn cầu (SEMI) dự báo, thị trường bán dẫn của Việt Nam dự kiến sẽ đạt 7,01 tỷ USD vào năm 2028, với tốc độ tăng trưởng ngành bình quân mỗi năm khoảng 6,69% trong giai đoạn 2023 –...

Dùng công nghệ AI giả danh nghệ sĩ để lừa đảo

Cục An toàn thông tin (Bộ TT&TT) mới đây vừa đưa ra khuyến cáo người dân nên thận trọng trước những bài đăng hoặc những thông tin không rõ nguồn gốc trên mạng xã hội, đặc biệt người dân cần thực hiện kiểm tra tính xác thực của thông tin về nghệ sĩ.Tuyệt đối không làm theo hướng dẫn, không thực hiện giao dịch chuyển tiền cho các đối tượng lạ. Không cung cấp thông tin cá nhân...

Từ Việt Nam, VinFuture góp phần định hình tương lai khoa học toàn cầu

Theo ông, VinFuture không chỉ tôn vinh những đổi mới có tác động đến toàn nhân loại mà còn tạo nền tảng để Việt Nam trở thành trung tâm kết nối và phát triển công nghệ tiên phong của thế giới.- Xét đến nhu cầu đổi mới và phát triển bền vững hiện nay của thế giới, Giáo sư dự đoán lĩnh vực khoa học nào sẽ được chú ý trong Giải thưởng VinFuture 2024?Nếu nhìn vào những...

TikTok Canada bị yêu cầu giải tán, ứng dụng vẫn hoạt động

Bộ trưởng Đổi mới Canada François-Philippe Champagne cho biết quyết định đóng cửa hai văn phòng tại Canada của TikTok - Toronto và Vancouver - dựa trên thông tin và bằng chứng xuất hiện trong quá trình đánh giá về ảnh hưởng với an ninh quốc gia, cùng với lời khuyên của cộng đồng an ninh và tình báo Canada."Chúng tôi đi đến kết luận rằng những hoạt động này do TikTok và các văn phòng của họ...

Mới nhất

Tuyến buýt liên tỉnh liền kề Quảng Trị

Sáng 8/11, UBND tỉnh Quảng Trị cho biết, vừa quyết định phê duyệt thông tin dự án Vận hành cung ứng dịch vụ vận tải hành khách công cộng bằng xe buýt không trợ giá tuyến xe buýt liên tỉnh liền kề Quảng Trị - Huế và ngược lại. ...

Những bài tập giảm kiệt sức, căng thẳng trong công việc

Nhiều người đã từng trải qua tình trạng căng thẳng trong công việc, nhưng một nghiên cứu mới cho thấy những bài tập thể dục vừa sức có thể giúp giảm thiểu điều này. ...

Giá nâng mũi là bao nhiêu? Cần lưu ý gì khi nâng mũi?

Hiện nay, rất nhiều người đã thực hiện nâng mũi với mong muốn giúp cho khuôn mặt của mình thanh thoát, cân đối hơn. Nếu bạn cũng đang quan tâm đến phương pháp làm...

Cơ hội phát triển đô thị vệ tinh

Sau khi TP.HCM công bố kế hoạch triển khai 11 vị trí TOD (bố trí nhiều nhà ở gắn với các dịch vụ và tiện ích ở gần điểm giao thông công cộng) dọc tuyến metro, các chuyên gia và địa phương cho rằng đây là cơ...

Mới nhất