Trang chủNewsKhoa học - Công nghệPhở GPT ghi tên Việt Nam lên bản đồ công nghệ thế...

Phở GPT ghi tên Việt Nam lên bản đồ công nghệ thế giới


Phở GPT được viết tắt của Phở – Generative Pre-trained Transformer, là dự án mô hình ngôn ngữ lớn dành riêng cho tiếng Việt, do đội ngũ kỹ sư VinAI – thành viên của Tập đoàn Vingroup – thực hiện.

“Bắt kịp” nhịp công nghệ thế giới

Phở GPT sử dụng mã nguồn mở (Open-source) thay vì là phần mềm sở hữu riêng như ChatGPT của OpenAI. Nghĩa là mã nguồn của Phở GPT công khai, có sẵn và người sử dụng có thể đóng góp cho sự phát triển của Phở GPT thông qua những ứng dụng tuỳ chỉnh.

Theo giới thiệu của VinAI, Phở GPT có 7,5 tỷ tham số, được xây dựng trên nền tảng giải mã Transformer. Mô hình này được huấn luyện từ đầu, sử dụng những kỹ thuật tiên tiến nhất hiện có như cơ chế tập trung chớp nhoáng (Flash Attention) và ngoại suy độ dài ngữ cảnh AliBi.

Những kỹ thuật này không chỉ giúp Phở GPT hiểu sâu hơn về ngữ cảnh, mà còn làm tăng khả năng đối thoại, tương tác tự nhiên của ứng dụng trong quá trình sử dụng. Điều này giúp mô hình trở thành công cụ đa nhiệm và linh hoạt, có khả năng đáp ứng đa dạng nhu cầu ngôn ngữ của người sử dụng.

ông Bùi Hải Hưng, Tổng Giám đốc VinAI.

ông Bùi Hải Hưng, Tổng Giám đốc VinAI.

Chia sẻ về ý nghĩa của việc Phở GPT ra đời, ông Bùi Hải Hưng, Tổng Giám đốc VinAI, cho biết, mục tiêu của dự án là phát triển những mô hình tương tự ChatGPT cho tiếng Việt và văn hóa người Việt. Phở GPT có khả năng hiểu, viết văn phong tiếng Việt một cách vượt bậc so với các công nghệ về ngôn ngữ thế hệ trước. Mô hình cũng được huấn luyện từ đầu với tập dữ liệu tiếng Việt, không phụ thuộc bất cứ mô hình nào khác của thế giới, đảm bảo việc làm chủ công nghệ lõi tiên tiến cho Việt Nam.

Đáng nói, ngay khi thế giới đang xôn xao về sự ra đời của Chat GPT, một năm sau đó, Phở GPT đã xuất hiện tại Việt Nam. Theo chia sẻ của ông Bùi Hải Hưng, VinAI là đơn vị tiên phong tại Đông Nam Á cho ra mắt mô hình ngôn ngữ lớn với mã nguồn mở. Sau đó vài tuần, sản phẩm tương tự mới được ra mắt tại Singapore.

Nâng tầm AI Việt

Kết quả so sánh phiên bản Phở GPT-7B5-Instruct với ChatGPT mã nguồn đóng (GPT-3.5-turbo) và các mô hình mã nguồn mở khác cho thấy, Phở GPT đứng thứ hai, chỉ sau ChatGPT trong hầu hết mục đánh giá.

Phở GPT có nhiều điểm khác biệt so với những mô hình ngôn ngữ khác, đặc biệt là ChatGPT. Nó được thiết kế để hiểu và viết văn phong tiếng Việt một cách tự nhiên, phản ánh đúng ngữ cảnh, ngữ pháp, từ vựng, cách diễn đạt của người Việt. Nó có thể tương tác với người dùng theo chủ đề liên quan đến văn hoá, lịch sử, địa lý, xã hội, giải trí, thể thao… của Việt Nam.

Thêm nữa, Phở GPT sở hữu mã nguồn mở và linh hoạt. Người dùng có thể phát triển ứng dụng tùy chỉnh và độc đáo, đặc biệt là ứng dụng đòi hỏi sự bảo mật cao mà không phụ thuộc nguồn từ các phần mềm sở hữu riêng.

Đồng thời, điểm ưu tiên của Phở GPT còn là hiệu suất cao và tiết kiệm chi phí với việc được huấn luyện bằng kỹ thuật tối ưu hóa mới nhất, giúp giảm kích thước và tăng tốc độ của ứng dụng. Phở GPT cũng có thể chạy trên nền tảng tính toán nhỏ hơn, giúp giảm chi phí, tiết kiệm tài nguyên.

Được đào tạo với kho dữ liệu tiếng Việt có dung lượng lên đến 41GB, trong đó, 1GB văn bản Wikipedia và một biến thể 40GB đã loại bỏ phần trùng lặp từ tập dữ liệu tin tức, được huấn luyện cách sử dụng thư viện llm-foundry của Mosaicml llm, Phở GPT có thể sinh ra các đoạn văn bản theo yêu cầu của người dùng, như bài viết, thơ, bài hát, luận, bài phát biểu, giới thiệu… Phở GPT cũng có thể tạo ra nội dung sáng tạo, hài hước, như truyện ngắn, lời bình, châm ngôn, lời nhắn, tweet, meme… Đồng thời, nó còn đối thoại với người dùng theo chủ đề khác nhau như thời sự, giáo dục, sức khỏe, du lịch, ẩm thực, thể thao, giải trí… Bên cạnh đó, Phở GPT cũng có thể trả lời câu hỏi của người dùng, cung cấp thông tin, tư vấn, hỗ trợ, giải đáp thắc mắc…

Thêm nữa, Phở GPT có thể dịch các đoạn văn bản hoặc loại văn bản có tính chất khác nhau như văn bản chính thức, thương mại, học thuật, văn học… từ tiếng Việt sang ngôn ngữ khác và ngược lại.

Một tính năng nổi bật nữa đó là Phở GPT phân tích, xử lý các đoạn văn bản, như tóm tắt, phân loại, gán nhãn, trích xuất thông tin, phát hiện cảm xúc, phát hiện sai sót, cải thiện văn phong…

Trong tương lai, đội ngũ phát triển Phở GPT cho biết, họ tiếp tục cải tiến mô hình và mở rộng dự án cho ngôn ngữ khác, đặc biệt là trong khu vực Đông Nam Á.

“Việc Phở GPT ra đời đánh dấu lần đầu tiên Việt Nam có cơ hội “bắt kịp” thế giới trong mảng công nghệ tiến bộ này và sở hữu mô hình ngôn ngữ lớn với mã nguồn mở dành riêng cho người Việt, tối ưu với ngôn ngữ tiếng Việt, độc lập với thế giới. Đây chính là niềm tự hào của Vin AI nói riêng và người Việt nói chung”, đại diện VinAI nói thêm.

Nhận định về tiềm năng và cơ hội phát triển của Phở GPT thời gian tới, ông Trần Duy Đông, Thứ trưởng Bộ Kế hoạch và Đầu tư, nhấn mạnh: “AI sẽ là một trong những lĩnh vực mà Việt Nam có nhiều tiềm năng để phát triển mạnh mẽ và sớm bắt kịp trình độ thế giới. Bộ sẽ luôn ủng hộ, đồng hành cùng cộng đồng AI nói riêng, cộng đồng khoa học công nghệ nói chung, để phát triển một hệ sinh thái đổi mới sáng tạo toàn diện, năng động, đóng góp cho sự phát triển chung của đất nước”.





Nguồn

Cùng chủ đề

ChatGPT được tích hợp tìm kiếm trên web để cạnh tranh với Copilot, Gemini

Theo doanh nghiệp công nghệ Trí tuệ Nhân tạo (AI) OpenAI, với việc tích hợp tìm kiếm trên web, ChatGPT đang cạnh tranh với các đối thủ như Microsoft Copilot và Google Gemini. Người dùng đăng ký gói ChatGPT Plus hoặc nằm trong danh sách chờ SearchGPT sẽ ngay lập tức được sử dụng tính năng cung cấp thông tin theo thời gian thực, trong các cuộc trò chuyện. ChatGPT không được thiết kế như một sản...

ChatGPT có thêm tính năng tìm kiếm AI mới

(CLO) Hôm 31/10, OpenAI đã tích hợp tính năng tìm kiếm mới vào chatbot ChatGPT, thay vì ra mắt một sản phẩm tìm kiếm riêng. ...

ChatGPT được tích hợp tính năng tìm kiếm mới để cạnh tranh với Google, Microsoft

DNVN - Công ty OpenAI đã ra mắt tính năng tìm kiếm mới cho ChatGPT, đánh dấu một bước tiến quan trọng trong cuộc đua với các đối thủ lớn như Google, Microsoft Bing và Perplexity. ...

OpenAI mang tính năng tìm kiếm đến ChatGPT, thách thức Google

OpenAI sẽ bổ sung một bộ tính năng tìm kiếm mới lên ChatGPT, leo thang cuộc chiến giữa startup này với Google. ChatGPT Search cho phép người dùng chatbot tìm kiếm thông tin kịp thời như họ vẫn làm trên web. OpenAI cung cấp nguyên mẫu vào tháng 7, độc lập với ứng dụng ChatGPT và chỉ dành cho một số người dùng giới hạn. Các tính năng tìm kiếm mới – sử dụng mô hình 4o của OpenAI – sẽ...

ChatGPT được tích hợp tính năng tìm kiếm mới

Theo đó, OpenAI đã tích hợp chức năng tìm kiếm trực tiếp vào chatbot nổi tiếng của mình thay vì phát triển một sản phẩm riêng biệt.  Được biết, tính năng mới này sẽ cung cấp câu trả lời nhanh chóng, cập nhật và kèm theo đường dẫn đến nguồn tin đáng tin cậy. Tính năng sử dụng mô hình GPT-4o được tinh chỉnh và kết hợp với các nhà cung cấp dịch vụ tìm kiếm bên thứ ba...

Nổi bật

Mới nhất

Cùng tác giả

Bài đọc nhiều

Dân mạng sáng tạo không tưởng để khắc chế điểm yếu số 1 của Mac Mini

Chiếc máy tính Mac Mini mới của Apple với chip M4 sẽ chính thức lên kệ vào ngày 8/11. Mặc dù thiết bị này đang gây sốt vì mức giá "rẻ bất ngờ" cùng sức mạnh đáng nể nhưng có một thiết kế cố ý của Apple khiến không ít người dùng khó chịu, đó là nút nguồn nằm ở phần đáy máy. Chiếc Mac Mini mới trang bị 3 cổng Thunderbolt 4 hoặc Thunderbolt 5 USB-C (phiên bản...

HMD Global hợp tác xây dựng giải pháp không gây nghiện smartphone cho trẻ em

Mục tiêu của HMD Global là tạo ra smartphone có thể không gây nghiện. Điều này bắt nguồn từ một nghiên cứu của HMD và Perspectus Global gần đây cho thấy, hơn 10.000 phụ huynh từ năm quốc gia (Anh, Mỹ, Ấn Độ, Đức và Australia) đã bày tỏ những mối quan tâm của họ.Tổng giám đốc điều hành HMD, Jean-Francois Baril, bày tỏ sự phấn khích khi tạo ra công nghệ đặt giá trị “con người” vào...

Thành Cát Tư Hãn có bao nhiêu con cháu?

Thành Cát Tư Hãn mở rộng đế chế Mông Cổ từ Thái Bình Dương tới sông Danube trong suốt thời gian từ cuối thế kỷ 12 tới đầu thế kỷ 13. Để lại vô số chiến trường đẫm máu trên đường chinh phạt, vị vua này cũng để lại di sản con cháu đáng kinh ngạc. Ước tính khoảng 16 triệu người hiện nay là hậu duệ của Thành Cát Tư Hãn.Trong nghiên cứu xuất bản trên Tạp...

Cách tạo hình ảnh bằng AI miễn phí

Trong thời đại công nghệ số, trí tuệ nhân tạo (AI) trở thành công cụ hỗ trợ đắc lực trong nhiều lĩnh vực, bao gồm cả thiết kế hình ảnh và sáng tạo nội dung. Một trong những ứng dụng nổi bật nhất đang được ứng dụng rộng rãi của AI hiện nay là khả năng tạo ra hình ảnh.1. AI và khả năng tạo hình ảnhTrước tiên, hãy tìm hiểu về cách AI có thể tạo ra...

Quảng cáo không phù hợp làm giảm người dùng sử dụng ứng dụng

Yandex Ads vừa có báo cáo Xu hướng và Thách thức trong gia tăng doanh thu từ ứng dụng tại Việt Nam, trong đó có nhiều thông tin đáng chú ý.Theo Yandex Ads, đơn vị này đã khảo sát với hàng trăm nhà phát hành ứng dụng và các ứng dụng này sử dụng hình thức tạo doanh thu từ quảng cáo. Trong đó, ứng dụng trò chơi chiếm 45% và các ứng dụng khác chiếm 55%.Hãng nghiên...

Cùng chuyên mục

iPhone SE 4 sẽ chia tay Qualcomm bằng chip 5G ‘nhà làm’

Mẫu điện thoại giá rẻ mới của Apple - iPhone SE 4 - sẽ tiếp nối chiếc iPhone SE 3 sau 3 năm và dự kiến được sản xuất hàng loạt từ tháng 12. Nó sẽ sở hữu thiết kế giống iPhone 14, lần đầu tiên loại bỏ thiết kế truyền thống trên dòng SE. Đây cũng sẽ là lần đầu tiên nhiều công nghệ mới ra mắt trên một chiếc iPhone không phải flagship.Mặc dù Qualcomm vẫn...

Chiếc điện thoại di động đầu tiên trong cuộc đua giữa AT&T và Motorola

"Joel, tôi là Marty. Tôi gọi cho anh từ điện thoại di động - chiếc điện thoại di động cầm tay, di động thực sự".Đây là lời đầu tiên tến sĩ Martin Cooper nói với tiến sĩ Joel S. Engel, khi ấy là giám đốc doanh nghiệp tại AT&T, sáng 3/4/1973, khi ông gọi từ chiếc điện thoại di động cầm tay đầu tiên của cả thế giới. Thời điểm này, ông Cooper là giám đốc hệ thống...

HMD Global hợp tác xây dựng giải pháp không gây nghiện smartphone cho trẻ em

Mục tiêu của HMD Global là tạo ra smartphone có thể không gây nghiện. Điều này bắt nguồn từ một nghiên cứu của HMD và Perspectus Global gần đây cho thấy, hơn 10.000 phụ huynh từ năm quốc gia (Anh, Mỹ, Ấn Độ, Đức và Australia) đã bày tỏ những mối quan tâm của họ.Tổng giám đốc điều hành HMD, Jean-Francois Baril, bày tỏ sự phấn khích khi tạo ra công nghệ đặt giá trị “con người” vào...

Dân mạng sáng tạo không tưởng để khắc chế điểm yếu số 1 của Mac Mini

Chiếc máy tính Mac Mini mới của Apple với chip M4 sẽ chính thức lên kệ vào ngày 8/11. Mặc dù thiết bị này đang gây sốt vì mức giá "rẻ bất ngờ" cùng sức mạnh đáng nể nhưng có một thiết kế cố ý của Apple khiến không ít người dùng khó chịu, đó là nút nguồn nằm ở phần đáy máy. Chiếc Mac Mini mới trang bị 3 cổng Thunderbolt 4 hoặc Thunderbolt 5 USB-C (phiên bản...

Quảng cáo không phù hợp làm giảm người dùng sử dụng ứng dụng

Yandex Ads vừa có báo cáo Xu hướng và Thách thức trong gia tăng doanh thu từ ứng dụng tại Việt Nam, trong đó có nhiều thông tin đáng chú ý.Theo Yandex Ads, đơn vị này đã khảo sát với hàng trăm nhà phát hành ứng dụng và các ứng dụng này sử dụng hình thức tạo doanh thu từ quảng cáo. Trong đó, ứng dụng trò chơi chiếm 45% và các ứng dụng khác chiếm 55%.Hãng nghiên...

Mới nhất

Ngành chế biến, chế tạo đẩy mạnh tăng trưởng công nghiệp 10 tháng của Nam Định

10 tháng, chỉ số sản xuất toàn ngành công nghiệp của Nam Định tăng 14,71% so với cùng kỳ năm trước, đây mức tăng cao nhất từ năm 2019 đến nay. Theo số liệu từ Cục Thống kê Nam Định, sản xuất công nghiệp tháng 10/2024 duy trì đà tăng trưởng tích cực, ước tăng 2,28%...

Thu thuế phải thu được lòng dân

Cải cách thủ tục hành chính, tạo thuận lợi cho người nộp thuế phải đi từ việc sửa đổi những quy định bất hợp lý, thậm chí vô lý. ...

Phú Yên: Đồng bào DTTS giữ rừng ở thượng nguồn sông Kỳ Lộ

Không còn phá rừng làm rẫy, 906 hộ đồng bào dân tộc Chăm, Ba Na ở xã Phú Mỡ, huyện Đồng Xuân, tỉnh Phú Yên đã nhận trách nhiệm quản lý, bảo vệ hơn 25.000 ha rừng tự nhiên ở vùng thượng nguồn sông Kỳ Lộ. Không chỉ được hưởng chính sách chi trả dịch vụ môi trường rừng,...

Tỷ lệ trẻ em dưới 5 tuổi bị suy dinh dưỡng thể thấp còi còn 9,8%

Theo Sở Y tế Hà Nội, trong 9 tháng năm 2024, tỷ lệ trẻ em dưới 5 tuổi bị suy dinh dưỡng thể thấp còi còn 9,8 % (giảm 0,3% so với cùng kỳ năm 2023). Hà Nội: Tỷ lệ trẻ em dưới 5 tuổi bị suy dinh dưỡng thể thấp còi còn 9,8%Theo Sở Y tế Hà Nội, trong...

Đại hội trình diễn võ đạo Nhật Bản tại Việt Nam

Đại hội Trình Diễn Võ đạo Nhật Bản là sự kiện võ thuật quốc tế lớn do Nippon Budokan (Nhật Bản Võ đạo Quán) và Japan Budo Association (Hiệp hội Võ đạo Nhật Bản) tổ chức hàng năm từ năm 1978 đến 2019 tại nhiều quốc gia. Trong năm nay 2024, Đại hội Biểu diễn Võ đạo Nhật Bản được...

Mới nhất