Trang chủKhoa học - Công nghệCông nghệ sốAI dịch thuật của startup Việt tốt hơn cả Google, ChatGPT

AI dịch thuật của startup Việt tốt hơn cả Google, ChatGPT


Doctranslate.io là nền tảng dịch thuật bằng AI (trí tuệ nhân tạo), được sáng lập bởi tiến sĩ Trần Vũ Anh. Startup ra đời năm 2023, được Google chọn tham gia chương trình Google Accelerator for Startups 2024. Mới đây, Doctranslate.io tiếp tục nằm trong top 5 startup tiềm năng nhất tại Ngày hội Khởi nghiệp đổi mới sáng tạo Quốc gia (TECHFEST 2024).

AI dịch tối ưu hơn Google, ChatGPT

Sau nhiều năm sinh sống và làm việc ở nước ngoài, Vũ Anh nhận thấy ngôn ngữ là rào cản lớn để mang tri thức đến gần hơn với người Việt. Trong khi các mô hình ngôn ngữ lớn như Google dịch thuật, ChatGPT làm rất tốt công việc phiên dịch trong giao tiếp, hội thoại, Vũ Anh nhận ra còn một “thị trường ngách” nhiều dư địa mà các ông lớn chưa “với tay” đến là dịch thuật văn bản.

“Nếu bạn có một file tài liệu, bài nghiên cứu khoa học dài 20 trang, bạn có thể đưa vào cho ChatGPT dịch. Nhưng chatbot sẽ chỉ trả về các bản dịch dưới dạng chữ viết. Những phần rất quan trọng như biểu đồ, hình ảnh, bảng dữ liệu… gần như bị mất tất cả định dạng. Nếu phải ngồi sắp xếp, thiết kế lại các bảng biểu đó sẽ vô cùng mất thời gian, công sức, thậm chí có thể xảy ra sai sót. Các mô hình ngôn ngữ lớn của Google, OpenAI dù mạnh nhưng vẫn chưa xử lý được triệt để vấn đề. Đó là lý do Doctranslate.io ra đời, tập trung vào việc dịch văn bản, hình ảnh, âm thanh, video”, Vũ Anh nói.

AI dịch thuật của startup Việt tốt hơn cả Google, ChatGPT- Ảnh 1.

File hình ảnh gốc (trái) và file dịch thuật của Doctranslate.io

Điểm đặc biệt của nền tảng là người dùng có thể đưa đầu vào là một file văn bản, nhiều định dạng với biểu đồ, hình ảnh. Sau đó AI không chỉ dịch các đoạn văn mà còn dịch cả hình ảnh, giữ nguyên định dạng gốc, giúp người dùng có thể so sánh trực tiếp và dùng ngay, không tốn thêm thời gian để thiết kế lại. Với một file hình ảnh nhiều nội dung, Doctranslate.io thậm chí còn cho phép xuất ra file PowerPoint để người dùng tùy chỉnh từng chi tiết và dùng vào nhiều mục đích khác nhau.

Trong nghiên cứu khoa học được công bố tại hội nghị IEEE-RIVF (International Conference on Computing and Communication Technologies) và IEEE – tổ chức kỹ thuật chuyên nghiệp lớn nhất thế giới), mô hình ALMA-Gemma-7B-IT-ST của Doctranslate.io đã cho điểm vượt trội so với Google Translate, GPT-3.5-Turbo của OpenAI… trong bài kiểm tra dịch thuật từ tiếng Anh sang tiếng Việt.

Cụ thể, trong khi GPT-3.5 Turbo lần lượt được 39,3 điểm và 34,1 điểm cho bài dịch Anh – Việt và ngược lại Việt – Anh, AI của Doctranslate.io vượt trội với 56,21 điểm và 57,32 điểm. Còn Google Translate được 39,86 điểm và 35,76 điểm.

Công thức riêng của startup Việt

Ngoài việc cung cấp những sản phẩm ngách mà các mô hình AI lớn chưa đánh chiếm, một trong những lý do khiến Doctranslate.io vượt trội so với ChatGPT, Google Translate là khả năng hiểu tiếng Việt sâu sắc.

Theo Vũ Anh, tiếng Việt có nhiều đặc trưng so với tiếng Anh và những ngôn ngữ khác. Nếu không nắm rõ, sẽ không thể cải thiện được khả năng dịch thuật của AI. Một trong những ví dụ đơn giản nhất là ngôi thứ. “Chúng ta có rất nhiều danh từ, đại từ nhân xưng để chỉ mối quan hệ và cả sắc thái trong từng ngữ cảnh khác nhau. Ví dụ khi dịch truyện, nói ‘ông Chí Phèo’ và ‘thằng Chí Phèo’ là khác nhau rất nhiều. Đây là điều các mô hình AI lớn, nếu không hiểu biết sâu sắc tiếng Việt và không tinh chỉnh sẽ không thể cải thiện được độ chính xác”, người sáng lập Doctranslate.io nói.

AI dịch thuật của startup Việt tốt hơn cả Google, ChatGPT- Ảnh 2.

Giao diện nền tảng dịch thuật Doctranslate.io

Trong quá trình triển khai, đội ngũ của Vũ Anh cũng nhận thấy nhu cầu dịch thuật về tài liệu trong ngành y tế, văn bản của các công ty đa quốc gia, ngân hàng, dịch nội dung các cuộc họp, dịch truyện… là rất lớn. Tuy nhiên không phải lúc nào các tổ chức này cũng sẵn sàng sử dụng các mô hình ngôn ngữ lớn miễn phí như của Google, OpenAI trong hệ thống. Một số định chế cần những mô hình “offline” để có thể dễ dàng tích hợp vào hệ thống, đem lại hiệu quả công việc tốt nhưng đặc biệt hơn là đảm bảo quyền riêng tư của dữ liệu.

Nắm bắt được nhu cầu đó, Doctranslate.io phát triển cả nền tảng dịch thuật cho người dùng phổ thông lẫn phiên bản được tùy chỉnh để có thể dễ dàng tích hợp vào các hệ thống của doanh nghiệp chuyển đổi số cần riêng tư, bảo mật. Hiện tại người dùng có thể sử dụng bản dùng thử miễn phí của Doctranslate.io để dịch văn bản, hình ảnh, video, cuộc hội thoại. Trong khi đó các doanh nghiệp có thể dùng bản cloud hoặc API của Doctranslate.io. Cao hơn, Doctranslate.io còn cung cấp phiên bản on-premises, có độ tùy biến cao và dữ liệu được xử lý ngay tại hệ thống của công ty.

Sau hơn một năm có mặt trên thị trường, Doctranslate.io đang có hơn 200.000 người dùng hoạt động thường xuyên mỗi tháng và được tích hợp trong nhiều hệ thống của doanh nghiệp. Startup AI của Việt Nam dự định sẽ tiếp tục mở rộng thị trường ra các nước trong khu vực Đông Nam Á, sau đó là toàn cầu. “Với Doctranslate.io, chúng tôi từng bước hiện thực hóa mục tiêu đưa tri thức đến gần hơn với mọi người và khẳng định vị thế của trí tuệ Việt trên bản đồ công nghệ toàn cầu”, Trần Vũ Anh chia sẻ.




Nguồn: https://thanhnien.vn/ai-dich-thuat-cua-startup-viet-tot-hon-ca-google-chatgpt-185250115142214607.htm

Cùng chủ đề

Nổi bật

Mới nhất

Cùng tác giả

Bài đọc nhiều

Andrew Ng – Top 100 người ảnh hưởng AI toàn cầu sẽ thuyết trình tại Việt Nam

Diễn đàn Công nghệ FPT (FPT Techday 2023) - sự kiện công nghệ thường niên lớn nhất Việt Nam với chủ đề Kiến tạo hạnh phúc sẽ được Tập đoàn FPT tổ chức vào hai ngày 24 - 25/10 tại Hà Nội. Sự kiện FPT Techday 2023 là nơi cập nhật những xu hướng công nghệ và kinh doanh của tương lai, nơi các doanh nghiệp và chuyên gia chia sẻ tầm nhìn về thế giới mới, tìm kiếm...

Meta bị phạt 100.000 USD/ngày tại Na Uy do vi phạm luật bảo mật dữ liệu

Cơ quan bảo vệ dữ liệu Na Uy cho biết Meta Platforms, công ty sở hữu Facebook và Instagram sẽ bị phạt 100.000 USD/ngày cho đến khi đưa ra biện pháp khắc phục những vi phạm về quyền riêng tư. Theo thông báo đưa ra vào ngày 17/7, cơ quan Datatilsynet chịu trách nhiệm giám sát dữ liệu tại quốc gia Bắc Âu sẽ “tính tiền phạt” theo từng ngày, bắt đầu từ ngày 4/8 cho đến ngày 3/11...

Hàn Quốc hướng đến “quân đội AI” trước áp lực tỉ lệ sinh giảm

Ngành công nghiệp quân sự và quốc phòng của Hàn Quốc đang nhanh chóng thúc đẩy trí tuệ nhân tạo trên chiến trường, coi công nghệ này là phao cứu sinh cho lực lượng chiến đấu đang phải vật lộn với viễn cảnh thiếu hụt quân số.

OpenAI ủng hộ ý tưởng xin giấy phép mới được phát triển mô hình AI tiên tiến

Theo đó, công ty sở hữu ChatGPT và Dall-E đưa ra nhiều cam kết về chính sách AI. “Công ty cam kết hợp tác với chính phủ Mỹ và các nhà hoạch định chính sách trên khắp thế giới ủng hộ xây dựng yêu cầu cấp phép với tất cả các mô hình AI năng lực cao trong tương lai”. Ý tưởng về quy trình cấp phép phát triển AI, đồng đề xướng bởi những công ty dẫn đầu...

Cùng chuyên mục

TikTok lên kế hoạch 19/1 đóng cửa tại Mỹ, người dùng đổ xô sang mạng xã hội khác

TikTok đã lên kế hoạch đóng cửa đối với người dùng Hoa Kỳ vào chủ nhật tuần này (19/1), khi lệnh cấm ứng dụng này có hiệu lực, trừ phi Tòa án Tối cao Mỹ ngăn chặn. Thời gian gần đây, người dùng TikTok bắt đầu chuyển sang mạng xã hội khác để thay thế. ...

TikTok trên đất Mỹ có giá lên tới 50 tỷ USD

Những ông trùm kinh doanh như Elon Musk có thể phải chi số tiền lên tới 50 tỷ USD để mua lại TikTok tại Mỹ nếu công ty của Trung Quốc, ByteDance quyết định bán ứng dụng mạng xã hội này. ...

Mới nhất

Làng nghề bánh tráng Ea Bar tất bật vào vụ Tết

Chỉ còn hơn 10 ngày nữa là đến Tết Nguyên đán Ất Tỵ, không khí lao động sản xuất tại làng nghề làm bánh tráng xã Ea Bar , huyện Buôn Đôn, tỉnh Đắk Lắk tất bật, hối hả hơn bao giờ hết. Các cơ sở sản xuất đẩy mạnh công suất, tăng sản lượng chuẩn bị hàng phục...

Hoàn hiện quy định để đáp ứng yêu cầu thực tế

Luật An toàn thực phẩm (năm 2010) đã có những đóng góp quan trọng trong việc xây dựng hệ thống pháp luật về an toàn thực phẩm, nhưng theo thời gian, các quy định của Luật đã bộc lộ nhiều hạn chế, cần sửa đổi, hoàn thiện để đáp ứng tốt hơn tình hình thực tế. Quản lý an toàn...

Việc bổ cập nước sông Hồng chưa thể làm hồi sinh sông Tô Lịch

(NLĐO) - Bộ TN-MT nói việc bổ cập nước sông Hồng sang sông Tô Lịch là cần thiết, cấp bách, nhưng giải pháp Hà Nội đưa ra...

Mới nhất

Cùng vui ‘Tết sum vầy