Powered by Techcity

AI phát huy di sản Hán Nôm

20 năm một ước mơ

Cách đây 20 năm, khi còn làm phần mềm từ điển cho Công ty Kim Từ điển, PGS-TS Đinh Điền đã nhận thấy rằng: “Người ta toàn dịch các thứ tiếng nước ngoài thông dụng sang tiếng Việt hoặc ngược lại, chứ ít ai dịch chữ Hán Nôm sang chữ quốc ngữ vì không có lợi ích thương mại. Hơn nữa, có nhiều người biết được chữ Hán nhưng chưa chắc đã đọc được chữ Nôm”. Mười năm sau, khi cảm thấy đủ điều kiện, PGS-TS Đinh Điền đã bắt tay thực hiện điều ấp ủ của mình.

r5c-7418.jpg
PGS-TS Đinh Điền hướng dẫn dùng ứng dụng chuyển tự chữ Nôm sang chữ quốc ngữ.

Để có dữ liệu, PGS-TS Đinh Điền tìm kiếm ở nhiều nguồn như các trang mạng, thư viện, phòng lưu trữ tư liệu Hán Nôm của các trường, viện, kể cả “năn nỉ” những người có tư liệu chữ Hán Nôm để xin sao chụp. “Mình ngỏ lời mượn tư liệu chữ Hán Nôm cá nhân của họ, nhiều người không hiểu thì ngại và không muốn cho; có người hiểu thì cho mượn, mà mượn được thì quý lắm nên cứ gọi là mình phải tới ngay”, PGS-TS Đinh Điền nhớ lại.

Sau khi xin sao chụp tư liệu, PGS-TS Đinh Điền thuê người biết chữ Hán Nôm nhập liệu vào máy tính. Gần 10 năm dày công thu thập dữ liệu Hán Nôm, nhưng mãi đến gần đây, khi công nghệ học máy của AI phát triển mạnh, nguồn dữ liệu đó mới được sử dụng để “dạy” cho máy biết cách dịch từ chữ Hán Nôm sang chữ quốc ngữ dựa trên các bản dịch thủ công của con người trước đó.

Ngoài nhiệm vụ chính là giảng dạy, thầy Đinh Điền còn tự ý thức rằng, mình phải thực hiện tốt nhiệm vụ nghiên cứu khoa học. Chính vì thế, các bài toán ứng dụng AI để nhận dạng tự động, dịch tự động chữ Hán Nôm được thầy xem như là đề bài cho các khóa luận, các luận văn cử nhân, thạc sĩ. Mỗi lần đứng lớp, thầy đều mạnh dạn kể về ý tưởng bài toán này cho các bạn sinh viên, học viên cao học nghe. Tuy nhiên, để tìm được người cộng tác, theo đuổi ý tưởng này không hề dễ, bởi ứng dụng này không nhằm mục đích thương mại và người biết chữ Hán Nôm hầu như rất ít và khó tìm. Vì vậy, suốt 5 – 6 năm đầu, thầy đã “một mình một trận tuyến”.

PGS-TS Đinh Điền đã phải nỗ lực làm nhiều công việc để có đủ chi phí lo toan từ việc mua tư liệu, chi phí nhập liệu, máy móc… Dù tốn kém, công sức bỏ ra bao nhiêu đi chăng nữa, thì theo thầy, tri thức từ kho tàng Hán Nôm còn giá trị hơn gấp vạn lần. “Mình biết có chuyện đau lòng đã xảy ra ở cố đô Huế, người ta dắt con bò đi tránh lũ, nhưng để lại rương chữ Hán Nôm vì với họ, con bò có giá trị kinh tế hơn. Nhưng nếu mất đi kho tàng Hán Nôm thì dù có tiền tỷ cũng không thể mua lại được”, PGS-TS Đinh Điền chia sẻ.

Bảo tồn văn hóa chữ Hán Nôm

PGS-TS Đinh Điền luôn đau đáu, chữ Hán Nôm là chữ quốc ngữ đầu tiên do cha ông ta xây dựng dựa trên chất liệu của chữ Hán và đã sử dụng trong gần 1.000 năm, từ thế kỷ thứ 10 đến thế kỷ 19. Trong suốt 10 thế kỷ, biết bao công trình về lịch sử, văn học, y học, nông nghiệp, địa lý… được viết và lưu giữ. Nhưng đáng tiếc, phần lớn chưa được dịch sang chữ quốc ngữ. Vì vậy, rất cần một hệ thống hỗ trợ người dùng nhận dạng, phiên âm tự động các văn bản Hán Nôm sang chữ quốc ngữ.

“Việc khai thác các văn bản Hán Nôm sẽ giúp các nhà nghiên cứu, học giả hiểu rõ hơn về quá khứ, từ đó phục hồi và tái hiện lại những sự kiện, diễn biến lịch sử chân thực, mang tính khoa học hơn. Qua đó, chúng ta hiểu rõ hơn về giá trị văn hóa, lịch sử của dân tộc, góp phần nâng cao nhận thức, giáo dục của cộng đồng, tự hào về di sản văn hóa và truyền thống của tổ tiên; ngoài ra, giúp thu hút du khách trong và ngoài nước đến tham quan, tìm hiểu về văn hóa, lịch sử”, PGS-TS Đinh Điền bày tỏ.

Qua thời gian dài thực hiện, ứng dụng chuyển tự này đã được đưa vào sử dụng. Trước đây, mô hình chỉ cho phép chuyển tự từ chữ Hán Nôm sang chữ quốc ngữ thì nay đã nâng cấp, có thể chuyển đổi từ chữ quốc ngữ sang chữ Hán Nôm, ngay cả ảnh chụp cũng được nhận diện. Hồng Thi (sinh viên năm nhất, Trường Đại học Khoa học xã hội và Nhân văn, Đại học Quốc gia TPHCM) chia sẻ: “Khi em vào trang web: tools.clc.hcmus.edu.vn và gõ chữ quốc ngữ hay Hán Nôm bất kỳ, ứng dụng sẽ cho kết quả chuyển tự rất chính xác và nhanh chóng. Thao tác rất đơn giản và không hề mất phí, chỉ cần có kết nối mạng là được”.

Ở văn bản thuộc các lĩnh vực về văn học, xã hội, lịch sử, hệ thống cho kết quả chính xác trên 90%. TS Hồ Minh Quang, Trưởng khoa Đông Phương học, Trường Đại học Khoa học xã hội và Nhân văn TPHCM, nhận định rằng, đây là bước đi đầu tiên trong việc kết nối thành tựu khoa học máy tính với bảo tồn và khai thác di sản Hán Nôm của nước nhà. Nó có tính ứng dụng cao, hỗ trợ chuyên môn của người làm công tác nghiên cứu, giảng dạy Hán Nôm, cũng như kích thích nhu cầu sử dụng của người yêu thích tìm hiểu di sản Hán Nôm, nhất là người trẻ…

Với phiên bản vừa hoàn thành thử nghiệm, hệ thống đã nhận diện được chữ Hán Nôm trong các ảnh chụp, quét. Do đó, du khách có thể dùng điện thoại chụp hình các văn bản Hán Nôm, hoành phi, câu đối, liễn thờ tại các phủ, điện, đình, chùa, đền, miếu và đưa vào trang web để hệ thống tự động nhận dạng. Trong tương lai, thay vì chỉ dịch âm thì hệ thống sẽ dịch nghĩa các từ Hán Việt để mọi người có thể hiểu được nghĩa theo các từ ngữ thông thường hiện nay.

Dự kiến, ứng dụng sẽ được chuyển giao cho Phòng Quản lý di sản văn hóa, trực thuộc Sở VH-TT TPHCM để phục vụ công tác lưu trữ, bảo tồn và phát huy di sản văn hóa chữ Hán Nôm của dân tộc. Ngoài ra, có thể chuyển giao cho các trường đại học giảng dạy bộ môn chuyên ngành Hán Nôm, Việt Nam học, trường phổ thông trong cả nước để giảng dạy…

PGS-TS Đinh Điền là người đầu tiên sáng tạo ra phần mềm phát âm tiếng Việt cho người khiếm thị vào năm 1998 và ứng dụng dịch tự động từ chữ braille sang chữ sáng dành cho người khiếm thị. Nhờ đó, ông vinh dự nhận được giải thưởng “10 gương mặt trẻ Việt Nam tiêu biểu 1998” trong lĩnh vực khoa học – kỹ thuật.

Ngoài ra, trong suốt nhiều năm qua, PGS-TS Đinh Điền đã nghiên cứu và cho ra đời nhiều công trình khoa học liên quan đến liên ngành ngôn ngữ học, ngoại ngữ và tin học như: Từ điển Oxford Anh – Việt; Từ điển đa ngữ cho người khiếm thị…

Báo Sài Gòn giải phóng

Nguồn

Cùng chủ đề

10 Di sản Tư liệu của Việt Nam được UNESCO ghi danh

Việc Cửu đỉnh ở Hoàng cung Huế được ghi danh Di sản Tư liệu khu vực châu Á-Thái Bình Dương, đã nâng tổng số di sản tư liệu của Việt Nam được UNESCO ghi danh lên 10 di sản (gồm 3 Di sản Tư liệu Thế giới và 7 Di sản Tư liệu khu vực châu Á-Thái Bình Dương). Ba Di sản tư liệu quý giá mang tầm thế giới 1. Mộc bản triều Nguyễn Mộc bản...

Độc đáo chuyện xin chữ ngày Tết của người Dao vùng Tây Bắc

Nghệ nhân Triệu Văn Quẩy viết câu đối. Đồng bào dân tộc Dao là một trong số ít dân tộc thiểu số của Việt Nam có chữ viết riêng. Người Dao rất trân trọng gìn giữ chữ viết qua những biến thiên thăng trầm của lịch sử. Nhờ đó, hình thành nên nhiều nét văn hóa độc đáo. Trong đó, điển hình là tục xin chữ đầu năm. Cứ vào dịp Tết, những...

Lan tỏa giá trị nhân văn của truyện Kiều qua các trang lịch 2024

Tại buổi lễ, thay mặt Nhà xuất bản Chính trị quốc gia Sự thật, Phó Giám đốc - Phó Tổng Biên tập Nhà xuất bản Nguyễn Hoài Anh đã trao ấn phẩm lịch 2024 tặng đại diện các đơn vị. Báo Nhân Dân window.addEventListener("load",function(){if(typeof Web_AdsArticleAfterBody!="undefined"){window.CMS_BANNER.pushAds(Web_AdsArticleAfterBody,"adsWeb_AdsArticleAfterBody")}else{document.getElementById("adsWeb_AdsArticleAfterBody").style.display="none"}}); Nguồn

Cùng tác giả

Tập trung sản xuất để vụ đông mang lại thu nhập tốt

Tập trung sản xuất để vụ đông mang lại thu nhập tốt. Theo kế hoạch, toàn tỉnh sẽ sản xuất 4.480 ha cây vụ đông. Ngoài ra, từ các nguồn hỗ trợ, bà con sẽ tăng thêm khoảng 600 ha ngô và 600 ha rau màu. Hiện việc...

Tập huấn "Hỗ trợ hệ sinh thái khởi nghiệp đổi mới sáng tạo tỉnh Lào Cai"

Quang cảnh lớp tập huấn. Tại lớp tập huấn, 50 đại biểu đến từ các sở, ban, ngành, tổ chức, doanh nghiệp, học sinh, sinh viên được chuyên gia Học viện Khoa học công nghệ và Đổi mới sáng tạo phổ biến các văn bản quy phạm pháp luật liên...

Gặp mặt đại biểu Quốc hội là nhà giáo, nguyên là nhà giáo, cán bộ quản lý giáo dục

Cùng dự có Phó Chủ tịch nước Võ Thị Ánh Xuân, các Phó Chủ tịch Quốc hội và hơn 100 đại biểu Quốc hội là nhà giáo, nguyên là nhà giáo, cán bộ quản lý giáo dục. Thành quả của giáo dục từ sự nỗ lực lớn của đội ngũ nhà giáo Thay mặt toàn ngành Giáo dục, các nhà giáo, Bộ trưởng Bộ GDĐT Nguyễn Kim Sơn trân trọng gửi lời cảm ơn chân thành và sâu sắc tới Chủ...

Nông sản trong nước và quốc tế quy tụ về AgroViet 2024

Hội chợ triển lãm Nông nghiệp Quốc tế – AgroViet 2024 là sự kiện xúc tiến thương mại quan trọng của ngành NN&PTNT Việt Nam, được tổ chức thường niên. Năm 2024, Hội chợ được tổ chức với chủ đề “Kết nối chuỗi giá trị, phát triển nông nghiệp xanh, kinh tế tuần hoàn”, được tổ chức trong 04 ngày từ ngày 20 đến 23/11/2024, nhằm thúc đẩy, mở rộng quan hệ hợp tác giao lưu kinh tế quốc...

Chuyện chưa kể về clip học trò mang cua tặng cô giáo thu hút 16 triệu lượt xem

XEM CLIP: video-embed-169"> Mới đây, trên một nền tảng mạng xã hội xuất hiện đoạn clip do cô giáo vùng cao đăng tải, ghi lại cảnh học sinh tiểu học mang những món quà giản dị tặng cô giáo. Trong đoạn clip, các em mang gừng, hoa ven đường, mía, cua núi… để tặng cô giáo nhân ngày 20/11 kèm theo những lời chúc ngộ nghĩnh. “Em chúc cô bò nhanh như con cua”, một học sinh gửi lời chúc kèm theo món...

Cùng chuyên mục

Báo Lào Cai Thường kỳ số 4207 ra ngày 18/11/2024

Báo Lào Cai Thường kỳ số 4207 ra ngày 18/11/2024 Nguồn

Việt Nam tiếp tục đối mặt với kháng thuốc gia tăng

window.addEventListener('load', function(){ if(typeof Web_SdaArticleAfterComment != 'undefined'){window.CMS_RENNAB.pushSda(Web_SdaArticleAfterComment, 'sdaWeb_SdaArticleAfterComment');}else{document.getElementById('sdaWeb_SdaArticleAfterComment').style.display = "none";} }); Nguồn

Quảng bá, tôn vinh giá trị văn hóa của đồng bào Khmer

window.addEventListener('load', function(){ if(typeof Web_SdaArticleAfterComment != 'undefined'){window.CMS_RENNAB.pushSda(Web_SdaArticleAfterComment, 'sdaWeb_SdaArticleAfterComment');}else{document.getElementById('sdaWeb_SdaArticleAfterComment').style.display = "none";} }); Nguồn

Nghề làm mã ở Bảo Hà

Nghề làm mã ở Bảo Hà Nguồn

Bộ Chỉ huy Quân sự tỉnh khảo sát xây dựng điểm dân cư tại huyện Bát Xát

window.addEventListener('load', function(){ if(typeof Web_SdaArticleAfterComment != 'undefined'){window.CMS_RENNAB.pushSda(Web_SdaArticleAfterComment, 'sdaWeb_SdaArticleAfterComment');}else{document.getElementById('sdaWeb_SdaArticleAfterComment').style.display = "none";} }); Nguồn

Sân chơi mang nhiều ý nghĩa

window.addEventListener('load', function(){ if(typeof Web_SdaArticleAfterComment != 'undefined'){window.CMS_RENNAB.pushSda(Web_SdaArticleAfterComment, 'sdaWeb_SdaArticleAfterComment');}else{document.getElementById('sdaWeb_SdaArticleAfterComment').style.display = "none";} }); Nguồn

Pep Guardiola thua 4 trận liên tiếp lần đầu tiên

window.addEventListener('load', function(){ if(typeof Web_SdaArticleAfterComment != 'undefined'){window.CMS_RENNAB.pushSda(Web_SdaArticleAfterComment, 'sdaWeb_SdaArticleAfterComment');}else{document.getElementById('sdaWeb_SdaArticleAfterComment').style.display = "none";} }); Nguồn

Lào Cai hưởng ứng ngày Thế giới phòng chống bệnh đái tháo đường (14/11)

window.addEventListener('load', function(){ if(typeof Web_SdaArticleAfterComment != 'undefined'){window.CMS_RENNAB.pushSda(Web_SdaArticleAfterComment, 'sdaWeb_SdaArticleAfterComment');}else{document.getElementById('sdaWeb_SdaArticleAfterComment').style.display = "none";} }); Nguồn

3 sản phẩm trà của Lào Cai được trao giải tại cuộc thi “Trà thế giới”

window.addEventListener('load', function(){ if(typeof Web_SdaArticleAfterComment != 'undefined'){window.CMS_RENNAB.pushSda(Web_SdaArticleAfterComment, 'sdaWeb_SdaArticleAfterComment');}else{document.getElementById('sdaWeb_SdaArticleAfterComment').style.display = "none";} }); Nguồn

[Ảnh] Bản Xèo nhộn nhịp mùa thu hoạch dong riềng

Bản Xèo nhộn nhịp mùa thu hoạch dong riềng Nguồn

Tin nổi bật

Tin mới nhất