NGHIÊN CỨU HỆ THỐNG DỊCH NGÔN NGỮ TIẾNG VIỆT-K’HO SỬ DỤNG DỊCH MÁY BẰNG NƠRON

  • Nguyễn Thị Lương, La Quốc Thắng, Trần Nhật Quang, Dương Bảo Ninh, Nguyễn Hữu Khánh, Phan Thị Thanh Nga, Trần Ngô Như Khánh, Trần Thống
Từ khóa: Ngôn ngữ K’Ho; Ngữ liệu song ngữ; Dịch tự động; RNN; OpenMNT

Tóm tắt

Ngôn ngữ K’Ho là ngôn ngữ được sử dụng bởi dân tộc K’Ho, sinh sống ở vùng Nam Tây Nguyên, đặc biệt là các huyện Đơn Dương, Đức Trọng, Di Linh, Đạ Huoai, Lạc Dương thuộc tỉnh Lâm Đồng. Hiện nay, ủy ban nhân dân tỉnh và ban dân tộc tỉnh Lâm Đồng đang khuyến khích cán bộ và viên chức trong tỉnh biết tiếng K’Ho để tiếp xúc và tuyên truyền các chủ trương, đường lối, chính sách, pháp luật của Đảng và Nhà nước tới người K’Ho. Trong bài báo này, chúng tôi sử dụng nguồn tài nguyên tiếng K’Ho và sự hỗ trợ từ các chuyên gia tiếng K’Ho để xây dựng bộ song ngữ Việt – K’Ho nhằm góp phần vào việc quảng bá và bảo tồn ngôn ngữ K’Ho. Bộ ngữ liệu bao gồm hơn 16.000 cặp câu song ngữ Việt-K’Ho, vốn không dễ dàng thu thập do giới hạn về nguồn tài liệu liên quan tới ngôn ngữ tiếng K’Ho. Chúng tôi sử dụng bộ mã nguồn OpenNMT để xây dựng hệ thống dịch tự động dựa trên bộ dữ liệu song ngữ. Kết quả dịch có thể đạt được độ chính xác lên tới 56,54%, là một kết quả có thể chấp nhận được trong lĩnh vực dịch tự động.

điểm /   đánh giá
Phát hành ngày
2023-04-07
Chuyên mục
Công nghệ thông tin và Truyền thông