Phát triển mô hình nhận dạng tiếng nói dân tộc thiểu số Hrê, Co sang tiếng Việt dạng văn bản sử dụng trí tuệ nhân tạo
Tóm tắt
Việc xây dựng cơ sở dữ liệu (CSDL) điện tử tiếng đồng bào dân tộc thiểu số Việt - Hrê, Việt - Co là hết sức cần thiết nhằm thu hẹp khoảng cách giao tiếp và ngôn ngữ giữa người Hrê, Co và người Kinh. Hiện nay, công nghệ nhận diện lời nói bằng trí tuệ nhân tạo (AI) đạt độ chính xác cao với tiếng Việt và nhiều ngôn ngữ khác, cho phép ứng dụng nhận diện tiếng Việt trong chiều dịch Việt - Hrê và Việt - Co của CSDL điện tử. Tuy nhiên, chiều ngược lại, nhận dạng và dịch tiếng Hrê, Co sang tiếng Việt hiện chưa có nghiên cứu. Trong bài báo này, các cặp từ tương ứng để tạo lập kho dữ liệu Việt - Hrê, Việt - Co đã được tiến hành số hóa đồng nhất. Nhờ vào kho dữ liệu đã xây dựng, nhóm tác giả đã phát triển thành công bộ phần mềm CSDL điện tử cho phép tra cứu ngữ nghĩa giữa các ngôn ngữ Việt - Hrê, Việt - Co với hai phiên bản web và thiết bị di động. Đặc biệt, nhóm tác giả cũng đã nghiên cứu và xây dựng thành công mô hình nhận dạng lời nói tiếng Hrê và Co, mở rộng khả năng ứng dụng cho CSDL điện tử này.