Nhận dạng văn bản tiếng Việt trong ảnh ngoại cảnh bằng học sâu

  • Huỳnh Văn Huy Trường Đại học Lạc Hồng
  • Nguyen Thi Thanh Tan Trường Đại học Điện lực
  • Ngô Quốc Tạo Viện Công nghệ thông tin, Viện Hàn lâm Khoa học và Công nghệ Việt Nam
Từ khóa: Phát hiện; Nhận dạng; Đặc trưng; Xác suất; Độ chính xác.

Tóm tắt

Bài báo này đề xuất một phương pháp hiệu quả để nhận dạng văn bản tiếng Việt trong ảnh ngoại cảnh. Phương pháp được đề xuất dựa trên ý tưởng kết hợp ba luồng xử lý đồng thời trong một công đoạn nhận dạng, bao gồm: (i) Nhận dạng (dự đoán) chuỗi ký tự từ hình ảnh; (ii) Xử lý ngữ cảnh; (iii) Hợp nhất và hiệu chỉnh lỗi. Hiệu quả của phương pháp được kiểm nghiệm trên hai tập dữ liệu ảnh ngoại cảnh được thu thập từ thực tế VinText và VnSceneText. Các kết quả thực nghiệm cho thấy phương pháp có khả năng phát hiện được các văn bản có hình dạng và kích thước bất kỳ với độ chính xác cao và ổn định. Cụ thể, phương pháp đạt độ chính xác mức từ (word accuracy), độ chính xác mức ký tự (character accuracy) là (81.87%, 93.02%) và (82.56%, 94.33%) lần lượt trên hai tập dữ liệu thử nghiệm.

điểm /   đánh giá
Phát hành ngày
2023-10-25
Chuyên mục
Tổng quan