Xây dựng bộ dữ liệu tiếng Việt cho bài toán trả lời câu hỏi trực quan (Visual Question Answering)

  • Vĩnh Anh Nghiêm Quân
  • Nguyễn Thị Lan Anh
  • Nguyễn Lê Trung Thành
  • Đinh Thị Diệu Minh
Từ khóa: Từ khóa: Trả lời câu hỏi trực quan, sinh câu hỏi tự động, sinh câu hỏi trực quan.

Tóm tắt

Tóm tắt: Bài toán trả lời câu hỏi trực quan (VQA) là bài toán kết hợp thị giác máy tính và xử lý ngôn ngữ tự nhiên. Trong bài báo này, chúng tôi trình bày các chiến lược xây dựng bộ dữ liệu VQA mới bằng tiếng Việt, Flickr8k-ViQA, bằng cách sinh tự động các cặp câu hỏi – câu trả lời từ những chú thích của bộ dữ liệu Flickr8k. Chúng tôi mô tả các công cụ đã sử dụng, phân tích những trở ngại gặp phải trong quá trình xây dựng và cách khắc phục, đồng thời đề xuất cách đánh giá các mô hình trên bộ dữ liệu này.

 

điểm /   đánh giá
Phát hành ngày
2021-12-21