Nghiên cứu về tóm tắt văn bản và một số phương pháp tóm tắt hiệu quả

  • Trần Thị Thu Phương
Từ khóa: Bộ dữ liệu, học sâu, học tăng cường, mô hình, tóm tắt văn bản

Tóm tắt

Nghiên cứu này xem xét các phương pháp tóm tắt văn bản trích xuất và tóm tắt khái quát, tập trung vào các kỹ thuật học sâu như kiến trúc Transformer và học tăng cường. Tóm tắt trích xuất lựa chọn các câu quan trọng, trong khi tóm tắt khái quát tạo ra bản tóm tắt giống con người bằng cách diễn đạt lại nội dung. Các bộ dữ liệu quan trọng như Vietnews và Wikilingua được nhấn mạnh vì vai trò của chúng trong việc huấn luyện mô hình cho các ngôn ngữ có ít tài nguyên như tiếng Việt. Nghiên cứu cũng đề cập đến các thách thức trong việc duy trì tính mạch lạc và chính xác ngữ nghĩa, đồng thời đề xuất các giải pháp để nâng cao chất lượng tóm tắt. Định hướng tương lai bao gồm cải thiện các tiêu chí đánh giá, tối ưu hóa tính mạch lạc trong tóm tắt tiếng Việt và phát triển các mô hình đa ngôn ngữ tiên tiến. Bằng cách tích hợp các kỹ thuật hiện đại và giải quyết các thách thức quan trọng, nghiên cứu này đóng góp vào sự phát triển của các hệ thống tóm tắt tự động chính xác và đáng tin cậy hơn.

điểm /   đánh giá
Phát hành ngày
2025-04-25