Tóm tắt văn bản trên cơ sở phân loại ý kiến độc giả của báo mạng tiếng Việt

  • Nguyễn Ngọc Duy
  • Phan Thị Tươi

Tóm tắt

Muốn biết ý kiến của người dùng về một mặt hàng, hoặc của cộng đồng về một vấn đề nóng trong xã hội,…, cách tốt nhất trong thời đại bùng nổ thông tin trên internet và mạng xã hội, là khai thác thông tin một cách hiệu quả từ những nguồn này. Mỗi ý kiến không chỉ là một thông tin đơn thuần, mà còn chứa cả cảm xúc của người viết. Do đó, chúng có thể tạo nên một luồng dư luận tác động đến cộng đồng mạng. Đây thật sự là nguồn tài nguyên khổng lồ, có ý nghĩa to lớn đối với nhiều lĩnh vực – từ kinh tế, chính trị đến văn hóa xã hội – nếu có phương pháp khai thác thông tin hiệu quả. Một hệ thống tự động để phân loại ý kiến dựa trên cảm xúc là rất cần thiết để khai thác hiệu quả nguồn tài nguyên này. Để hỗ trợ người sử dụng khai thác thông tin hiệu quả hơn, vấn đề tóm tắt thông tin cần được nghiên cứu giải quyết, nhất là ở khía cạnh quan điểm và cảm xúc trong mỗi ý kiến.    

Hướng đến mục tiêu khai thác hiệu quả nguồn tài nguyên, bài báo này sẽ giới thiệu mô hình tóm tắt văn bản, không chỉ dựa vào ngữ nghĩa mà còn dựa trên yếu tố cảm xúc. Chúng tôi đã xây dựng một mô hình tổng quát để giải quyết bài toán này. Từ các phương pháp phân tích ý kiến và tóm tắt văn bản mà nhiều công trình nghiên cứu đã sử dụng, bài báo đã kết hợp và phát triển các phương pháp để tóm tắt văn bản tiếng Việt trên cơ sở phân loại cảm xúc. Các văn bản được tóm tắt là các trang báo mạng tiếng Việt.

điểm /   đánh giá
Phát hành ngày
2017-01-13
Chuyên mục
BÀI BÁO