MỘT PHƯƠNG PHÁP TỐI ƯU THAM SỐ TÍNH MỜ TRÍCH RÚT TẬP CÂU TÓM TẮT TỐI ƯU TỪ DỮ LIỆU SỐ
Tóm tắt
Trích rút tập câu tóm tắt bằng ngôn ngữ từ dữ liệu số giúp đưa ra các câu tóm tắt được diễn đạt bằng ngôn ngữ tự nhiên mô tả tri thức ẩn dấu trong tập dữ liệu số. Một số mô hình thuật toán di truyền được đề xuất nhằm trích rút tập câu tóm tắt tối ưu, trong đó, mô hình thuật toán trích rút tập câu tóm tắt đảm bảo tính giải nghĩa nội dung các câu tóm tắt trên cơ sở kết hợp thuật toán di truyền với chiến lược tham lam cho kết quả khá tốt. Tuy nhiên, việc xác định các tham số tính mờ của mô hình thuật toán phụ thuộc vào cảm nhận trực giác của chuyên gia. Trong bài báo này, chúng tôi đề xuất một thuật toán tối ưu các tham số tính mờ nhằm nâng cao chất lượng tập câu tóm tắt được trích xuất từ dữ liệu số. Kết quả thực nghiệm với cơ sở dữ liệu creep cho thấy, với bộ tham số tính mờ được tối ưu, chất lượng của tập câu tóm tắt được trích rút tốt hơn trên ba độ đo là giá trị hàm thích nghi, giá trị chân lý trung bình và số câu có từ lượng hóa lớn hơn a half.