Khai thác dữ liệu chuỗi theo mối quan tâm của người dùng

  • Trang Văn Thị Thiên
Từ khóa: Cơ sở dữ liệu chuỗi, khai thác dữ liệu, khai thác mẫu tuần tự, mẫu tuần tự phổ biến, ràng buộc.

Tóm tắt

Khai thác dữ liệu chuỗi hay còn gọi là khai thác mẫu tuần tự là đi tìm những chuỗi con xuất hiện phổ biến (gọi là mẫu tuần tự) trong cơ sở dữ liệu chuỗi, ngưỡng phổ biến này do người dùng quy định. Trong những năm gần đây, do sự bùng nổ thông tin và dữ liệu lớn, bài toán này có xu hướng phát triển thành khai thác mẫu tuần tự có ràng buộc nhằm khắc phục cả hai thách thức về tính hiệu quả và hiệu suất thực thi vì ràng buộc đại diện cho mối quan tâm của người dùng. Bài báo này trình bày khảo sát chi tiết tất cả các phương pháp khai thác mẫu tuần tự và các loại ràng buộc đã được nghiên cứu. Phân loại các phương pháp khai thác, đồng thời phân tích ưu nhược điểm của chúng, từ đó chỉ ra hướng tiếp cận và phương pháp làm nền tảng cho các nghiên cứu về sau của bài toán này.

điểm /   đánh giá
Phát hành ngày
2024-02-19