THUẬT TOÁN GIA TĂNG LỌC - ĐÓNG GÓI TÌM TẬP RÚT GỌN TRONG BẢNG QUYẾT ĐỊNH KHÔNG ĐẦY ĐỦ KHI TẬP ĐỐI TƯỢNG VÀ TẬP THUỘC TÍNH THAY ĐỔI GIÁ TRỊ

  • Nguyễn Anh Tuấn, Nguyễn Long Giang, Vũ Đức Thi
Từ khóa: Lý thuyết tập thô; Bảng quyết định không đầy đủ; Rút gọn thuộc tính; Tập rút gọn; Thuật toán gia tăng; Lọc - Đóng gói

Tóm tắt

Trong xu thế phát triển của dữ liệu lớn, các bảng quyết định thường không đầy đủ, ngày càng có kích thước lớn và luôn thay đổi, cập nhật. Việc xây dựng các thuật toán gia tăng hiệu quả theo phương pháp tiếp cận lọc - đóng gói nhằm giảm thiểu số thuộc tính tập rút gọn, từ đó nâng cao hiệu quả các mô hình phân lớp, học máy là vấn đề nghiên cứu rất cần thiết. Trong bài báo này, chúng tôi đề xuất hai thuật toán gia tăng lọc - đóng gói tìm tập rút gọn của bảng quyết định không đầy đủ thay đổi sử dụng khoảng cách: thuật toán IFWA_U_Obj trong trường hợp tập đối tượng thay đổi giá trị và thuật toán IFWA_U_Attr trong trường hợp tập thuộc tính thay đổi giá trị. Kết quả thực nghiệm trên các tập dữ liệu mẫu cho thấy, các thuật toán gia tăng lọc - đóng gói đề xuất hiệu quả hơn về số lượng thuộc tính tập rút gọn và độ chính xác phân lớp so với các thuật toán lọc đã công bố.

điểm /   đánh giá
Phát hành ngày
2021-08-31
Chuyên mục
Khoa học Tự nhiên - Kỹ thuật - Công nghệ (TNK)