Đánh giá hiệu năng của các kỹ thuật lọc cộng tác trên tập dữ liệu Amazon Fashion
Abstract
Hệ thống gợi ý đóng vai trò quan trọng trong việc nâng cao trải nghiệm người dùng thông qua việc cung cấp các đề xuất cá nhân hóa trên các nền tảng thương mại điện tử. Trong số các kỹ thuật hiện có, lọc cộng tác được sử dụng rộng rãi nhờ khả năng khai thác các mối quan hệ tiềm ẩn giữa người dùng và sản phẩm. Tuy nhiên, sự đa dạng của các thuật toán khiến việc lựa chọn mô hình phù hợp trở nên khó khăn. Nghiên cứu này thực hiện một đánh giá thực nghiệm toàn diện trên 18 mô hình lọc cộng tác, được phân thành ba nhóm chính: phân rã ma trận, các phương pháp heuristic/thống kê và các mô hình học sâu, sử dụng tập dữ liệu Amazon Fashion 2023. Các mô hình được đánh giá dựa trên các chỉ số AUC, NDCG@20, Precision@20, Recall@20 và thời gian huấn luyện. Kết quả cho thấy GMF đạt giá trị AUC cao nhất (0,7883), trong khi VAECF và EASER thể hiện chất lượng gợi ý top-k vượt trội, với Recall@20 đạt 0,1429. Ngược lại, các mô hình như BiVAECF và COE có chi phí huấn luyện cao và hiệu quả hạn chế, đặc biệt trong bối cảnh dữ liệu thưa. Từ các kết quả này, nghiên cứu làm rõ ưu điểm và hạn chế của từng nhóm mô hình, đồng thời đề xuất hướng phát triển các mô hình lai nhằm cân bằng giữa hiệu năng và hiệu quả tính toán cho việc triển khai hệ thống gợi ý ở quy mô lớn.