ỨNG DỤNG KỸ THUẬT HỌC MÁY TRÊN DỮ LIỆU MẤT CÂN BẰNG HỖ TRỢ DỰ ĐOÁN SỚM KHẢ NĂNG THÔI HỌC CỦA HỌC SINH TRUNG HỌC PHỔ THÔNG

  • Dũng Lê
  • Võ Đức Quang
  • Nguyễn Thị Lan Anh
  • Mai Hồng Mận
  • Cao Thanh Sơn
Từ khóa: Học máy; khai phá dữ liệu; dữ liệu mất cân bằng; Cây quyết định; AdaBoost, SMOTE.

Tóm tắt

Bài báo đề xuất một mô hình học máy cho bài toán phân lớp trên tập dữ liệu mất cân bằng, trong đó sử dụng kết hợp kỹ thuật sinh mẫu tổng hợp SMOTE và giải thuật AdaBoost cho thuật toán Cây quyết định. Các tác giả đã tiến hành thực nghiệm đánh giá so sánh hiệu quả phân lớp của mô hình đã đề xuất với các giải thuật Cây quyết định sử dụng entropy và chỉ số Gini trên bộ dữ liệu thực tế thu thập tại Trường trung học phổ thông (THPT) Đông Hiếu, Thái Hòa, Nghệ An từ năm 2014 đến năm 2019. Kết quả nghiên cứu có thể sử dụng làm nền tảng để xây dựng ứng dụng hỗ trợ dự đoán sớm khả năng thôi học của học sinh THPT, có ý nghĩa góp phần nâng cao chất lượng giáo dục đào tạo của nhà trường và các cấp quản lý giáo dục.

 

điểm /   đánh giá
Phát hành ngày
2020-10-15
Chuyên mục
Bài viết