Các phương pháp học máy để dự đoán tình trạng bỏ học của sinh viên
Tóm tắt
Vấn đề học sinh bỏ học trong quá trình học tập đang là mối lo ngại ngày càng tăng với những hệ lụy sâu rộng. Vấn đề này không chỉ ảnh hưởng trực tiếp đến sinh viên và gia đình họ mà còn đặt ra những thách thức đáng kể cho các cơ sở giáo dục đại học và xã hội nói chung. Hậu quả đối với sinh viên bao gồm việc gia tăng khó khăn và thiếu hụt các kỹ năng mềm cũng như kinh nghiệm sống, thường khiến họ phải tìm kiếm việc làm bán thời gian. Nghiên cứu này tập trung phát triển mô hình machine learning thông qua quá trình phân tích, so sánh và đánh giá hiệu suất của 5 mô hình: AdaBoost, DecisionTree, RandomForest, ExtraTree và BernoulliNB. Tất cả các mô hình đều được triển khai bằng cách sử dụng "Bộ dữ liệu dự đoán học sinh bỏ học". Dựa trên kết quả thu được sau khi xử lý số liệu, nghiên cứu sẽ tiến hành phân tích dựa trên 2 tiêu chí chính: đánh giá theo tỷ lệ phần trăm trung bình, độ lệch chuẩn và kết quả cuối cùng cũng như đánh giá bằng mô hình chuỗi thời gian theo độ tuổi (Balanced Accuracy Progression). Từ những phân tích này, mô hình có hiệu suất tối ưu sẽ được lựa chọn. Bằng cách xác định các nguyên nhân cơ bản và giải quyết các vấn đề này một cách hiệu quả, nghiên cứu nhằm mục đích giảm bớt gánh nặng cho gia đình và xã hội, giảm thiểu các vấn đề xã hội, kích thích tăng trưởng kinh tế, tạo cơ hội việc làm và nâng cao cả khả năng cạnh tranh và năng suất. Bộ dữ liệu này có giá trị đáng kể đối với các nhà nghiên cứu thực hiện nghiên cứu so sánh về kết quả học tập của sinh viên và đóng vai trò là nguồn tài nguyên quan trọng để đào tạo trong lĩnh vực học máy.