ỨNG DỤNG PHƯƠNG PHÁP HỌC MÁY VỚI NGÔN NGỮ R TRONG DỰ ĐOÁN KẾT QUẢ HỌC TẬP
Từ khóa:
khai phá dữ liệu giáo dục, học máy trong R, dự đoán kết quả học tập, so sánh mô hình dự đoán, phân tích yếu tố học tập, Linear Regression, SVM, Random Forest
Tóm tắt
Nghiên cứu này ứng dụng các kỹ thuật khai phá dữ liệu giáo dục bằng ngôn ngữ R nhằm xây dựng và đánh giá mô hình dự đoán kết quả học tập. Ba mô hình - Linear Regression, Random Forest và SVM - được triển khai trên tập dữ liệu chuẩn hóa gồm 2.392 học sinh với 8 biến đầu vào. Linear Regression cho kết quả tốt nhất (R² = 0,9537; RMSE = 0,0494), vượt trội so với SVM và Random Forest. Phân tích hồi quy cho thấy hỗ trợ từ phụ huynh (β = 0,102), thời gian học (β = 0,14) và vắng mặt (β = -0,72) là các yếu tố ảnh hưởng mạnh đến GPA. Kết quả góp phần xây dựng khung phân tích toàn diện bằng R và cung cấp cơ sở dữ liệu thực nghiệm cho các chiến lược can thiệp giáo dục hiệu quả.