ỨNG DỤNG PHƯƠNG PHÁP HỌC MÁY VỚI NGÔN NGỮ R TRONG DỰ ĐOÁN KẾT QUẢ HỌC TẬP
Abstract
Nghiên cứu này ứng dụng các kỹ thuật khai phá dữ liệu giáo dục bằng ngôn ngữ R nhằm xây dựng và đánh giá mô hình dự đoán kết quả học tập. Ba mô hình - Linear Regression, Random Forest và SVM - được triển khai trên tập dữ liệu chuẩn hóa gồm 2.392 học sinh với 8 biến đầu vào. Linear Regression cho kết quả tốt nhất (R² = 0,9537; RMSE = 0,0494), vượt trội so với SVM và Random Forest. Phân tích hồi quy cho thấy hỗ trợ từ phụ huynh (β = 0,102), thời gian học (β = 0,14) và vắng mặt (β = -0,72) là các yếu tố ảnh hưởng mạnh đến GPA. Kết quả góp phần xây dựng khung phân tích toàn diện bằng R và cung cấp cơ sở dữ liệu thực nghiệm cho các chiến lược can thiệp giáo dục hiệu quả.