Ứng dụng Soft Actor ‑ Critic cho điều hướng UAV trong môi trường 2D/3D
Tóm tắt
Bài báo trình bày nghiên cứu ứng dụng thuật toán Soft Actor - Critic (SAC) trong việc điều hướng máy bay không người lái (UAV) trong môi trường mô phỏng phức tạp 2D và 3D. SAC, một phương pháp học tăng cường ngoài chính sách (off -policy), được triển khai với kiến trúc mạng nơ - ron đa lớp để tối ưu chính sách ngẫu nhiên và hàm phần thưởng tổng thể, giúp UAV tự động điều chỉnh quỹ đạo, tránh vật cản và đạt mục tiêu một cách an toàn và hiệu quả. Kết quả thực nghiệm cho thấy SAC đạt tỉ lệ thành công cao, quỹ đạo mượt mà trong môi trường 2D và 3D, đồng thời vượt trội hơn các thuật toán phổ biến như PPO và A2C. Bài báo cũng đề xuất hướng phát triển mở rộng với việc áp dụng các thuật toán off-policy khác và bổ sung cảm biến ảnh cho điều hướng UAV trong môi trường thực tế.