SO SÁNH ĐIỀU KHIỂN DỰ BÁO VÀ PHƯƠNG PHÁP HỌC MÁY TĂNG CƯỜNG

  • Nguyễn Tiến Ban
Từ khóa: MPC – Bộ điều khiển dự báo; RL - Học máy tăng cường; Tính ổn định; ADP - Quy hoạch động thích nghi; Điều khiển hệ có giới hạn.

Tóm tắt

Bài báo so sánh hai phương pháp điều khiển liên quan đến điều khiển tối ưu là điều khiển dự báo (Model Predictive Control - MPC) và phương pháp học máy tăng cường (Reinforcement Learning - RL) cho hệ thống điều khiển rời rạc. Về cơ bản, MPC điều khiển dựa trên mô hình và có thể đảm bảo tính ổn định, khả thi và bền vững cho hệ đồng thời giải quyết tốt vấn đề giới hạn của trạng thái và tín hiệu điều khiển trong khi đó RL không cần biết trước mô hình và mang tính thích nghi cao. Việc kết hợp hai phương pháp để tận dụng ưu điểm của mỗi bên đang được đẩy mạnh nghiên cứu.

 

điểm /   đánh giá
Phát hành ngày
2020-08-05