SO SÁNH ĐIỀU KHIỂN DỰ BÁO VÀ PHƯƠNG PHÁP  HỌC MÁY TĂNG CƯỜNG

Nguyễn Tiến Ban

Nguyễn Tiến Ban

Từ khóa: MPC – Bộ điều khiển dự báo; RL - Học máy tăng cường; Tính ổn định; ADP - Quy hoạch động thích nghi; Điều khiển hệ có giới hạn.

Tóm tắt

Bài báo so sánh hai phương pháp điều khiển liên quan đến điều khiển tối ưu là điều khiển dự báo (Model Predictive Control - MPC) và phương pháp học máy tăng cường (Reinforcement Learning - RL) cho hệ thống điều khiển rời rạc. Về cơ bản, MPC điều khiển dựa trên mô hình và có thể đảm bảo tính ổn định, khả thi và bền vững cho hệ đồng thời giải quyết tốt vấn đề giới hạn của trạng thái và tín hiệu điều khiển trong khi đó RL không cần biết trước mô hình và mang tính thích nghi cao. Việc kết hợp hai phương pháp để tận dụng ưu điểm của mỗi bên đang được đẩy mạnh nghiên cứu.

SO SÁNH ĐIỀU KHIỂN DỰ BÁO VÀ PHƯƠNG PHÁP HỌC MÁY TĂNG CƯỜNG

Tóm tắt

BỘ KHOA HỌC VÀ CÔNG NGHỆ - MINISTRY OF SCIENCE AND TECHNOLOGY OF VIETNAM

CỤC THÔNG TIN KHOA HỌC VÀ CÔNG NGHỆ QUỐC GIA - NATIONAL AGENCY FOR SCIENCE AND TECHNOLOGY INFORMATION