BỘ ĐIỀU KHIỂN TỐI ƯU BỀN VỮNG DỰA TRÊN BIẾN TRƯỢT CHO CÁC HỆ CƠ KHÍ MÔ HÌNH PHI TUYẾN BẤT ĐỊNH

  • Vũ Văn Tú
  • Nguyễn Thị Thu Hiền
Từ khóa: Học tăng cường thích nghi, Điều khiển tối ưu, Quy hoạch động thích nghi, Điều khiển trượt, Rô-bốt Planar.

Tóm tắt

Trong bài báo này, nhiêm vụ chính của chúng ta là thiết kế một bộ
điều khiển tối ưu bền vững được áp dụng cho Rô-bốt Planar sử dụng một mạng
nơ-ron kết hợp với biến trượt. Một thuật toán học tăng cường thích nghi (ARL)
được phát triển để giải nghiêm phương trình Hamilton-Jacabi-Bellman (HJB)
trong điều kiên của điều khiển tối ưu. Sự hội tụ của kỹ thuật được đề xuất với
phân tích nghiêm của phương trình HJB được đảm bảo. Ngoài ra hiêu quả của
bám quỹ đạo cũng được đề cập. Các nghiên cứu mô phỏng được đưa ra để đánh
giá chất lượng của phương pháp đề xuất

điểm /   đánh giá
Phát hành ngày
2024-03-03