SO SÁNH ĐIỀU KHIỂN DỰ BÁO VÀ PHƯƠNG PHÁP HỌC MÁY TĂNG CƯỜNG

  • Nguyễn Tiến Ban

Abstract

Bài báo so sánh hai phương pháp điều khiển liên quan đến điều khiển tối ưu là điều khiển dự báo (Model Predictive Control - MPC) và phương pháp học máy tăng cường (Reinforcement Learning - RL) cho hệ thống điều khiển rời rạc. Về cơ bản, MPC điều khiển dựa trên mô hình và có thể đảm bảo tính ổn định, khả thi và bền vững cho hệ đồng thời giải quyết tốt vấn đề giới hạn của trạng thái và tín hiệu điều khiển trong khi đó RL không cần biết trước mô hình và mang tính thích nghi cao. Việc kết hợp hai phương pháp để tận dụng ưu điểm của mỗi bên đang được đẩy mạnh nghiên cứu.

 

điểm /   đánh giá
Published
2020-08-05