Trust-region inverse reinforcement learning
This paper proposes a new unified inverse reinforcement learning (IRL) framework based on trust-region methods and a recently proposed Pontryagin differential programming (PDP) method in Jin et al. (2020), which aims to learn the parameters in both the system model and the cost function for three ty...
محفوظ في:
المؤلفون الرئيسيون: | Cao, Kun, Xie, Lihua |
---|---|
مؤلفون آخرون: | School of Electrical and Electronic Engineering |
التنسيق: | مقال |
اللغة: | English |
منشور في: |
2023
|
الموضوعات: | |
الوصول للمادة أونلاين: | https://hdl.handle.net/10356/170705 |
الوسوم: |
إضافة وسم
لا توجد وسوم, كن أول من يضع وسما على هذه التسجيلة!
|
مواد مشابهة
-
Game-theoretic inverse reinforcement learning: a differential pontryagin's maximum principle approach
بواسطة: Cao, Kun, وآخرون
منشور في: (2022) -
An efficient spectral trust-region deflation method for multiple solutions
بواسطة: Li, Lin, وآخرون
منشور في: (2023) -
A trust region algorithm for minimization of locally Lipschitzian functions
بواسطة: Qi, L., وآخرون
منشور في: (2013) -
Trust region methods for solving multiobjective optimisation
بواسطة: Qu, S., وآخرون
منشور في: (2014) -
On piecewise quadratic Newton and trust region problems
بواسطة: Sun, J.
منشور في: (2013)