首页
技术日记
编程
旅游
登录
标签
Functions
Expressing Arbitrary Reward Functions as Potential-Based Advice论文阅读
Abstract 在强化学习领域,结合外部的知识是个很重要的问题。基于势能的reward shaping为agent提供了指定形式的additional reward,这种做法是能保证最优策略不
论文
reward
Arbitrary
Expressing
Functions
admin
3月前
11
0