发布于 2021-12-15 11:37:35 | 阅读 18423
谷歌团队在CoRL 2021上提出了一种隐式行为克隆 (Implicit BC) 算法,该方法在7项测试任务中的6项上优于此前最佳的离线强化学习方法(Conservative Q Learning)。
谷歌行为克隆算法 CoRL顶会
提交成功!请耐心等待,我们的工程师会在24小时内联系您!
即时通讯云使用者请在应用详情页面咨询客服云使用者请进入管理员模式咨询
在线咨询
电话咨询
微信咨询
扫码1对1咨询
注册客服
注册IM