浏览全部资源
扫码关注微信
华南师范大学 软件学院, 广东 佛山 538200
周娴玮(1980-),男,博士,华南师范大学软件学院讲师、硕士生导师,研究方向为机器人自动化技术
张锟(1998-),男,CCF学生会员,华南师范大学软件学院硕士研究生,研究方向为安全强化学习。
叶鑫(1996-),男,CCF学生会员,华南师范大学软件学院硕士研究生,研究方向为强化学习。
纸质出版日期:2024-09-16,
收稿日期:2023-08-10,
移动端阅览
周娴玮,张锟,叶鑫.基于鲁棒交叉熵与梯度优化的安全强化学习方法[J].软件导刊,2024,23(09):143-149.
ZHOU Xianwei,ZHANG Kun,YE Xin.Safe Reinforcement Learning Method Based on Robust Cross-Entropy and Gradient Optimization[J].Software Guide,2024,23(09):143-149.
周娴玮,张锟,叶鑫.基于鲁棒交叉熵与梯度优化的安全强化学习方法[J].软件导刊,2024,23(09):143-149. DOI: 10.11907/rjdk.231853.
ZHOU Xianwei,ZHANG Kun,YE Xin.Safe Reinforcement Learning Method Based on Robust Cross-Entropy and Gradient Optimization[J].Software Guide,2024,23(09):143-149. DOI: 10.11907/rjdk.231853.
0
浏览量
下载量
CSCD
关联资源
相关文章
相关作者
相关机构