您当前的位置:
首页 >
文章列表页 >
基于鲁棒交叉熵与梯度优化的安全强化学习方法
计算机软件与理论 | 更新时间:2024-09-25
    • 基于鲁棒交叉熵与梯度优化的安全强化学习方法

    • Safe Reinforcement Learning Method Based on Robust Cross-Entropy and Gradient Optimization

    • 在智能体安全执行任务领域,研究者提出了一种新算法,通过模型预测控制框架和优化方法,有效提升了智能体的安全性和效率。
    • 软件导刊   2024年23卷第9期 页码:143-149
    • DOI:10.11907/rjdk.231853    

      中图分类号: TP391.4
    • 纸质出版日期:2024-09-16

      收稿日期:2023-08-10

    移动端阅览

  • 周娴玮,张锟,叶鑫.基于鲁棒交叉熵与梯度优化的安全强化学习方法[J].软件导刊,2024,23(09):143-149. DOI: 10.11907/rjdk.231853.

    ZHOU Xianwei,ZHANG Kun,YE Xin.Safe Reinforcement Learning Method Based on Robust Cross-Entropy and Gradient Optimization[J].Software Guide,2024,23(09):143-149. DOI: 10.11907/rjdk.231853.

  •  
  •  

0

浏览量

0

下载量

0

CSCD

文章被引用时,请邮件提醒。
提交
工具集
下载
参考文献导出
分享
收藏
添加至我的专辑

相关文章

融合强化学习与迁移对抗的服装标注
基于强化学习的生成式人工智能综述
基于子图特征融合的链接预测方法

相关作者

李倩
李霜
靖琦东
田炜
滕磊
黄晋
舒启杰
何儒汉

相关机构

中电工业互联网有限公司
纺织服装智能化湖北省工程研究中心
湖北省服装信息化工程技术研究中心
武汉纺织大学 计算机与人工智能学院
北京信息科技大学 计算机学院
0