Searchrewardreturned 15 results
1
基于改进好奇心的深度强化学习方法
Accepted Paper
No. 9, 2024 :
doi:10.19734/j.issn.1001-3695.2024.01.0014
2
面向动态三维迷宫的综合奖励设计
Accepted Paper
No. 6, 2024 :
doi:10.19734/j.issn.1001-3695.2023.10.0440
3
一种分层强化学习的知识推理方法
No. 3, 2024 : 805-810
doi:10.19734/j.issn.1001-3695.2023.07.0309
4
基于节点分组信誉模型的改进PBFT共识算法
No. 10, 2023 : 2916-2921
doi:10.19734/j.issn.1001-3695.2023.03.0091
5
基于深度强化学习的存内计算部署优化算法
No. 9, 2023 : 2616-2620
doi:10.19734/j.issn.1001-3695.2023.02.0047
6
基于时空感知增强的深度Q网络无人水面艇局部路径规划
No. 5, 2023 : 1330-1334
doi:10.19734/j.issn.1001-3695.2022.09.0466
7
自动驾驶车辆在无信号交叉口右转驾驶决策技术研究
No. 5, 2023 : 1468-1472
doi:10.19734/j.issn.1001-3695.2022.08.0420
8
基于异步奖励深度确定性策略梯度的边缘计算多任务资源联合优化
No. 5, 2023 : 1491-1496
doi:10.19734/j.issn.1001-3695.2022.08.0471
9
基于内在奖励的技能获取和组合方法
No. 12, 2022 : 3678-3682,3687
doi:10.19734/j.issn.1001-3695.2022.04.0231
10
基于分层强化学习的自动驾驶车辆掉头问题研究
No. 10, 2022 : 3008-3012,3045
doi:10.19734/j.issn.1001-3695.2022.03.0127
11
基于力觉引导的机械臂自适应开门旋拧方法
No. 6, 2021 : 1804-1808
doi:10.19734/j.issn.1001-3695.2020.06.0251
12
基于深度强化学习的固体放射性废物抓取方法研究
No. 11, 2020 : 3363-3367
doi:10.19734/j.issn.1001-3695.2019.07.0288
13
DPOS共识机制的改进方案
No. 10, 2020 : 3086-3090
doi:10.19734/j.issn.1001-3695.2019.05.0234
14
深度强化学习复原多目标航迹的TOC奖励函数
No. 6, 2020 : 1626-1632
doi:10.19734/j.issn.1001-3695.2018.12.0886
15
区块链中矿池选择策略的研究与分析
No. 6, 2020 : 1804-1807
doi:10.19734/j.issn.1001-3695.2018.12.0875