Search Result

1

Research on deep reinforcement learning method based on improved curiosity

基于改进好奇心的深度强化学习方法

Qiao He

Li Zenghui

Liu Chun

Hu Sidong

deep reinforcement learning

knowledge distillation

optimization of near-end policy

sparse reward

intrinsic curiosity

Accepted Paper No. 9, 2024 : doi:10.19734/j.issn.1001-3695.2024.01.0014

2

Integrated reward design for dynamic 3d mazes

面向动态三维迷宫的综合奖励设计

Jiao Changcheng

Wang Shaowei

3d maze

dynamic

reward design

reinforcement learning

event trigger

Accepted Paper No. 6, 2024 : doi:10.19734/j.issn.1001-3695.2023.10.0440

3

Knowledge reasoning method based on hierarchical reinforcement learning

一种分层强化学习的知识推理方法

Sun Chong

Wang Hairong

Jing Boxiang

Ma He

knowledge reasoning

hierarchical reinforcement learning

interactive reward

link prediction

No. 3, 2024 : 805-810 doi:10.19734/j.issn.1001-3695.2023.07.0309

4

Improved PBFT consensus algorithm based on node grouping reputation model

基于节点分组信誉模型的改进PBFT共识算法

Chen Suming

Wang Bing

Chen Yuquan

Xing Tao

Ma Yuhui

Zhao Jianli

blockchain

consensus algorithm

node grouping

reputation reward and punishment mechanism

PBFT

No. 10, 2023 : 2916-2921 doi:10.19734/j.issn.1001-3695.2023.03.0091

5

Processing in memory deployment optimization algorithm based on deep reinforcement learning

基于深度强化学习的存内计算部署优化算法

Hu Yidi

Xia Yinshui

processing in memory

deep reinforce learning

neural network deployment

proximal policy optimization

intrinsic reward

No. 9, 2023 : 2616-2620 doi:10.19734/j.issn.1001-3695.2023.02.0047

6

Local path planning for unmanned surface vehicle based on spatial and temporal sensing-enhanced deep Q-network

基于时空感知增强的深度Q网络无人水面艇局部路径规划

Zhang Mu

Tang Jun

Yang Youbo

Chen Yu

Lei Yinjie

local path planning

complex obstacle

current disturbance

deep Q-network

multi-scale spatial attention

reward function

No. 5, 2023 : 1330-1334 doi:10.19734/j.issn.1001-3695.2022.09.0466

7

Right-turn driving decisions of autonomous vehicles at signal-free intersections

自动驾驶车辆在无信号交叉口右转驾驶决策技术研究

Wang Shuyan

Wan Qingtian

deep reinforcement learning

autonomous driving

signal-free intersections

decision making

reward function

No. 5, 2023 : 1468-1472 doi:10.19734/j.issn.1001-3695.2022.08.0420

8

Multi-tasks resource joint optimization based on asynchronous reward deep deterministic policy gradient in edge computing

基于异步奖励深度确定性策略梯度的边缘计算多任务资源联合优化

Zhou Heng

Li Lijun

Dong Zengshou

edge computing

task offloading

resource joint optimization

dynamic bandwidth allocation

DDPG

No. 5, 2023 : 1491-1496 doi:10.19734/j.issn.1001-3695.2022.08.0471

9

Intrinsic reward-based skill acquisition and combination approach

基于内在奖励的技能获取和组合方法

Zhao Ying

Qin Jin

positive state

subgoal

skill

skill assessment

No. 12, 2022 : 3678-3682,3687 doi:10.19734/j.issn.1001-3695.2022.04.0231

10

Research on autonomous vehicle U-turn problem based on hierarchical reinforcement learning

基于分层强化学习的自动驾驶车辆掉头问题研究

Cao Jie

Shao Zixuan

Hou Liang

hierarchical reinforcement learning

car U-turn

sparse rewards

proximal policy optimization

No. 10, 2022 : 3008-3012,3045 doi:10.19734/j.issn.1001-3695.2022.03.0127

11

Adaptive opening and screwing method of manipulator based on force guidance

基于力觉引导的机械臂自适应开门旋拧方法

Jiang Yuanchen

Liu Hongwei

Liu Manlu

Zhang Junjun

deep reinforcement learning

force guided

adaptive method

reward function

No. 6, 2021 : 1804-1808 doi:10.19734/j.issn.1001-3695.2020.06.0251

12

Research on solid radioactive waste grasping method based on deep reinforcement learning

基于深度强化学习的固体放射性废物抓取方法研究

Zhou Qijie

Liu Manlu

Li Xinmao

Zhang Hua

solid radioactive waste

deep reinforcement learning

robotic grasping

reward

No. 11, 2020 : 3363-3367 doi:10.19734/j.issn.1001-3695.2019.07.0288

13

Improvement of DPOS consensus mechanism

DPOS共识机制的改进方案

Gao Ying

Tan Xuecheng

DPOS

reputation voting

reward and punishment mechanism

No. 10, 2020 : 3086-3090 doi:10.19734/j.issn.1001-3695.2019.05.0234

14

Design of TOC reward function in multi-target trajectory recovery with deep reinforcement learning

深度强化学习复原多目标航迹的TOC奖励函数

He Liang

Xu Zhengguo

Jia Yu

Shen Chao

Li Yun

deep reinforcement learning(DRL)

sequential decision

Q function

trajectory osculating circle(TOC)

No. 6, 2020 : 1626-1632 doi:10.19734/j.issn.1001-3695.2018.12.0886

15

Research and analysis of mining pool selection strategy in blockchain

区块链中矿池选择策略的研究与分析

Di Jian

Lin Weihua

bitcoin

blockchain

mining pool

reward system

risk decision

No. 6, 2020 : 1804-1807 doi:10.19734/j.issn.1001-3695.2018.12.0875

Search reward

Searchrewardreturned 15 results

Research on deep reinforcement learning method based on improved curiosity

Integrated reward design for dynamic 3d mazes

Knowledge reasoning method based on hierarchical reinforcement learning

Improved PBFT consensus algorithm based on node grouping reputation model

Processing in memory deployment optimization algorithm based on deep reinforcement learning

Local path planning for unmanned surface vehicle based on spatial and temporal sensing-enhanced deep Q-network

Right-turn driving decisions of autonomous vehicles at signal-free intersections

Multi-tasks resource joint optimization based on asynchronous reward deep deterministic policy gradient in edge computing

Intrinsic reward-based skill acquisition and combination approach

Research on autonomous vehicle U-turn problem based on hierarchical reinforcement learning

Adaptive opening and screwing method of manipulator based on force guidance

Research on solid radioactive waste grasping method based on deep reinforcement learning

Improvement of DPOS consensus mechanism

Design of TOC reward function in multi-target trajectory recovery with deep reinforcement learning

Research and analysis of mining pool selection strategy in blockchain