Search Result - Official site of Journal of Application Research of Computers

Search Result

SearchYang Mengnanreturned 2 results

1

Function approximation for policy gradients with parameter-based exploration

基于值函数估计的参数探索策略梯度算法

Zhao Tingting

Yang Mengnan

Chen Yarui

Wang Yuan

Yang Jucheng

reinforcement learning

value function

policy gradients with parameter based exploration

variance of gradient estimates

No. 8, 2023 : 2404-2410 doi:10.19734/j.issn.1001-3695.2022.11.0781

2

Intention based reinforcement learning by information maximization

基于互信息最大化的意图强化学习方法的研究

Zhao Tingting

Wu Shuai

Yang Mengnan

Chen Yarui

Wang Yuan

Yang Jucheng

reinforcement learning(RL)

mutual information

intentional control

proximal policy optimization

No. 11, 2022 : 3327-3332,3364 doi:10.19734/j.issn.1001-3695.2022.03.0168