搜索结果 - 《计算机应用研究》编辑部官方网站

搜索结果

搜索policy gradients with parameter based exploration共有 1 个结果

1

基于值函数估计的参数探索策略梯度算法

Function approximation for policy gradients with parameter-based exploration

Zhao Tingting

Yang Mengnan

Chen Yarui

Wang Yuan

Yang Jucheng

reinforcement learning

value function

policy gradients with parameter based exploration

variance of gradient estimates

2023年第8期 : 2404-2410 doi:10.19734/j.issn.1001-3695.2022.11.0781