Double DQN过估计对比
原始DQN vs Double DQN的Q值估计偏差
DQN: r+γmaxQ(s',a';θ^-) | DDQN: r+γQ(s',argmaxQ(s',a';θ);θ^-)
噪声水平: 0.3 | 实验次数: 0
DQN过估计 | Double DQN减少过估计
红色=DQN 蓝色=Double DQN 虚线=真实值
过估计对比
偏差曲线
↻ 重置