Double DQN过估计对比

原始DQN vs Double DQN的Q值估计偏差

DQN: r+γmaxQ(s',a';θ^-) | DDQN: r+γQ(s',argmaxQ(s',a';θ);θ^-)
噪声水平: 0.3 | 实验次数: 0
DQN过估计 | Double DQN减少过估计
红色=DQN 蓝色=Double DQN 虚线=真实值