MADDPG集中Critic实现
每个Agent有独立Actor和集中Critic
MADDPG: Q_i(s,a_1,...,a_n) 集中Critic
模式: 架构
等待演示...
切换模式查看不同视角
架构
训练流程
vs DDPG
↻ 重置