MAPPO核心实现

多智能体PPO: 集中Critic + 分散Actor

MAPPO: Actor用局部观察, Critic用全局状态
模式: 架构
等待演示...
切换模式查看不同视角