MAPPO核心实现

多智能体PPO: 集中Critic + 分散Actor

MAPPO: Actor用局部观察, Critic用全局状态

模式: 架构

等待演示...

切换模式查看不同视角