感知-行动循环演示
看机器人如何通过「感知→决策→行动」循环与环境交互
循环: 感知(s) → 策略π(a|s) → 行动(a) → 新状态(s')
模式: 单步循环
等待演示...
切换模式查看不同视角
单步循环
多步轨迹
延迟对比
↻ 重置