残差连接的梯度高速公路
残差连接如何为梯度提供直达路径
y = F(x) + x → ∂y/∂x = F'(x) + 1
残差块结构
梯度流对比
↻ 重置