残差连接与批归一化梯度流
对比普通网络、残差网络和BN的梯度传播效果
ResNet: y = F(x) + x → ∂y/∂x = F'(x) + 1
普通网络
残差连接
批归一化
↻ 重置