残差连接与批归一化梯度流

对比普通网络、残差网络和BN的梯度传播效果

ResNet: y = F(x) + x → ∂y/∂x = F'(x) + 1