权重初始化与梯度传播
对比不同初始化方法对梯度分布的影响
Xavier: W ~ N(0, 2/(n_in+n_out))
全零初始化
随机初始化
Xavier初始化
He初始化
↻ 重置