GRU门控机制与LSTM对比

观察GRU重置门和更新门如何协同控制信息流

z_t = σ(W_z·[h_{t-1},x_t]), r_t = σ(W_r·[h_{t-1},x_t])
h_t = (1-z_t)⊙h_{t-1} + z_t⊙tanh(W·[r_t⊙h_{t-1},x_t])
点击模式按钮查看门控行为
GRU: 2个门(重置门r+更新门z) vs LSTM: 3个门(遗忘+输入+输出)