Transformer编码器
观察Transformer编码器的完整结构与数据流
Encoder: x → MHA → Add&Norm → FFN → Add&Norm → output
6层编码器堆叠, 每层含多头注意力和前馈网络
点击模式按钮查看编码器结构
每层两个子层: 多头注意力 + 前馈网络, 各有残差+层归一化
单层结构
数据流
多层堆叠
↻ 重置