多头拼接与输出投影

观察多头输出如何拼接并通过线性投影融合信息

MultiHead = Concat(head_1,...,head_h) · W^O
h=8, d_k=64 → 拼接后512维 → W^O: 512×512 → 输出512维
点击模式按钮查看拼接投影过程
W^O让不同头的信息交互融合