QKV线性变换

观察线性变换如何将输入映射到不同的语义空间

Q=XW^Q, K=XW^K, V=XW^V — 三个独立的线性变换
W^Q,W^K,W^V: d_model×d_k 可学习参数
点击模式按钮查看线性变换效果
不同W将相同输入投影到不同子空间