QKV线性变换
观察线性变换如何将输入映射到不同的语义空间
Q=XW^Q, K=XW^K, V=XW^V — 三个独立的线性变换
W^Q,W^K,W^V: d_model×d_k 可学习参数
点击模式按钮查看线性变换效果
不同W将相同输入投影到不同子空间
空间投影
变换对比
参数共享分析
↻ 重置