深度学习Attention中的Q,K,V为什么不叫A,B,C或者X,Y,Z?
2024-01-13 阅读 24
在深度学习中,通常使用Q(Query)、K(Key)和V(Value)来表示注意力机制中的三个重要矩阵。这是因为这些符号更符合注意力机制的概念和数学表达。在注意力机制中,Query表示我们要查询的信息,Key表示用来比较的信息,Value表示根据Query和Key计算出的加权值。这种命名方式更有意义,更容易理解和记忆,因此被广泛使用。使用A、B、C或者X、Y、Z这样的符号可能会让人们更容易混淆,不利于理解和交流。
更新于 2024年04月08日