深度学习attention机制中的Q,K,V 解释
参考:
https://www.zhihu.com/question/325839123/answer/1945590592194191583
说的挺有道理的:
评论