再利用深度学习的自注意力机制的时候，下一个网络是直接用输出还是用一个权值赋值给原输入矩阵？-有趣的事

再利用深度学习的自注意力机制的时候，下一个网络是直接用输出还是用一个权值赋值给原输入矩阵？

2023-08-11 阅读 155

更新于 2023年08月11日