SwiftFormer 论文介绍了一种新的高效加性注意力机制,该机制有效地用线性元素乘法取代了自注意力计算中的二次矩阵乘法运算。
Go to file
pice35408784b54431987c4d13c457b9cd 65f791cd01 Initial commit 2024-11-22 16:24:23 +08:00
README.md Initial commit 2024-11-22 16:24:23 +08:00

README.md

swiftformer-xs_a13684108589002752134956

SwiftFormer 论文介绍了一种新的高效加性注意力机制,该机制有效地用线性元素乘法取代了自注意力计算中的二次矩阵乘法运算。