Swin Transformer 是一种视觉 Transformer。它通过在更深层次合并图像块(灰色部分所示)来构建层次化的特征图,并且由于仅在每个局部窗口内计算自注意力(红色部分所示),因此具有与输入图像大小线性相关的计算复杂度。
Go to file
pice35408784b54431987c4d13c457b9cd 9ef28deeaf Initial commit 2024-11-12 10:49:03 +08:00
README.md Initial commit 2024-11-12 10:49:03 +08:00

README.md

swin-tiny-patch4-window7-224_a13568225211969536363778

Swin Transformer 是一种视觉 Transformer。它通过在更深层次合并图像块灰色部分所示来构建层次化的特征图并且由于仅在每个局部窗口内计算自注意力红色部分所示因此具有与输入图像大小线性相关的计算复杂度。