swin-base-patch4-window7-22.../README.md

350 B
Raw Permalink Blame History

swin-base-patch4-window7-224_a13525179237003264811587

Swin Transformer 是一种视觉 Transformer。它通过在更深层次合并图像块灰色部分所示来构建层次化的特征图并且由于仅在每个局部窗口内计算自注意力红色部分所示因此具有与输入图像大小线性相关的计算复杂度。