Swin Transformer 是一种视觉 Transformer。它通过在更深层次合并图像块（灰色部分所示）来构建层次化的特征图，并且由于仅在每个局部窗口内计算自注意力（红色部分所示），因此具有与输入图像大小线性相关的计算复杂度。

Go to file

YYJ-aaaa d9cad718d7 first commit		2024-11-08 15:51:19 +08:00
.gitattributes	Add .gitattributes	2024-11-08 15:35:29 +08:00
README.md	Initial commit	2024-11-08 15:35:28 +08:00
config.json	first commit	2024-11-08 15:51:19 +08:00
model.safetensors	first commit	2024-11-08 15:51:19 +08:00
preprocessor_config.json	first commit	2024-11-08 15:51:19 +08:00
pytorch_model.bin	first commit	2024-11-08 15:51:19 +08:00
tf_model.h5	first commit	2024-11-08 15:51:19 +08:00

README.md

swin-base-patch4-window7-224_a13525179237003264811587

Swin Transformer 是一种视觉 Transformer。它通过在更深层次合并图像块（灰色部分所示）来构建层次化的特征图，并且由于仅在每个局部窗口内计算自注意力（红色部分所示），因此具有与输入图像大小线性相关的计算复杂度。