d9cad718d7 | ||
---|---|---|
.gitattributes | ||
README.md | ||
config.json | ||
model.safetensors | ||
preprocessor_config.json | ||
pytorch_model.bin | ||
tf_model.h5 |
README.md
swin-base-patch4-window7-224_a13525179237003264811587
Swin Transformer 是一种视觉 Transformer。它通过在更深层次合并图像块(灰色部分所示)来构建层次化的特征图,并且由于仅在每个局部窗口内计算自注意力(红色部分所示),因此具有与输入图像大小线性相关的计算复杂度。