pice35408784b54431987c4d13c457b9cd
a54d0b8f91
Signed-off-by: pice35408784b54431987c4d13c457b9cd <c457b9cd@leinao.ai> |
||
---|---|---|
.gitattributes | ||
README.md |
README.md
vit-large-patch32-384_a14058242923032576570175
Vision Transformer (ViT) 模型在 ImageNet-21k(1400 万张图像,21843 个类别)上以 224x224 的分辨率进行预训练,并在 ImageNet 2012(100 万张图像,1000 个类别)上以 384x384 的分辨率进行微调。