vit-large-patch16-384_a1381.../README.md

3 lines
288 B
Markdown
Raw Permalink Normal View History

2024-12-04 16:19:27 +08:00
# vit-large-patch16-384_a13819965258461184668209
Vision Transformer ViT 模型在 ImageNet-21k1400 万张图像21843 个类别)上以 224x224 的分辨率进行预训练,并在 ImageNet 2012100 万张图像1000 个类别)上以 384x384 的分辨率进行微调。