3 lines
227 B
Markdown
3 lines
227 B
Markdown
|
# vit-base-patch16-224-cifar10_a13830216739319808912711
|
|||
|
|
|||
|
Vision Transformer (ViT) 模型在 ImageNet-21k(1400 万张图像,21843 个类别)上进行预训练,并在 CIFAR10 上以 224x224 的分辨率进行微调。
|