vit-base-patch32-384_a13570.../README.md

3 lines
266 B
Markdown
Raw Permalink Normal View History

2024-11-12 16:24:29 +08:00
# vit-base-patch32-384_a13570863137681408750282
视觉TransformerViT是一种类似BERT的变换器编码器模型它在一个大型图像集合上以有监督的方式预训练即在分辨率为224x224像素的ImageNet-21k数据集上进行预训练。