文档图像变换器(DiT)是一种类似于BERT的变换器编码器模型,通过自监督方式在大量图像集合上进行预训练。该模型的预训练目标是根据遮蔽补丁预测离散变分自编码器(dVAE)编码器的视觉标记。
Go to file
YYJ-aaaa 68263a5274 first commit 2024-11-01 16:47:43 +08:00
.gitattributes Add .gitattributes 2024-11-01 16:42:10 +08:00
README.md Initial commit 2024-11-01 16:42:09 +08:00
config.json first commit 2024-11-01 16:47:43 +08:00
preprocessor_config.json first commit 2024-11-01 16:47:43 +08:00
pytorch_model.bin first commit 2024-11-01 16:47:43 +08:00

README.md

dit-base-finetuned-rvlcdip_a13446431344160768890061

文档图像变换器DiT是一种类似于BERT的变换器编码器模型通过自监督方式在大量图像集合上进行预训练。该模型的预训练目标是根据遮蔽补丁预测离散变分自编码器dVAE编码器的视觉标记。