dit-base-finetuned-rvlcdip_.../README.md

3 lines
315 B
Markdown
Raw Permalink Normal View History

2024-11-01 16:42:09 +08:00
# dit-base-finetuned-rvlcdip_a13446431344160768890061
文档图像变换器DiT是一种类似于BERT的变换器编码器模型通过自监督方式在大量图像集合上进行预训练。该模型的预训练目标是根据遮蔽补丁预测离散变分自编码器dVAE编码器的视觉标记。