dit-base-finetuned-rvlcdip_.../README.md

315 B
Raw Blame History

dit-base-finetuned-rvlcdip_a13446431344160768890061

文档图像变换器DiT是一种类似于BERT的变换器编码器模型通过自监督方式在大量图像集合上进行预训练。该模型的预训练目标是根据遮蔽补丁预测离散变分自编码器dVAE编码器的视觉标记。