pice35408784b54431987c4d13c457b9cd c7682a6710 | ||
---|---|---|
README.md |
README.md
dit-base-finetuned-rvlcdip_a13446431344160768890061
文档图像变换器(DiT)是一种类似于BERT的变换器编码器模型,通过自监督方式在大量图像集合上进行预训练。该模型的预训练目标是根据遮蔽补丁预测离散变分自编码器(dVAE)编码器的视觉标记。