TrOCR 模型是一种编码器 - 解码器模型,由一个作为编码器的图像变换器(Transformer)和一个作为解码器的文本变换器(Transformer)组成。图像编码器是利用 BEiT 的权重进行初始化的,而文本解码器则是依据 RoBERTa 的权重进行初始化的。
Go to file
pice35408784b54431987c4d13c457b9cd 028896bd02 Initial commit 2025-01-03 14:54:53 +08:00
README.md Initial commit 2025-01-03 14:54:53 +08:00

README.md

trocr-large-printed_a14159038854590464176034

TrOCR 模型是一种编码器 - 解码器模型由一个作为编码器的图像变换器Transformer和一个作为解码器的文本变换器Transformer组成。图像编码器是利用 BEiT 的权重进行初始化的,而文本解码器则是依据 RoBERTa 的权重进行初始化的。