TrOCR 模型是一种编码器 - 解码器模型,由一个作为编码器的图像变换器(Transformer)和一个作为解码器的文本变换器(Transformer)组成。图像编码器是利用 BEiT 的权重进行初始化的,而文本解码器则是依据 RoBERTa 的权重进行初始化的。
Go to file
pice35408784b54431987c4d13c457b9cd 4cea95d5f3 Add .gitattributes
Signed-off-by: pice35408784b54431987c4d13c457b9cd <c457b9cd@leinao.ai>
2025-01-03 14:54:54 +08:00
.gitattributes Add .gitattributes 2025-01-03 14:54:54 +08:00
README.md Initial commit 2025-01-03 14:54:53 +08:00

README.md

trocr-large-printed_a14159038854590464176034

TrOCR 模型是一种编码器 - 解码器模型由一个作为编码器的图像变换器Transformer和一个作为解码器的文本变换器Transformer组成。图像编码器是利用 BEiT 的权重进行初始化的,而文本解码器则是依据 RoBERTa 的权重进行初始化的。