TrOCR 模型是一个编码器-解码器模型,由一个作为编码器的图像 Transformer 和一个作为解码器的文本 Transformer 组成。图像编码器是根据 BEiT 的权重初始化的,而文本解码器是从 RoBERTa 的权重初始化的。
Go to file
YYJ-aaaa eeb13b6f82 first commit 2024-10-29 11:14:34 +08:00
.gitattributes Add .gitattributes 2024-10-29 10:47:44 +08:00
README.md Initial commit 2024-10-29 10:47:44 +08:00
config.json first commit 2024-10-29 11:14:34 +08:00
generation_config.json first commit 2024-10-29 11:14:34 +08:00
merges.txt first commit 2024-10-29 11:14:34 +08:00
model.safetensors first commit 2024-10-29 11:14:34 +08:00
preprocessor_config.json first commit 2024-10-29 11:14:34 +08:00
pytorch_model.bin first commit 2024-10-29 11:14:34 +08:00
special_tokens_map.json first commit 2024-10-29 11:14:34 +08:00
tokenizer_config.json first commit 2024-10-29 11:14:34 +08:00
vocab.json first commit 2024-10-29 11:14:34 +08:00

README.md

trocr-base-handwritten_a13409670139736064969847

TrOCR 模型是一个编码器-解码器模型,由一个作为编码器的图像 Transformer 和一个作为解码器的文本 Transformer 组成。图像编码器是根据 BEiT 的权重初始化的,而文本解码器是从 RoBERTa 的权重初始化的。