16318e0819 | ||
---|---|---|
.gitattributes | ||
README.md | ||
config.json | ||
model.safetensors | ||
preprocessor_config.json | ||
pytorch_model.bin | ||
special_tokens_map.json | ||
spiece.model | ||
tokenizer.json | ||
tokenizer_config.json |
README.md
pix2struct-large
Google 的 Pix2Struct是一种用于理解视觉情境语言的预训练图像到文本模型。 该模型使用新颖的学习技术进行训练,将网页的屏幕截图解析为简化的HTML,为一系列下游活动提供非常适合的预训练数据源。