commit f73f3e18d333f61f20708fd7d44f0313c801aca4 Author: pice35408784b54431987c4d13c457b9cd Date: Wed Sep 25 15:28:34 2024 +0800 Initial commit diff --git a/README.md b/README.md new file mode 100644 index 0000000..b8a443f --- /dev/null +++ b/README.md @@ -0,0 +1,3 @@ +# pix2struct-large + +Google 的 Pix2Struct是一种用于理解视觉情境语言的预训练图像到文本模型。 该模型使用新颖的学习技术进行训练,将网页的屏幕截图解析为简化的HTML,为一系列下游活动提供非常适合的预训练数据源。 \ No newline at end of file