GIT 是一个以 CLIP 图像标记和文本标记为条件的 Transformer 解码器。该模型使用“teacher forcing”对大量(图像、文本)对进行训练。
Go to file
pice35408784b54431987c4d13c457b9cd 115acc93b8 Initial commit 2024-10-29 09:30:44 +08:00
README.md Initial commit 2024-10-29 09:30:44 +08:00

README.md

git-base_a13409064600334336897081

GIT 是一个以 CLIP 图像标记和文本标记为条件的 Transformer 解码器。该模型使用“teacher forcing”对大量图像、文本对进行训练。