3 lines
340 B
Markdown
3 lines
340 B
Markdown
|
# vision-perceiver-conv_a13412844918009856586318
|
|||
|
|
|||
|
Perceiver IO 是一个 transformer 编码器模型,可以应用于任何模态(文本、图像、音频、视频等)。核心思想是在一组不太大的潜在向量(例如 256 或 512)上采用自我注意机制,并且只使用输入来执行与潜在向量的交叉注意。
|