Qwen2-VL-7B-Instruct/README.md

420 B
Raw Blame History

Qwen2-VL-7B-Instruct

Qwen2-VL-7B-Instruct是一个视觉语言模型支持高分辨率图像和20分钟以上视频的理解。它在多个视觉理解基准测试中表现出色具备复杂推理和决策能力。该模型可集成到移动设备和机器人中实现基于视觉环境和文本指令的自动操作。此外Qwen2-VL-7B-Instruct支持多语言能理解图像中的多种语言文本。