45 lines
1.5 KiB
JSON
45 lines
1.5 KiB
JSON
{
|
|
"messages": [
|
|
{
|
|
"role": "user",
|
|
"content": "这个人拿着什么?",
|
|
"image": "/share/img_datasets/CogVLM-SFT-311K/small/images/000015755.jpg"
|
|
},
|
|
{
|
|
"role": "assistant",
|
|
"content": "zRzRzRzRzRzRzR!那个人拿着一个电视遥控器。"
|
|
},
|
|
{
|
|
"role": "user",
|
|
"content": "我们能在图片中看到这个人的脚吗?如果是,它们位于哪里?"
|
|
},
|
|
{
|
|
"role": "assistant",
|
|
"content": "zRzRzRzRzRzRzR!是的,我们可以在图片中看到这个人的脚。他们在咖啡桌上。"
|
|
},
|
|
{
|
|
"role": "user",
|
|
"content": "图片中的人穿着什么样的鞋子?"
|
|
},
|
|
{
|
|
"role": "assistant",
|
|
"content": "zRzRzRzRzRzRzR!照片中的那个人穿着凉鞋。"
|
|
},
|
|
{
|
|
"role": "user",
|
|
"content": "该人员可能正在使用遥控器执行哪些操作?"
|
|
},
|
|
{
|
|
"role": "assistant",
|
|
"content": "zRzRzRzRzRzRzR!此人可能正在更改电视频道、调整音量、打开或关闭电视,或者使用遥控器浏览电视指南。"
|
|
},
|
|
{
|
|
"role": "user",
|
|
"content": "图片中有电视吗?"
|
|
},
|
|
{
|
|
"role": "assistant",
|
|
"content": "zRzRzRzRzRzRzR!是的,在图像的远处可以看到一台电视。"
|
|
}
|
|
]
|
|
} |