检测 Transformer(DETR)模型在 SKU110K 目标检测(含 8000 张带标注图像)数据集上进行了端到端训练。与原始模型相比,主要区别在于它有 400 个查询数量(num_queries),并且是在 SKU110K 数据集上进行了预训练。
Updated 2025-01-02 14:20:04 +08:00
Mistral-Nemo-Instruct-2407
Updated 2025-01-02 13:55:31 +08:00
该模型是在来自 Roboflow 的车牌识别数据集上对 hustvl/yolos-small 进行微调后的版本,其训练集中包含 5200 张图像,验证集中包含 380 张图像。原始的 YOLOS 模型是在 COCO 2017 目标检测数据集(含 11.8 万张带标注图像)上进行微调的。
Updated 2025-01-02 13:44:14 +08:00
这是一个针对时尚领域经过微调的目标检测模型。
Updated 2025-01-02 11:41:03 +08:00
Qwen2-Audio-7B-Instruct
Updated 2025-01-02 11:35:02 +08:00
CosyVoice-300M-Instruct
Updated 2025-01-02 09:40:48 +08:00
在 ImageNet-1k 上以 224x224 的分辨率训练的 Swin Transformer 模型。
Updated 2024-12-31 16:20:10 +08:00
利用视觉 Transformer(ViT)模型来预测一幅艺术图像是否是通过人工智能生成的。
Updated 2024-12-31 15:21:36 +08:00
在 ImageNet-1k 上以 240x240 的分辨率训练的 EfficientNet 模型。
Updated 2024-12-31 15:06:05 +08:00
KaLM-embedding-multilingual-mini-instruct-v1
Updated 2024-12-31 12:43:03 +08:00
gme-Qwen2-VL-2B-Instruct
Updated 2024-12-31 10:39:23 +08:00