检测 Transformer(DETR)模型在 SKU110K 目标检测(含 8000 张带标注图像)数据集上进行了端到端训练。与原始模型相比,主要区别在于它有 400 个查询数量(num_queries),并且是在 SKU110K 数据集上进行了预训练。
Updated 2025-01-02 14:20:04 +08:00
Mistral-Nemo-Instruct-2407
Updated 2025-01-02 13:55:31 +08:00
该模型是在来自 Roboflow 的车牌识别数据集上对 hustvl/yolos-small 进行微调后的版本,其训练集中包含 5200 张图像,验证集中包含 380 张图像。原始的 YOLOS 模型是在 COCO 2017 目标检测数据集(含 11.8 万张带标注图像)上进行微调的。
Updated 2025-01-02 13:44:14 +08:00
这是一个针对时尚领域经过微调的目标检测模型。
Updated 2025-01-02 11:41:03 +08:00
Qwen2-Audio-7B-Instruct
Updated 2025-01-02 11:35:02 +08:00
fish-speech-1.5
Updated 2025-01-02 10:29:31 +08:00
OuteTTS-0.2-500M
Updated 2025-01-02 10:20:00 +08:00
CosyVoice-300M
Updated 2025-01-02 10:10:50 +08:00
CosyVoice-300M-Instruct
Updated 2025-01-02 09:40:48 +08:00
EXAONE-3.5-7.8B-Instruct
Updated 2024-12-31 20:09:06 +08:00
granite-3.1-2b-instruct
Updated 2024-12-31 17:26:16 +08:00
EXAONE-3.5-2.4B-Instruct
Updated 2024-12-31 16:45:02 +08:00
在 ImageNet-1k 上以 224x224 的分辨率训练的 Swin Transformer 模型。
Updated 2024-12-31 16:20:10 +08:00
利用视觉 Transformer(ViT)模型来预测一幅艺术图像是否是通过人工智能生成的。
Updated 2024-12-31 15:21:36 +08:00
在 ImageNet-1k 上以 240x240 的分辨率训练的 EfficientNet 模型。
Updated 2024-12-31 15:06:05 +08:00
KaLM-embedding-multilingual-mini-instruct-v1
Updated 2024-12-31 12:43:03 +08:00
InternVL2_5-8B
Updated 2024-12-31 12:21:45 +08:00
Index-1.9B-Chat
Updated 2024-12-31 10:57:15 +08:00
stella_en_400M_v5
Updated 2024-12-31 10:56:38 +08:00
gme-Qwen2-VL-2B-Instruct
Updated 2024-12-31 10:39:23 +08:00