Gitea: Git with a cup of tea

mcc7bdf431f2214a9bb77bcbe5965754b8 / Dshmp_a13573771932594176836057

0 0

RVOS

Updated 2024-11-12 22:34:23 +08:00

gi111f11cb7f354a74a8c123f5b155498e / Qwen2.5-Math-7B-Instruct_a13571055665541120819061

0 0

Qwen2.5-Math-7B-Instruct

Updated 2024-11-12 18:13:33 +08:00

gi111f11cb7f354a74a8c123f5b155498e / chinese-roberta-wwm-ext-large_a13571545632600064277521

Text 0 0

chinese-roberta-wwm-ext-large

Updated 2024-11-12 18:12:28 +08:00

gi111f11cb7f354a74a8c123f5b155498e / chinese-roberta-wwm-ext_a13571383564562432345306

Text 0 0

hfl Chinese BERT with Whole Word Masking

Updated 2024-11-12 17:50:36 +08:00

gi111f11cb7f354a74a8c123f5b155498e / TeleChat2-7B_a13570718410862592324120

Python 0 0

星辰语义大模型-TeleChat2 7b

Updated 2024-11-12 17:16:02 +08:00

system / ddd_a13571051192971264315057

0 0

sss

Updated 2024-11-12 16:48:25 +08:00

pice35408784b54431987c4d13c457b9cd / vit-base-patch32-384_a13570863137681408750282

0 0

视觉Transformer（ViT）是一种类似BERT的变换器编码器模型，它在一个大型图像集合上以有监督的方式预训练，即在分辨率为224x224像素的ImageNet-21k数据集上进行预训练。

Updated 2024-11-12 16:37:53 +08:00

gi111f11cb7f354a74a8c123f5b155498e / internlm2-chat-1_8b_a13569596008165376146657

Python 0 0

internlm2-chat-1_8b

Updated 2024-11-12 14:21:31 +08:00

pice35408784b54431987c4d13c457b9cd / deit-tiny-patch16-224_a13569669175046144793751

0 0

该模型实际上是一个更高效训练的 Vision Transformer (ViT)。

Updated 2024-11-12 14:05:27 +08:00

gi111f11cb7f354a74a8c123f5b155498e / Llama3-Chinese-8B-Instruct_a13568140478509056667206

Python 0 0

Llama3-Chinese-8B基于Llama3-8B的中文对话模型，由Llama中文社区和AtomEcho（原子回声）联合研发

Updated 2024-11-12 11:49:09 +08:00

pice35408784b54431987c4d13c457b9cd / swin-tiny-patch4-window7-224_a13568225211969536363778

0 0

Swin Transformer 是一种视觉 Transformer。它通过在更深层次合并图像块（灰色部分所示）来构建层次化的特征图，并且由于仅在每个局部窗口内计算自注意力（红色部分所示），因此具有与输入图像大小线性相关的计算复杂度。

Updated 2024-11-12 11:26:29 +08:00

gi111f11cb7f354a74a8c123f5b155498e / MiniCPM3-4B_a13567660624834560972296

Python 0 0

MiniCPM3-4B

Updated 2024-11-12 10:21:42 +08:00

pice35408784b54431987c4d13c457b9cd / deit-base-distilled-patch16-224_a13567891499773952587369

0 0

该模型是一个蒸馏版的 Vision Transformer (ViT)。它除了类 token 外，还使用了蒸馏 token，以便在预训练和微调期间有效地从教师模型（CNN）中学习。蒸馏 token 通过自注意力层与类 token ([CLS]) 和图像块 token 交互，并通过反向传播进行学习。

Updated 2024-11-12 10:15:56 +08:00

gi111f11cb7f354a74a8c123f5b155498e / glm4_9b_chat

Python 0 0

glm4 9b

Updated 2024-11-12 10:06:02 +08:00

gi111f11cb7f354a74a8c123f5b155498e / CodeQwen1.5-7B-Chat_a13560203783958528569373

0 0

CodeQwen1.5-7B-Chat

Updated 2024-11-11 18:25:13 +08:00

13477934375497729238240 / de_a13559740221091840474510

0 0

cs

Updated 2024-11-11 16:50:09 +08:00

gi111f11cb7f354a74a8c123f5b155498e / Qwen2-VL-7B-Instruct_a13559528930930688314902

0 0

Qwen2-VL-7B-Instruct

Updated 2024-11-11 16:29:30 +08:00

pice35408784b54431987c4d13c457b9cd / swin-base-patch4-window7-224_a13525179237003264811587

0 0

Swin Transformer 是一种视觉 Transformer。它通过在更深层次合并图像块（灰色部分所示）来构建层次化的特征图，并且由于仅在每个局部窗口内计算自注意力（红色部分所示），因此具有与输入图像大小线性相关的计算复杂度。

Updated 2024-11-08 15:53:38 +08:00

system / test_systemesru_a13524799157956608163173

0 0

这是一个测试

Updated 2024-11-08 15:20:41 +08:00

pice35408784b54431987c4d13c457b9cd / mobilenet_v2_1.0_224_a13524964415893504347131

0 0

MobileNet 系列模型具有小巧、低延迟、低功耗的特点，可根据不同应用场景的资源限制进行参数化调整。

Updated 2024-11-08 15:17:14 +08:00