Google DeepMind 发布的 Gemma3-4B 在计算效率、任务适应性和多模态能力之间取得了良好平衡,相较于 1B 版本,它提供了更强的文本理解能力,并新增了视觉模块支持,使其适用于更广泛的任务场景。同时,相较于 12B 和 27B 版本,4B 版本在推理效率和资源占用上具备显著优势,适合在云端和本地 GPU 设备上运行。
Go to file
yang yingjie 660604adce first commit 2025-03-24 11:14:43 +08:00
.gitattributes Add .gitattributes 2025-03-24 11:08:33 +08:00
README.md Initial commit 2025-03-24 11:08:33 +08:00
added_tokens.json first commit 2025-03-24 11:14:43 +08:00
chat_template.json first commit 2025-03-24 11:14:43 +08:00
config.json first commit 2025-03-24 11:14:43 +08:00
generation_config.json first commit 2025-03-24 11:14:43 +08:00
model-00001-of-00002.safetensors first commit 2025-03-24 11:14:43 +08:00
model-00002-of-00002.safetensors first commit 2025-03-24 11:14:43 +08:00
model.safetensors.index.json first commit 2025-03-24 11:14:43 +08:00
preprocessor_config.json first commit 2025-03-24 11:14:43 +08:00
processor_config.json first commit 2025-03-24 11:14:43 +08:00
special_tokens_map.json first commit 2025-03-24 11:14:43 +08:00
tokenizer.json first commit 2025-03-24 11:14:43 +08:00
tokenizer.model first commit 2025-03-24 11:14:43 +08:00
tokenizer_config.json first commit 2025-03-24 11:14:43 +08:00

README.md

gemma-3-4b-it

Google DeepMind 发布的 Gemma3-4B 在计算效率、任务适应性和多模态能力之间取得了良好平衡,相较于 1B 版本,它提供了更强的文本理解能力,并新增了视觉模块支持,使其适用于更广泛的任务场景。同时,相较于 12B 和 27B 版本4B 版本在推理效率和资源占用上具备显著优势,适合在云端和本地 GPU 设备上运行。