Nemotron-Research-Reasoning-Qwen-1.5B 是全球领先的15亿参数开源权重模型,专为复杂推理任务而设计,包括数学问题求解、编程挑战、科学问答及逻辑谜题等。该模型采用ProRL算法在多样化、全面性的数据集上进行训练,在数学、编程及GPQA等广泛任务中表现卓越,以显著优势超越Deepseek同规模的15亿参数模型。
Go to file
yang yingjie 3aeb1df2c2 first commit 2025-06-11 11:14:55 +08:00
assets first commit 2025-06-11 11:14:55 +08:00
.gitattributes Add .gitattributes 2025-06-11 11:03:01 +08:00
README.md Initial commit 2025-06-11 11:03:00 +08:00
config.json first commit 2025-06-11 11:14:55 +08:00
generation_config.json first commit 2025-06-11 11:14:55 +08:00
model.safetensors first commit 2025-06-11 11:14:55 +08:00
special_tokens_map.json first commit 2025-06-11 11:14:55 +08:00
tokenizer.json first commit 2025-06-11 11:14:55 +08:00
tokenizer_config.json first commit 2025-06-11 11:14:55 +08:00

README.md

Nemotron-Research-Reasoning-Qwen

Nemotron-Research-Reasoning-Qwen-1.5B 是全球领先的15亿参数开源权重模型专为复杂推理任务而设计包括数学问题求解、编程挑战、科学问答及逻辑谜题等。该模型采用ProRL算法在多样化、全面性的数据集上进行训练在数学、编程及GPQA等广泛任务中表现卓越以显著优势超越Deepseek同规模的15亿参数模型。