Nemotron-Research-Reasoning.../README.md

434 B
Raw Permalink Blame History

Nemotron-Research-Reasoning-Qwen

Nemotron-Research-Reasoning-Qwen-1.5B 是全球领先的15亿参数开源权重模型专为复杂推理任务而设计包括数学问题求解、编程挑战、科学问答及逻辑谜题等。该模型采用ProRL算法在多样化、全面性的数据集上进行训练在数学、编程及GPQA等广泛任务中表现卓越以显著优势超越Deepseek同规模的15亿参数模型。