434 B

Raw Permalink Blame History

Nemotron-Research-Reasoning-Qwen

Nemotron-Research-Reasoning-Qwen-1.5B 是全球领先的15亿参数开源权重模型，专为复杂推理任务而设计，包括数学问题求解、编程挑战、科学问答及逻辑谜题等。该模型采用ProRL算法在多样化、全面性的数据集上进行训练，在数学、编程及GPQA等广泛任务中表现卓越，以显著优势超越Deepseek同规模的15亿参数模型。

434 B Raw Permalink Blame History Unescape Escape

Nemotron-Research-Reasoning-Qwen

434 B

Raw Permalink Blame History