Phi-4-reasoning-plus 是一款先进的开源权重推理模型,它基于 Phi-4 进行微调,采用了思维链轨迹数据集的监督微调以及强化学习技术。其中,监督微调数据集融合了合成提示词与从公共领域网站筛选的高质量数据,内容聚焦于数学、科学、编程技能,同时包含用于安全和负责任人工智能的对齐数据。
Go to file
pice35408784b54431987c4d13c457b9cd 0a6450bc62 Add .gitattributes
Signed-off-by: pice35408784b54431987c4d13c457b9cd <c457b9cd@leinao.ai>
2025-06-19 14:13:24 +08:00
.gitattributes Add .gitattributes 2025-06-19 14:13:24 +08:00
README.md Initial commit 2025-06-19 14:13:24 +08:00

README.md

Phi-4-reasoning-plus

Phi-4-reasoning-plus 是一款先进的开源权重推理模型,它基于 Phi-4 进行微调,采用了思维链轨迹数据集的监督微调以及强化学习技术。其中,监督微调数据集融合了合成提示词与从公共领域网站筛选的高质量数据,内容聚焦于数学、科学、编程技能,同时包含用于安全和负责任人工智能的对齐数据。