@ -0,0 +1,3 @@
# Phi-4-reasoning-plus
Phi-4-reasoning-plus 是一款先进的开源权重推理模型,它基于 Phi-4 进行微调,采用了思维链轨迹数据集的监督微调以及强化学习技术。其中,监督微调数据集融合了合成提示词与从公共领域网站筛选的高质量数据,内容聚焦于数学、科学、编程技能,同时包含用于安全和负责任人工智能的对齐数据。