Initial commit

This commit is contained in:
pice35408784b54431987c4d13c457b9cd 2025-06-19 14:13:24 +08:00
commit 6a4e4c069d
1 changed files with 3 additions and 0 deletions

3
README.md Normal file
View File

@ -0,0 +1,3 @@
# Phi-4-reasoning-plus
Phi-4-reasoning-plus 是一款先进的开源权重推理模型,它基于 Phi-4 进行微调,采用了思维链轨迹数据集的监督微调以及强化学习技术。其中,监督微调数据集融合了合成提示词与从公共领域网站筛选的高质量数据,内容聚焦于数学、科学、编程技能,同时包含用于安全和负责任人工智能的对齐数据。