From 6a4e4c069d2a0d1c4a5a6f4e58ab6b596da1c75f Mon Sep 17 00:00:00 2001 From: pice35408784b54431987c4d13c457b9cd Date: Thu, 19 Jun 2025 14:13:24 +0800 Subject: [PATCH] Initial commit --- README.md | 3 +++ 1 file changed, 3 insertions(+) create mode 100644 README.md diff --git a/README.md b/README.md new file mode 100644 index 0000000..a5b8eb8 --- /dev/null +++ b/README.md @@ -0,0 +1,3 @@ +# Phi-4-reasoning-plus + +Phi-4-reasoning-plus 是一款先进的开源权重推理模型,它基于 Phi-4 进行微调,采用了思维链轨迹数据集的监督微调以及强化学习技术。其中,监督微调数据集融合了合成提示词与从公共领域网站筛选的高质量数据,内容聚焦于数学、科学、编程技能,同时包含用于安全和负责任人工智能的对齐数据。 \ No newline at end of file