首页 > 读书写作 > 读书写作 > 微软重磅发布Phi-4推理模型,小型AI挑战大模型霸主

微软重磅发布Phi-4推理模型,小型AI挑战大模型霸主

发布时间:2025-05-01 22:45:41来源: 13663887898

5 月 1 日消息,微软昨日(4 月 30 日)发布 Phi-4-reasoning 系列推理模型,通过监督微调 Phi-4,并利用 o3-mini 生成的高质量“可教导”提示数据集训练,专为复杂推理任务设计。

IT之家援引博文介绍,微软本次共推出 Phi-4-reasoning、Phi-4-reasoning-plus 和 Phi-4-mini-reasoning 三款模型,官方称该系列模型不仅延续了小型模型的高效特性,还在推理能力上实现重大突破。

该系列模型通过推理时间扩展(inference-time scaling)技术,擅长处理需要多步骤分解和内部反思的复杂任务,尤其在数学推理和代理型应用中表现突出,具备媲美大型前沿模型的潜力。

Phi-4-reasoning 是一款拥有 140 亿参数的开源推理模型,通过监督微调(Supervised Fine-Tuning,SFT)Phi-4,结合 OpenAI o3-mini 的高质量推理演示数据,并充分利用额外计算资源,生成详细的推理链条。

Phi-4-reasoning-plus 增强版通过强化学习(Reinforcement Learning,RL)进一步提升性能,tokens 用量比标准版多 1.5 倍,支持更高精度。

两款模型在数学推理和博士级科学问题测试中,均超越 OpenAI o1-mini 和
DeepSeek-R1-Distill-Llama-70B
,甚至在 AIME 2025(美国数学奥林匹克资格赛)中击败 6710 亿参数的 DeepSeek-R1 满血模型。

Phi-4-mini-reasoning 专为计算资源有限的环境设计,是一款基于 Transformer 的紧凑型语言模型,优化用于数学推理。

读书写作更多>>

JAPANNEXT推出18.5\"大型便携显示器,FHD 60Hz规格 酷比魔方iWork GT Ultra上架:U5-125H + 16G + 1T售4949元 iQOO 15 Ultra手机双配色首发亮相,2月初见 小米澎湃OS 3 Beta第二期招募开启:小米17系列等8款机型抢先适配 真我realme手机今年4月全面接入OPPO售后服务 美团:2025年快乐生活相关订单增36%,95后消费者占近6成 天猫超市启动闪购年货节 杭州将率先实现闪购4小时送达 马斯克下场抢人!xAI组建「人才狙击队」,极客版HR年薪168万 基础研究进入“从0到1”突破期 Intel纯大核Bartlett Lake最新消息:最高12个P核5.9GHz! 手机周报份额再次出炉:苹果险胜华为,小米陷入苦战! 美团高调入局汽车销售 只剩5年?诺奖得主Hassabis放出AGI时间表:还差一两个技术突破 爆款刚诞生,德邦基金为何急下“谢客令”? 最赚钱对冲基金,要来A股了 新能源车的“硬核”战事,2026年卷向何处? AYANEO首款手机Pocket PLAY跳票 苹果iPhone 18系列、Air2屏幕配置曝光,部分Face ID屏下化 华为智选新品WIKO Hi畅享80 Plus上架,内置6620mAh电池 河声丨推动优化电商“长辈模式”,激发银发消费活力 自变量:具身模型不是把DeepSeek塞进机器人 荣耀Power2发布:10080mAh大电池+2699元起,户外党狂喜 iQOO新机炸场,ROG退场,游戏手机只剩一家? 折叠屏手机领衔 摩托罗拉2026年全系手机型号遭曝光! 2026年了,iPhone se3使用体验分享 苹果上新马年手机壳,售价449元 刷新纪录!智己汽车2025全盘点:销量口碑双丰收,领跑新势力 ​卢放:岚图L3级有条件自动驾驶进入实车测试 沃尔沃汽车12月销量达16063辆,全新XC70蝉联品牌销冠 比亚迪狂销460万完胜!日产破60万,理想意外大跌