微软发布创新语言模型Phi-2：27亿参数挑战大模型性能边界

志斌 • 2023年12月13日下午2:12 • 人工智能

大模型之家讯 12月13日，微软宣布推出其最新语言模型Phi-2，凭借27亿参数的规模，挑战了大型语言模型的性能边界。据微软介绍，通过在模型缩放和训练数据整理方面的创新，Phi-2在复杂的基准测试中展示出可媲美或优于比其大25倍的模型的性能。

Phi-2是一个基于Transformer的模型，它在1.4T的词块上进行了训练，这些词块来源于自然语言处理（NLP）和编码的合成数据集以及网络数据集。在96个A100 GPU上进行训练的过程中，Phi-2耗时14天。值得注意的是，Phi-2作为一个基础模型，并未通过人类反馈强化学习（RLHF）进行调整，也未经过指导性微调。尽管如此，与经过对齐的现有开源模型相比，Phi-2在毒性和偏差方面表现出更好的性能。

在各种综合基准测试中，Phi-2超越了Mistral和Llama-2模型在70亿和130亿参数下的性能。令人瞩目的是，在多步骤推理任务（即编码和数学）上，Phi-2的性能达到了Llama-2-70 B模型的25倍。此外，与最近发布的Google Gemini Nano 2相比，Phi-2的性能不相上下，甚至在某些方面更胜一筹。

这一突破性的成果表明，微软在语言模型领域的研究正取得显著进展。Phi-2的成功发布为自然语言处理和人工智能领域的研究提供了新的思路和方法。微软表示，他们将继续致力于推动语言模型的发展，并期待未来更多创新的突破。

原创文章，作者：志斌，如若转载，请注明出处：http://damoai.com.cn/archives/2449

赞 (0)

0 0

微软或调整H100 AI服务器订单拟加大对B100和超微MI300投入

上一篇 2023年12月13日

Meta Ray-Ban智能眼镜推出多模态AI功能，可实时感知用户提供相关信息

下一篇 2023年12月13日

人工智能

清言上线情感语音模型GLM-4-Voice，AI 的 phone use 也来了

在 8 月智谱发布的音视频通话功能，大模型有了眼睛和嘴巴。今天我们再往前迈一步，智谱的大模型家族加入了一位新成员——GLM-4-Voice 端到端情感语音模型。 GLM-4-Voi…

王昊达
2024年10月25日
人工智能

云知声发布“山海·知医大模型5.0”：医疗大模型“可信度”成为核心变量

大模型之家讯 12月22日，云知声发布医疗领域专家级大模型“山海・知医大模型5.0”。这一版本被外界视为其医疗大模型体系的重要节点，核心变化并不在于参数规模，而在于模型角色的转变—…

志斌
2025年12月22日
人工智能

AQUA实测360智脑4.0：大模型助力企业全面智能化重塑

图片来源：360智脑从1.0到4.0，从落地搜索场景到接入全端应用、360智脑仅用了不到三个月的时间，大模型的发展速度正如同一把“钢鞭”，催促着国内企业前进的脚步…… 360集团…

王昊达
2023年10月31日
人工智能

京东三季度服务收入上涨12.7%，占净收入比例首次超过20%，智能服务覆盖商家同比翻倍

大模型之家讯京东2023年三季度，总收入达到2477亿元，保持同比增长。服务收入达到524亿元，同比增长12.7%；占净收入21.2%，比例首次超过20%，成绩亮眼。京东的商家数…

志斌
2023年11月16日
人工智能

可灵AI，用老照片讲新故事？

当残缺暗淡的老照片变得清晰明亮，当前人与今人“眼神”交会，时空交错间，历史照进现实，记忆终于得以补全…… 近日，话题#AI是假的但爱是真的#冲上微博热搜，引得无数网友为之感动的同时…

欧玉娇
2024年8月6日
人工智能

OpenAI正式发布ChatGPT Agent：”AI代理人”已至，人类准备好交出操作权了吗？

北京时间7月18日凌晨，OpenAI如约发布了其最新力作——ChatGPT Agent。根据CEO Sam Altman和四位OpenAI研究员介绍，ChatGPT Agent是…

志斌
2025年7月18日
人工智能

通义千问开源首个图像生成基础模型 Qwen-Image

大模型之家讯 8月5日，阿里云通义团队再度推进开源节奏，正式推出其首个图像生成基础模型 Qwen-Image。该模型为通义千问（Qwen）体系下的图像生成成员，拥有200亿参数，并…

志斌
2025年8月5日
人工智能

百度发布文心大模型 4.5 与 X1，免费开放并拓展应用场景

大模型之家讯 3 月 16 日，百度正式推出文心大模型 4.5 和文心大模型 X1，两款模型现已在文心一言官网（https://yiyan.baidu.com）免费向用户开放。与此…

志斌
2025年3月16日
人工智能

面壁智能完成数亿元融资，端侧AI高效大模型商业化加速

大模型之家讯近日，面壁智能宣布完成新一轮数亿元融资，本轮融资由龙芯创投、鼎晖百孚、中关村科学城基金和赛富投资基金联合领投，北京市人工智能产业投资基金与清科创投跟投，万甲资本担任本…

志斌
2024年12月11日
百度智能云推出OpenClaw限时免费一键部署服务，开发者零成本体验AI数字员工

大模型之家讯 2月2日消息，百度智能云宣布上线OpenClaw一键部署服务，并开启限时免费体验活动。开发者可以通过百度智能云轻量应用服务器，快速部署这款近期在AI开发圈热度颇高的智…

志斌
人工智能 2026年2月2日

发表回复

志斌

数码科技领域深耕多年的专业管理者与技术服务专家，现任大模型之家主编、速途网资深编辑、元宇宙研究院分析师。专注于人工智能、消费电子与IDC行业的深度报道，凭借广泛科技圈人脉，包括媒体、公关、分析师及企业高层，持续引领行业洞察与分析。商务合作咨询： Qiaodao007

1.2K posts

0 comments