国内第一！文心5.0 Preview登榜LMArena

志斌 • 2025年12月23日下午4:32 • 人工智能

大模型之家讯 12月23日，LMArena大模型竞技场发布最新排名，文心新模型ERNIE-5.0-Preview-1203以1451分登上LMArena文本榜，排名中国第一。在创意写作、高难度指令等方面表现突出，超过Claude-Opus-4-1、GPT-5.2、GPT-5.1和Qwen3-Max-Preview等多款国内外主流模型。

在创意写作及复杂任务场景中，ERNIE-5.0-Preview-1203能够准确理解用户需求，生成结构清晰、逻辑一致的文本内容。

文心大模型于2019年首次对外发布，文心大模型5.0是百度今年11月发布的原生全模态大模型。该模型参数量达2.4万亿，采用原生全模态统一建模技术，具备全模态理解与生成能力，支持文本、图像、音频、视频等多种信息的输入与输出。

此前，文心大模型5.0 Preview在LMArena文本榜中位居全球并列第二、中国第一，超过GPT-5-High等多款国内外主流模型；同时，在LMArena视觉理解榜中位居国内第一，整体表现与Claude-Sonnet-4、GPT-5-High相当。

如果说LMArena的评测表现体现了文心大模型在文本理解、推理与生成等能力上的竞争力，那么决定这些能力能否稳定转化为企业生产力的关键，在于面向落地场景的Agent Infra。

百度千帆持续完善企业级Agent Infra，在模型能力之上提供面向落地的完整基础设施：在模型服务层，千帆已接入文心大模型5.0、DeepSeek-V3.2等150+主流模型，覆盖企业多样化的应用需求。

围绕企业级Agent落地，千帆在数据、工具与运行保障等关键环节提供支撑。数据服务方面，百度千帆·数据智能平台通过一站式多模态数据管理与处理能力，构建AI时代的数据智能基础设施，端到端帮助用户降本增效。工具服务方面，千帆全新发布MCP广场，全面开放百度集团沉淀多年的成熟AI能力，包括百度AI搜索、百度地图、百度文库网盘PPT生成及小度智能终端等，覆盖网页搜索、数据处理、生活服务核心场景。同时，针对垂直行业推出题目解析、作文点评等特色组件，并引入覆盖出行、支付等企业级高频需求的优质第三方MCP能力。Agent运行环境方面，千帆提供企业级服务，包括全生命周期管理、主流芯片适配、灵活权限管理，确保Agent稳定安全运行。

这也意味着，模型能力的“看得见”，最终需要通过Agent Infra的“跑得稳、落得下、扩得开”来完成价值闭环——从模型到工具、从开发到运营，百度千帆正通过坚实的Agent Infra，驱动智能体成为可持续、可复制、可规模化的企业智能化基础设施

原创文章，作者：志斌，如若转载，请注明出处：http://damoai.com.cn/archives/14059