大模型之家讯 12月23日,LMArena大模型竞技场发布最新排名,文心新模型ERNIE-5.0-Preview-1203以1451分登上LMArena文本榜,排名中国第一。在创意写作、高难度指令等方面表现突出,超过Claude-Opus-4-1、GPT-5.2、GPT-5.1和Qwen3-Max-Preview等多款国内外主流模型。

在创意写作及复杂任务场景中,ERNIE-5.0-Preview-1203能够准确理解用户需求,生成结构清晰、逻辑一致的文本内容。
文心大模型于2019年首次对外发布,文心大模型5.0是百度今年11月发布的原生全模态大模型。该模型参数量达2.4万亿,采用原生全模态统一建模技术,具备全模态理解与生成能力,支持文本、图像、音频、视频等多种信息的输入与输出。
此前,文心大模型5.0 Preview在LMArena文本榜中位居全球并列第二、中国第一,超过GPT-5-High等多款国内外主流模型;同时,在LMArena视觉理解榜中位居国内第一,整体表现与Claude-Sonnet-4、GPT-5-High相当。
如果说LMArena的评测表现体现了文心大模型在文本理解、推理与生成等能力上的竞争力,那么决定这些能力能否稳定转化为企业生产力的关键,在于面向落地场景的Agent Infra。
百度千帆持续完善企业级Agent Infra,在模型能力之上提供面向落地的完整基础设施:在模型服务层,千帆已接入文心大模型5.0、DeepSeek-V3.2等150+主流模型,覆盖企业多样化的应用需求。
围绕企业级Agent落地,千帆在数据、工具与运行保障等关键环节提供支撑。数据服务方面,百度千帆·数据智能平台通过一站式多模态数据管理与处理能力,构建AI时代的数据智能基础设施,端到端帮助用户降本增效。工具服务方面,千帆全新发布MCP广场,全面开放百度集团沉淀多年的成熟AI能力,包括百度AI搜索、百度地图、百度文库网盘PPT生成及小度智能终端等,覆盖网页搜索、数据处理、生活服务核心场景。同时,针对垂直行业推出题目解析、作文点评等特色组件,并引入覆盖出行、支付等企业级高频需求的优质第三方MCP能力。Agent运行环境方面,千帆提供企业级服务,包括全生命周期管理、主流芯片适配、灵活权限管理,确保Agent稳定安全运行。
这也意味着,模型能力的“看得见”,最终需要通过Agent Infra的“跑得稳、落得下、扩得开”来完成价值闭环——从模型到工具、从开发到运营,百度千帆正通过坚实的Agent Infra,驱动智能体成为可持续、可复制、可规模化的企业智能化基础设施
原创文章,作者:志斌,如若转载,请注明出处:http://damoai.com.cn/archives/14059