大模型之家讯 3 月 16 日,百度正式推出文心大模型 4.5 和文心大模型 X1,两款模型现已在文心一言官网(https://yiyan.baidu.com)免费向用户开放。与此同时,文心大模型 4.5 已上线百度智能云千帆大模型平台,企业用户与开发者登录后即可调用 API,文心大模型 X1 也即将在千帆平台上线。后续,百度搜索、文小言 APP 等产品将陆续接入这两款新模型,为用户带来更为多元的使用体验。

文心大模型 4.5 是百度自主研发的新一代原生多模态基础大模型,通过多模态联合建模实现协同优化,展现出卓越的多模态理解能力,能够综合理解文字、图片、音频、视频等各类内容。在文本能力方面,其语言能力进一步精进,理解、生成、逻辑、记忆能力全方位提升,去幻觉、逻辑推理及代码能力也有显著增强。

文心大模型 4.5 能力的提升得益于一系列关键技术,包括 FlashMask 动态注意力掩码,可加速大模型灵活注意力掩码计算,提升长序列建模与训练效率;多模态异构专家扩展技术,能解决不同模态梯度不均衡问题,强化多模态融合能力;时空维度表征压缩技术,在时空维度对图片和视频语义表征高效压缩,提升多模态数据训练效率;基于知识点的大规模数据构建技术,构建高知识密度预训练数据,降低模型幻觉;基于自反馈的 Post-training 技术,提升强化学习稳定性与预训练模型对齐人类意图的能力。

文心大模型 X1 则是具备更强理解、规划、反思、进化能力的深度思考模型,且支持多模态,是首个能自主运用工具的模型。在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算及工具调用等方面表现突出。目前,文心大模型 X1 已支持高级搜索、文档问答、图片理解、AI 绘图等多款工具。

其能力全面提升同样依赖关键技术,如递进式强化学习训练方法,全面提升模型在多场景的综合应用能力;基于思维链和行动链的端到端训练,针对特定场景根据结果反馈优化训练效果;多元统一的奖励系统,为模型训练提供更可靠的反馈。

用户可通过文心一言官网免费体验两款新模型。在百度智能云千帆大模型平台,文心大模型 4.5 API 已开放调用,输入价格低至 0.004 元 / 千 tokens,输出价格低至 0.016 元 / 千 tokens,文心大模型 X1 上线后输入价格低至 0.002 元 / 千 tokens,输出价格低至 0.008 元 / 千 tokens。百度表示,2025 年将在人工智能、数据中心、云基础设施上加大投入,致力于打造更先进智能的下一代模型。分享

原创文章,作者:志斌,如若转载,请注明出处:http://damoai.com.cn/archives/9534