大模型之家2025年10月热力榜：大模型正从”能力竞赛”转向”生态协同”

2025年10月，人工智能大模型领域呈现多维突破趋势，行业专家指出，生成式AI正从单一功能向全场景协同演进。在基础能力层面，多模态交互与长文本处理成为核心方向——通过混合专家架构、上下文压缩等技术，模型在保持高性能的同时显著降低训练成本，如部分模型实现560万美元级训练投入即可支撑复杂场景全流程自动化。效率提升方面，预训练MFU（模型浮点运算利用率）突破47%，推理时延压缩至50ms级别，支撑单卡日处理20万页面级任务，同时API成本降至行业领先水平，如某文本模型输入成本仅为同类产品的8%。

行业共识认为，当前大模型正从“能力竞赛“转向“生态协同“，通过智能体架构升级、任务模式创新及多工具联动，实现从被动问答向主动规划执行的角色转变，为知识密集场景提供全流程处理能力，推动企业级应用与To C市场双重拓展。

在《2025年10月大模型热力榜》中，共收录了410个大模型及其所属企业。上榜企业中，垂直领域深化趋势明显，医疗、安全、金融等场景涌现专有范式。医疗大模型通过六层知识体系构建循证推理链，实现句句可溯源；安全智能体通过L3级成熟度认证，具备跨场景自主决策能力，任务执行成功率领先。此外，国产化生态加速构建，通过芯片与大模型深度兼容优化，多模态推理效率提升超30%，推动”硬件标准化+软件模块化”一体机落地，显著降低部署门槛。

10月，百度在AI领域多点突破：搜索AIGC日均生成破千万，蒸汽机模型实现长视频实时交互生成；智能云居中国智算专业服务市场第一，GenAI IaaS增速首位。飞桨平台适配60多款芯片，创建超110万模型，支撑文心4.5系列开源模型10款，包括47B和3B混合专家模型等。ERNIE-4.5-300B-A47B模型预训练MFU达47%，50ms时延下输入57K tokens/秒、输出29K tokens/秒。多模态文档解析模型PaddleOCR-VL以92.6分登顶OmniBenchDoc V1.5榜单，16小时内获HuggingFace Trending全球第一。数字人技术助力超10万主播，直播转化率提升31%，成本降80%。飞桨文心生态开发者超2333万，服务企业76万家。

10月，阿里巴巴发布通义千问旗舰模型Qwen3-Max，总参数超万亿，预训练数据量达36T tokens，是其迄今最大模型。该模型在中英文理解、复杂指令遵循等核心能力上显著增强，知识幻觉大幅减少，代码生成能力突出，Instruct 版本在 SWE-Bench Verified 测试中获 69.6 分。港股市场反应积极，相关消息公布后阿里巴巴股价一度涨超 3%，海通国际指出其有望推动企业级应用和To C市场拓展。同月，阿里还推出下一代架构Qwen3-Next，采用混合注意力机制等技术，80B参数仅激活3B性能即媲美235B模型，训练成本较密集模型大降超90%。

10月，深度求索发布的DeepSeek-OCR模型采用“上下文光学压缩”技术，以 100 视觉 token 超越传统 OCR 模型性能，单A100-40G 日处理达20万+页面。R1系列模型通过混合专家架构将训练成本控制在560万美元，在医疗预约等场景实现全流程自动化推理。

10月23日，腾讯在ima开放日活动上官宣2.0版本升级计划，该版本于10月24日启动内测，10月27日正式上线。核心升级围绕基于Agent能力的”任务模式”展开，使知识库从被动问答工具转变为可自主规划执行的”共事伙伴”，支持用户通过自然语言发起报告或播客生成任务，并可附加文档、网页等多类型参考资料。系统将自动拆解任务步骤，联动搜索、创作等工具完成全流程处理，播客生成还支持音色、对话人数等自定义设置。知识库同步推出”AI要点”功能，可自动生成结构化摘要，并强化多任务并行与协作共享能力。作为面向中文知识密集场景的AI原生应用，ima上线一年来累计处理2亿份知识文件，2025年9月月活用户较1月增长突破80倍。

360安全智能体于2025年10月成为首家通过中国软件评测中心智能体能力成熟度评估的安全厂商，其”钓鱼邮件研判”和”网络告警研判”两大核心场景双双获评L3成熟级认证，标志着安全智能体已具备面向复杂跨场景任务的自主决策与多工具调用能力，可独立完成专业级安全任务，任务执行成功率达到行业领先水平。依托CoE多专家协同安全大模型架构，通过安全场景专项化训练形成垂类大模型。钓鱼邮件研判智能体融合”Workflow + MCP”机制，实现对附件加密、多模态欺骗等高级攻击的精准识别；网络告警研判智能体则通过强化学习构建深度分析能力，自动输出研判思考过程、结果及证据链路。

2025年10月15日，商汤科技与寒武纪正式签署战略合作协议，双方以”软硬件深度融合”为核心定位，共同推进人工智能领域国产化生态构建。合作围绕四大方向展开：技术合作层面，依托商汤大模型研发能力与寒武纪芯片技术积累，推进软硬件联合优化；芯片适配方面，重点实现寒武纪思元370芯片与商汤日日新V6大模型的深度兼容，目标将多模态推理效率提升30%以上；行业方案领域，打造”硬件标准化+软件模块化”一体机，如金融智能文档处理一体机和制造业质检解决方案，显著降低部署门槛；区域拓展上，计划在长三角、粤港澳等区域构建”算力枢纽+场景示范+企业孵化”生态网络。

2025年10月，MiniMax在多模态模型领域实现重大突破，发布MiniMax-M2文本模型与Speech 2.6语音模型，构建”智能-成本-体验”三角优势。M2文本模型（230B总参数/10B激活参数）于10月27日开源，Artificial Analysis榜单全球前五、开源第一，编码与Agent能力突出，Terminal-Bench等评测表现优异，API输入0.3美元/百万Token，成本仅Claude 4.5 Sonnet的8%，推理速度快近一倍。10月30日推出的Speech 2.6语音模型，首包响应250毫秒，专业格式处理无需人工教学，新增”Fluent Lora”功能优化发音，赋能Voice Agent场景。MiniMax开放MCP工具链，形成技术闭环，推动多模态交互应用落地。

10月27日，科大讯飞在全球1024开发者节发布“AI+数字员工”系列产品，评标智能体在国家能源集团等累计评审超18万单，准确率97%，年均经济效益19亿元；星火行业分析师支持全维度态势感知与专业研报撰写。10月21日获语音增广方法发明专利，提升语音数据多样性。AI For Science联合团队提出PaMMA-Net模型，核聚变预测相似度超95%，发表于《Nuclear Fusion》。10月14日AI同传技术升级，翻译主观体验达4.6分，首字响应2秒，发布翻译耳机及双屏翻译机2.0，IDC报告显示其8项核心维度排名第一。

2025年10月，昆仑万维围绕”智能体-视频模型-商业化”战略路径持续突破。AI智能体领域，发布Skywork Deep Research Agent V2作为天工超级智能体核心引擎，首次引入”多模态深度调研”能力，整合图文混合信息的检索、理解与生成全流程，显著降低专业研究门槛。AI视频方向，推出SkyReels-A3模型，基于”DiT视频扩散模型+插帧延展+强化学习动作优化+运镜可控”架构，实现任意时长全模态音频驱动数字人创作，支撑电影、直播等多元场景。

10月22日，百川智能发布循证增强医疗大模型 Baichuan-M2 Plus，同步升级配套应用百小应并开放 API。该模型定位医疗垂类，首创六源循证推理（EAR）范式，构建从原始研究到真实世界反馈的六层知识体系，仅采用权威医学证据，主动屏蔽非专业信息。技术上，M2 Plus 采用 PICO 框架将查询转化为结构化医学问题，通过智能提问、精准锁定、证据排序三步检索证据，并引入“循证增强训练”机制，奖励引用、惩罚臆测，确保句句有据可回溯。商业化落地方面，通过升级百小应应用与开放 API，实现从通用模型到医疗垂类的深耕，为医疗智能创新提供技术支撑。

原创文章，作者：志斌，如若转载，请注明出处：http://damoai.com.cn/archives/13443