随着2025年的开启,全球人工智能行业又迎来了一个关键的里程碑时刻。深度推理已然成为大模型发展的新风尚。过去,大模型更多侧重于数据的堆砌和简单的模式识别,虽能在一定程度上满足基础应用需求,但在面对复杂问题时常常捉襟见肘。如今,随着行业对模型智能水平要求的不断提高,深度推理能力已成为衡量大模型优劣的关键指标。
在这一科技浪潮涌动的时期,大模型 “拼多多” DeepSeek R1系列模型的横空出世,无疑成为了行业内一颗璀璨的新星。这一发布,不仅打破了以往AI发展进程中的诸多常规认知,更开启了一个全新的AI时代。AI的 “aha 时刻” 在这一刻惊艳登场,意味着我们在人工智能的探索之路上迈出了具有突破性意义的一步。同时,R1系列模型仅需更少的算力需求就能实现与OpenAI o1系列模型同等的效果,这一成果犹如一颗重磅炸弹,在全球AI行业中激起了千层浪,吸引了无数从业者、研究者以及投资者的目光,预示着AI技术在普及和应用层面将迎来一次重大的飞跃。
在《2025年1月大模型热力榜》中,共收录了220家大型模型及其所属企业。其中,百度、360、智谱和商汤等人工智能企业持续领跑榜单。这些企业在AI技术研发、产品创新以及应用拓展等多个维度展现出了强大的实力与深厚的潜力,引领着行业的发展潮流,为人工智能的进步与普及贡献着关键力量。
另一方面,来自深度求索的DeepSeek凭借R1大模型强势上榜。1月20日,DeepSeek正式发布了DeepSeek-R1模型。该模型完全通过强化学习训练,摒弃了传统的监督微调方式。在性能上,DeepSeek-R1在数学、代码和自然语言推理等任务上可媲美OpenAI o1正式版,在AIME 2024、MATH-500等主流评测集上得分与o1相近。同时,DeepSeek还开源了DeepSeek-R1-Zero和DeepSeek-R1两个660B模型,并蒸馏了6个小模型。其API服务定价具有优势,英伟达、亚马逊、微软等科技巨头纷纷支持搭载或上线该模型,中国的天翼云、秘塔AI等也积极应用,展示出其广泛的影响力。
美国当地时间2025年1月6日,美国国防部将商汤加入“中国军事企业清单”。商汤科技1月7日发表声明称此举毫无事实依据,对此表示强烈反对。同时商汤方面还强调,该清单的主要影响是名单上实体公司不能成为美国国防部的供应商,对商汤业务没有实质影响。公司将尽快就此事与各方积极沟通,以确保获得公正的对待,并最大限度保护公司和股东的利益。
1月15日,科大讯飞正式发布深度推理模型X1。该模型是当前业界全国产算力平台上唯一的深度推理模型,中文数学能力对标OpenAI的o1模型。据悉,X1模型将在讯飞AI学习机、数学教学助手、医疗等真实场景中率先应用,为用户提供更智能、便捷的服务体验。
同日,MiniMax发布并开源了新一代01系列模型,包括基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型通过大规模应用线性注意力机制,打破了Transformer传统架构的记忆瓶颈,能够处理高达400万token的输入。这一输入长度是GPT-4o的32倍,Claude-3.5-Sonnet的20倍,展现了其强大的处理能力。
1月16日,阿里云通义开源了全新的数学推理过程奖励模型Qwen2.5-Math-PRM。据悉,该模型的72B及7B尺寸版本在性能上均大幅超越了同类开源过程奖励模型。尤其在识别推理错误步骤的能力上,Qwen2.5-Math-PRM以7B的小尺寸就成功超越了GPT-4o。此外,通义团队还开源了首个步骤级的评估标准ProcessBench,这一标准填补了大模型推理过程错误评估的空白。
同日,阶跃星辰自研的推理模型Step Reasoner mini已正式上线。作为Step系列模型家族的首个推理模型,Step Reasoner mini擅长主动规划、尝试和反思,通过慢思考和反复验证的逻辑机制,为用户提供准确可靠的回复。该模型不仅擅长解决逻辑推理、代码和数学等复杂问题,还具备文学创作等通用领域的能力。目前,阶跃星辰自研的Step系列基座模型矩阵已全面覆盖语言、多模态和推理等领域。
1月20日,豆包实时语音大模型正式推出,并在豆包APP全量开放。该模型是一款集语音理解和生成于一体的模型,实现了端到端的语音对话功能。相比传统级联模式,豆包实时语音大模型在语音表现力、控制力、情绪承接方面表现惊艳,同时具备低时延、对话中可随时打断等特性,并发布全新AI Coding产品Trae(trae.ai),实现从Copilot向Autopilot的演进。同日,商汤善惠宣布完成数千万元A轮融资,本轮融资由金沙江创投领投,微木资本、嘉实基金和金弘基金等知名资管平台和产业资本跟投,此次融资将重点投向零售AI算法研发创新、海外市场拓展战略方向。
1月21日,由百度文库和百度网盘联合打造的AI创作新物种“自由画布”开启公测,百度副总裁,文库事业部、网盘事业部负责人王颖透露,百度文库AI功能MAU已突破9000万,DAU年同比增长230%;付费用户超4000万,位居全球第二、中国第一。
1月22日,字节旗下豆包大模型1.5正式发布。据介绍全新 Doubao-1.5-pro 模型综合能力显著增强,在知识、代码、推理、中文等多个权威测评基准上获得最佳成绩,综合得分优于 GPT-4o、Claude 3.5 Sonnet 等业界一流模型,模型效果达到全球领先水平。
1月24日,百川智能发布了国内首个全场景深度思考模型Baichuan-M1-preview。该模型是国内目前唯一同时具备语言、视觉和搜索三大领域推理能力的模型。在数学、代码等多个权威评测中,Baichuan-M1-preview的表现均超越了o1-preview,展现了其在多领域推理方面的独特优势。此外,作为国内唯一专注医疗领域的头部大模型公司推出的深度思考模型,它还解锁了医疗循证模式,实现了从医疗证据检索到深度推理的完整端到端服务,能够快速、精准地回答医疗临床、科研问题。
原创文章,作者:志斌,如若转载,请注明出处:http://damoai.com.cn/archives/8990