创业,就是要做一头站在风口上的猪,风口站对了,猪也可以飞起来。
12月20日,有消息称,DeepSeek开源大模型DeepSeek-V2的关键开发者之一——罗福莉将加入小米,或供职于小米AI实验室,领导小米大模型团队。
罗福莉毕业于北大计算语言学硕士毕业,曾任职于阿里达摩院机器智能实验室,主导开发了多语言预训练模型VECO,并在DeepSeek参与了MoE大模型DeepSeek-V2的研发。
知情人士透露,雷军对小米在大模型领域的发力时间较晚感到担忧。此次亲自下场重金招募核心人才,甚至开出了千万元级别的薪酬。
如今,雷军将“天才AI少女”招入麾下,小米打的是怎样的算盘?
大模型“激活”手机存量市场
随着芯片算力的持续提升,AI Agent在智能手机上的应用逐渐成为常态。通过手机底层系统级AI,AI Agent将在人机交互和意图识别方面取得显著进步,能够更加精准地理解用户需求,主动完成任务,并成为用户高度定制化的私人助理。这一趋势将成为品牌维护用户群体的核心护城河。
据IDC预测,2025年中国新一代AI手机市场出货量将达1.18亿台,同比增长59.8%,整体市场占比达到40.7%。
在这一背景下,小米面临巨大机遇与挑战。根据2024年第三季度财报,小米智能手机业务实现收入人民币475亿元,同比增长13.9%;高端化战略初显成效。然而,随着市场进入存量化阶段,高端创新需求的升级让大模型技术成为品牌突围的关键。
事实上,AI技术早已融入智能手机的方方面面,从语音助手到影像处理,再到性能优化。但大模型的出现,为手机AI能力带来了质的飞跃。
然而,与OPPO和vivo相比,小米在大模型技术的宣传上显得较为低调。虽然在影像处理、语义助手等领域有所布局,但在多模态交互与跨App联动等方面的应用仍有提升空间。
轻量化和本地部署
小米集团创始人雷军曾公开表示:“我们做大模型的思路可能和很多公司不太一样,我们选择主力突破的是轻量化和本地部署。”
从成本考虑,云侧的AI大模型要根据调用付费,还需要巨大算力,用起来成本也很高。而端侧在本地运算,如果将大部分AI推理场景放在端侧,不仅可以更接近用户的数据,实现更有效的训练,同时也能够大量节约云端算力开支。
从用户构成考虑,以“互联网手机”起家的小米,用户对于互联网新技术的接受程度更高。用户对于小爱同学的接受程度也更高,小米旗下人工智能助手小爱同学月活用户数达到1.35亿,同比增长8.5%。
从产品方面考虑,“为发烧而生”的小米手机,用户在芯片性能、摄像头技术、屏幕显示等方面有着相对更高的需求,这也让小米更倾向于推出同价位性能更高的手机,这也为其未来部署本地化AI创造了条件。
此外,根据2024年Q3财报显示,小米集团的AIoT平台已连接的IoT设备数超8.61亿,同比增长23.2%。被称为“杂货铺”的小米,这些海量的AIoT设备,轻量化、需要借助分布式算力的终端设备,目前主要依赖于云端的AI能力,想要实现本地化部署,对于轻量化的需求更高。
因此,尽管端侧大模型在效果上难以媲美云端,但其在隐私保护、低延迟和成本控制方面的优势,使其成为小米发力的重点领域。
甚至可以说,小米是更适合发力端侧大模型的企业,也是更需要发力端侧大模型的企业之一。
2024年2月,小米推出了基于大模型的AISP影像处理平台,用于解决超高倍焦段拍摄中的细节缺失问题,显著提升图像质量。同年5月,小米发布了大语言模型MiLM,覆盖从0.3B到30B多个参数规模,适配不同场景需求,并通过技术突破实现了端侧部署。
为了确保本地部署模型的效果,小米团队开发了专用的硬件加速模块,使得MiLM模型的运行速度提升了约35%,同时功耗降低20%。此外,通过创新的“TransAct大模型结构化剪枝方法”和端侧量化技术,小米团队大幅提升了训练效率并降低了量化精度损失。MiLM2-4B模型已在端侧成功部署,为未来更多设备的本地化部署打下基础。
重金招揽AI人才:雷军的破局之道
小米为何选择招募罗福莉?
在大模型之家看来,这不仅是看中她的研究能力,更是认准其研究方向与小米大模型战略的契合度。罗福莉曾在阿里主导开发的VECO模型是跨语言理解与生成的典范,其在文本生成与风格转换领域的研究为智能终端设备提供了核心技术支撑。其所研究的方向,都是目前最热门的语音和文本识别技术,而文本的识别改写、语义的转化,正是目前手机、平板、PC等移动终端、以及车机设备中,最为常用的场景。因此,罗福莉与小米的发展重点可谓是既专业又对口。
细数小米的发展过程,每年都有一个百万美金年度技术大奖,这是小米内部规格最高的奖项,奖励在重大技术创新项目中做出关键突破的10人以内团队。而这哥奖项的评选,主要遵循三个标准:技术的独创性、世界范围内的领先性,以及与小米主营业务的契合性。
罗福莉的加入,延续了小米招募顶尖人才的传统。无论是为了吸引卢伟冰、王川等行业大咖,小米多次通过收购对方创业公司实现人才引入。在技术竞争日益激烈的时代,人才是成事的关键。
小米近年来在全球范围内广泛吸纳AI顶尖人才。从美国硅谷到中国北京,从算法工程师到AI产品专家,小米的人才布局正在形成覆盖全球的AI研发网络。这不仅提升了小米的技术实力,也使其具备了在多个领域同时展开创新的能力。小米AI实验室的研究项目数量在过去一年增长了45%,其中多模态交互、图像生成和语义理解成为重点方向。
罗福莉的到来,或将加速小米在这些前沿领域的技术落地,进一步缩小与行业领先者的差距。雷军曾表示,小米将继续加大在AI、物联网(IoT)等前沿技术的投入,力争在全球科技创新中占据一席之地。
为了吸引顶尖人才,小米不仅提供高薪酬,还打造了开放的研发环境和多样化的技术交流平台。此外,小米还计划与高校和研究机构建立更紧密的合作关系,共同推动AI技术的基础研究和应用落地。这种双向合作模式,将为小米注入源源不断的技术创新动力。
大模型驶向智驾风口
与其他手机企业不同,小米的另一优势便是拥有汽车业务,雷军在2024年度演讲中提出,通过AI赋能“人车家”生态,推动技术与场景的深度融合。
小米的「人车家全生态」,其中汽车领域的大模型实践,既是体验赋能、也是落地样板。这意味着在小米SU7上,用户不仅能用小爱同学深度控车,还能进行手机、移动设备,甚至是与IoT设备的全方位控制能力。
如今,智驾已经成为新能源汽车领域的必争之地。理想汽车创始人李想曾表示,“大模型的研发和训练是智能电动车企业的必要能力。” 小米的智能驾驶系统通过接入多模态大模型技术,赋能从语音交互到复杂道路环境识别的全链路场景。
除了基于LLM带来的理解能力的升级,在自动驾驶方面,小米汽车智能驾驶系统在半年内经历了三次重大升级,从高精地图+模块化架构到无图+模块化架构,再到如今的端到端大模型架构,追赶了友商三代研发步伐。目前,小米端到端全场景智能驾驶系统面对车位启动、路口通行、无保护左右转、闸机通行、超车、借道避让、自动进入车库、自动泊车等场景时的表现都比较流畅,展现出了“类人”的驾驶能力。
12月23日,小米SU7宣布1.4.5 OTA推送,正式接入视觉语言大模型(VLM),可识别复杂道路环境和特殊交通规则,并通过语音和文字给予实时提示。同时,充电地图完成升级,与蔚来、小鹏、理想达成充电补能网络合作。这些升级不仅提升了用户体验,也展示了小米在大模型技术实际落地中的实力。
除了智能手机和汽车,小米的大模型技术还深入渗透到AIoT生态中。从家电控制到安防监控,从语音助手到健康管理,大模型技术正赋能每一个AIoT设备。雷军强调,小米的目标是实现全场景的智能化,让每一个设备都成为用户的智能伙伴。
为了实现真正的全场景智能化,小米正加快AIoT设备的互联互通进程。通过统一的AI框架和大模型算法,小米希望实现设备之间的数据共享和协同工作。这种创新将使用户体验更加流畅,并为小米的生态系统创造新的价值。
写在最后
招募罗福莉等顶尖AI人才,预示了小米在大模型赛道上发力的决心。通过手机、汽车、AIoT生态的全线布局,小米的目标并非仅限于技术突破,而是要打造“人车家”融合的完整智能生活场景。未来,小米的成功不仅取决于技术实力,更在于能否将AI能力与用户需求深度结合。
然而大模型赛道竞争者众多,挑战同样严峻。小米在技术积累和市场影响力上仍面临挑战,如何将“轻量化”和“本地部署”战略真正转化为用户可感知的体验差异,并在多样化场景中形成闭环生态,是小米必须回答的问题。
站在大模型风口上的小米,能否飞得更高、更远?答案或许正藏在AI赋能的每一个智能终端中。小米与大模型的故事,才刚刚开始。
原创文章,作者:志斌,如若转载,请注明出处:http://damoai.com.cn/archives/8515