“大模型我们走在最前面,我们要去勇闯无人区,需要去冒前人没有冒过的风险。”这句话出自日前百度一场内部颁奖活动中,百度创始人、董事长兼首席执行官李彦宏的讲话。他还指出,百度一直坚信技术可以改变世界,会一直沿着这条路走下去。
李彦宏还在演讲中,回顾了百度在过去一年中,在大模型领域取得的成果。李彦宏表示,文心一言在去年3月16日首发,历经3.5、4.0版本不断迭代,大模型的基础能力始终走在中国大模型的最前列。他介绍说,自去年五月用大模型重构所有产品线以来,“今天,有10%的大搜流量,已经是通过文心一言的模型来生成的;今天,每天有250万用户,用到文库的AI能力。”在回顾成果的兴奋之余,李彦宏的神态依然保持着那份从容与坚定。事实上,无论是内部与外部的演讲,李彦宏都是以从容的姿态示人。似乎在他看来相较于短期的成功与失败,真正重要的是技术的长期价值和其对人类社会的深远影响,只有持续的投入,才能换来通向通用人工智能(AGI)的曙光。
以技术为信仰,勇闯无人区
评价一家企业的价值,尤其是科技企业,核心点仍是关注企业的技术能力和壁垒。
在AI领域,百度发力最早,拥有的技术壁垒也是业内最高,不仅早在十几年前即投入到AI研究中,而且在中国首发AI技术框架、生成式大模型产品,在AI基础能力上,始终走在中国最前列。
这与李彦宏的技术信仰密不可分。如果说“用科技让复杂的世界更简单”的使命,是对于百度愿景最好的概括,那么百度的发展历程,是对技术信仰的最好诠释。
自1999年成立以来,百度便致力于为用户提供更便捷、更智能的服务。早在回国创立百度前,李彦宏就已经研发出了全球第一个超链搜索引擎,并获得了专利,比谷歌早了三年,而后这项专利后来被谷歌引用了数百次。
而这项技术,也埋下了百度未来发力人工智能的“种子”。
搜索与人工智能技术的联系千丝万缕,搜索引擎需要处理海量的信息,并根据用户的需求进行智能匹配,这需要强大的人工智能技术作为支撑。而百度在搜索引擎领域的深厚积累,为其在人工智能领域的发展提供了坚实的基础。
早在2010年,百度就成立了自然语言处理NLP部门,成为中国最早投入AI的公司,挺进人工智能发展的“无人区”,并在2013年成立了第一个深度学习实验室。
2023年,伴随ChatGPT的爆火,大模型技术走到了人工智能行业的聚光灯下。凭借着强大的理解、生成、逻辑、记忆能力,大模型不仅能够处理海量的数据,还能从中学习到更加复杂、更加精细的知识模式,进而为各行各业提供更为精准、智能的解决方案。
而早在行业关注到大模型这一技术趋势前,百度便已经率先开始相关的技术储备。2019年3月,文心大模型发布1.0版本,彼时,国内对于大模型的关注还处于起步阶段,ERNIE 1.0采用了多层双向注意力机制,实现了在海量数据中自动学习知识表示,提升自然语言理解能力。
而在随后ERNIE 2.0和ERNIE 3.0的更新中,文心大模型相继引入了多模态学习技术、跨语言学习技术、以及动态知识更新技术,实现了模型持续的学习和进化。
多年在大模型领域的积累,也让百度能够在2023年大模型成为行业热点之后,第一时间发布文心大模型3.5,并正式推出国内首款生成式AI产品文心一言。从2023年8月 31日面向全社会全面开放以来文心一言用户数已经突破了2亿,API日均调用量也突破了2亿。
如今,文心大模型已经升级到4.0版本,并伴随技术迭代,不断扩展着能力的边界。文心大模型的持续快速进化,得益于百度在芯片、框架、模型和应用上的全栈布局,尤其是飞桨深度学习平台和文心的联合优化。在上个月举行的Create 2024百度AI开发者大会上,百度宣布文心大模型的周均训练有效率达到98.8%,相比一年前文心一言发布时,训练效率提升到当时的5.1倍,推理105倍。
百度在不断提升大模型的效率和效果的同时,也在降低大模型的成本和门槛。
目前,文心大模型已广泛应用于搜索、信息流、智能音箱等互联网产品,并通过飞桨深度学习平台、百度智能云赋能工业、能源、金融、通信、媒体、教育等各行各业。截至2024年3月,百度智能云的千帆大模型平台已为8.5万家企业提供服务,精调了1.4万个大模型,并开发出超过19万个大模型应用。同时三星、荣耀等手机品牌,也与百度智能云达成合作,为用户提供优质的生成式AI服务。
如今,百度已经成为中国互联网与人工智能技术的引领者,同时,百度还积极参与国际交流与合作,推动中国AI产业走向世界舞台。近期由清华大学基础模型研究中心联合中关村实验室研制的SuperBench大模型综合能力评测中,文心一言4.0表现亮眼,与国际一流模型水平接近。
如今,众多车企纷纷开始布局“智能驾驶”,但国内最早投身于自动驾驶技术研究的企业,也是百度,2013年开始率先投身国内自动驾驶的“无人区”,成为中国最早、投入最多的自动驾驶企业。
如今,在自动驾驶领域,百度自动驾驶出行服务商萝卜快跑已经成为全球最大的自动驾驶出行服务商之一。目前,萝卜快跑已经在北京、上海、广州等多个城市开放运营,为更多用户提供了优质的自动驾驶服务。
推动技术成果共享,促进大模型生态共赢
在辉煌成绩背后,通常被人们所忽略的,是百度对技术研发的持续投入和人才培养的重视。百度十年如一日坚持压强式、马拉松式的研发投入,在AI领域投入超过1000亿元,研发人员占比超过60%。这种长期且高强度的投入,成为百度在人工智能领域的技术创新的基石。
在这一过程中,百度也成为了中国乃至全球人工智能的“黄埔军校”,提前完成5年为全社会培养500万AI人才的目标,还培养并吸引了一批顶尖的技术人才,如吴恩达、余凯、林元庆等他们曾为百度的发展做出了重要贡献。
除了内部培养,百度还积极开展校企合作,与众多高校和研究机构建立了紧密的合作关系,共同开展科研项目,培养技术人才。这种“产学研”合作模式不仅为百度输送了人才,也为学术界的研究提供了实践场景,实现了真正的互利共赢。
在探索技术“无人区”的同时,百度更是勇于“搭桥铺路”,将成果与合作伙伴共享,推动AI技术的行业进步,通过与各行各业的企业合作,共同打造繁荣的产业生态。
截至目前,飞桨文心生态已经凝聚了1295万开发者,服务了24.4万家企事业单位,并基于飞桨和文心创建了89.5万个模型。这些数字背后,不仅彰显了百度在AI领域的实力,也通过提供技术支持和解决方案,帮助各行各业实现了数字化转型和智能化升级。
投入前沿技术需要创新、需要勇闯无人区,没有作业可以抄,只能自己探索摸索。2024年也是大模型应用落地的关键之年,百度正在各个方面积极尝试,这些尝试都不容易,但如果能实现突破,就像李彦宏所说,“熬过去,就能化茧成蝶”。
原创文章,作者:志斌,如若转载,请注明出处:http://damoai.com.cn/archives/5176