2024年,大模型的技术进步在不断深化,其强大的能力已开始向多模态领域全面进军。这一年,大模型不再仅仅局限于文本处理,而是逐步扩展到图像、音频、视频等多种媒体数据的理解和处理。这不仅极大地提高了人工智能的应用范围,更为各行各业带来了前所未有的创新机会。在产业端,大模型的应用也日渐广泛,深度学习、自然语言处理、计算机视觉等技术,都在助力大模型更好地服务于人类社会,实现其更大的价值。
在2024年《1月大模型热力榜》中,大模型之家榜单共统计105家大模型及其所属企业,较上月新增3家。其中,百度文心一言再次占据热力榜第一名的宝座,与360智脑与商汤日日新大模型一道,成功登上热力榜前三名。值得注意的是,猎户星空旗下猎户星空大模型,凭借创始人傅盛的影响力,以及与360创始人兼董事长周鸿祎的对话,成功引爆了行业关注,并首次登上了热力榜榜单。
本月初,商汤科技智能产业研究院与中国信息通信研究院云计算与大数据研究所,中国智能算力产业联盟,人工智能算力产业生态联盟,联合发布《新一代人工智能基础设施白皮书》明确了新一代AI基础设施的定义和特点。数据显示,过去4年,大模型参数量年均增长400%,AI算力需求增长超过15万倍。新一代AI基础设施以大模型能力输出为核心平台,集成算力资源、数据服务和云服务,旨在提升大模型和生成式AI应用的性能。白皮书还首次提出了新一代AI基础设施评估体系,对厂商综合能力进行全面评估。新基础设施的建设将降低大模型开发门槛,为各领域创造更大社会价值。同时在月底的2023福布斯中国创新力企业国际投资大会上,商汤科技基于大模型技术,通过商汤如影AI视频生成平台,为福布斯中国集团首席战略官晏格文(Graham Earnshaw)先生量身打造的AI数字人形象生动亮相,打破次元壁,以跨越虚实的出众表演惊艳了在场的所有观众,并获得晏格文本人的盛赞。
1月16日,元象发布了全球首个上下文窗口长度为256K的开源大模型 XVERSE-Long-256K,支持输入25万汉字,无条件免费商用。
同日,智谱AI发布新一代基座大模型GLM-4,整体性能相比上一代大幅提升,逼近 GPT-4。具体表现上,GLM-4可以支持 128K的上下文窗口长度,单次提示词可以处理的文本可以达到300页。同时在多模态能力方面,文生图和多模态理解都得到了增强。30日,智谱AI宣布GLM-4模型的开放API正式上线。GLM-4模型具备综合能力全面跃升的特点,支持更长上下文、更强的多模态、更快的推理速度和更多并发,同时增强了智能体能力。
1月22日,由中国一汽联合阿里云通义千问打造的大模型应用GPT-BI落地。这是汽车行业的首个大模型BI应用,该应用可接收自然语言查询,结合企业数据自动生成分析图表,目前可达到近90%的准确率。
30日当天,科大讯飞将于发布星火认知大模型 V3.5,其相比于去年10月24日发布的讯飞星火 V3.0,在逻辑推理、文本生成、数学答题及小样本学习能力均实现大幅提升。科大讯飞表示,星火认知大模型 V3.5基于全国产化算力底座“飞星一号”平台训练,目前已经完成训练。
接下来快和「大模型之家」一起来看看2024年首期《大模型热力榜》中是否有你关注的大模型吧!
原创文章,作者:欧 玉娇,如若转载,请注明出处:http://damoai.com.cn/archives/3345