大模型之家讯 近日,新华社研究院中国企业发展研究中心发布《人工智能大模型体验报告3.0》报告,对主流大模型进行了全面的评估,并为中国企业的大模型产品选型提供了专业指导。报告显示,商汤商量SenseChat在定量实测的情商维度上,位居全部10款大模型第一,并在定性评估中入选大模型市场未来领袖象限。此外,商汤赋能电力AI平台智能化升级的实践,也入围此次新华社研究院报告的“厂商最佳实践案例”。
新华社研究院:商量SenseChat情商表现第一,中国大模型市场的“未来领袖”
新华社研究院测评选取了10家国产主流大模型产品,进行了深入的定量实测,覆盖基础能力、智商、情商和工作提效四个维度的1000道题,并精选其中的400道进行实际问答测试,准确地反映大模型在不同场景和问题下的实际表现。
实测中,商汤商量取得1746分的优异结果,其中情商维度表现位居10家主流大模型第一。分析显示,在智商指数方面,商汤商量能够根据指令回答问题;在情商指数方面,能够给出方案详尽,问题切入角度多样,且能够引发用户进行深入思考的答复。
而在工作提效方面,商汤商量不仅能够较好地解答日常疑惑,在法学、经济学、文学方向上也表现不凡,能够以较快的速度响应并给出准确可信的结果。
同时此次评测升级了评测体系,首次纳入象限评估模式,从“技术实力”和“发展潜力”两个维度进行详细的定性分析,并选入未来领袖、技术为王、潜力无限和中规中矩四个象限,体现大模型在技术和市场方面的综合实力。商汤商量也凭借在“技术实力”和“发展潜力”不俗的表现,在众多大模型中脱颖而出,被新华社研究院认可为中国大模型市场的“未来领袖”。
厂商最佳实践案例:商汤商量助力能源电力企业升级AI平台
随着大模型能力提升,以及应用场景的逐步丰富。新华社研究院报告指出,以商汤商量为代表,大模型已经覆盖了职场、营销、出行、生活、公文、客服等多个行业和场景。同时,大模型的产业价值也受到了越来越多的关注。如何将大模型与产业深度融合,通过提升生产效率、优化决策和管理、创新业务模式等,推动社会经济的发展和进步,成为了大模型厂商更为重要的课题。
在新华社研究院报告的“厂商最佳实践案例”部分,商汤与电力企业共同探索大模型技术与新型电力系统的创新结合,并在电力生产和运维领域应用大模型技术,实现了降本增效,助力电力企业AI平台的智能化升级。
这个案例中,某国有电力企业希望借助大模型能力,为庞大规模用户提供高质量服务。同时在电网自动化巡检、电力调度等领域,也面临着智能化能力构建和提升的迫切需求。面对这一需求,以商汤大模型体系为核心,双方共同探索电力人工智能平台建设,优先解决在运维场景对长尾故障和缺陷进行智能识别和判断的问题。根据规划,未来双方将共同推动电力行业AI大模型训练与应用、算力建设、标准建设、产业转化和市场拓展,加快推动电力行业的人工智能创新及应用。
据统计,目前商汤商量在金融、手机、医疗、汽车、地产、能源、传媒、工业制造等众多垂直行业,已经与超过500家客户建立了深度合作,和行业企业一起探索大模型的产业落地,加速赋能企业的智能化转型。新华社研究院报告也认为,随着大模型快速的升级迭代,大模型的技术能力开始越来越多地体现在产品能力上,大模型将会推动数字经济和产业经济的深度融合,掀起一轮技术革命,为社会经济发展提供源源不断的科技动力。
领先基础设施和研发体系,巩固商汤大模型竞争力
事实上商汤商量今年4月正式推出,是国内最早推出的基于千亿参数大语言模型的产品之一,并一直不断迭代更新。在今年9月SuperCLUE的评测中,商汤商量位列中文大模型总榜及AI智能体子榜双榜排名第一,展示了在大模型方面极强的综合竞争力。
这些离不开商汤对人工智能基础设施的前瞻性打造、以及围绕大模型及研发体系的规模化投入。商汤以SenseCore商汤AI大装置为基础,建立了一套工程化的体系来支撑大模型的快速迭代,软件、系统、和硬件都在以服务大模型快速迭代为目标做研发配合,实现了敏捷、低成本、大批次地做模型迭代,有助于商汤发现大模型最好、最有效的生产配方。
其中商汤上海临港AIDC是目前全国规模最大的人工智能智算中心之一,截止2023年8月底已上架的GPU数量达到约3万张。而在对大模型的迭代训练过程中,商汤也积累了稀缺的算法和工程上的专业知识,以及改进数据管理的方法。商汤通过人工和算法结合的方式,对原始语料数据来做分门别类的精细化清洗,目前已经实现每月产出2万亿token的高质量训练数据,预计在2023年底,可以突破10万亿token。
借助这些丰厚、领先的算力和数据资源,商汤不断优化迭代大模型能力,同时创造领先的大模型落地和生成式AI应用生态,通过帮助客户打造行业大模型和更多的领域应用,推动更多产业的智能化升级。
原创文章,作者:志斌,如若转载,请注明出处:http://damoai.com.cn/archives/2102