全面对标GPT-4Turbo？日日新5.0终于打破了大模型行业“瓶颈”

“这张海报就是由大模型生成的。”徐立说，“除了聚焦本身发布的参数之外，我们今年更多的关注了行业的场景落地，并以行业来驱动人工智能的爆发”。

4月23日，商汤技术交流日在上海临港正式开幕，延续着上一次的开场方式，商汤科技董事长兼CEO徐立，依然在正式介绍前展示出了一张幻灯片：海报呈漆面工艺风格，主要景物以山、树木等静态物质为主。据悉，此次商汤科技推出的是全新版本的「日日新5.0」。

商汤科技董事长徐立强调：目前，日日新5.0大模型体系综合能力全面对标GPT-4，技术领跑加速生成式AI向产业落地的全面跃迁，实现大模型按需所取。

高达200K的推理上下文窗口，日日新5.0全面对标GPT-4Turbo

2023年，AI浪潮来袭，商汤科技的大模型体系也在“大模型 + 大装置”的战略规划下，持续高效的进行着优化与升级。

自去年4月商汤「日日新 SenseNova」大模型体系正式问世以来，其已正式推出五个大版本迭代。而今，商汤新一代「日日新 SenseNova 5.0」时隔一年正式问世，对已有的多个大模型进行全方位升级外，还创造了一些「崭新的面孔」。

据悉，基于超过10TBtokens训练、覆盖大量合成数据，升级后的“日日新SenseNova 5.0”采用混合专家架构，推理时上下文窗口可以有效到 200K 左右。同时，日日新5.0在自然语言能力（大量中文预料的构建）、综合推理（包括数字推理）、代码生成、多模态交互等整体表现上「更上一层楼」，全面对标GPT-4 Turbo ，并且常用的客观评测上达到或超GPT-4 Turbo系列模型。

首先，发布会上，商汤科技以“高考中红楼梦的相关撰文需求”展示了日日新5.0的答题能力。测试结果发现，日日新5.0不仅解题速度十分优秀，还摒弃了大模型最常应用的传统撰文套路，以发散的撰文思维及时下最热互联网“热点”完成了此次创作。

数学题目测试中，商汤科技选择了以“13个小朋友玩老鹰捉小鸡，捉住了5只小鸡外，还剩几只小鸡”为题干，让ChatGPT4.0及日日新5.0分别进行回答。测试结果显示，这两款大模型在答数学题的能力上差异显著。

可见，在数学能力方面，日日新5.0大模型面对逻辑谜题能够跳出坑位，给出解决方案。基于此，商汤科技董事长兼CEO徐立强调：“在很多情况下，如果说模行要有行业上的差异化，把行业化的数据，以及行业化数据背后的理解叠加，一定是形成一个差异化的竞争能力”。

其次，多模态方面，商汤科技以“一头老象在茂密的森林中”为命题测试了日日新5.0生图能力，并与行业内领先的一众“对手”进行对比，测试结果显示，这几款大模型在生图的能力上风格不同，各有千秋。

而在以“人”为主的生图测试中，相较于之前，日日新5.0多模态的迭代能力有着十分明显的提升，在人物细节构造上（即凌乱的头发、复杂的皮肤纹理）都十分出色。反观其他“几个友商”都在皮肤及发型上有不同程度的模糊化加工。

在本质上将“合成与理解”放在一起的技术处理上，商汤科技以“未来派建筑，楼顶有一个白色陶瓷LOGO——Sensenova”为命题进行了测试。

从各家大模型的回复中，我们注意到，除日日新5.0外，对于文字嵌入建筑当中均有一定的缺失，包括文字的理解，及LOGO的摆放位置等等。

反观日日新5.0，除了完全理解“需求”外，甚至对于LOGO细节处的倒影，及水面波浪式的纹理都做出了具象化的处理。

再有，数据推理多模态能力上。商汤科技以长图嵌入数据分析为例，展示了图片文字拆分，图片文字理解，基于长图思考形成逻辑性回答的能力。

值得注意的是，本次发布会的演示环节，依旧采取的现场直播演示，相较于上一个版本，日日新5.0的确在理解能力、逻辑能力以及数学能力的展示上更加全面及详细。

大模型之家认为，作为商汤「日日新SenseNova」大模型体系的通用基础模型，日日新5.0的大幅度升级使得人们在使用模型处理多样化语言任务时更高效、更准确，让国产大模型拥有了与 GPT-4 相媲美的使用体验。

同时，对于整个行业来说，未来基于此模型基础上开展的学术研究、技术创新、商业应用也有了更多机会。

推出企业级一体机，商汤朋友圈均有新动作

基础模型升级之外，基于金融、代码、医疗、政务等重点行业边缘侧日益增长的AI应用需求，商汤科技推出了企业级一体机，主打高性价比、开箱即用、数据安全及国产化芯片全适用。

据悉，一体机为2-42架构（即商汤独创），可达到2P算力，256G显存及448GB/s的连接。可同时支持企业级千亿模型加速和知识检索硬件加速，实现本地化部署，即买即用，降低企业应用大模型的门槛。相比行业同类产品，推理成本节约80%，检索大大加速，CPU工作负载50%。

此外，商汤科技还推出了创新的端云协同解决方案，该方案能够智能地判断并协同发挥端侧与云端各自的优势。在需要联网搜索或处理复杂场景时，该方案能够智能地将任务分流至云端处理，而在部分场景中，端侧处理的占比甚至超过了80%，从而大幅降低了推理成本，提高了整体效率。

值得注意的是，商汤科技日日新·端侧大语言模型的推理速度达到了业内最快水平。在中端平台上，该模型能够实现平均18.3字/s的生成速度，而在旗舰平台上更是高达78.3字/s，为用户提供了极速的语言处理能力。

而商汤科技的扩散模型，同样在端侧展现了业内最快的推理速度。其端侧LDM-AI扩图技术在某主流平台上的推理速度小于1.5秒，相较于友商的云端应用，速度提升了惊人的10倍。更值得一提的是，该技术支持输出1200万像素及以上的高清图片，并允许用户在端上快速进行等比扩图、自由扩图、旋转扩图等图像编辑功能，为用户带来了极致的便捷和高效体验。

而在自身应用方面，商汤“日日新SenseNova 5.0”在秒画、如影、格物、琼宇、大医、小浣熊家族等产品均有重要更新。

此外，在发布会中，商汤还邀请了金山办公、华为、小米、阅文集团等多位生态伙伴嘉宾，共同探讨和交流大模型技术在办公、金融、出行等不同领域的应用及前景。

金山办公方面，基于“日日新”大模型的卓越代码生成及工具调用能力，助力WPS365打造更高效释放场景能力的办公新质生产力平台，为企业构建专属的“企业大脑”。

海通证券方面，其携手商汤科技共同推出了金融行业专用的多模态全栈式大模型。这一合作不仅助力双方在智能客服、合规风控、代码辅助、展业办公助手等多个领域实现业务的实际应用，还共同深入研究了智能投顾、舆情监控等行业前沿场景，成功打通了证券行业大模型从研发到落地的全栈式能力。

小米则在旗下最新发布的SU7中应用了商汤的大模型技术，并基于商汤端云大模型解决方案，以小米小爱同学为车主提供智能化交互体验。

华为方面则宣布了与商汤联合发布面向金融、医疗、政务、代码等行业的大模型，并强调，双方将发挥各自在算力、数据、场景等方面优势，共建大模型生态，加速人工智能走深走实。

AI竞技，商汤底气何在？

值此商汤技术交流日之际，截至今日收盘，商汤科技股价上涨1.67%，报收0.61元/股，可见资本对于日日新大模型5.0的看好。

联想到实际业绩上，据3月26日商汤科技发布的2023年业绩报告显示：2023年公司整体营业收入34亿元人民币，其中生成式AI收入达12亿元，占集团总收入比例升至35%，实现近200%增长。这也是商汤成立十年以来，以最快速度实现从无到有，并取得超过10亿收入体量的新业务。

对此，商汤集团董事长兼CEO徐立博士曾公开表示，“生成式AI对商汤来说已不仅仅是技术领域的变革性创新，更成为公司的核心业务。商汤生成式AI业务的增长，得益于各行各业对大模型的训练和推理的广泛需求，这预示着中国硬科技投资的新周期正式开启。商汤通过在各业务层面深入融合生成式AI能力，正在赢得新客户，并推动效率和生产力的全面提升。”无疑，全新的 AI 2.0 时代下，商汤正加速转型变革，以通用人工智能（AGI）目标打造全新面貌的“商汤 2.0”。

眼下，AI赛道的战火已经燃烧到了行业场景的落地上。而能够引领大众欣赏世界的大模型，不仅为用户带来了更多的想象力，也为整个行业带来了更加具象化的商业应用憧憬。

在此背景下，为了在千行百业中用好它们，真正实现「行业场景落地」，一套完整的体系势必能让我们事半功倍。而从今日的技术交流日来看，在这一方面，商汤已经做好了准备。

原创文章，作者：欧玉娇，如若转载，请注明出处：http://damoai.com.cn/archives/4943