大模型驱动创新：开放性路径、多模态能力与多场景支持的商业价值

“人类历史上第一次，比最聪明的人类还要聪明得多的东西出现了。”马斯克在英国人工智能安全峰会上这样说道。

论偏激与否，不可否认的是，AI在不到一年的时间，真切地改变着人类生产生活的方式，通过人工智能拓展人类的知识边界，推动经济社会的发展，为国家和企业带来竞争优势和增长动力。从2022年底GPT 3.0引发国内小范围的热潮，到如今呼之欲出的GPT 5.0，从简单追求语言模型的文字能力，到现在已经不满足于大模型仅为使用者提供文本内容辅助，人们已经习惯了AI技术的快速迭代，这也意味着人工智能也正逐渐回归技术与工具本身。

图源：《人工智能大模型产业创新价值研究报告》

在大模型之家发布的《人工智能大模型产业创新价值研究报告》中曾指出：随着传感器技术的发展和物联网的兴起，大量的多模态数据（如图像、视频、声音等）被广泛采集和应用。大模型可以利用这些多模态数据进行跨模态学习，从而提升其在多个感知任务上的性能和表现。通过充分利用大模型的泛化能力、构建多模态数据集、解决融合和对齐问题，以及提供强大的计算资源支持。目前，大模型多模态已经成为人工智能企业关注的重点发展趋势，泛化能力也成为了形成完备的商业模式的关键能力之一。

多媒体革命，视听数据引领下一代模型发展

在第三季度，OpenAI也正式对Plus和企业计划的用户开放语音对话功能，让用户通过语音与ChatGPT进行交流，为用户提供了一种更自然和便捷的交互方式。用户可以使用不同的语言来与ChatGPT对话，它会根据用户的语音输入生成回应，并以用户选择的声音类型回复用户。

图源：网络

值得一提的是，语音聊天功能一经上线便吸引国内外广泛关注。在体验中大模型之家发现，目前ChatGPT的语音回复表现总体与4.0版本文本能力相当，并且可以通过换气、犹豫等行为使对答更加拟人。

图源：百度文心一言

目前，国内大模型厂商针对图像和声音领域也开始了广泛的布局，例如，在百度世界大会发布的百度文心大模型4.0在跨模态文生图方面取得了显著的进步。新版本的文心4.0充分发挥了其跨模态能力，让创作者们能够更加深入地探索文学和视觉艺术之间的互动。根据用户的的情感、主题和情感色彩来智能地选择和调整绘画风格，从而创造出与文本内容相契合的图像。

图源：企查查

除此之外，作为国内公开融资最高的大模型创业企业之一的智谱AI，今年已累计获得的融资超25亿元人民币，其基于GLM-130B模型开发的智谱清言（QAGLM）在视觉领域也展现出了强大的优势。

在大模型之家”AQUA专业大模型评估体系”的测评中，智谱清言能够从图像输入中提取关键信息，生成与图像内容相关的文本描述，该功能的应用前景非常广泛，从自动图像标注到视觉辅助等各种场景都可以利用。大模型的多模态能力，例如图像、视频和声音，为行业的商业化落地带来更多的可能。这些不同模态的数据类型不仅扩展了模型接触不同信息的范围，还促进了模型在不同领域的广泛应用。同时，这些数据类型的丰富性为模型提供了更多的上下文信息，包括视觉和声音元素，使得模型能够更好地理解和处理多感知信息问题。此外，声音和视频数据还被广泛用于自然语言处理任务，如语音识别和情感分析，拓宽了商业应用领域。

定制+微调，多场景支持填补商业需求

除了多模态能力以外，大模型泛化能力中多场景支持也更为重要。根据不同的应用场景和商业需求进行定制化和微调，才能实现更好的用户体验和商业效益。今年9月，360宣布360智脑大模型全面接入360全家桶，正式面向公众开放，用户可通过官方网站一站式登录360智脑app、360搜索、360安全浏览器、LoRA360、AI数字员工等大模型服务。

图源：360智脑

作为认知型通用大模型，360智脑4.0已经完全整合到360旗下的产品生态系统中，为用户提供广泛的智能服务。涵盖了搜索、浏览器、安全卫士、智脑APP等产品。如在360搜索中的智能对话搜索、360浏览器中的划词AI辅助功能、360安全卫士中的AI数字员工，以及智脑APP中的多语言数字人交流。

11月4日，360大模型“奇元大模型”通过备案落地，至此360公司也成为国内首家两个大模型均通过备案的科技企业。就大型模型的功能和应用而言，奇元大型模型商业化和产品定位主要针对B端用户，但未来将更加专注于商业化应用和特定领域，以协助用户提高工作效率。这也意味着“奇元大模型”将不断扩展其应用范围，以满足各种不同行业和领域的需求。帮助用户更有效地完成任务，提高工作效率。

360智脑4.0通过在不同场景中的应用增加产品的吸引力，帮助吸引更多用户，尤其是那些寻求全面解决方案的用户。也意味着产品可以进入不同的市场领域，拓宽市场覆盖范围，使公司能够针对不同用户群体提供智能解决方案，从而扩大市场份额。

大模型之家认为，多模态、多场景的支持对于提高用户体验和商业效益具有重要作用。大模型的整合能力和灵活性有助于拓展市场覆盖范围，满足不同用户群体的需求，以提供更多智能解决方案，从而增加市场份额。随着大型模型技术的不断进步和应用领域的扩展，将带来更多创新和机会，以提升商业效益和用户满意度。

开放性路径，扩充大模型商业蓝图

除了整合服务外，探索开放性升级的方式也引起了众多企业的关注。越来越多的企业提供更多不同参数规模的产品，以适应不同开发与部署环境的需求，让开发者和合作伙伴能够参与，共同创造新的应用和解决方案，这使得大模型的能力和应用范围向更多领域和行业扩展，以创造更多商业价值。

据了解，人工智能公司百川智能旗下大模型Baichuan2-192K现已正式开启内测，以API调用的方式开放给百川智能的核心合作伙伴，已经与财经类媒体及律师事务所等机构达成了合作。以开源大模型起家的人工智能公司，从上一代Baichuan-53B便开始尝试闭源大模型的发展路径。

图源：百川智能

百川智能也表示迭代产品Baichuan2-53B正式进军To B领域，开启商业化进程。Baichuan2-53B可为客户提供专业技术支持、培训和持续维护服务，协助客户克服挑战、不断提升技能水平，并保证模型性能持续改进，从而构筑稳固的客户信任基础，提升客户满意度。

除了百川智能以外，11月1日，vivo正式发布旗下自研通用大模型矩阵蓝心大模型BlueLM，同样以“矩阵”的形式发布，包含10亿、70亿、700亿、1300亿、1750亿共5个参数规模，能够分别对应不同的场景。其中，10亿、70亿量级模型专注于端侧场景，700亿模型则是面向云端服务的主力，1300亿和1750亿模型则将在更为复杂的场景中发挥作用，带来更加丰富的知识和推理能力。

目前，云端部署大模型仍然是行业的主流方案，其优势在于能够最小化设备算力的需求，也可以调用参数量级较大的模型。正因如此，在云端开发与部署大模型，打造云原生大模型在企业与大模型融合深度方面发挥关键作用。

阿里云作为中国最大的云计算平台之一，也提出一系列大模型部署解决方案。其中，MaxCompute大数据计算平台提供了多种数据处理和分析工具，如数据仓库、数据湖和机器学习平台等，这些工具通过阿里云的全球分布网络部署在多个数据中心，从而提高模型的可用性和性能。据了解，未来阿里巴巴所有产品都将接入通义千问大模型，进行全面升级。

图源：阿里云

与本地私有化不同，通过云端私有化定制的方式，用户可以在云环境中利用大型模型，并进行个性化的调整。借助云服务提供商的基础设施和资源，用户可以方便地进行模型的培训、微调和部署。这一方法有助于减少硬件和维护成本，同时使用户能够更具弹性地扩展他们的计算资源，以适应不断变化的需求。

此外，多重部署方式通过将模型分布在多个地理位置或数据中心，可以大幅度提高模型的可用性与容灾能力。这意味着即使一个地点或服务器发生故障，其他节点仍然可以提供服务，确保业务的连续性。

开放性路径、多模态能力以及多场景支持将继续推动大模型商业落地，为不同行业和领域的需求提供智能解决方案。在企业中，泛化能力高的模型可以用于支持决策制定和预测，从而提高业务流程的效率和质量。它们可以帮助企业更好地理解和利用数据，以做出更明智的战略决策。同时，企业可以更灵活地利用这些模型，开发各种应用，而不仅仅局限于单一领域。

原创文章，作者：王昊达，如若转载，请注明出处：http://damoai.com.cn/archives/1693