“人类历史上第一次,比最聪明的人类还要聪明得多的东西出现了。”马斯克在英国人工智能安全峰会上这样说道。
论偏激与否,不可否认的是,AI在不到一年的时间,真切地改变着人类生产生活的方式,通过人工智能拓展人类的知识边界,推动经济社会的发展,为国家和企业带来竞争优势和增长动力。从2022年底GPT 3.0引发国内小范围的热潮,到如今呼之欲出的GPT 5.0,从简单追求语言模型的文字能力,到现在已经不满足于大模型仅为使用者提供文本内容辅助,人们已经习惯了AI技术的快速迭代,这也意味着人工智能也正逐渐回归技术与工具本身。
图源:《人工智能大模型产业创新价值研究报告》
在大模型之家发布的《人工智能大模型产业创新价值研究报告》中曾指出:随着传感器技术的发展和物联网的兴起,大量的多模态数据(如图像、视频、声音等)被广泛采集和应用。大模型可以利用这些多模态数据进行跨模态学习,从而提升其在多个感知任务上的性能和表现。通过充分利用大模型的泛化能力、构建多模态数据集、解决融合和对齐问题,以及提供强大的计算资源支持。目前,大模型多模态已经成为人工智能企业关注的重点发展趋势,泛化能力也成为了形成完备的商业模式的关键能力之一。
多媒体革命,视听数据引领下一代模型发展
在第三季度,OpenAI也正式对Plus和企业计划的用户开放语音对话功能,让用户通过语音与ChatGPT进行交流,为用户提供了一种更自然和便捷的交互方式。用户可以使用不同的语言来与ChatGPT对话,它会根据用户的语音输入生成回应,并以用户选择的声音类型回复用户。
图源:网络
值得一提的是,语音聊天功能一经上线便吸引国内外广泛关注。在体验中大模型之家发现,目前ChatGPT的语音回复表现总体与4.0版本文本能力相当,并且可以通过换气、犹豫等行为使对答更加拟人。
图源:百度文心一言
目前,国内大模型厂商针对图像和声音领域也开始了广泛的布局,例如,在百度世界大会发布的百度文心大模型4.0在跨模态文生图方面取得了显著的进步。新版本的文心4.0充分发挥了其跨模态能力,让创作者们能够更加深入地探索文学和视觉艺术之间的互动。根据用户的的情感、主题和情感色彩来智能地选择和调整绘画风格,从而创造出与文本内容相契合的图像。
图源:企查查
除此之外,作为国内公开融资最高的大模型创业企业之一的智谱AI,今年已累计获得的融资超25亿元人民币,其基于GLM-130B模型开发的智谱清言(QAGLM)在视觉领域也展现出了强大的优势。
在大模型之家”AQUA专业大模型评估体系”的测评中,智谱清言能够从图像输入中提取关键信息,生成与图像内容相关的文本描述,该功能的应用前景非常广泛,从自动图像标注到视觉辅助等各种场景都可以利用。大模型的多模态能力,例如图像、视频和声音,为行业的商业化落地带来更多的可能。这些不同模态的数据类型不仅扩展了模型接触不同信息的范围,还促进了模型在不同领域的广泛应用。同时,这些数据类型的丰富性为模型提供了更多的上下文信息,包括视觉和声音元素,使得模型能够更好地理解和处理多感知信息问题。此外,声音和视频数据还被广泛用于自然语言处理任务,如语音识别和情感分析,拓宽了商业应用领域。
定制+微调,多场景支持填补商业需求
除了多模态能力以外,大模型泛化能力中多场景支持也更为重要。根据不同的应用场景和商业需求进行定制化和微调,才能实现更好的用户体验和商业效益。今年9月,360宣布360智脑大模型全面接入360全家桶,正式面向公众开放,用户可通过官方网站一站式登录360智脑app、360搜索、360安全浏览器、LoRA360、AI数字员工等大模型服务。
图源:360智脑
作为认知型通用大模型,360智脑4.0已经完全整合到360旗下的产品生态系统中,为用户提供广泛的智能服务。涵盖了搜索、浏览器、安全卫士、智脑APP等产品。如在360搜索中的智能对话搜索、360浏览器中的划词AI辅助功能、360安全卫士中的AI数字员工,以及智脑APP中的多语言数字人交流。
11月4日,360大模型“奇元大模型”通过备案落地,至此360公司也成为国内首家两个大模型均通过备案的科技企业。就大型模型的功能和应用而言,奇元大型模型商业化和产品定位主要针对B端用户,但未来将更加专注于商业化应用和特定领域,以协助用户提高工作效率。这也意味着“奇元大模型”将不断扩展其应用范围,以满足各种不同行业和领域的需求。帮助用户更有效地完成任务,提高工作效率。
360智脑4.0通过在不同场景中的应用增加产品的吸引力,帮助吸引更多用户,尤其是那些寻求全面解决方案的用户。也意味着产品可以进入不同的市场领域,拓宽市场覆盖范围,使公司能够针对不同用户群体提供智能解决方案,从而扩大市场份额。
大模型之家认为,多模态、多场景的支持对于提高用户体验和商业效益具有重要作用。大模型的整合能力和灵活性有助于拓展市场覆盖范围,满足不同用户群体的需求,以提供更多智能解决方案,从而增加市场份额。随着大型模型技术的不断进步和应用领域的扩展,将带来更多创新和机会,以提升商业效益和用户满意度。
开放性路径,扩充大模型商业蓝图
除了整合服务外,探索开放性升级的方式也引起了众多企业的关注。越来越多的企业提供更多不同参数规模的产品,以适应不同开发与部署环境的需求,让开发者和合作伙伴能够参与,共同创造新的应用和解决方案,这使得大模型的能力和应用范围向更多领域和行业扩展,以创造更多商业价值。
据了解,人工智能公司百川智能旗下大模型Baichuan2-192K现已正式开启内测,以API调用的方式开放给百川智能的核心合作伙伴,已经与财经类媒体及律师事务所等机构达成了合作。以开源大模型起家的人工智能公司,从上一代Baichuan-53B便开始尝试闭源大模型的发展路径。
图源:百川智能
百川智能也表示迭代产品Baichuan2-53B正式进军To B领域,开启商业化进程。Baichuan2-53B可为客户提供专业技术支持、培训和持续维护服务,协助客户克服挑战、不断提升技能水平,并保证模型性能持续改进,从而构筑稳固的客户信任基础,提升客户满意度。
除了百川智能以外,11月1日,vivo正式发布旗下自研通用大模型矩阵蓝心大模型BlueLM,同样以“矩阵”的形式发布,包含10亿、70亿、700亿、1300亿、1750亿共5个参数规模,能够分别对应不同的场景。其中,10亿、70亿量级模型专注于端侧场景,700亿模型则是面向云端服务的主力,1300亿和1750亿模型则将在更为复杂的场景中发挥作用,带来更加丰富的知识和推理能力。
目前,云端部署大模型仍然是行业的主流方案,其优势在于能够最小化设备算力的需求,也可以调用参数量级较大的模型。正因如此,在云端开发与部署大模型,打造云原生大模型在企业与大模型融合深度方面发挥关键作用。
阿里云作为中国最大的云计算平台之一,也提出一系列大模型部署解决方案。其中,MaxCompute大数据计算平台提供了多种数据处理和分析工具,如数据仓库、数据湖和机器学习平台等,这些工具通过阿里云的全球分布网络部署在多个数据中心,从而提高模型的可用性和性能。据了解,未来阿里巴巴所有产品都将接入通义千问大模型,进行全面升级。
图源:阿里云
与本地私有化不同,通过云端私有化定制的方式,用户可以在云环境中利用大型模型,并进行个性化的调整。借助云服务提供商的基础设施和资源,用户可以方便地进行模型的培训、微调和部署。这一方法有助于减少硬件和维护成本,同时使用户能够更具弹性地扩展他们的计算资源,以适应不断变化的需求。
此外,多重部署方式通过将模型分布在多个地理位置或数据中心,可以大幅度提高模型的可用性与容灾能力。这意味着即使一个地点或服务器发生故障,其他节点仍然可以提供服务,确保业务的连续性。
开放性路径、多模态能力以及多场景支持将继续推动大模型商业落地,为不同行业和领域的需求提供智能解决方案。在企业中,泛化能力高的模型可以用于支持决策制定和预测,从而提高业务流程的效率和质量。它们可以帮助企业更好地理解和利用数据,以做出更明智的战略决策。同时,企业可以更灵活地利用这些模型,开发各种应用,而不仅仅局限于单一领域。
原创文章,作者:王昊达,如若转载,请注明出处:http://damoai.com.cn/archives/1693