AQUA实测腾讯混元大模型：拥抱大模型从生态做起

“我们正在加大投资人工智能模型，为我们的产品赋予新的功能，并提升对内容和广告的精准推荐能力。我们不仅致力于将领先的人工智能能力定位为自身业务发展的倍增器，也让其为我们的企业客户，乃至整个社会创造价值。”腾讯董事会主席兼首席执行官马化腾在2023年第三季度财报中表示。

据悉，腾讯本季度总收入为人民币1546亿元，同比增长10%。同时财报中还表示，腾讯正在升级自研基础模型腾讯混元，将其部署到内部产品中，并向外部企业客户开放使用。

随着混元大模型的发布，腾讯也正式将全面拥抱大模型作为未来的发展方向。目前我国人工智能市场大模型数量已经趋于饱和，如何通过大模型为企业开辟商业化路径，为用户赋能实际生产生活新方式已经成行业新的竞争高地。

图源：大模型之家

对此，大模型之家将依照《人工智能大模型产业创新价值研究报告》提出的“AQUA”评价体系，从模型能力、任务处理能力、应用生态等六个维度对腾讯混元大模型展开多角度全方位的评测。

模型能力

模型规模：混元大模型的参数规模超过千亿，是目前国内最大的中文语言模型之一。模型规模的提升可以持续提高模型的泛化能力和通用能力，使模型能够处理更多的场景和任务。
训练数据量：混元大模型的预训练语料超过2万亿tokens，覆盖了多个领域和主题的中文文本。训练数据量的增加可以提升模型的语言理解和生成能力，使模型能够学习到更丰富和更深层的语言知识。训练数据量是大语言模型优化的关键，可以为模型提供更多的语言样本和语言规律，提高模型的质量和效果。
训练算力：混元大模型采用了腾讯自研的训练框架和优化策略，利用腾讯云的高性能计算集群，实现了低成本、高效率的大模型训练。训练算力的提升可以缩短模型的训练时间，提高模型的训练质量，使模型能够快速迭代和优化。训练算力作为大语言模型实现的基础，为大模型带来更多的计算资源和计算能力，提高模型的性能和稳定性。

任务处理能力

通过AQUA任务处理能力测试环节，大模型之家发现混元大模型具有非常出色的联系上下文能力，混元大模型能够理解并保持对整个对话历史的把握。其上下文理解能力使得模型能够准确解读前文的语境，从而更好地回应用户的提问。

图源：混元大模型

再对评测问题的“追问”，混元大模型不仅可以给出正确的答案还可以在接下来的多轮对话中丰富用户的需求，这样的模型能够保持一致性，确保在整个对话过程中回答的信息不产生矛盾。可以灵活地适应对话中的变化，处理新引入的信息，能够在对话的不同轮次中保持一致的语境。使得混元大模型更具智能，并且在复杂的任务中表现更为出色。

从混元大模型的任务处理表现上可以看出，模型在训练中使用了大规模的数据集，使其能够涵盖多样的语境和主题，从而更全面地理解不同领域的知识。通过广泛训练思路帮助模型在处理各种领域和主题的对话时表现得更为灵活和全面。大模型通常采用先进的注意力机制，能够在处理长文本序列时更好地关注重要的部分，确保对话的一致性和准确性。

图源：混元大模型

值得一提的是混元大模型在一轮对话中还设置了清除上下文关联功能，通过此功能可以让使用者快速的校准在对话出现问题或错误的情况，对于需要精准回答当前问题而不受先前对话历史影响的场景，清除上下文关联功能有助于控制对话的方向，确保模型专注于当前上下文而不被过去的信息干扰。

图源：混元大模型

同时，该功能可以让混元大模型更独立于先前的语境，从而提高模型对于不同问题和场景的适应性和鲁棒性。

图源：混元大模型

在测试中，大模型之家还发现混元大模型基本上在所有的回答后都会给出相应的扩展内容，特别是在客观选择题上，都会给出正确的答案以及各个选项的解释。在内容创作方面，混元大模型生成的答案不会吝惜文字，在目前市场上的同类产品具有很强的竞争力。

泛化能力

在泛化能力上，混元大模型可以通过语音、文字、图片等多种方式与用户交互，根据用户的需求，提供相应的输出方式增加用户的沟通效率和体验，适应不同的场景和设备。混元大模型可以对多种模态的信息进行理解和生成，如图文对齐、图像描述、图像检索、图像问答、图像摘要、图像分类等。

混元大模型AI创意展示

图源：混元大模型

除多模态能力外，在多场景支持领域，混元大模型目前支持如文档场景、会议场景、广告场景和营销场景应用，可以提供文档创作、文本润色、文本校阅、表格公式及图表生成、智能问答、文本摘要、文本分类等能力，提高场景的适应性和效率。

混元大模型会议场景

应用应用拓展能力

混元大模型不仅可以作为基底模型，为不同产业场景构建专属应用，还可以作为基础设施，支持腾讯的各种产品和应用能力。目前，腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等超过50个腾讯业务和产品，已经接入腾讯混元大模型测试，并取得初步效果。

其中，腾讯会议通过接入混元大模型实现了会前、会中、会后全流程的体验重塑，从而有效提升了会议的效率和质量。这也代表混元大模型在应用拓展方面具备卓越的能力，能够为各类产品和服务提供更为智能、高效、丰富的体验。这表明混元大模型在腾讯多元化业务生态中发挥着关键的角色，并为不同业务领域的需求提供了有效的解决方案

开放性指标

在开放性指标中，腾讯云业务也为混元大模型带来多重部署方式，面向丰富的业务场景，提供整套行业和技术解决方案。混元大模型作为腾讯云的核心产品之一，腾讯云业务提供的高性能计算资源为大模型的训练和推理提供了强有力的支持。

图源：大模型之家

通过与腾讯云的其他产品和服务相结合，实现多语言、多模态、多场景的泛化能力，为用户提供更智能、更便捷、更有趣的体验，促进产品和服务的创新。同时，腾讯云还可以提供多层次的安全措施，包括数据加密、访问控制等助力数据安全和隐私保护。

大模型之家认为，腾讯的庞大用户基础为腾讯在人工智能时代提供了先天性的资源优势。腾讯拥有超过10亿的通信和社交用户，以及超过1亿的视频、音乐、文学等数字内容用户，通过汇聚来自各种业务领域的庞大用户群体的数据，能够为混元大模型提供丰富、多样的训练样本，从而提升模型的训练效果和泛化能力。这样的数据基础为模型的智能化和个性化提供了有力的支持，使其能够更准确地理解用户需求和行为。

原创文章，作者：王昊达，如若转载，请注明出处：http://damoai.com.cn/archives/2543