昆仑万维发布 Mureka V7.5 与 MoE-TTS 技术

志斌 • 2025年8月15日下午3:13 • 人工智能

大模型之家讯 8 月 15 日，昆仑万维宣布正式上线音乐生成模型 Mureka V7.5，标志着其 SkyWork AI 技术发布周收官。与此同时，公司语音团队推出了基于 Mixture of Experts（专家混合）架构的描述性语音合成框架 MoE-TTS。

昆仑万维发布 Mureka V7.5 与 MoE-TTS 技术

Mureka V7.5：中文音乐生成能力升级

据介绍，Mureka V7.5 在中文歌曲生成的音色、演奏技法、咬字与情感表现方面均有提升。模型在传统民歌、戏曲、华语流行及当代民谣等曲风上具备更深的理解能力，能够更准确地还原中文音乐的韵律与情感特征。

昆仑万维发布 Mureka V7.5 与 MoE-TTS 技术

此次升级还引入了针对中文歌曲特性的 ASR（自动语音识别）优化，用于更精确地识别歌词内容、气息运用、情感变化和演唱细节。通过智能划分乐句与停顿位置，并结合精确的乐段识别，生成的人声在自然度、呼吸感和结构清晰度上更接近真人演唱，尤其在处理中文韵律和气息时效果突出。

MoE-TTS：面向自然语言描述的语音合成框架

昆仑万维发布 Mureka V7.5 与 MoE-TTS 技术

在语音技术方向，昆仑万维推出 MoE-TTS，定位于开放描述（Out-of-domain Descriptions）场景的研究型语音合成框架。该技术允许用户以自然语言描述声音特征（如“清澈的少年音带磁性尾韵”）来精准控制声音风格。

昆仑万维发布 Mureka V7.5 与 MoE-TTS 技术

MoE-TTS 结合预训练大语言模型（LLM）的文本处理能力与语音专家模块（Speech Expert Modules），通过模态路由实现文本与语音的独立优化，并在冻结文本参数的同时对齐跨模态信息，从而提升对复杂修辞和开放语义的泛化理解能力。

昆仑万维发布 Mureka V7.5 与 MoE-TTS 技术

在域内与域外的双测试集评测中，MoE-TTS 在风格贴合度（SEA）和整体贴合度（OA）等指标上优于部分主流闭源 TTS 系统。昆仑万维计划将 MoE-TTS 集成至 Mureka-Speech 平台，作为角色配音的基座模型向全球开发者开放。

通过 Mureka V7.5 与 MoE-TTS 的发布，昆仑万维在音乐与语音生成领域同时推进模型能力与应用场景，为后续在数字人、虚拟助手和沉浸式内容创作方向的落地提供技术基础。

原创文章，作者：志斌，如若转载，请注明出处：http://damoai.com.cn/archives/12354

赞 (0)

0 0

科技无界·健康随行：越凡医疗开启穿戴式健康新纪元

上一篇 2025年8月15日下午1:42

千亿市场国产化！紫光汉图X商汤日日新：多模态AI打造“会判作业”的打印机

下一篇 2025年8月15日下午3:39

人工智能

上海银行携手商汤科技打造AI数字员工，助力银发群体跨越“数字鸿沟”入选ITU全球AI for Good案例集

大模型之家讯近日，在瑞士日内瓦举办的联合国机构国际电信联盟（ITU）信息社会世界峰会二十年审议（WSIS+20）高级别活动和“人工智能向善”（AI for Good）全球峰会上，…

志斌
2024年6月12日
人工智能

真人与数字人深情对唱，福布斯中国集团高管点赞，商汤如影数字人上演“舞台秀”

大模型之家讯在近期举办的2023福布斯中国创新力企业国际投资大会上，商汤科技基于大模型技术，通过商汤如影AI视频生成平台，为福布斯中国集团首席战略官晏格文（Graham Earn…

志斌
2024年2月1日
人工智能

英伟达发布AI领域最强GPU，支持27万亿参数超级AI算力方案亮相

大模型之家讯在当地时间3月18日的演讲中，英伟达的黄仁勋发表了题为《见证AI的变革时刻》的主题演讲，介绍了英伟达在最新研发进展方面的成果。他围绕五大板块，分别是新的产业发展、Bl…

志斌
2024年3月19日
人工智能

传长城旗下毫末智行已停工解散，巅峰期员工过千人

大模型之家讯据速途网爆料称，据知情人士爆料，由长城控股，高瓴，高通等投资的智驾公司毫末智行今日下午突然通知，员工24日（周一）起不用到岗上班，该事项为HR传达，目前赔偿机制等后续…

志斌
2025年11月24日
人工智能

华为做加法、OpenAI做减法，谁能见证AI硬件的“iPhone”时刻？

随着AI行业曾经硝烟弥漫的“百模大战”逐渐鸣金收兵，头部格局初定，科技巨头们不再执着于参数的军备竞赛，而是开始疯狂寻找落地的行业触点：在B端追求极致的降本增效；在C端则追求挖掘那个…

志斌
2026年2月4日
人工智能

昆仑万维开源Skywork R1V多模态推理模型，引领视觉思维链创新

大模型之家讯 3月18日，昆仑万维正式宣布开源首款工业界多模态思维链推理模型Skywork R1V，并同步发布了模型权重及技术报告。该模型的相关资源已在Hugging Face与G…

志斌
2025年3月18日
人工智能

商汤Seko深度测评：能听懂话、说改就改，一句话“拍”出科幻大片

最近影视圈都在聊“AI缩短创作链路”，但真正用过才知道，有些工具是噱头，有些是真能让普通人创造无限的。这几天被朋友安利了个超有意思的AI工具——商汤刚出的Seko，说能凭一句话生…

杨金旭
2025年7月21日
百度发布2024Q4及全年财报：AI驱动业绩飙升，文心大模型调用量一年暴增33倍

大模型之家讯 2月18日晚，百度发布2024年第四季度及全年财报，显示全年总营收达1331亿元，归属百度核心的净利润达234亿元，同比增长21%。财报披露，2024年12月，文心大…

志斌
人工智能 2025年2月18日
宁畅发布千卡级别算力集群，引领AI基础设施革新

大模型之家讯日前，宁畅信息技术有限公司正式发布了一项创新性的“全栈全液”AI基础设施方案，该方案以其强大的计算能力和液冷技术，为人工智能领域的发展注入了新的活力。据了解，该方案…

志斌
人工智能 2024年6月3日
人工智能

小米开源首个端到端语音大模型：MiMo-Audio

大模型之家讯 9月19日，小米宣布开源其首个原生端到端语音模型——Xiaomi-MiMo-Audio。这一模型基于自研预训练架构和规模超过亿小时的语音数据，在语音领域率先实现了基于…

志斌
2025年9月19日

发表回复

登录后才能评论