全球首款音乐推理大模型Mureka O1评测:AI音乐的“DeepSeek时刻”?

全球首款音乐推理大模型Mureka O1评测:AI音乐的“DeepSeek时刻”?

AI音乐生成终于迎来了“Deepseek 时刻”。

随着AIGC技术的飞速发展,音乐创作正迎来前所未有的变革。在这股浪潮中,昆仑万维近年来不断加码AI音乐领域,从去年4月推出国内首个可公开使用的AI音乐生成大模型——Mureka V1(SkyMusic),其技术布局逐渐清晰。

3月26日,昆仑万维发布了全球首款音乐推理大模型Mureka O1和基础模型Mureka V6。Mureka V6引入自研 ICL(in-context learning)技术,使得声场更加开阔,人声质感和混音设计进一步强化;Mureka O1是基于V6的CoT思维链过程优化版本,在推理过程中加入思考与自我批判,提升音乐品质。

全球首款音乐推理大模型Mureka O1评测:AI音乐的“DeepSeek时刻”?

官方表示,在最新的音乐评测中,Mureka O1展现出卓越的音乐品质,在最终的整体听感评测超过了Suno V4。其中乐器演奏法多样性和配器设计方面明显超越Suno V4,Mureka O1在音质、人声质感及BGM质感上实现了显著提升。这不仅是Mureka自身产品能力的跃迁,也意味着AI音乐创作技术正逐步向更高质量、更具艺术性的方向迈进。

全球首款音乐推理大模型Mureka O1评测:AI音乐的“DeepSeek时刻”?

技术跃升:ICL与CoT改变AI音乐创作

Mureka V6的核心创新点在于ICL技术的引入。传统AI音乐模型往往受限于固定的生成模式,而ICL的核心能力在于能够根据输入的上下文信息动态调整音乐的结构和情感表达。这使得V6在模拟乐器层次分布、混音细节方面有了长足进步,特别是在生成交响乐和流行歌曲时,能够有效避免AI生成音乐中常见的“扁平化”问题,提升整体空间感和音色层次。

相较于V6,Mureka O1的突破更具前瞻性。O1采用了全球首个应用于音乐生成的CoT(Chain of Thought)机制,即MusiCoT。与传统自回归模型逐步生成音频不同,MusiCoT在生成细粒度音频token前,先预生成整体音乐结构,使得最终生成的音乐更加连贯、精准。在实际应用中,O1能够基于输入的情绪关键词,如“悲伤、雨夜”等,先分析节奏模式,再通过多轮推理优化和声结构及旋律走向。这种“思考式”生成方式,使得O1在减少突兀风格转变、提升逻辑连贯性上表现突出。

这意味着,当用户输入诸如“悲伤、雨夜”等描述时,O1会先分析情绪关键词和节奏模式,再通过多轮迭代优化和声结构及旋律走向。与传统AI音乐系统常见的突兀风格和逻辑断裂问题不同,O1能够有效降低这些问题的发生,使音乐生成更加流畅和自然。

全球首款音乐推理大模型Mureka O1评测:AI音乐的“DeepSeek时刻”?

Mureka团队还开放了开放O1的完整技术报告(《Analyzable Chain-of-Musical-Thought Promptingfor High-Fidelity Music Generation》),也让我们能够一窥Mureka背后的秘密。

该论文详细描述了CoT在音乐生成中的应用架构、训练策略以及消融实验结果。例如,在MBPP编程推理任务中,O1通过CoT机制使得错误率下降了40%。这一成果不仅增强了模型的透明度,也为学术界和开发者提供了可复现的研究路径。

全球首款音乐推理大模型Mureka O1评测:AI音乐的“DeepSeek时刻”?

实测:思维链能力惊艳、音乐能当Prompt

从技术升级的角度来看,Mureka在基础模型能力上取得了不小的提升,而当这些新特新用于音乐创作时,又回带来什么新的体验呢?

全球首款音乐推理大模型Mureka O1评测:AI音乐的“DeepSeek时刻”?

在全新升级的Mureka中,提供了“简单模式”与“高级模式”两种音乐创作的方式。在“简单模式”下,用户只需要用自然语言描述想要创作的内容与风格,Mureka会全部自主地完成作词、谱曲、以及后期音乐生成的全部步骤。

在Mureka V6全新升级的“场景描述提示词库”的加持下,用户可以更精确地控制生成音乐的风格和情感。例如当我们输入“咖啡厅午后的爵士乐”时,系统则会生成慵懒的萨克斯旋律和摇摆节奏。(下方的《午后的爵士乐》,便是基于Mureka V6的功能所创作)可以说,在简单模式下,即使是零基础的小白,也能随时创作一首即兴的音乐,用AI技术实现了音乐创作的普惠。

不过,对于专业的音乐创作人而言,想要创作效果更好的音乐,需要更多的可操作的空间,而Mureka的“高级模式”则提供了更丰富的选择。

全球首款音乐推理大模型Mureka O1评测:AI音乐的“DeepSeek时刻”?

在高级模式中,Mureka不仅为用户提供了手动输入标题和歌词的空间,同时还提供了参考歌曲、选择歌手、歌曲描述、旋律动机等选项,帮助用户更为精准地把控音乐创作的风格与细节。

全球首款音乐推理大模型Mureka O1评测:AI音乐的“DeepSeek时刻”?

在“选择歌手”菜单下,用户不仅可以选择Mureka软件中已经内置好的歌手,还提供了上传音频的选项,能够实现AI音色克隆,精准模拟歌手音色,一键生成个性化专属作品。

全球首款音乐推理大模型Mureka O1评测:AI音乐的“DeepSeek时刻”?

而在“歌曲描述”方面,用户可以通过直接输入文字,或是系统提供的选项,快速调整歌曲的曲风、情绪、人声的性别。而在选框的下方,Mureka则会利用AI,主动基于对于用户输入内容,匹配对应的风格关键词,让用户对于生成的风格有更为直观的理解。

全球首款音乐推理大模型Mureka O1评测:AI音乐的“DeepSeek时刻”?

不仅如此,除了常规的文字提示词外,Mureka全新上线的“旋律动机”功能,更是能让用户通过输入一小段旋律作为创作的“提示词”,辅助完成创作。

全球首款音乐推理大模型Mureka O1评测:AI音乐的“DeepSeek时刻”?

那么我们就用Mureka V6,来做一首《法厄同之歌》。(歌词来源于网络,非Mureka创作)

歌词:

[Verse]

法厄同呀法厄同

降临在空洞

法厄同呀法厄同

指引盗洞客

法厄同呀法厄同

绳匠的传奇!绳网的传奇!新艾利都的传奇!

[Chorus]

绿色的眼睛射激光

呼啦一下大楼全部融化啦

黑白耳朵晃一晃

听到空洞里的老鼠在搬家

恶名以骸不听话

抬起小腿一脚踹飞脑袋瓜

哭泣女孩想回家

举起小手一挥空洞开门啦

[Verse]

抡动千斤大锤柄

坏蛋连盔带甲砸成煎蛋饼

扛起导弹发射筒

恶徒飞出空洞挥手不用送

法厄同大人,法厄同大人!

红色的领巾随风飘扬

[Bridge]

有谁不服气?有谁不服气?还有哪个以骸不服气?

[Outro]

法厄同呀法厄同

主宰新艾利都

法厄同呀法厄同

拯救盗洞客

法厄同呀法厄同

这首《法厄同之歌》的歌词写得比较无厘头,这也考验了模型对于歌词内容以及情感的理解能力。同时,“法厄同”三个字对于不少AI音乐创作软件而言,极易发生吐字不清晰的状况,这也考验了模型发音的准确程度。在生成的音乐中,我们可以听到Mureka V6在吐字发音方面成功避开了歌词中易出错的点,而在旋律的完整性上,Mureka V6也可能根据给出的主歌(Verse)、副歌(Chorus)等章节匹配出完整且连贯的旋律,效果令人惊艳。

全球首款音乐推理大模型Mureka O1评测:AI音乐的“DeepSeek时刻”?

但这显然并没有结束,在大模型之家测试用更高级的Mureka O1来作曲时,更为神奇的事情法发生了。

从生成的音乐可以听出,由Mureka O1创作的整首音乐有了更加细腻的表达,不仅在旋律上引入了快慢拍来区分舒缓与急切的场景,形成反差;歌曲中还会为不同桥段匹配不同风格,例如在歌曲中加入说唱的演绎风格(音乐0:45),让整首歌更符合都市风的创作背景。

众所周知,音乐的创作即是创作者情绪的表达,而Mureka O1在情感的细腻程度上,显然上了一个台阶。(对得起5倍于V6的价格)

这一功能使得Mureka相比于Suno,能够提供更加丰富和直观的创作指导,尤其对于专业创作者而言,其能够上传现有旋律片段作为提示词,进一步提升创作的自由度与精准度。

全球首款音乐推理大模型Mureka O1评测:AI音乐的“DeepSeek时刻”?

除了功能上的提升,Mureka还提供了音频局部编辑、延长,为用户提供了更大创作自由度,甚至音轨分离功能还允许用户一键导出独立的音轨文件,如人声、主乐器和和弦伴奏等。这一功能在影视配乐、游戏音频设计等领域的应用,可以大幅提高创作效率。

全球首款音乐推理大模型Mureka O1评测:AI音乐的“DeepSeek时刻”?

如果你的需求过于“刁钻”,Mureka还提供人性化的API服务。Mureka是全球首批开放API服务的AI音乐生成平台,还提供了模型微调API,允许企业根据自有版权曲库,训练定制的专属风格模型。

AI音乐的未来:从工具到生态

技术演进的背后,是AI音乐产业生态重塑的写照。Mureka V6&O1不仅提升了AI音乐的音质和结构复杂度,还推动了行业多样化。通过开放API和技术共享,其影响力已超越工具本身,迈向生态构建。

目前,Mureka已进入全球市场,用户来自在100多个国家和地区。在欧美,AI音乐正渗透至制作和发行环节。数据显示,2023年全球DAW市场规模达30亿美元,预计2026年70%的DAW企业将采用AI辅助创作,这些数据显示,AI音乐不仅是创作工具,更在B端展现商业价值,预示着AI音乐正成为产业变革的核心动力。

Mureka O1的推出,使AI音乐从“数据驱动生成”迈向“思考式创作”,提升艺术性与可控性,同时推动行业标准建立,在游戏、视频、短剧、影视等行业均有着广阔的应用空间。随着全球开发者生态的完善,Mureka正成为AI音乐领域的引领者,连接全球的音乐创作者、企业与用户。

这一切,都昭示着AI音乐的“DeepSeek时刻”或许已经到来。

原创文章,作者:志斌,如若转载,请注明出处:http://damoai.com.cn/archives/9743

(1)
上一篇 5天前
下一篇 5天前

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注