上海 AI 实验室等开源音频和语音生成工具包 Amphion

大模型之家讯 上海 AI 实验室、香港中文大学数据科学院、深圳大数据研究院联合开源了一个名为 Amphion 的音频、音乐和语音生成工具包。

Amphion 可帮助开发人员研究文本生成音频、音乐等与音频相关的领域,可以在一个框架内完成,以解决生成模型黑箱、代码库分散、缺少评估指标等难题。据悉,Amphion 包含了数据处理、通用模块、优化算法等基础设施。同时针对文本到语音、歌声转换、文本到音频生成等任务,提供了特定的框架、模型和开发说明,还内置了各类神经语音编解码器和评价指标。

上一篇:

下一篇:

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注