上海 AI 实验室等开源音频和语音生成工具包 Amphion

大模型之家讯上海 AI 实验室、香港中文大学数据科学院、深圳大数据研究院联合开源了一个名为 Amphion 的音频、音乐和语音生成工具包。

Amphion 可帮助开发人员研究文本生成音频、音乐等与音频相关的领域，可以在一个框架内完成，以解决生成模型黑箱、代码库分散、缺少评估指标等难题。据悉，Amphion 包含了数据处理、通用模块、优化算法等基础设施。同时针对文本到语音、歌声转换、文本到音频生成等任务，提供了特定的框架、模型和开发说明，还内置了各类神经语音编解码器和评价指标。

上海 AI 实验室等开源音频和语音生成工具包 Amphion

发表回复