‌香港中文大学(深圳)与趣丸科技联合研发语音大模型MaskGCT开源

大模型之家讯 10月24日,香港中文大学(深圳)与趣丸科技联合研发的语音大模型“MaskGCT”正式在Amphion系统中开源,面向全球用户开放使用。该模型采用掩码生成模型与语音表征解耦编码的创新范式,在声音克隆、跨语种合成、语音控制等任务中展现出卓越性能。据悉,MaskGCT在三个TTS基准数据集上都达到了SOTA效果,性能超越当前最先进的同类模型,部分指标甚至超越人类水平,展现了强大的技术实力和应用潜力。

上一篇:

下一篇:

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注