阿里通义开源音频语言模型Qwen2-Audio,支持语音问答及多元音频分析

大模型之家讯 8月13日,阿里通义宣布开源其大模型音频语言模型Qwen2-Audio。该模型具备直接进行语音问答的能力,可理解并分析用户输入的各类音频信号,包括人声、自然音及音乐等。此次开源举措有望推动音频语言处理技术的发展,为行业带来更多创新可能。

上一篇:

下一篇:

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注