阿里通义开源音频语言模型Qwen2-Audio，支持语音问答及多元音频分析

大模型之家讯 8月13日，阿里通义宣布开源其大模型音频语言模型Qwen2-Audio。该模型具备直接进行语音问答的能力，可理解并分析用户输入的各类音频信号，包括人声、自然音及音乐等。此次开源举措有望推动音频语言处理技术的发展，为行业带来更多创新可能。