大模型之家讯 中国电信人工智能研究院(TeleAI)发布业内首个支持30种方言自由混说的语音识别大模型星辰超多方言语音识别大模型,打破单一模型只能识别特定单一方言的困境,可同时识别理解粤语、上海话、四川话、温州话等30多种方言。据了解,中国电信人工智能研究院已构建超30种,超30万小时的高质量方言数据库,首创“蒸馏+膨胀”联合训练算法,解决超大规模多场景数据集和大规模参数条件下,预训练坍缩的问题,实现1B参数80层模型稳定训练。
大模型之家讯 中国电信人工智能研究院(TeleAI)发布业内首个支持30种方言自由混说的语音识别大模型星辰超多方言语音识别大模型,打破单一模型只能识别特定单一方言的困境,可同时识别理解粤语、上海话、四川话、温州话等30多种方言。据了解,中国电信人工智能研究院已构建超30种,超30万小时的高质量方言数据库,首创“蒸馏+膨胀”联合训练算法,解决超大规模多场景数据集和大规模参数条件下,预训练坍缩的问题,实现1B参数80层模型稳定训练。