Meta发布Seamless Communication系列AI翻译大模型，实现实时语音转换低于2秒延迟

志斌 • 2023年12月22日上午10:25 • 人工智能

大模型之家讯 Meta最新发布了一系列 AI 翻译大模型，命名为 Seamless Communication，标志性地实现了实时语音转换延迟不超过2秒的能力。该系列模型包括 SeamlessExpressive、SeamlessStreaming、SeamlessM4T v2 和 Seamless，其中前三个已经在 GitHub 上开源。

Meta发布Seamless Communication系列AI翻译大模型，实现实时语音转换低于2秒延迟

这些模型不仅具备跨语言语音复杂性的保留能力，而且能够模仿语气、语速、情感等细致特征，使得 AI 翻译更富有表现力。在技术架构方面，Meta 采用了非自回归架构，提高了模型的扩展性和鲁棒性，特别适用于流媒体场景。

核心算法 EMMA 能够智能决定何时已经拥有足够的信息来生成下一个语音片段或目标文本，同时采用了 UnitY2 等新架构来增强语音生成能力。为了解决翻译准确性的问题，Meta 引入了“毒性缓解”技术，在翻译生成过程中自动检测和调整生成的有毒单词，显著减少了翻译的“毒性”。

为了防止滥用风险，Meta 还为音频添加了水印，通过在音频中嵌入不可察觉的信号，可以准确追踪音频的来源，并对抗各种攻击手段。这一系列模型的开源不仅包括模型本身，还涵盖元数据、数据和数据对齐工具，其中元数据包括58.5万小时的语音文本对，是目前容量最大、语言覆盖最广的语音语料库之一。

Meta 的这一系列翻译模型在实时语音翻译领域取得了显著的突破，不仅提升了翻译速度，还注重模仿语音的表现力和保护用户隐私的技术手段。这一技术创新为未来语音翻译和交流领域带来了更加广阔的可能性。

原创文章，作者：志斌，如若转载，请注明出处：http://damoai.com.cn/archives/2683

赞 (1)

0 0

OpenAI 开放 ChatGPT 语音功能，用户可免费体验自然对话

上一篇 2023年12月22日

OpenAI CEO山姆·奥特曼：GPT-5计划2024年发布

下一篇 2023年12月25日

人工智能

百度智能云AI“打工人”天团上线，7款数字员工“落地即上岗”

大模型之家讯随着AI技术迅猛发展，新的算法、模型和应用不断涌现。当AI开始主动洞察需求、解决问题，成为独立的业务执行者，新一代数字员工应运而生，成为重构企业组织形态、驱动效率革…

志斌
2025年8月5日
人工智能

苹果在印度成了“开源手机”，但印度AI为什么还是扶不起来？

谁能想到，以供应链见长的库克，在即将卸任的前夕，竟然因为供应链泄密“翻了车”。近日，一个叫World Leaks的勒索软件组织，攻破了苹果在印度的核心供应商塔塔电子（Tata E…

何煦
2026年7月3日
作业帮编程全面升级，引入AIoT技术打造全新编程体验

大模型之家讯近日，作业帮编程宣布全面升级，引入创新的AIoT（人工智能物联网）技术，突破空间限制，重新定义软硬件编程交互体验。升级后，作业帮编程将采用“TAD”闭环服务模式，覆盖…

志斌
人工智能 2023年11月27日
阶跃 Step Image Edit 2 发布：单次出图低至 0.5 秒，小参数大能力，重新定义图像模型能效比

大模型之家讯阶跃今日正式推出新一代图像生成编辑模型 Step Image Edit 2，主打“小身材、大能力、快响应”，剑指轻量级图像编辑领域新标杆。 Step Ima…

志斌
人工智能 2026年4月29日
人工智能

阿里Qoder发布Quest 1.0智能体，丁宇称AI编程进入自主进化时代

大模型之家讯 2026年1月14日，阿里巴巴旗下Qoder团队正式上线Quest 1.0智能体。该智能体具备自我学习与快速进化能力，可在无需用户干预的情况下，自主理解需求、规划技术…

志斌
2026年1月15日
人工智能

大模型+数字人始于电商直播，发展于千行百业

“只需几分钟的训练素材视频和1000美元成本，品牌方就能实现全天候直播售卖产品。”中国的AI数字人技术深度赋能电商产业，实现全天候直播。近日，《麻省理工科技评论》发表了文章《De…

赵小满
2023年10月10日
腾讯AI的“温良恭俭让”：是战略深耕，还是底气不足？

在近两年中国AI版图中，腾讯云不卷Token价格战，不参与开源模型的军备竞赛，甚至在对外口径中刻意淡化模型本身的参数。虽然这种“克制”被官方解读为“务实”与“工程优先”，但从商业博…

何煦
人工智能 2026年3月29日
人工智能

文心X1 Turbo获信通院当前最高评级逻辑代码双满分

大模型之家讯 5月20日，中国信通院发布大模型推理能力评估结果。结果显示，百度文心X1 Turbo在24项能力评估中，16项达5分、7项达4分、1项达3分，综合评级获当前最高级“4…

志斌
2025年5月20日
人工智能

文心大模型如何保障安全防线？百度副总裁陈洋详解

大模型之家讯 12月21日，“云融未来，安全内在”第七届云安全联盟大中华区大会（CSA GCR Congress）在深圳圆满举办。百度副总裁陈洋出席大会并围绕“安全大模型”+“大模…

志斌
2023年12月27日
人工智能

晶圆未出厂，主帅已易帜：Anthropic在IPO前夜，拆掉了OpenAI的硬件地基

6月6日，OpenAI自研芯片项目002号员工Clive Chan在X平台宣布，自己已经正式加入Anthropic。如果放在普通科技公司，这或许只是一次再正常不过的人才流动。但放…

志斌
2026年6月8日

发表回复

登录后才能评论

志斌

数码科技领域深耕多年的专业管理者与技术服务专家，现任大模型之家主编、速途网资深编辑、元宇宙研究院分析师。专注于人工智能、消费电子与IDC行业的深度报道，凭借广泛科技圈人脉，包括媒体、公关、分析师及企业高层，持续引领行业洞察与分析。商务合作咨询： Qiaodao007

1.5K posts

0 comments