OpenAI重磅发布GPT-4o系列语音模型：重塑AI智能体未来格局

志斌 • 2025年3月21日下午2:18 • 人工智能

大模型之家讯美东时间周四，OpenAI举行技术直播，推出三款新语音模型：语音转文本模型GPT-4o Transcribe和GPT-4o MiniTranscribe，以及文本转语音模型GPT-4o MiniTTS。这些模型在前代基础上取得显著进步，进一步接近OpenAI的AI智能体愿景。

GPT-4o MiniTTS文本到语音模型能够生成更细腻、逼真的语音，并具备更高的可控性。开发者可以使用自然语言指示模型的语音风格，例如“像疯狂的科学家一样说话”或“以平静的声音说话”。OpenAI在官网提供了六种不同语气的示例，产品人员杰夫·哈里斯表示，目标是让开发者定制语音体验和环境。

在语音转文本方面，GPT-4o Transcribe和GPT-4o MiniTranscribe的准确度明显高于之前的Whisper模型。新模型经过多样化、高质量音频数据集训练，能够更好地捕捉口音和不同语音，即使在嘈杂环境中也能表现出色。OpenAI表示，新模型在多种语言中的词错误率更低，幻觉概率也有所降低。哈里斯强调，确保模型的准确性对于获得可靠的语音体验至关重要。

这些模型的发布符合OpenAI构建AI智能体的愿景，即开发能够代表用户独立完成任务的自动化系统。产品主管奥利维尔·戈德曼指出，未来几个月将会看到越来越多的AI智能体出现，帮助客户和开发者利用有用、可用且准确的智能体。

与之前的Whisper模型不同，OpenAI并不打算公开发布新的转录模型。哈里斯表示，GPT-4o Transcribe和GPT-4o MiniTranscribe比Whisper大得多，不适合公开发布。他强调，开源发布需要深思熟虑，确保模型针对特定需求。

原创文章，作者：志斌，如若转载，请注明出处：http://damoai.com.cn/archives/9661

赞 (0)

0 0

亚马逊云科技获评IDC 2025年全球公有云基础设施即服务“领导者”

上一篇 2025年3月21日

2025三星家电新品发布会举行，全面升级“有AI的科技∙艺术∙家”

下一篇 2025年3月21日

资讯

荣耀300系列重磅发布里程碑之作引领档位越级进化

大模型之家讯 2024年12月2日，全新一代荣耀300系列正式发布，新潮的环球旅拍发布会不仅展现了荣耀追求极致的创新理念，也标志着数字系列迎来科技体验以及美学设计的巨大升级。凭借荣…

志斌
2024年12月2日
资讯

国培云网与商予科技携手共进，徐冰增持股份彰显信心

大模型之家讯近日，飞利信旗下全资子公司北京国培云网科技有限公司与商汤旗下商汤科技院校业务开展单位商予科技(北京)签署人工智能领域合作协议，此举标志着双方将依托各自的企业优势，在人…

王昊达
2024年9月20日
资讯

华为全场景新品大放异彩再领科技新风尚

大模型之家讯 10月18日，为期三天的中国国际消费电子博览会(CICE)在青岛国际会展中心(红岛馆)盛大启幕。本次博览会以“绿色领航数链未来”为主题，吸引了全球消费电子行业的顶尖…

志斌
2024年10月19日
资讯

“收割”低幼，摩笔天书葫芦里卖的什么药？

在家庭场景中，AI与教育的结合，远不是为了”寓教于乐”…… 日前，大模型之家注意到，摩尔线程旗下AI多模态创作工具“摩笔天书”正式对外开放邀请测试。据悉，“摩笔天书”…

欧玉娇
2024年1月24日
资讯

云智一体战略新增“生态繁荣”，百度智能云建立大模型全链路生态支持体系

百度智能云已建立起国内最繁荣的AI原生产业生态。

志斌
2023年10月18日
资讯

真我Neo7 SE正式发布，天玑8400游戏神机国补价1530元起

大模型之家讯 2 月 25 日，真我举办新品发布会，正式推出 ” 耐玩战神，续航超神 ” 的真我 Neo7 SE。其搭载天玑 8400-MAX，配备 700…

志斌
2025年2月25日
人工智能

深圳站WOT全球技术创新大会2023，精彩即将开启！

前几天刷屏的“中国大模型「顶流群聊」笔记”想必很多人都看到了，包括百川智能创始人&CEO王小川，创新工场董事长、零一万物创始人李开复，澜舟科技CEO周明在内的20多位中国大…

赵小满
2023年9月11日
人工智能

2023红人新经济发展报告：数字化红利涌现市场已突破5.5万亿

8月18日，艾瑞咨询联合红人新经济平台天下秀发布了《2023年中国红人新经济行业发展报告》。报告指出，随着数字基础设施的不断完善以及AIGC等新技术对内容生产的颠覆，红人新经济生态…

赵小满
2023年8月18日
商汤科技在香港部署“日日新粤语大模型”

大模型之家讯近日，商汤科技在香港科技园公司的高效能运算（HPC）服务平台部署了“日日新粤语大模型”（下称粤语大模型），为行业内首批在香港本地智能计算中心部署运行的大模型。商汤5…

志斌
资讯 2024年11月26日
资讯

AI手机看荣耀：荣耀MagicOS 9.0正式发布，开启手机自动驾驶新时代

大模型之家讯 10月23日，荣耀在MagicOS 9.0发布会及开发者大会上正式发布行业首个搭载智能体的个人化全场景AI操作系统——MagicOS 9.0，推出全新自研魔法大模型家…

王昊达
2024年10月23日

发表回复

志斌

数码科技领域深耕多年的专业管理者与技术服务专家，现任大模型之家主编、速途网资深编辑、元宇宙研究院分析师。专注于人工智能、消费电子与IDC行业的深度报道，凭借广泛科技圈人脉，包括媒体、公关、分析师及企业高层，持续引领行业洞察与分析。商务合作咨询： Qiaodao007

1.0K posts

0 comments