OpenAI开放三大实时音频模型:告别纯文本,AI智能体进入“实时听与做”时代

2026.05.08 12:18
2026年5月8日,OpenAI发布三款实时音频模型,涵盖复杂任务处理、跨语言沟通及实时语音识别功能,已上线测试平台,多家企业参与早期测试,定价各有不同。

2026年5月8日消息,美国当地时间周四,OpenAI正式向开发者推出三款全新音频大模型,以增强语音智能体交互的自然度及实时任务执行能力。

这三款模型分别是GPT-Realtime-2、GPT-Realtime-Translate以及GPT-Realtime-Whisper,目前均已在开发者测试平台上线。其中,GPT-Realtime-2专注于处理复杂任务,支持外部工具调用并保持语境连贯;GPT-Realtime-Translate可支持70余种源语言转换为13种目标语言;GPT-Realtime-Whisper则聚焦实时语音识别,能同步生成字幕并触发工作流更新。

Zillow、Priceline、德国电信等企业已开始对这些模型进行早期测试。定价上,GPT-Realtime-2的音频输入费用为每百万Token32美元起,GPT-Realtime-Translate每分钟0.034美元,GPT-Realtime-Whisper每分钟0.017美元。

作品声明:内容由AI生成

快报

更多

2026-06-23 23:06

国内部分商品期货夜盘收盘,油脂油料涨幅居前表现突出

2026-06-23 23:00

Meta推出299美元智能眼镜新系列,加倍押注AI硬件平台

2026-06-23 22:56

中国短剧行业走向精品化,一季度AI短剧占比达95%

2026-06-23 22:52

最新一批灯塔工厂一半在中国

2026-06-23 22:50

安德利:收购标的甬强科技市占率不足1%,但已具备M8级别及以上高速覆铜板产品的研发及生产能力

2026-06-23 22:49

孩子王公司递表港交所

2026-06-23 22:49

欧洲议会推进数字欧元计划,试图摆脱美国支付体系依赖

2026-06-23 22:34

滨化股份向港交所提交上市申请书

2026-06-23 22:33

2025年度审计工作报告发布,中央财政赤字与预算持平

2026-06-23 22:31

误报“北京海淀地震”预警,小米电视致歉:研发人员测试时操作失误

2026-06-23 22:28

英伟达市值跌破5万亿美元

2026-06-23 22:27

以色列与黎巴嫩新一轮会谈在美国启动

2026-06-23 22:18

微软美国威斯康星州数据中心投运

2026-06-23 22:17

何立峰在河南调研时指出:加快完善产业创新体系 持续推动外贸稳规模优结构

2026-06-23 22:15

美股量子计算概念股普涨,Infleqtion涨逾14%

2026-06-23 22:15

伊朗代表:霍尔木兹海峡已免费开放

2026-06-23 22:10

商务部副部长兼国际贸易谈判副代表凌激会见空客公司执行副总裁哈里森

2026-06-23 22:08

世界钢铁协会:5月全球粗钢产量同比下降0.3%

2026-06-23 22:05

SpaceX股价拉升涨超2%

2026-06-23 22:03

富时A50中国指数期货逆势走高