谷歌Gemini3.5 Live Translate上线:70+语言实时互译,保留原音韵律延迟仅数秒

2026.06.09 23:48
6月9日谷歌发布Gemini3.5 Live Translate实时语音互译模型,支持70余种语言,采用流式处理实现数秒延迟下的连续输出,保留说话者语调、语速与音高。开发者即日起可试用API,企业用户本月可在Google Meet体验,普通用户将通过移动端翻译应用使用,安卓端新增聆听模式。

跨语言沟通时,传统实时翻译系统往往因延迟高、对话易中断或丢失说话者的情感特征,影响沟通效率与体验。6月9日晚,谷歌正式推出Gemini3.5 Live Translate实时语音互译模型,正是为了解决这些长期困扰行业的问题。

这款模型支持70多种语言的识别与自然语音翻译,核心优势在于采用流式处理技术——不同于传统轮流翻译需要等完整语音输入的方式,它能把语音信号分割成短片段,边接收边处理,仅需数秒延迟就能实现连续流畅的输出。同时,模型还能精准还原原说话者的语调、语速和音高,通过对语音韵律信息的建模,让翻译结果更贴近原表达的情感与风格,避免机械生硬的效果。

技术层面,Gemini3.5基础模型的多模态能力为实时翻译提供了坚实支撑,它融合了语音识别、自然语言处理与语音合成技术,在流式架构下实现了低延迟与高准确性的平衡。开发者从即日起可通过Gemini Live API及Google AI Studio试用公开预览版,为各类应用集成实时翻译功能提供接口;企业用户本月起能在Google Meet中体验私有预览版,帮助跨国团队提升会议沟通效率;普通用户则可通过Android和iOS版谷歌翻译应用使用该功能,其中Android端新增“聆听模式”,支持贴耳收听翻译音频,优化了私密场景下的使用体验。

近期行业动态表明,AI翻译领域正加速向实时化、自然化方向发展,用户对翻译的情感还原和低延迟需求也在持续增长,Gemini3.5 Live Translate的发布正是这一趋势的典型体现。在竞争对手方面,OpenAI的Whisper模型虽然支持实时语音转文字翻译,但在保留说话者语调上还有提升空间;微软Translator的实时翻译功能已应用于Teams会议,但支持的语言数量比Gemini3.5 Live Translate的70多种要少。谷歌此次发布的模型在语言覆盖和情感保留方面有着明显优势,这或许能进一步巩固其在AI翻译领域的领先地位。

作品声明:内容由AI生成

快报

更多

2026-06-26 23:07

万邦医药:拟3.02亿元收购赛德盛75.52%股份

2026-06-26 23:03

国内商品期货夜盘收盘涨跌不一,能源化工品表现疲软

2026-06-26 23:02

海光芯正:香港公开发售获1296.89倍认购,发售价114港元

2026-06-26 22:51

消息称OpenAI倾向于等到2027年再进行IPO

2026-06-26 22:35

丁薛祥在新疆调研时强调:突出优势特色培育壮大新动能,加快推进经济社会高质量发展

2026-06-26 22:29

布伦特原油期货跌幅扩大至4%

2026-06-26 22:25

礼来、强生等医疗制药股票续刷记录新高

2026-06-26 22:21

纳斯达克中国金龙指数涨幅扩大至1%

2026-06-26 22:19

拉卡拉:拟参与投资设立上海考拉先导人工智能创业投资基金

2026-06-26 22:18

熙菱信息:拟对外投资设立控股子公司,聚焦算力中心新建扩建等业务及后续产业扩张

2026-06-26 22:17

迅雷宣布2000万美元股票回购计划

2026-06-26 22:15

6连板兴业科技:目前所有产品均不涉及光模块客户

2026-06-26 22:15

电脑涨价潮来了,多个电脑热门机型售价大幅上调

2026-06-26 22:12

OpenAI据悉尚未确定IPO时间表

2026-06-26 22:12

美股跌幅迅速收窄,标普500指数率先转涨

2026-06-26 22:08

美国6月密歇根大学消费者信心指数终值录得49.5,低于预期

2026-06-26 22:02

美国6月一年期通胀率预期终值为4.6%

2026-06-26 22:01

钱江摩托:拟出资2亿元参与设立合伙企业

2026-06-26 22:00

百润股份:部分董事、高管拟合计2500万元至5000万元增持公司股份

2026-06-26 22:00

艾比森:实控人丁彦辉拟减持不超3%公司股份