Google发布Gemini 3.5 Live Translate 支持70余种语言的实时语音翻译新模型
5 小时前

北京时间2026年6月9日,谷歌宣布推出最新的实时语音互译音频模型Gemini 3.5 Live Translate。该模型支持超过70种语言的语音到语音翻译,能够生成自然流畅的翻译语音,并保留原说话者的语调、语速和音高。相较于传统轮流式系统,Gemini 3.5 Live Translate在等待更多上下文以提高翻译准确性与即时响应之间找到了平衡,使得整个交流过程更加连贯无间断,延迟控制在几秒内。从即日起,开发者可通过Gemini Live API及Google AI Studio访问该模型的公开预览版本;企业级用户可在Google Meet中体验私有预览版;普通消费者则可通过Android或iOS平台上的谷歌翻译应用程序使用这项服务。此外,针对Android设备,还特别设计了“聆听模式”,允许用户直接通过手机听筒收听翻译结果,提供了便利。

简体中文 English