OpenAI同传模型登陆可穿戴设备

OpenAI同传模型登陆可穿戴设备 | AI快讯详情 | Blockchain.News

据gdb称，gpt realtime translate支持70+语种输入到13种语音输出，并已在智能眼镜上演示。

2026年5月29日Greg Brockman宣布OpenAI推出gpt-realtime-translate模型。该模型可接收70多种输入语言的语音音频并实时输出13种目标语言的语音已应用于智能眼镜场景。

关键要点

该模型直接处理原始音频输入并生成合成语音无需中间文本步骤相比级联系统显著降低端到端延迟。演示覆盖普通话西班牙语阿拉伯语等多种语言。

旅游平台可集成模型提供实时导览服务跨国企业会议无需人工翻译教育机构可同步翻译现场讲座。

monetization策略包括API分层订阅智能眼镜捆绑和企业许可。

主要挑战包括背景噪声口音切换和隐私合规通过设备端推理和领域微调解决。

语音原生模型将持续扩展语言支持降低延迟并推动全球通信市场新收入来源。

支持70多种输入语言和13种输出语言。

直接语音到语音翻译延迟更低对话更自然。

旅游教育和跨国商务协作。

噪声口音和隐私合规。

@gdb

President & Co-Founder of OpenAI