火山引擎发布豆包语音模型2.0 实现语义与情感双突破
3 天前

2025年10月16日,火山引擎正式发布豆包语音合成模型2.0(Doubao-Seed-TTS 2.0)和声音复刻模型2.0(Doubao-Seed-ICL 2.0)。这两款模型基于豆包大语言模型全新架构,实现了语音从“文本朗读”到“理解式情感表达”的跨越。语音合成模型支持多轮对话语境,精准呈现语气、停顿与情绪变化,并支持语速、声线等指令的精细化控制。声音复刻模型在秒级还原声线的基础上,新增情感演绎能力,可适配小说配音、对话交互等多场景。针对教育场景专项优化后,模型对小初高全学科复杂公式符号的朗读准确率达90%,远超行业平均水平。目前,两款模型已上线火山引擎语音控台,服务OPPO、洋葱学园等客户,覆盖对话助手、教育辅助等多元场景。

简体中文 English