B站推出语音模型 IndexTTS,支持拼音纠正汉字发音
2025-02-27

B站今日发布论文,介绍其文本转语音模型IndexTTS。该模型能依据拼音纠正汉字发音,并通过标点控制语音停顿。经数万小时数据训练,IndexTTS性能领先,优于XTTS、CosyVoice2等现行系统,尤其在字词错误率和扬声器相似性方面表现突出。