突破开源天花板!ChatTTS文本转语音模型,仅5天斩获16k关注

Published on
2 mins read
--- views

最近一个相当火热的开源项目,ChatTTs文本转语音模型,仅仅5天斩获了16k的关注,真是个好项目。

地址如下:https://github.com/2noise/ChatTTS

我试了试其中的效果,真的很NB,难怪这么多人关注这个项目。

介绍

ChatTTS是专门为对话场景设计的文本转语音模型,例如LLM助手对话任务。

它支持英文和中文两种语言。最大的模型使用了10万小时以上的中英文数据进行训练。

在HuggingFace中开源的版本为4万小时训练且未SFT的版本.

亮点

对话式 TTS: ChatTTS针对对话式任务进行了优化,实现了自然流畅的语音合成,同时支持多说话人。 细粒度控制: 该模型能够预测和控制细粒度的韵律特征,包括笑声、停顿和插入词等。 更好的韵律: ChatTTS在韵律方面超越了大部分开源TTS模型。同时提供预训练模型,支持进一步的研究。

点击查看详情