MeloTTS:由MyShell 开发的一个高质量的多语言文本到语音(TTS)库。

支持英语、西班牙语、法语、中文、日语和韩语等多种语言。

速度非常快,支持中英混合的发音,能生成清晰、自然的语音输出。

即使在普通的在CPU上也能实现实时语音合成。

测试了下质量很不错。👍

 

主要特点

1、多语言支持:MeloTTS支持多种语言的文本到语音转换,包括英语(有美国、英国、印度、澳大利亚等多种口音)、西班牙语、法语、中文、日语和韩语。这使得它适用于全球多种语言环境的应用场景。

2、中英混合发音:特别对于中文,MeloTTS支持中英混合的发音,这是在多语言交流中非常实用的功能,能够处理包含英文单词的中文文本。

3、实时CPU推理:MeloTTS设计优化以确保即使在没有GPU加速的情况下,也能在CPU上实现实时语音合成,这提高了其在不同硬件环境下的可用性。

4、高质量语音输出:MeloTTS旨在生成清晰、自然的语音输出,力求在各种支持的语言中保持语音的自然度和清晰度。

5、易于安装和使用:提供了简单的安装指南和Python API,使得用户可以轻松地在Linux环境中安装MeloTTS,并通过几行代码实现文本到语音的转换。

MeloTTS利用了多个优秀的开源项目,如TTS、VITS、VITS2和Bert-VITS2,以实现其高质量的文本到语音转换功能。它遵循MIT许可证,适用于商业和非商业用途。

支持的语言列表

  • 英语(美式)

  • 英语(英国)

  • 英语(澳大利亚)

  • 英语(默认)

  • 西班牙语

  • 法语

  • 中文(混合英语)

  • 日语

离线懒人包

为了让用户更便捷地使用这一工具,幕后将MeloTTS封装成了一键启动包,用户无需配置繁琐的Python环境,只需点击下载即可使用。下载地址如下:

下载和使用指南

  1. 解压后运行oneclick-run.bat,然后打开浏览器访问http://127.0.0.1:7860

  2. 点击生成:点击“提交”按钮,等待即可。

项目运行一段时间后,会得到该项目给出的回答。将自动为图片去除背景,效果超赞,且速度很快,感兴趣的朋友,快去试试吧~

获取地址:https://pan.baidu.com/s/1QsO2XMNn-S5XP14fP3lCJw?pwd=dxyi#list/path=%2F&parentPath=%2Fsharelink3120898935-1073040725146826

 

分享来源:“幕后”团队,请关注