大家好,我是 Java陈序员。
现在的自媒体可谓是十分火热,各个视频剪辑软件提供了文本生成语音的功能,但大多都是千篇一律的音色,比如“这个男人叫小帅”。
如果你想做自媒体,既不想录制自己的语音,又想自己的视频配音与他人不同,可以考虑使用大模型来训练生成自己的语音。
今天,给大家介绍一个开源免费的文本转语音工具,支持十几种语言生成!
关注微信公众号:【Java陈序员】,获取开源项目分享、AI副业分享、超200本经典计算机电子书籍等。
项目介绍EmotiVoice —— 一个强大的开源 TTS 引擎(Text To Speech,即文本转语音),完全免费开源!
EmotiVoice 供了一个易于使用的 Web 界面用于文本转语音,支持中英文双语,包含 2000 多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。
此外,EmotiVoice 还提供了用于批量生成结果的 API 接口。
项目使用启动工具EmotiVoice 的使用方法十分简单,在 Windows 环境下,解压软件压缩包后,双击运行 start.bat 即可启动。
双击运行 start.bat 后,将会在 CMD 命令窗口中运行服务:
并在浏览器中自动打开 Web 界面:
单句合成
1、选择说话人,工具提供了十几种不同的男女音色供选择
2、选择情绪,工具提供了普通、生气、开心、惊讶、悲伤、厌恶、恐惧等语音情绪
3、输入合成文本
4、点击合成
5、合成的音频可以进行在线播放和下载,或者在合成时勾选生成音频后直接保存在wav_file目录下
故事剧本多人合成EmotiVoice 除了提供单句合成,还提供了故事剧本多人合成的功能。
1、输入角色和文本
2、为角色选定声音情感
3、为角色选定配音员
4、点击合成音频
快速上手完整安装conda create -n EmotiVoice python=3.8 -yconda activate EmotiVoicepip install torch torchaudiopip install numpy numba scipy transformers soundfile yacs g2p_en jieba pypinyin pypinyin_dict更多的模型训练,可参考项目文档。
Docker 部署尝试 EmotiVoice 最简单的方法是运行 Docker 镜像,需要一台带有 NVidia GPU 的机器!
docker run -dp 127.0.0.1:8501:8501 syq163/emoti-voice:latest容器启动成功后,访问:
http://localhost:8501/EmotiVoice 作为一款 TTS 引擎,可以说功能十分强大,而且开源免费,大家快去围观体验吧~
项目地址:https://github.com/netease-youdao/EmotiVoice最后推荐的开源项目已经收录到 GitHub 项目,欢迎 Star:
https://github.com/chenyl8848/great-open-source-project或者访问网站,进行在线浏览:
https://chencoding.top:8090/#/大家的点赞、收藏和评论都是对作者的支持,如文章对你有帮助还请点赞转发支持下,谢谢!