Drew Thomasson 最近发布了一个创新的开源项目—— ebook2audiobookXTTS。
该工具利用 Calibre 和 Coqui TTS,将电子书转换为高质量的有声读物,支持多种语言,并提供可选的语音克隆功能。

该项目的主要优点是能够将文本内容转换为高质量的有声读物,
适合需要将大量文本信息转换为音频格式的用户,让阅读体验更加丰富。

该项目已经开源,大家可以在GitHub上进行下载安装到本地部署来使用。

今天我就先带大家在Huggingface上演示操作一遍,熟悉一下它的具体功能都有哪些。

点此上传我们需要转换的电子书文件,借助 Calibre,我们可以将多种电子书格式转换为文本,
.epub或.mobi格式为最佳,这两种文件会实现自动章节检测转换。

下方上传我们的音频文件作为转换语音参考,当然你也可以上传自己的声音作为有声书音源。

该项目默认语言为英语,但它为我们提供了十几种语言,可以满足全球用户需求。

如果你有自己的训练模型,就可以打开自定义模型选项,来上传自己的模型使用。

上传完毕点击转换按钮即可,在下方可以实时查看它的转换状态。

转换完成的有声书读物我们可以在此播放器内点击播放查看效果,合适的话就点此按钮下载。

转换后生成的有声读物随之.m4b 格式保存,包含丰富的元数据和章节信息,提升用户的使用体验。

该项目的目标受众包括电子书作者、有声书制作者、视障人士、喜欢听书的用户以及需要学习外语的用户。
感兴趣的小伙伴可以自行下载到本地部署,或者在线体验。
GitHub地址:https://github.com/DrewThomasson/ebook2audiobookXTTS
Huggingface在线体验: https://huggingface.co/spaces/drewThomasson/ebook2audiobookXTTS