你是不是也和我一样,手机里存了一堆电子书,总想着“有空了一定看”,结果却是“收藏从未停止,阅读从未开始”?
每天通勤路上、做家务的时候、健身房里,眼睛被屏幕占着,手被器械占着,唯独耳朵闲着。这时候要是能“听书”,那该多完美?
市面上听书软件不少,要么书库不全,要么收费不菲,更别提想听冷门书籍或者自己收藏的 PDF 了,简直难如登天。
今天就给大家安利一个 GitHub 上的宝藏开源项目—— ebook2audiobook 。这玩意儿能把你手里的电子书,直接变成带章节、带元数据的有声书,而且效果还真不赖!
先别急着划走,我知道你可能担心技术太复杂。放心,跟着我一步一步来,你也能轻松上手。
项目亮点
这个项目之所以能火,主要是因为这几点:
🌟 多引擎支持:内置 XTTSv2、Piper、Vits、Tacotron2 等多种顶尖 TTS 引擎,想用哪个用哪个,音质、速度自己权衡。
🌍 1100+ 语言覆盖:甭管是英文原著、中文网文,还是小众语言的专业书,基本都能找到对应的语音模型。
🎭 声音克隆:给你最爱的小说主角配上自己的声音?或者用家人的声音录制睡前故事?只要提供几秒的音频样本,它就能模仿得惟妙惟肖。
📑 完美保留章节:不像有些工具把整本书糊成一个几小时的音频,它能智能识别电子书目录,自动分割成一个个章节文件,听着方便,找着也快。
💻 本地运行,保护隐私:所有转换都在你自己的电脑上进行,不用担心书籍内容泄露给第三方。
解决什么痛点?
想象一下这个场景:你是一个学生,导师发给你几十篇全英文的 PDF 论文,看得你头昏眼花,进度极其缓慢。或者,你是个网文爱好者,追的一本冷门小说只有 EPUB 格式,网上根本找不到它的有声版。
以前你怎么办?要么硬着头皮看,把眼睛看瞎;要么放弃,错过精彩的故事。
现在有了 ebook2audiobook,事情就简单了。
你就把它想象成一个超级智能的“文字转声音工厂”。把电子书文件扔进去,选择你喜欢的“播音员”(也就是 TTS 引擎和声音),按下启动键。它就会自动把书拆开、识别文字、生成语音、按章节打包,最后递给你一个可以直接拷进手机或播放器里的文件夹。
整个过程就像你把一袋大米倒进电饭煲,按下煮饭键,坐等香喷喷的米饭出锅一样。你只需要提供原材料(电子书),剩下的繁琐工作,全部交给这个项目。
手把手教程
说了这么多,咱们直接上手操作。假设你的电脑是 Windows 系统,并且装有 Python(这是运行很多 AI 项目的基础)。
➤ 环境安装
首先,打开命令行(CMD 或 PowerShell),把项目代码克隆到本地:
git clone https://github.com/DrewThomasson/ebook2audiobook.gitcd ebook2audiobook
接下来是最重要的一步:创建并激活虚拟环境。这一步能保证项目依赖的软件包和你电脑上其他的 Python 项目互不干扰。
# Windowspython -m venv python_envpython_env\Scripts\activate# macOS / Linuxpython3 -m venv python_envsource python_env/bin/activate
最后,安装项目所需的依赖包:
pip install -r requirements.txt
安装过程可能需要一些时间,因为要下载 PyTorch 等大型库,耐心等待就好。
➤ 基础使用
环境准备好后,使用起来就非常简单了。假设你要转换一本叫 我的书.epub 的电子书,想用默认设置生成英文有声书,只需要在命令行输入:
python app.py -i "我的书.epub"
就这么简单!程序会自动开始处理,你会在屏幕上看到处理进度。最终生成的有声书会保存在一个以你书籍名字命名的文件夹里。
➤ 进阶配置
如果你想玩点花的,比如生成中文有声书,或者使用声音克隆,就需要了解一些参数了。
举个例子,你想用 XTTSv2 引擎,生成中文语音,并且把输出文件保存到 D 盘的 my_audiobooks 文件夹:
python app.py -i "我的书.epub" -o "D:\my_audiobooks" -l "zh-cn" -e "xtts"
-i-o-l:指定语言代码,比如中文是 zh-cn,英文是 en。-e
如果你想体验声音克隆,需要准备一段你希望克隆的声音的 WAV 音频文件。然后用类似这样的命令:
python app.py -i "我的书.epub" -v "path/to/your/voice_sample.wav" -e "xtts"
加上 -v 参数,指定你的声音样本文件路径。项目就会尝试模仿这个声音来朗读你的电子书,是不是很酷?
同类项目对比
市面上的文字转语音工具不少,但像 ebook2audiobook 这样专门为电子书优化、开源免费且功能全面的项目,还真不多见。我们来简单对比一下:
| | | |
|---|
| 核心功能 | | | |
| 性能 | | | |
| 生态 | 开源,支持 1000+ 语言,可本地运行,隐私保护 | | |
| 声音质量 | 支持 XTTSv2 等先进模型,音质自然,可克隆声音 | | |
简单来说,商业 APP 像是一个装修豪华的图书馆,你只能看它上架的书;通用 TTS 工具 像一台只能复印的打印机,能复制但不好用;而 ebook2audiobook 则像你私人的印刷厂,你想印什么书、用什么纸张、设计成什么样式,全都由你自己决定。
开源项目最有魅力的地方,就是它给了我们无限的自由和可能性。 ebook2audiobook 的出现,真正意义上实现了“阅读自由”。
以后无论是学习资料、工作文档,还是小说闲书,只要你有电子版,就能把它变成耳朵里的声音。你可以在地铁上“复习”论文,可以在散步时“阅读”小说,可以把珍藏的食谱变成听得到的教程。
别让你的电子书在硬盘里落灰了,快去试试这个项目,给你的眼睛放个假,让耳朵忙起来吧!如果在安装或使用过程中遇到任何问题,欢迎在评论区留言交流。
项目地址:https://github.com/DrewThomasson/ebook2audiobook.git