NAS实现听书自由,极空间部署小说智能转语音神器『EasyVoice』

B站影视 日本电影 2025-09-23 21:04 1

摘要:听书可以充分利用碎片化时间,比如说在通勤路上、做家务时、锻炼身体时,甚至是上班摸鱼的时候,我们都可以在不影响手头工作的前提下,通过听书来获取阅读同样的快乐。

说实话在这个快节奏的社会,我们已经很难抽出时间安静的看书了,也是因为如此,很多小伙伴开始选择听书。

听书可以充分利用碎片化时间,比如说在通勤路上、做家务时、锻炼身体时,甚至是上班摸鱼的时候,我们都可以在不影响手头工作的前提下,通过听书来获取阅读同样的快乐。

极空间NAS也是知道各位书虫不易,在很早之前就为我们安排了专为听书而生的应用套件“有声读物”,它不仅支持常见的AAC、AIFF、APE、AU、FLAC、M4A、MMF、MP3等多种格式,还支持快进/后退、多倍速播放,以及多平台进度同步等。

也就是说,只要我们将自己收集到的有声资源添加过来,就能通过这个应用愉快的听书了!问题是:电子书资源到处都是,有声资源哪里找?

所以,针对这个问题,为大家分享一个将电子书资源转换成语音的项目『EasyVoice』,从此让大家实现听书自由。

EasyVoice是一个免费开源的文本、小说智能转语音解决方案,可以让我们轻松将文本内容转换为高质量的语音输出,同时还同时生成字幕,方便创作者们用作视频制作或者字幕翻译。

项目Github主页(记得Star支持作者呀~):https://github.com/cosin2077/easyVoice

项目的核心功能:

文本转语音 ➡️ 一键将大段文本转为语音,高效又省时。

流式传输 再多的文本,都可以迅速返回音频直接开始试听!

多语言支持 支持中文、英文等多种语言。

字幕支持 自动生成字幕文件,方便视频制作和字幕翻译。

角色配音 提供多种声音选项,完美适配不同角色。

自定义设置 ⚙️ 可调整语速、音调等参数,打造专属语音风格。

AI 推荐 通过 AI 智能推荐最适合的语音配置,省心又贴心。

试听功能 生成前可试听效果,确保每一句都如你所愿!

先在文件管理器的Docker目录新建一个easyvoice的文件夹,然后在该文件夹下再建audio子文件夹用来保存生成的音频、字幕文件。

接着打开极空间NAS的“Docker”应用,点击【Compose】 > 【新增项目】。

在新增项目页面自定义项目名称,输入以下 Docker Compose 配置信息后点“创建”按钮:

services: easyvoice: image: cosincox/easyvoice:latest container_name: easyvoice ports: - 3112:3000 # 项目WebUI打开端口,冒号前面请勿和本地冲突 volumes: - ./docker/easyvoice/audio:/app/audio # 映射media文件夹实际路径 restart: always

以上代码需要根据注释自行修改,没有注释的默认即可,镜像的拉取需要自行解决网络问题,粘贴到自己的NAS这边之前建议使用AI工具优化一下,以防止格式问题造成的部署失败。

顺便说一下,volumes映射的路径需要在当前界面使用“查询路径”查找到真实路径直接复制粘贴就可以了,个人觉得极空间这里对于新手小白已经是相当友好的操作了。

如果说有其它需求的,比如说 AI 智能推荐,可以根据作者给出的方案添加环境变量。目前它仅限于OpenAI模型,我没有该模型的API Key,所以部署的时候就没使用环境变量。如果有OpenAI模型的API Key,可以自己添加上去。(其实也可以在项目部署好之后在设置中添加)

部署好之后就能看到容器显示“运行中”就可以使用了。

打开方式依然是浏览器状态栏【IP:端口号】的方式。

文本转换页面还是很简洁的,左边是文本内容,可以直接粘贴文本,也可以直接上传自己下载的txt电子书,右边则是转换语言相关的设置选项,包括语言、性别、配音角色、语速、音量、音调等,设置项还是非常丰富的。

PS:它目前只支持txt的文本确实有些不便,毕竟我们收藏的电子书基本上都是EPUB、MOBI这些,TXT纯文本几乎很少。所以如果确实想体验该项目的小伙伴建议找个文本转换工具将其它格式的电子书转换成TXT吧~

支持的声音选项还挺多的,不仅可以选择男女角色,甚至还有地方口音,从而满足大家更个性化的语音需求。

我这里直接上传了一本金庸先生的《天龙八部》,文本文档统计的有差不多130万的字数。将“天龙八部.txt”拖过来之后项目上面的文本框是正确的显示。我们在右边设置好自己需要的语音相关信息就可以直接点下方的“生成语音”按钮开始转换了。

这里需要强调的是,我们上传到这里的txt小说的编码格式必须为“UTF-8”,要不然该项目是无法识别,具体表现为乱码,自然也就无法转换语音了。

转换的时候下方有一个进度条,但是其实显示是不准的,不过此时已经可以点击“播放”按钮开始试听了。

日志中也可以看到转换的情况,不过从显示的信息可以看到它显示的其实是生成字幕文件的进度。

转换的时候几乎没有占用资源,毕竟它默认调用的是Edge-TTS API,也就是微软Edge的在线语音服务,所以也能理解它为什么不会占用本地资源了,唯一的不便就是转换的时候需要保持当前页面一直在线~。

大文本转换用时确实有点长,我已经转换了差不多5个时间,一直都是显示的99.99%的进度,转换好的语音时间都已经1335分钟,但是时间仍然在增长,说明语音生成依然在继续。

转换后的语音文件在我们刚开始创建的audio子文件夹中,文件格式为MP3,大小为919MB。说实话比预想中要小得多,毕竟当前已经是一段超过20个小时的语音文件了。

双击可以直接打开,试听了下没有任何问题,语气自然,语速适中,每一句话都清晰可辨,也没感觉到机械感或生硬感,效果确实还不错。

因为我目前还不确定它还要转换多久,并且本来也只是为了演示,所以我也就没继续了。转换好的语音文件可以直接添加到极空间的“有声读物”应用中,之后就能愉快的听书了!

今天分享的这个项目对于喜欢听书的小伙伴来说还是非常不错的,它能够非常轻松的将文字类的txt小说转换成效果不错的mp3文档,在配合极空间的“有声读物”,就能非常安逸的实现听书自由了!

极空间NAS作为国产家用与轻办公市场的新兴力量,凭借简单易用、高性价比的特性,以及功能丰富、娱乐性强的优点,迅速成为众多NAS需求用户的不二之选。其产品线更是覆盖广泛,从百元级的入门款,到千元级的旗舰款应有尽有,能够满足不同用户群体的多样化需求,有兴趣的小伙伴可以关注下!

来源:数码小能手一点号

相关推荐