最近看到了开源项目 DrewThomasson/ebook2audiobook
非常火,我上班路上最起码有 1 个多小时的开车路程,所以想将一些技术类文章、书籍转换成语音,自己随意听听。
奈何试了几台机器都不行,要么是 Linux 版本太低,要么是一个类似日文的框架没办法安装,报错;然后它的一键脚本也不太适合我,它会自动安装 conda ,然后会干扰到我本来的 Python 环境,就很迷。
用 colab 试了一下,人声还是稍微有点不自然,而且好像有些英文单词,发音是接近日文的发音,及其怪异。
想问问下 v 友们,有没有类似成熟的本地模型?然后朗读声音比较自然的。
1
neteroster 1 天前 1
https://funaudiollm.github.io/cosyvoice2/
https://github.com/RVC-Boss/GPT-SoVITS https://github.com/fishaudio/fish-speech 其中后两个还支持少样本声音克隆,可以搞点自己喜欢的声音样本做克隆生成 |
2
neteroster 1 天前
@neteroster #1 CosyVoice 也支持,没记清楚
|
3
ijk0 1 天前 via iPhone 1
https://github.com/santinic/audiblez 最近看到了这个项目,有兴趣可以了解一下
|
4
syh2 OP @neteroster #1 已感谢,确实是我想要的,等我试一下。
|