Paper2GUI: 一款面向普通人的 AI 桌面 APP 工具箱,免安装即开即用,已支持 20+AI 模型,内容涵盖语音合成、视频补帧、视频超分、目标检测、图片风格化、OCR 识别等领域。支持 Windows 、Mac 、Linux 系统。
此次介绍的这三个语音合成工具,中文语音丰富、自带呼吸声,效果逼真,欢迎使用。
如果对人工智能感兴趣,可以帮忙在 github 给个 star :)
1
a570295535 2022-07-04 20:47:09 +08:00 via Android
点进去东西挺多啊,厉害👍呀!
|
2
yanwen 2022-07-04 21:47:34 +08:00
一种接口一个 app 有点多 。如果可以的话,整合成一个 app 就更好了 (参考 Bob )
|
4
baox2 2022-07-04 23:21:51 +08:00
RVM-GUI 智能图片抠图工具
速度很快,但抠像出来的图怎么都统一变成了 512*512 像素了阿?@baiyue |
5
linKnowEasy 2022-07-05 09:26:53 +08:00
感谢, star 了, 希望有整合版后 @ 我一下
|
6
baiyue OP @baox2 rvm 受限于模型转换问题,输出只能固定尺寸,推荐使用另外两个抠图工具,比如 modnet 或 mobilenet ,支持图片或视频抠图。
|
7
dfgxcvbcv 2022-07-05 14:36:26 +08:00
现在调现成的接口都能算自研了吗?
|
8
shuang 2022-07-05 23:54:45 +08:00
省流:下载 app 后需要自己提供 key 才能用
|
9
o00O00o 2022-07-06 09:12:46 +08:00
请教一下,桌面端是使用的什么技术栈呢?
|
10
baiyue OP @o00O00o 项目里有介绍,该项目主要是基于 webview2 开发的图形界面,使用 wails 组合 vue 前端和 go 后端。所以界面是 VUE 写的,逻辑部分由 go 语言完成,AI 推理这块使用 c++里的 ncnn 推理框架,搭配 vulkan 实现任意显卡支持,同时也为基于 wasm 的网页应用和移动端 app 提供可能。
|
11
icebear0 2022-07-06 09:54:48 +08:00
看到 OP 的这个,我第一时间想到的就是 bob (一个翻译软件),前几天也发布了正式版本,也在 V 站上抽奖过。
所以如果 OP 做一个 bob 的插件(可以做成语音插件)的话,我相信肯定会有很多人使用,并且也能达到宣传自己这个项目的作用。 bob 这款软件之前在 GitHub 上获得了 6.3K 的星,而且对应的群中,也有几千人在使用 |
13
newledge 2022-08-19 11:10:43 +08:00
最近就想搞搞语音合成。
|
14
baiyue OP |