有通过深度学习来提升音质的工具吗？

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

这是一个创建于 1163 天前的主题，其中的信息可能已经有所发展或是发生改变。

图片和视频处理的已经有一大堆了，提升分辨率、帧率之类的，而且效果基本上来说还行。

但是音频处理方面好像没怎么听说过

深度学习

帧率

处理

音质

18 条回复 • 2022-02-10 11:56:23 +08:00

michaelzhou

2022-02-08 13:43:48 +08:00

音频有环境声降噪、人声突出增强等等。

czfy

2022-02-08 13:54:05 +08:00

无线耳机用了不少算法吧

p2pCoder

2022-02-08 14:01:36 +08:00

音频肯定也有一大堆了，毕竟 cv nlp 音视频方向出论文的速度是非常快的

learningman

2022-02-08 14:06:43 +08:00

NVIDIA 有一个，但是必须要 RTX 显卡

learningman

2022-02-08 14:07:09 +08:00

NVIDIA RTX Voice

Chihaya0824

2022-02-08 14:57:01 +08:00

没听说过不代表没有嘛~
谷歌随便搜一下第一个就有篇带 code 的 paper
https://kuleshov.github.io/audio-super-res/

Chihaya0824

2022-02-08 15:01:09 +08:00

@Chihaya0824 上面的都是 5 年前的了
https://arxiv.org/abs/2111.00195
这里有份更近的

tfdetang

2022-02-08 16:28:02 +08:00

有趣的问题，仔细回顾下，确实音频音质提升的算法和工具似乎不如图片与视频的多。

虽然不是音频方向的，但是从直觉上觉得提升音质与提升画面分辨率算法并不会有本质上的区别，只需要很有限的改动就能把图像超分辨率应用到音频上。

我觉得可能还是音频的超分辨率效果不如图像这么直观，所以这个方向的关注度不如图像的那么高。