V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
fyxtc
V2EX  ›  问与答

有什么办法可以批量根据 mp3 内容快速分类的

  •  
  •   fyxtc · 2022-06-23 08:45:14 +08:00 · 1609 次点击
    这是一个创建于 883 天前的主题,其中的信息可能已经有所发展或是发生改变。
    每个 mp3 音频大概 10 秒左右,需要人听才能分类到 1,2,3
    人工操作就是把所有 mp3 拖到播放器然后播一个,再去文件管理器复制粘贴,得弄死

    目前想到一个思路自己写脚本命令行逐个播放( ffmpeg?),然后根据听到的内容(不用听完,可能 3 秒或 5 秒就能分辨)按键盘 1,2,3 直接打断播放(监听键盘事件然后打断当前播放并播放下一个)然后复制到对应分类文件夹

    这个思路行得通吗,大家还有更好的工具或者思路吗
    第 1 条附言  ·  2022-06-23 10:19:10 +08:00
    感谢兄弟们的建议,不过分词语言处理 AI 相关的是行不通的(需要联系上下文,且含有外语),退一万步就算行得通,怎么调教,怎么分类写这个规则就很耗时而且不一定完美,我还是得全部听一遍复验(几千个文件),结果还是没效率的
    22 条回复    2022-06-25 09:59:54 +08:00
    Soar360
        1
    Soar360  
       2022-06-23 09:21:11 +08:00
    语言转文字,分词,然后自动归类?
    0x2CA
        2
    0x2CA  
       2022-06-23 09:21:54 +08:00
    行的通,但是你开发一个花费时间找就分好了,除非你量大,而且后面经常用
    shilianmlxg
        3
    shilianmlxg  
       2022-06-23 09:31:44 +08:00
    不如用 sony 的 mediago 。记得它的分类是自带。只是解析很慢
    jhjguxin
        4
    jhjguxin  
       2022-06-23 09:41:18 +08:00
    写个程序主要做下面几件事情
    第一步遍历需要处理的文件列表
    第二步截取每个文件的前 10 秒(如果文件数量并不大,长度也小可以忽略此步骤)
    第三步调用类似科大讯飞语音转写 API 接口( https://www.xfyun.cn/doc/asr/lfasr/API.html
    第四步在提取出的文字中匹配你所需的分类关键字,如果成功进行第五步
    第五部根据匹配到的关键字将对应文件进行分类处理
    第六步将前面第 2-5 步操作失败的文件单独标记进行人工处理即可
    snoopyhai
        5
    snoopyhai  
       2022-06-23 10:01:39 +08:00
    网上有语音质检的能力. 找找看. 能不能基于质检去做一些特别设定.
    fyxtc
        6
    fyxtc  
    OP
       2022-06-23 10:02:55 +08:00
    @0x2CA 量大,几千个
    darkengine
        7
    darkengine  
       2022-06-23 10:08:07 +08:00
    speech to text ,再接个自然语言处理,然后分类
    fyxtc
        8
    fyxtc  
    OP
       2022-06-23 10:13:00 +08:00
    @Soar360
    @shilianmlxg
    @snoopyhai
    @jhjguxin


    感谢提供建议,不过分词是铁定不行的,有时候还需要联系上下句语义才能处理,而且有的还包含外语,所以只能人工听才能分。
    Buges
        9
    Buges  
       2022-06-23 10:29:14 +08:00 via Android
    如果隐私能接受,直接买讯飞的转文字(中文)
    tfdetang
        10
    tfdetang  
       2022-06-23 11:00:29 +08:00
    突然让我想到前段时接很火的那个电视剧 <人生切割术>

    其实我很好奇,人是怎么分类的? 标准是什么? 因为只要听 10 秒 感觉应该也不是特别复杂的上下文理解

    其实用 AI 分类不一定非要转文字啥的,也可以直接拿着音频数据作为一个序列信息来进行分类啊。 也不需要写任何规则只需要先人工分一部分数据就行了。

    只是一共就几千条数据上 AI 显然是不太划算的,得是一个持续性的长期工作才有价值
    Juszoe
        11
    Juszoe  
       2022-06-23 11:21:13 +08:00
    几千个还是人工处理吧,但 OP 有些小看 AI 了,这种分类是标准的 AI 适用场景,不需要写规则,打上类别标签就好了,难点就在于数据集要自己收集。
    如果要求 100%准确率,可能 AI 确实不合适
    wudicgi
        12
    wudicgi  
       2022-06-23 11:43:18 +08:00
    如果机器识别不可行的话, 楼主需要的是一个可以在界面上当场进行文件重命名操作的音频播放器?
    yufeng0681
        13
    yufeng0681  
       2022-06-23 12:14:01 +08:00   ❤️ 2
    原始诉求 还得往前回溯。 目前看是你想要的一个解决方案。
    1 、如果是长期工作,能不能让负责提供素材的人,就按照要求格式提供素材;
    2 、如果是自己采集的素材,也是临时工作,那就看看有没有其他规律可以寻觅,不行的话就只能人工分拣。
    3 、人工分拣,建议用阿里云盘。 它能在线播放音频。
    3.1 你听到 1 类的,你就收藏, 进入收藏库
    3.2 你听到 2 类的,你就下载,再次下载到本地目录 2
    3.3 如果是 3 累的,你不用处理, 等全部处理完毕, 把收藏 1 类的下载到本地第二个目录 1
    3.4 你把本地音频和下载的 1 2 类音频 放一起,全部排序,按同名排序,把孤单的 3 类文件,ctrl 选中,然后复制一份到新的目录 3 里, 就成了。
    yufeng0681
        14
    yufeng0681  
       2022-06-23 12:16:29 +08:00
    注 :阿里云盘的音乐播放界面, 有上一项,下一项, 收藏,下载,分享,按钮。

    重命名和移动按钮在 more 里面,要多点击一下,麻烦。。
    fyxtc
        15
    fyxtc  
    OP
       2022-06-23 12:48:34 +08:00
    @yufeng0681 谢谢,很有收获。我试了一下云盘下一项的时候并不会自动播放而是顺序播完才播的下一项,而且按空格也不会触发播放,这一点挺难受的,不知可有解决方案。
    libook
        16
    libook  
       2022-06-23 14:49:05 +08:00
    加个撤销机制以防按错,然后我觉得就可以做个 MVP 方案让负责分类的人员试用一下了,看是否提升了效率,然后根据反馈再优化。
    dddd1919
        17
    dddd1919  
       2022-06-23 14:51:53 +08:00
    100 块钱,雇个人
    yufeng0681
        18
    yufeng0681  
       2022-06-23 16:38:05 +08:00
    @fyxtc 感觉是阿里云盘的一个 bug ,或者说体验不合理的地方, 要不给阿里云盘提个问题单,让他修复一下?

    下一项,如果不想动。 那就在播放器那边增加 上一曲,下一曲 的功能,切换快捷键 是 播放器的必须项目。
    XimuTao
        19
    XimuTao  
       2022-06-24 10:10:20 +08:00
    根据按键分类这个思路, 我写过一个用来分类图片的[photo-classification]( https://github.com/ximu-tao/photo-classification), 需要的话我可以帮你改一个音频版本的
    fyxtc
        20
    fyxtc  
    OP
       2022-06-24 11:11:48 +08:00
    @XimuTao 看了下,很适合我的需求,我如果你有时间弄的话,那就太感谢了
    XimuTao
        21
    XimuTao  
       2022-06-24 13:46:08 +08:00   ❤️ 1
    @fyxtc https://github.com/ximu-tao/photo-classification/releases ,下载 audio-classification ,因为一直只有自己在用,所以有些小问题一直没修复,使用的时候注意一下
    fyxtc
        22
    fyxtc  
    OP
       2022-06-25 09:59:54 +08:00
    @XimuTao 用上了,完美解决,已 star ,感谢
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5470 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 33ms · UTC 03:29 · PVG 11:29 · LAX 19:29 · JFK 22:29
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.