V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
coolair
V2EX  ›  问与答

Python 如何将文件路径列表进行归类?

  •  
  •   coolair · 2020-08-27 16:13:04 +08:00 · 731 次点击
    这是一个创建于 1542 天前的主题,其中的信息可能已经有所发展或是发生改变。
    list_a = ['/usr/bin/a.sh', '/usr/bin/b.sh', '/usr/c.sh', '/usr/d.sh', '/bin/a.sh', '/bin/b.sh', '/bin/test/a.sh', '/bin/test/c.sh']
    
    ===>
    
    result = [['/usr/bin/a.sh', '/usr/bin/b.sh'], [ '/usr/c.sh', '/usr/d.sh'], ['/bin/a.sh', '/bin/b.sh'], ['/bin/test/a.sh', '/bin/test/c.sh']]
    

    也就是把目录相同的文件路径归到一个子列表中,如何操作更高效啊,谢谢。

    5 条回复    2020-08-27 16:33:17 +08:00
    imn1
        1
    imn1  
       2020-08-27 16:22:02 +08:00
    先订层级
    /相同 15 层 /a
    /相同 15 层 /b/a
    这两个算一类还是两类?
    BBrother
        2
    BBrother  
       2020-08-27 16:27:14 +08:00
    根据"/"切分,切出来的每一部分都是一个节点,以类似 trie 的思路建树,所有非叶子节点就是你要的子目录
    ungrown
        3
    ungrown  
       2020-08-27 16:29:57 +08:00
    路径所有 part 全部割开,然后迭代放入多层级的字典
    coolair
        4
    coolair  
    OP
       2020-08-27 16:30:12 +08:00
    @imn1 #1 两类
    imn1
        5
    imn1  
       2020-08-27 16:33:17 +08:00
    如果只计算 basename 和 dirname 就简单
    dirs = {dirname(x) for x in list_a}
    result = [[x for x in list_a if x.startswith(y+'/')] for y in dirs]
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2843 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 31ms · UTC 09:44 · PVG 17:44 · LAX 01:44 · JFK 04:44
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.