V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
yaott2020
V2EX  ›  问与答

请教关键词搜索数据结构

  •  
  •   yaott2020 · 2023-09-06 12:27:19 +08:00 via Android · 681 次点击
    这是一个创建于 473 天前的主题,其中的信息可能已经有所发展或是发生改变。

    现在有一些关键词

    [a, ab, abhs, hsks...]

    有一个字符串 abjs ,要求上面的列表中要有一个匹配,例如 abjs 关键词匹配有 [a, ab]

    使用什么数据结构去构造这些关键词使得搜索性能更好,同时存储空间尽量不大

    6 条回复    2023-09-06 14:04:22 +08:00
    NoOneNoBody
        1
    NoOneNoBody  
       2023-09-06 12:36:16 +08:00
    每个一条记录,跑不掉的,有时间的话还要做分类、权重
    我不是用“搜”的,用 AC 自动机
    passive
        2
    passive  
       2023-09-06 12:41:14 +08:00 via Android
    参考字典压缩算法
    passive
        3
    passive  
       2023-09-06 12:42:49 +08:00 via Android
    如果是这样简单的字母就用自动鸡吧
    yaott2020
        4
    yaott2020  
    OP
       2023-09-06 12:55:41 +08:00 via Android
    @passive 不是简单字母,是有一定长度的字符串,匹配的也不是简单的字符串,而是域名
    Mirana
        5
    Mirana  
       2023-09-06 13:38:24 +08:00
    前缀压缩
    sadfQED2
        6
    sadfQED2  
       2023-09-06 14:04:22 +08:00 via Android
    就你写写几个的话,前缀树+1
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2930 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 13:22 · PVG 21:22 · LAX 05:22 · JFK 08:22
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.