V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
pysex
V2EX  ›  Elasticsearch

100G 8000 万条信息全文检索, Elasticsearch 是最优选择吗?

  •  
  •   pysex · 2022-11-17 13:33:46 +08:00 · 2432 次点击
    这是一个创建于 740 天前的主题,其中的信息可能已经有所发展或是发生改变。

    数据存 MongoDB ,Elasticsearch 只存索引结果=最优选择
    还是数据做双写

    5 条回复    2023-06-02 12:32:40 +08:00
    huangqihong
        1
    huangqihong  
       2022-11-17 17:31:55 +08:00
    咦,我好像在掘金看到了的
    bjzhush
        2
    bjzhush  
       2022-11-17 21:23:25 +08:00
    你没写数据的增长速度,搜索的复杂度的支持,索引的实时程度的要求,查询结果返回时间的需求,还有用户量和查询量,对弹性扩容的需求,这些都需要考虑的
    很多年没做搜索了,ES 是比较出名的,但是貌似机器的消耗也比较多
    搜索方案很多的,测试起来也很快,都可以考虑考虑
    2013 年我曾经单机 sphinx 索引过 10 亿以上数据,响应还不慢,不过需求特殊,单机版就够用哈哈哈
    pysex
        3
    pysex  
    OP
       2022-11-18 09:55:04 +08:00
    @bjzhush 那自己买一台 ECS 自建?单机的
    bjzhush
        4
    bjzhush  
       2022-11-18 09:58:55 +08:00
    @pysex 当初是帮朋友做的,我自己本机的台式机,他拿过去用也是本机。场景不一样,那个是社工库
    bigtang
        5
    bigtang  
       2023-06-02 12:32:40 +08:00
    单机不是最优选择,ES 优势在分布式上,可以参考一下 tanglib.com, 单机 800G 文本,可以做到 instant search 。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3676 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 04:24 · PVG 12:24 · LAX 20:24 · JFK 23:24
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.