V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
pmispig
V2EX  ›  Hadoop

请问 hadoop 多块磁盘只部署一个 datanode 好还是每块磁盘各部署一个 datanode

  •  
  •   pmispig · 2022-07-27 13:01:09 +08:00 · 1464 次点击
    这是一个创建于 875 天前的主题,其中的信息可能已经有所发展或是发生改变。

    CPU 24 核 256G 内存的机器,有 10 块硬盘.
    请问部署方式是选择仅部署一个 datanode ,让这个 datanode 使用 10 块磁盘?
    还是部署 10 个 datanode ,每个 node 仅使用一块磁盘?
    请问两种姿势各有什么优势和缺点呢?

    7 条回复    2022-07-29 20:42:57 +08:00
    israinbow
        1
    israinbow  
       2022-07-27 14:36:53 +08:00
    10 块硬盘准备如何给一个 DataNode 用? 首先 RAID 0 不推荐给 HDFS 用, RAID 0 会造成磁盘数量 (n) 倍的不可用几率;
    而 HDFS 本身就是多个磁盘共用, 并发读写, 在多个磁盘上部署 DataNode 可以满足高可用 (互备) 和高 IO 性能.
    详见 https://stackoverflow.com/questions/27988955/why-is-raid-not-recommended-for-hadoop-hdfs-setups
    superchijinpeng
        2
    superchijinpeng  
       2022-07-27 14:41:24 +08:00
    只部署一个就可以了,我司是每个 DN 22 块盘
    liprais
        3
    liprais  
       2022-07-27 14:46:12 +08:00
    配的时候每个磁盘上一个目录就行
    Anybfans
        4
    Anybfans  
       2022-07-27 16:10:53 +08:00
    不知道 lvm 格式行不行,有大佬指导一下吗
    pmispig
        5
    pmispig  
    OP
       2022-07-27 19:57:51 +08:00
    @Anybfans 没必要 lvm,就是要独立驱动器,这样可以充分利用磁盘的性能。做 lvm 还不如做 raid
    Anybfans
        6
    Anybfans  
       2022-07-28 09:03:13 +08:00
    @pmispig #5 😂 目前公司用了 lvm + raid
    pmispig
        7
    pmispig  
    OP
       2022-07-29 20:42:57 +08:00
    @Anybfans 也毛病,lvm 对性能也没啥损失,我以前也是用 raid,现在测试 raid 速度比直通模式速度差了好多
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   4216 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 05:31 · PVG 13:31 · LAX 21:31 · JFK 00:31
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.