V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
JasonLaw
V2EX  ›  数据库

数据库 - 什么情况下应该使用 HDD,什么情况下应该使用 SSD?

  •  1
     
  •   JasonLaw · 2021-05-05 13:24:21 +08:00 via iPhone · 4502 次点击
    这是一个创建于 1293 天前的主题,其中的信息可能已经有所发展或是发生改变。
    39 条回复    2021-05-08 10:52:52 +08:00
    dzdh
        1
    dzdh  
       2021-05-05 13:34:41 +08:00   ❤️ 1
    实时性要求高,在线类应用,SSD

    线下数仓、离线分析,HDD
    tomczhen
        2
    tomczhen  
       2021-05-05 13:48:15 +08:00 via Android   ❤️ 28
    预算够的情况下用 SSD,预算不够的情况下用 hdd 。
    janus77
        3
    janus77  
       2021-05-05 14:02:43 +08:00
    有钱 SSD 没钱 HDD
    seers
        4
    seers  
       2021-05-05 14:04:51 +08:00   ❤️ 5
    SSD 当作 HDD 的缓存,内存当作 SSD 的缓存,CPU 缓存当作内存缓存
    xuanbg
        5
    xuanbg  
       2021-05-05 17:19:24 +08:00
    不差钱 SSD,差钱 SSD+HDD
    abcbuzhiming
        6
    abcbuzhiming  
       2021-05-05 17:26:36 +08:00
    当然是根据钱来的,性能只有不够的,问题是钱更不够
    xarthur
        7
    xarthur  
       2021-05-05 17:31:43 +08:00 via iPhone
    看你们的需求,ssd 和 hdd 对于软件来说是透明的(
    cominghome
        8
    cominghome  
       2021-05-05 17:33:09 +08:00
    不缺钱就上 SSD
    gBurnX
        9
    gBurnX  
       2021-05-05 18:10:51 +08:00   ❤️ 5
    看看楼上这么多评论,也就证实了,为什么很多小创公司,融到第一笔资金后,反而死得快。因为他们虽然懂技术,但不懂运营。

    对于一家公司来说,无论有钱没钱,如何采购设备,也需要根据项目与公司发展,进行全盘考虑。比如如果业务倾向是更多的廉价机器,当你融到钱后,也不应该把廉价设备比如 HDD 去换成昂贵设备 SSD,而是应该采购更多的使用 HDD 的廉价机器。
    czfy
        10
    czfy  
       2021-05-05 18:40:33 +08:00
    SSD 负责日常运算
    HDD 负责备份
    chinvo
        11
    chinvo  
       2021-05-05 18:50:39 +08:00 via iPhone
    上盘柜机头, SAS SSD 当热缓存, 11k 的 SAS HDD 当热存储, 9k/5k 的 SAS HDD 当冷存储, 磁带备份
    chinvo
        12
    chinvo  
       2021-05-05 18:52:35 +08:00 via iPhone
    @gBurnX #8 俺寻思没人说这是初创公司该做的啊, 这问题都问出来了不应该是能支撑大量数据的体量了么
    opengps
        13
    opengps  
       2021-05-05 18:53:48 +08:00
    虽然说这个问题尽可能用 ssd 是大结论,不过我还是补充一下一定得选用 ssd 的原因:极限读取或者写入能力,ssd 相对于 hdd 的性能提升不是一点半点,像我之前处理的 gps 轨迹数据,用关系型数据库,ssd 环境的极限压测写入能力是普通机械硬盘的数倍,像我面对的这种场景,只要规划要求的指标高到了单块机械硬盘之外,就一定得要求上 ssd 了。不过现实中更多时候是采用分布式解决,因为这类业务往往不是单块硬盘能承载的
    mhycy
        14
    mhycy  
       2021-05-05 20:28:50 +08:00
    二手平台走起,感谢 intel 的牙膏
    no1xsyzy
        15
    no1xsyzy  
       2021-05-05 21:02:27 +08:00
    @seers 中间再来个 NVRAM (比如 Optane )
    SSD 内还有当作 SLC 的临时性缓存
    namelosw
        16
    namelosw  
       2021-05-05 23:59:49 +08:00
    B-Tree 其实就是给 HDD 发明的,用起来没啥问题

    也就是不知道咋优化的时候换个 SSD 祈祷有 1%的提升之类的时候使用

    土豪公司有操心这俩的时间都赚完换 SSD 的钱直接上 SSD 就行
    msg7086
        17
    msg7086  
       2021-05-06 05:18:27 +08:00
    @gBurnX 「业务倾向是更多的廉价机器」
    数据库一般都是倾向更快的存储,没有哪个数据库说磁盘越慢越好的。
    如果「倾向」更慢的存储,那应该还是因为预算有限。
    AngryPanda
        18
    AngryPanda  
       2021-05-06 08:01:51 +08:00 via iPhone   ❤️ 1
    @gBurnX 请问你创业成功了吗?
    zzzmh
        19
    zzzmh  
       2021-05-06 09:29:16 +08:00
    钱是一方面,还有数据重要性,尤其是万一你是自己的机房,ssd 要是哪天炸了, 数据就真的理你远去了。hdd 就算炸了,还能从尸体里提取出数据。当然有钱搞 ssd,再花点零头钱买 hdd 备份就行了。
    Rocketer
        20
    Rocketer  
       2021-05-06 09:33:12 +08:00 via iPhone
    用了好几年云数据库,已经不知道该怎么选配置硬件了。

    嗯……其实软件也不用配置,都是 managed service,拿来即用
    godwinma
        21
    godwinma  
       2021-05-06 10:13:34 +08:00
    @2 楼 同感,有钱就 SSD,没钱就 HDD
    gBurnX
        22
    gBurnX  
       2021-05-06 10:22:33 +08:00
    @msg7086
    数据库的磁盘当然越快越好,问题是,这只是技术层面考虑的。

    当你成为公司老板,就不能只考虑这一个方面了,整体业务与技术人员、设备的性价比,都得考虑进去。

    想想谷歌第一批数据服务器,为什么不走 EMC,而是用了一堆廉价的连机箱都没的自制设备?

    现在国内也有几个跑数据的大老板用这种东西,省下一大笔钱。
    gBurnX
        23
    gBurnX  
       2021-05-06 10:23:10 +08:00
    @AngryPanda 我觉得自己从来没成功过。
    qq976739120
        24
    qq976739120  
       2021-05-06 10:33:42 +08:00
    @gBurnX 会有小公司因为机器昂贵倒闭的吗
    realpg
        25
    realpg  
       2021-05-06 10:48:15 +08:00
    任何时候都要使用 ssd
    只有钱不够的时候再研究 hdd
    est
        26
    est  
       2021-05-06 11:04:36 +08:00
    es 、pg 里都可以把数据分区到不同的 volume 。你可以冷数据放 hdd,热数据放 ssd 。
    lewis89
        27
    lewis89  
       2021-05-06 13:15:46 +08:00
    @gBurnX HDD 能比 SSD 便宜多少,这点设备开支 占大部分创业公司程序员的工资支出的零头不到.. 别在这里讨论这个了..
    msg7086
        28
    msg7086  
       2021-05-06 14:34:45 +08:00
    @gBurnX
    EMC 和自制设备,之间的区别是服务和支持。HDD 和 SSD,这已经不是同一种硬件了。
    何况像楼上所说,硬件相对便宜,人员工资才是开支大头。
    要是采购点 SSD 跑业务都会把公司搞垮,那每个月的工资怕不是只能打发乞丐了。
    aaa5838769
        29
    aaa5838769  
       2021-05-06 15:10:35 +08:00
    看预算
    gBurnX
        30
    gBurnX  
       2021-05-06 18:17:17 +08:00
    @msg7086
    @lewis89
    @realpg

    1.我知道你们技术能力非常强。但这问题并不只是个单纯的技术问题,它牵连到公司运营、财务问题等很多因素。

    2.举个国内的例子吧,很多初创公司还真是穷,一两个员工,配置上一大堆自制廉价设备,是常态。之前我在研究挖矿收益与成本问题时,看到一篇关于电力成本的深度报道,就说了一批小挖矿公司,为了追求廉价电力,搬去四川云南那边,房子是 2 层大平房,机器放在一楼,2 楼是生活间。暴雨来临,一楼大量进水,能到膝盖那种。2 个员工一个通宵也没能救下 2000 多台机器,一半以上全泡水里,然后公司直接破产,设备被转卖。这种情况在别的领域也比比皆是。

    其次,就算阿里这种大公司,就算是它现在辉煌时期,它有钱能把数据库服务器全换为 EMC 吗?比如 IBM 旗舰级 z7,一台应该是 1 亿多 RMB,阿里总部与各省数据中心,全换成这种,首次投入与维护成本,以及操作这种设备的稀缺昂贵员工,阿里不说破产,元气大伤总会有吧?

    再比如谷歌,初创时,连杂牌设备都用不起更别提 EMC,最后只能自制,连机箱都不装,UPS 用不起就绑个电池到主板旁边,他们也不是愿意这么搞,公司初创还没钱,他们心里苦。

    换个领域,比如 IT 社区与问答领域,国外几个大牌都是地球上最好的 IT 厂家养着,自己只管花钱,根本就不用考虑经济问题,因此没广告,或只有极少的广告,用户体验也很爽。再看看国内,比如知乎、SegmentFault 、掘金、博客园,他们的广告数量就比较多了。甚至知乎现在没钱了,逼着大家交会员费,不交的话,很多精品文章看不了。并且还直接学百度贴吧,把广告当成内容混在内容区域里。

    3.总结:程序员修炼技术,固然重要。如果大佬们,能再去了解一下公司运营与财务方面的知识,你们以后看问题的格局会更大,说不定会成为超佬(超级大佬)。

    4.lewis89,你的号好像被限流了,你 @ 我,我的提醒系统里没你的提醒。我之前的那个号也是,建议换个号吧,不然你 @ 别人,别人都收不到你的消息。
    msg7086
        31
    msg7086  
       2021-05-07 00:47:23 +08:00 via Android
    @gBurnX 说了这么多,不还是预算问题?

    我在穷的创业公司也待过,服务器都是买的二手的,但是该用 SSD 的时候还是得用啊。这和 EMC 有什么关系。还是那句话,这两个是不同的设备。有些东西你用硬盘就是没法跑,必须上 SSD 。

    之前看过一篇文章说,有家创业公司做数据库更新,拿 15K SAS 硬盘跑的,跑了几个月都没跑完,前后做了各种技术方案来跑都不行,后来咬咬牙买了昂贵的 SSD 换上,几天就跑完了。就是为了省这几个 SSD 的钱,公司的业务拖了半年多没更新上去。你说公司是省钱了还是亏钱了?
    msg7086
        32
    msg7086  
       2021-05-07 01:30:08 +08:00
    然后正好你提到了大公司,那我也来谈谈大公司的故事吧。
    我司生产用的服务器比较壮硕,志强 M 系配几 TB 内存的样子。当然价格也很贵,不会随便给。
    我刚进公司那会儿,我们组一个小哥正好在修一块业务代码,需要一台服务器来做测试。
    结果不巧,之前在用的一台服务器的分配时间到期了,被上头收回了。
    小哥只好去再申请一台来。一周后,新的服务器终于批下来了。

    小哥合法摸鱼一周,公司白白损失了一周的工资,2500 美元。
    你说公司赚了还是亏了。

    你说为什么公司不搞点便宜的机器当测试机?我也不知道,公司不是我开的,我没发言权。

    至于创业公司收益成本问题,你举的例子也不对。暴雨进水机器泡汤,这个说白了还是搞这东西的人技术不行。不要以为技术就只是把东西搭起来跑就行了。技术还包括很多其他的能力,比如说容灾。

    同样两个人都能把矿场搞起来,但是一个人搞出来的下个暴雨就凉了,另一个人搞出来的则可以长期稳定跑,那这两个人的技术能力就是不同的,不能一概而论。

    同样做网站的,有些人把程序代码传到服务器上然后就开张了。但是如果要专业搞,分布式,灾备,恢复演练,这些都得搞起来。我帮别人维护论坛,论坛附件都是按日按月打包加密传云端备份,数据库都是 binlog 两机热备,然后每周快照打包加密传云端,脚本监控热备延迟时间,出了问题直接 IM 上报警提示。换别人可能装个面板就交付生产了。

    你的操作可以穷,设备可以省钱,但是要省在该省的地方,花要花在该花的地方。追求省钱只会让你亏钱。你那挖矿的例子,只要花个几百块钱,找个懂生产安全的人过来给点意见,可能就能避免破产的命运了。反过来,就算没有进水,如果起火了呢?结果不还是一样。

    哦还有,别拿 EMC 举例子了,这种为了举例而举例就很没意思。这就好像我们在讨论 SUV 和 Minivan 的时候你突然扯到游艇一样,就挺突然的。大型技术公司很多时候不是买轮子的,而是造轮子的。他们内部可能早就有类似,甚至可能比 EMC 之类更好的方案了。阿里不是 EMC 的受众。
    gBurnX
        33
    gBurnX  
       2021-05-07 01:51:42 +08:00
    @msg7086

    1.在给定项目经费内,到底用 15K SAS,还是 SSD,这是需要经过详细研究与小规模测试后,才能做决定。你提的这个例子,并不是换不换 SSD 的问题,而是前期项目设计与测试没做好。

    2.你说到小哥摸鱼的这个问题,我在上一条评论,结尾位置说过,这就是公司运营与财务方面问题。初创公司可招不起周薪 2500 美元的人,只能招月薪很便宜的人,于是在经济问题上,设备相对于员工来说,就值钱了。能招周薪 2500 美元的人的大中型公司,思路和初创公司就不一样了,能够承受小范围的这种风险,当然大规模员工出现长期摸鱼,即使是大中型公司照样得崩。

    3.谁都想用 EMC,阿里哪里不是 EMC 的受众,阿里只是承担不起全换 EMC 的费用。这就和你说要换 SSD 是一回事,很多初创公司并没有全换 SSD 的经济能力。
    FH228
        34
    FH228  
       2021-05-07 10:40:52 +08:00
    据我所知 ssd 坏了数据不可恢复,hdd 可以恢复
    log4j
        35
    log4j  
       2021-05-07 10:44:26 +08:00
    预算足够的情况,SSD 搞起吧,对于系统的提升不是一点半点的
    tomczhen
        36
    tomczhen  
       2021-05-07 12:58:21 +08:00 via Android
    @gBurnX 如果能准确的评估和预测性能需求确实可以在最优性价比上选出该用 SSD 还是 hhd,但是楼主就一句话的情况下,脑补出各种大戏也是佩服。

    且不谈如何准确估算创业公司业务发展速度,单从楼主的一句话需求,有钱 SSD 没钱 hhd 绝对没问题。

    至于其他的,我个人觉得有点杠了。
    fuyufjh
        37
    fuyufjh  
       2021-05-07 16:13:41 +08:00
    这年头还有数据库跑在 HDD 上吗。。至少云上是买不到了
    SIGEV13
        38
    SIGEV13  
       2021-05-08 07:00:26 +08:00
    达则 SSD,穷则 HDD
    julyclyde
        39
    julyclyde  
       2021-05-08 10:52:52 +08:00
    考虑到雇佣高级人才需要很多钱,还不是立刻就能见效
    建议直接使用“纯 SSD”数据库方案

    给你举个例子,当年美团数据库从硬盘换成 SSD 之后,直接导致千兆网卡不够用了,然后又换了网卡
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1055 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 19:43 · PVG 03:43 · LAX 11:43 · JFK 14:43
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.