V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
sekisui
V2EX  ›  云修电脑

Linux (pve)过热(猜测)死机,可能是 CPU、主板问题还是固态硬盘、内存条问题

  •  
  •   sekisui · 207 天前 via iPhone · 1309 次点击
    这是一个创建于 207 天前的主题,其中的信息可能已经有所发展或是发生改变。
    主机:倍控 N100 主机
    状态:塞进弱电箱,散热一般
    nvme:金士顿 1T nvme (机械革命自带换下来的,否则不会买)
    内存条:阿斯加特 16G DDR5
    系统:pve8.1 系统,跑了 openwrt 和一个 lxc 的 debian
    现象:会出现不定时死机,状态是全死,pve 管理口和 openwrt 独立的 lan wan 全部不通
    不会自动重启
    买到手没有用 win 测一下压力,这一点怪我

    由于只有周末回家,想着做一些前期预案(买固态硬盘 or 内存条)方便快点解决。

    现在想让大家帮忙推测下,Linux 系统出现死机,且不重启,主要可能是 CPU 高温死机还是固态硬盘或者内存条
    因为印象中 CPU 撞墙会降频或者重启
    固态硬盘只碰见过掉盘或者无法写入
    内存条有问题比较玄学
    谢谢大家帮忙
    第 1 条附言  ·  41 天前
    回顾起来发现问题解决了但是没跟大家说方法
    结论是内存条问题 更换了三星颗粒内存条解决
    另外发现这种问题是这个品牌小主机常见问题
    也就是说倍控的小主机最好搭配三星颗粒内存条
    至于我的阿斯加特到底有没有坏(小主机跑 memory test 测试通不过)则不得而知
    13 条回复    2024-04-30 13:25:51 +08:00
    sekisui
        1
    sekisui  
    OP
       207 天前 via iPhone
    当然自我替换硬件测试是最好的,开这个帖主要是想通过现象做一个前期猜测,比如感觉是固态问题就京东先下单,感觉偏向于 CPU 或者主板那就到时候想办法复现
    JensenQian
        2
    JensenQian  
       207 天前 via Android
    你这 nvme 固态+这种没啥散热能力的小主机,都是发热大户,还塞弱电箱里面
    最好的选择就是直接放外面,买个小风扇放旁边对着吹
    ajaxgoldfish
        3
    ajaxgoldfish  
       207 天前 via Android
    个人遇见的夏天无厘头重启就是 cpu 虚焊导致重启,一个笔记本,一到夏天热了就重启,冬天屁事没有。
    rojer12
        4
    rojer12  
       207 天前
    盲猜一手硬盘,这些东西里面只有硬盘是最容易出问题的
    ferock
        5
    ferock  
       207 天前 via iPhone
    不要放小洞里…就没事
    M48A1
        6
    M48A1  
       207 天前 via iPhone
    之前我安装了 Windows server 遇到过太热了,虚拟的 ikuai 丢包

    直接安装 PVE 目前没有出现这种情况,感觉 pve 还是很节能~
    bjzhou1990
        7
    bjzhou1990  
       207 天前
    换 esxi 试试?我都稳定运行 1 年了
    Mithril
        8
    Mithril  
       207 天前
    PVE 的 kernel 有 bug ,会导致虚拟机 CPU 使用率极高然后直接卡死。
    大概是 8.1 还是哪个版本的改了,不过不确定你用的各种包版本对不对。
    你可以先试试升级了再说。
    lancelock
        9
    lancelock  
       207 天前
    这被动散热的,放外面都发烫,放弱电箱更不行了
    minami
        10
    minami  
       207 天前
    可能是供电不足,BIOS 里把 PL1/PL2 降下来,如果症状消失,建议退货,这是主板设计问题
    sekisui
        11
    sekisui  
    OP
       207 天前
    @JensenQian 换成 sata ssd 会不会好些,我以为 nvme 更耐造,毕竟软路由什么的对硬盘性能没什么要求
    JensenQian
        12
    JensenQian  
       206 天前 via Android
    @sekisui 还是整个散热,比硬盘简单
    impdx
        13
    impdx  
       202 天前
    linux 看日志就行了,把日志贴出来,就不用瞎猜了。最好接上显示器和键鼠看看 tty 能不能正常进,因为死机会重启的。下次死机看看 tty 能不能进,
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5582 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 08:50 · PVG 16:50 · LAX 00:50 · JFK 03:50
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.