V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
zuotun
V2EX  ›  问与答

开机之后掉显卡如何排查?

  •  
  •   zuotun · 1 天前 · 553 次点击
    刚入手的 R730 + Tesla ,刚开机时显卡正常,但是过了几个小时 nvidia-smi 就显示找不到设备,并且在 lspci 中也是能看到显卡存在的。
    显卡外观看上去正常没有焊油,电源也是 750W 的,诸位有什么头猪吗?
    8 条回复    2024-12-25 08:15:55 +08:00
    lixiaobai913
        1
    lixiaobai913  
       1 天前
    设备管理器看一下显卡状态,更换显卡驱动试一下,BIOS 设置超频也有关系
    Atukey
        2
    Atukey  
       1 天前
    显存可能虚焊了,跟你同样的问题,3070 改了 16G 显存后就间歇性黑屏,直到有一次黑屏重启后花屏了,拿去维修才知道是显存虚焊了。
    kk2syc
        3
    kk2syc  
       1 天前
    lspci 能看到说明显卡是没问题的,问题应该是 nvidia-smi
    kk2syc
        4
    kk2syc  
       1 天前
    baibaibai0126
        5
    baibaibai0126  
       1 天前
    之前我们这有台双 4090 的设备,一直掉显卡,后来换了电源线才解决,说是功率的问题。头绪打成头猪是故意的吗。
    zuotun
        6
    zuotun  
    OP
       1 天前
    @baibaibai0126 #5 总不能是手写输入的吧。但我只有一张卡还没开始干活呢,待机功率最高也就三十多瓦不至于因为这个掉吧。
    Damn
        7
    Damn  
       22 小时 48 分钟前 via iPhone
    @baibaibai0126 一看就是五笔了吧。。
    yy306525121
        8
    yy306525121  
       13 小时 18 分钟前 via iPhone
    有可能是电源电压不够
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3056 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 20ms · UTC 13:34 · PVG 21:34 · LAX 05:34 · JFK 08:34
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.