V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Distributions
Ubuntu
Fedora
CentOS
中文资源站
网易开源镜像站
metorm
V2EX  ›  Linux

Manjaro(Arch) + KDE 频繁死机,有人遇到吗?如何诊断具体原因?

  •  
  •   metorm · 2017-08-08 18:50:37 +08:00 · 12475 次点击
    这是一个创建于 2662 天前的主题,其中的信息可能已经有所发展或是发生改变。
    滚动升级的 Manjaro + KDE,最近开始频繁死机。
    部分时候是首先界面卡住,鼠标指针还能动,然后过一会儿就彻底不动了。此时短按电源键没用,只能长按强制关机。
    也有不少情况下,直接就彻底失去响应了,没有界面冻住鼠标能动这一过程。

    开始怀疑是过热,于是想了个办法(其实是自己写了个脚本),温度高于特定数值就降频。
    脚本地址: https://github.com/metorm/MyTinyUtilities/blob/master/linux/script/thermal-protect.bash
    把这个脚本开机自启之后,情况有所好转,但还是还是时有发生,我觉得可能不完全是硬件问题。

    求问,这个情况,有人遇到过吗?或者,有没有人有过类似的情况,提供点诊断思路?
    14 条回复    2017-08-24 22:05:21 +08:00
    o02VFqu3gZnZfX8n
        1
    o02VFqu3gZnZfX8n  
       2017-08-08 18:57:04 +08:00
    试着看看 systemd 有没有哪个 service 异常
    https://wiki.archlinux.org/index.php/Systemd#Investigating_systemd_errors
    pipapa
        2
    pipapa  
       2017-08-09 00:08:29 +08:00
    个人感觉可能是显卡原因。贴一贴 log
    onlyice
        3
    onlyice  
       2017-08-09 08:26:08 +08:00 via Android
    看看 systemd 的日志有没有奇怪的错误

    同时卡住时按 Ctrl + Alt + F2 切换到文本终端,看看哪个程序 CPU 占用高
    metorm
        4
    metorm  
    OP
       2017-08-09 08:44:05 +08:00
    谢谢各位,今天再重启的话我关注一下……
    metorm
        5
    metorm  
    OP
       2017-08-09 08:45:21 +08:00
    @pipapa N 卡。你是怀疑显卡过热死了,所以输出图像的部分全挂掉了?
    fucker
        6
    fucker  
       2017-08-09 10:38:23 +08:00
    同 Manjaro KDE,没遇到你的问题
    持续关注中。。
    Death
        7
    Death  
       2017-08-09 11:10:38 +08:00
    同 Manjaro KDE,我遇到的情况一般都是 chrome 突然卡死,或者锁屏后解锁时卡死。都是鼠标能动,但是界面没有反应,切到 tty 后发现,tty 也卡住了。也没有找到原因……
    pipapa
        8
    pipapa  
       2017-08-09 13:53:43 +08:00
    @metorm 驱动没弄好,总会有玄学的问题
    metorm
        9
    metorm  
    OP
       2017-08-09 15:22:46 +08:00
    @pipapa 直接装的软件仓库里面的版本啊,算 CUDA 也好着呢,按理说不该是驱动……
    metorm
        10
    metorm  
    OP
       2017-08-09 18:42:25 +08:00
    下午又死了一次,确认 Ctrl + Alt + F2 无效
    这么说的话,应该是真死了吧? @onlyice
    onlyice
        11
    onlyice  
       2017-08-09 19:24:49 +08:00
    @metorm 有可能是卡到 Ctrl + Alt + F2 都进不去
    不懂其他 debug 方式了。。
    metorm
        12
    metorm  
    OP
       2017-08-15 20:13:12 +08:00   ❤️ 3
    找到了疑似原因:
    由于我是固态硬盘并且磁盘空间有点紧张。
    我安装了 systemd-swap 软件包,并且开启了动态 swap 文件功能

    swapfu_enabled=1
    # Swap File Universal

    这个服务据说可以根据 swap 用量动态分配 swap 文件。然后,貌似这个不太稳定。

    由于物理内存耗尽经常与高负载同时发生,所以我之前认为是过热导致的。
    怀疑到这里,是因为前天我在虚拟机干活,为了虚拟机快一些,临时将虚拟机内存从 2G 增加到 4G (物理内存 8G ),并且在虚拟机之外开了 chrome 查资料。明明没什么负载,机器也刚打开不久,它就又死了,所以我怀疑跟内存相关。很容易联想到这里。关掉这个服务,使劲开 chrome 标签,内存耗尽后响应非常满,但是没有死。
    于是卸掉这个软件,用了几天,再没有死机。
    所以这个死机原因,就暂时可以认为是 systemd-swap 中 swapfu 功能的锅了。
    @onlyice @DaVinci42 @Death @fucker @pipapa
    onlyice
        13
    onlyice  
       2017-08-17 11:35:55 +08:00 via Android
    @metorm 赞楼主挖掘精神!
    metorm
        14
    metorm  
    OP
       2017-08-24 22:05:21 +08:00
    更新一下,从上次发帖到现在已经过了 9 天,没有一次死机,蛤蛤蛤~~~
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   992 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 19:51 · PVG 03:51 · LAX 11:51 · JFK 14:51
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.