这是一个创建于 1111 天前的主题,其中的信息可能已经有所发展或是发生改变。
hi 各位,遇到一个诡异的问题,业务环境的 postgres docker 容器会不定期挂掉。查了半个月实在找不到排查思路了,在此请教下各位,提前谢过。
1. docker 版本:1.11.2 +devicemapper
2. var/log/messages:
Jun 15 06:43:38 xxx systemd: Stopping Docker Application Container Engine...
Jun 15 06:43:38 xxx docker: time="2021-06-15T06:43:38.108240531+08:00" level=info msg="Processing signal 'terminated'"
Jun 15 06:43:38 xxx docker: time="2021-06-15T06:43:38+08:00" level=info msg="stopping containerd after receiving terminated"
Jun 15 06:43:38 xxx docker: time="2021-06-15T06:43:38.110994105+08:00" level=error msg="failed to receive event from containerd: rpc error: code = 13 desc = \"transport is closing\""
Jun 15 06:43:38 xxx systemd: Stopped Docker Application Container Engine.
Jun 15 06:43:38 xxx systemd: Closed Docker Socket for the API.
Jun 15 06:43:38 xxx systemd: Stopping Docker Socket for the API.
Jun 15 06:43:44 xxx systemd: Starting Docker Socket for the API.
Jun 15 06:43:44 xxx systemd: Listening on Docker Socket for the API.
Jun 15 06:43:44 xxx systemd: Starting Docker Application Container Engine...
看着是被第三方什么东西给停掉了,目前服务器上安装的有青藤云的 agent 但是没开扫描,目前看着没啥证据是青藤云导致的,卸载了问题依旧
3. 检查 docker inspect 和 docker logs 日志,没啥有用的信息
4. 尝试使用 auditctl 和 stap 之类的工具尝试追踪是啥程序给停掉了,折腾了几天也没啥发现。。
5 条回复 • 2021-09-08 10:23:36 +08:00
|
|
1
hzfyjgw 2021-09-08 10:15:42 +08:00
|
|
|
2
AngryPanda 2021-09-08 10:16:24 +08:00
宿主机操作系统是什么?
|
|
|
3
hzfyjgw 2021-09-08 10:16:33 +08:00
尝试更新 docker 版本试试
|
|
|
4
hzfyjgw 2021-09-08 10:21:46 +08:00
@ AngryPanda #2 docker 版本:1.11.2 +devicemapper 看这个驱动 应该是 Centos 的
|
|
|
5
chinvo 2021-09-08 10:23:36 +08:00 via iPhone
内存不够? CPU 吃紧?
|