V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Distributions
Ubuntu
Fedora
CentOS
中文资源站
网易开源镜像站
miaosl
V2EX  ›  Linux

怎么 zabbix 这么费劲啊,我要气哭了

  •  
  •   miaosl · 121 天前 · 4740 次点击
    这是一个创建于 121 天前的主题,其中的信息可能已经有所发展或是发生改变。

    我真几把受不了了 这样的服务端: 乌班图 24 客户端 1: debian12 客户端 2: centos7 客户端一,客户端主机名:msl1 ,然后自动注册条件是包含 msl ,注册不上,然后用匹配,匹配 msl 就可以了卧槽了然后删了注册到的主机又试了一次包含又行了?!

    客户端二,离谱的事情来了, 客户端配置: [root@mha0 scripts]# grep -Ev '^#|^$' /etc/zabbix/zabbix_agentd.conf PidFile=/run/zabbix/zabbix_agentd.pid LogFile=/var/log/zabbix/zabbix_agentd.log LogFileSize=0 AllowKey=system.run[*] Server=10.33.0.1 ServerActive=10.33.0.1 HostnameItem=system.hostname AllowRoot=1 Include=/etc/zabbix/zabbix_agentd.d/*.conf 然后服务端日志疯狂的报: ` 57342:20240722:115112.559 cannot send list of active checks to "10.2.0.0": host [mha0] not found

    客户端疯狂的报: 40610:20240722:195037.476 no active checks on server [10.33.0.1:10051]: host [mha0] not found

    但是我明明都能在服务端: root@msl:~# zabbix_get -s 10.2.0.0 -k "system.run[hostname]" mha0

    ` 我快气哭了,有经验的大佬快来救救我

    35 条回复    2024-07-24 16:52:07 +08:00
    bronyakaka
        1
    bronyakaka  
       121 天前
    只用过 prometheus grafana
    Int100
        2
    Int100  
       121 天前
    只用过 prometheus grafana +1
    ClericPy
        3
    ClericPy  
       121 天前
    最近两年有幸用过,实在是费劲。。。无奈下线了。你这报错问问大模型吧,说 mha0 没注册成功
    EKF/ELK + prometheus 配合云原生都成版本答案了
    daimaosix
        4
    daimaosix  
       121 天前 via Android
    关键我也真几把受不了啊
    PolarBears
        5
    PolarBears  
       121 天前
    zabbix 一开始我也用过一年,后来就都换 Prometheus 了
    Qetesh
        6
    Qetesh  
       121 天前
    服务端上主机的主机名称不对
    CivAx
        7
    CivAx  
       121 天前
    首先你为啥要用 zabbix… 你用的也都全是新的或者近代的系统,实在犯不上用 Zabbix
    R0n1n
        8
    R0n1n  
       121 天前 via Android
    LibreNMS
    vuv
        9
    vuv  
       121 天前
    我使用 debian 搭建过 zabbix ,用了下,不习惯,就没研究了。
    paxnil
        10
    paxnil  
       121 天前
    日志和 zabbix_get 说明客户端主机名是 mha0 ,不是 msl1 ,服务端没有配置名为 mha0 主机。
    waringid
        11
    waringid  
       121 天前
    应该是 zabbix 客户端获取的主机名称和你配置的主机名称不一致。先检查主机名是否一致,看看 /etc/hosts 里有没有对应的主机名称
    laminux29
        12
    laminux29  
       121 天前
    zabbix 虽然用户体验一般,但也不至于这种最简单的部署都存在问题。

    如果是第一次部署 zabiix ,你其实可以让 gpt4 全程协助你部署,有问题就及时问 gpt4 。虽然 gpt4 有时候偶尔智障,但基本部署以及解决基本问题,还是可以的。
    offswitch
        13
    offswitch  
       121 天前
    切换成 promethues ,现在都用 Prometheus 了,zabbix 以前比较流行,现在不怎么样。
    Hopetree
        14
    Hopetree  
       121 天前
    zabbix 这种老掉牙的东西还有人用啊,promethues+grafana 搞起
    zyq2280539
        15
    zyq2280539  
       121 天前
    我个人是用 zabbix,折腾久了也就有经验了,首先要在服务器端设置一个主机 host 标记,然后其他客户端都需要配置这个 host ,才可以。就一个配置问题
    zyq2280539
        16
    zyq2280539  
       121 天前
    上面说的这个 hosts 是指/etc/zabbix/web/zabbix.conf.php 里面的$ZBX_SERVER_NAME ,这个是服务端的标记,所有客户端想要顺利链接都需要配置 hosts 为相同值而已,值就是一个字符串随便起名
    JontyChen
        17
    JontyChen  
       121 天前
    上 prometheus 早日解脱
    frencis107
        18
    frencis107  
       121 天前
    prometheus +1

    op 试试吧,非常好用
    McreeWu
        19
    McreeWu  
       121 天前
    zabbix 配置起来真是麻烦,调试也麻烦,性能又一般,确实推荐 prometheus 。
    huangmingyou
        20
    huangmingyou  
       121 天前
    为啥要用这个化石
    s270987763
        21
    s270987763  
       121 天前
    1. 用了客户端主动上报模式;
    2. 日志报错 很明显是主机未能注册成功,无法发送主动上报的监控项;
    3. zabbix agent 配置 中主机名与 zabbix server web 配置中主机名不一致;
    4. 检查自动发现规则
    ladeo
        22
    ladeo  
       121 天前
    zabbix 很好用啊。估计 op 不是运维人员。
    服务器<1000 台基本都 ok 。
    zabbix 都不好用的话,naggios 不是更不好用了吗?
    liuliancao
        23
    liuliancao  
       121 天前
    第一个问题 有没可能是自动发现轮询间隔导致的 自动发现也可以设置 ip 段 要稍微等等
    第二个问题 客户端配置的 active 模式,你添加资产的时候 看下是不是选择了被动模式

    https://blog.51cto.com/qixue/category7.html 可以参考下我很久前写的 不过现在版本变化太大了 思路是差不多的

    不少 idc 都在使用,zabbix 还是挺好用的哈 使用这些肯定需要慢慢才会熟悉的 多折腾折腾 多 google 下

    如果还觉得受不了 也可以试用下 promethues 或者其他监控软件
    8355
        24
    8355  
       121 天前
    zabbix 那复杂的界面 不会用上手极为费劲
    prometheus + grafana
    拥抱现代化吧。。
    Sharuru
        25
    Sharuru  
       121 天前
    借楼求问 prometheus 有没有开箱即用的报警规则?
    miaosl
        26
    miaosl  
    OP
       121 天前
    @Qetesh 啊,大哥,我发现自动注册不设置条件就可以了,但是为啥设置条件就不行了,难道这个条件是对已经获取了的主机进行赛选用的嘛
    miaosl
        27
    miaosl  
    OP
       121 天前
    @paxnil 可能没说清楚,客户端 2 是 mha0 客户端 1 是 msl1 ,这个没问题的,我发现是因为我添加了自动注册条件导致的,但是讲道理这个自动注册条件为啥会报错
    miaosl
        28
    miaosl  
    OP
       121 天前
    @s270987763 是自动注册,我昨天看了一下,自动注册的条件是非必填项目,但是我填了,
    不填条件的化都能自动注册的,但是这个自动注册的条件到底是怎么用的
    miaosl
        29
    miaosl  
    OP
       121 天前
    @Sharuru 我看好多人都在说普罗米修斯才是主流,我的研究一下了
    FlytoSirius
        30
    FlytoSirius  
       121 天前
    很多年前,Zabbix 和 Nagios 还很流行, 云计算也并不普遍, 当时部署使用 Zabbix 管理我们的单位的数据中心。
    这么多年过去了, 现在做决策说还要用 Zabbix 的, 可能也都算是老头子了吧 。。。
    yulgang
        31
    yulgang  
       121 天前
    我没遇到过这种问题。

    agent 配置文件里的 hostname 要配置对,和 server 端网页里对应这个主机的 Host name 要一致,我习惯添 agent 端的 IP 地址。
    自动注册时 agent 配置文件里的 HostMetadata 也要设置对,然后 server 端网页上的自动注册的 Conditions 里配置 Host metadata contains XXXX ,Operations 里可以:

    Add to host groups: YYYY ;
    Remove from host groups: Discovered hosts ;
    Link to templates: TTTT

    这样就把 HostMetadata 里包含 XXXX 的主机自动添加到 YYYY 组里,如然后从自动注册分组里删掉这个主机,关联监控模板 TTTT


    host [mha0] not found 猜测是你的 agent 端 hosts 里没配置这个主机名的记录
    miaosl
        33
    miaosl  
    OP
       121 天前
    @yulgang 大哥,我最后是把 server 端的自动注册的条件取消了之后就可以了,因为我最开始学的时候,好像那个自动注册条件是就不需要配置?
    还是说这个自动注册的条件是对已经注册成主机的经行赛选分类的?
    263
        34
    263  
       120 天前
    看你的参数,只有 HostnameItem ,没有 Hostname ,这是不正确的配置。
    zabbix 建议即使设置了 HostnameItem=system.hostname ,也需要是指正确的 Hostname= mha0 。HostnameItem=system.hostname 是用来指定获取 hostname 的方法,而不是设置 hostname 。
    agent 的部署推荐使用 ansible 等来批量部署,直接获取系统变量填写,不要使用 HostnameItem=system.hostname 这种方式
    liuliancao
        35
    liuliancao  
       120 天前
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3641 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 10:40 · PVG 18:40 · LAX 02:40 · JFK 05:40
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.