V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
m31271n
V2EX  ›  程序员

各位 dalao 都用什么样的服务器监控解决方案?

  •  
  •   m31271n · 2016-07-21 14:49:59 +08:00 · 3122 次点击
    这是一个创建于 3046 天前的主题,其中的信息可能已经有所发展或是发生改变。

    只了解到现在比较常用的监控系统有 Graphite 和 TICK ,自己也写了个 总结 。但总感觉不对,所以特来发帖,请教各位 dalao 都是怎么做的?

    19 条回复    2016-07-22 14:41:57 +08:00
    zhangfan
        1
    zhangfan  
       2016-07-21 14:54:58 +08:00
    cacti
    9hills
        2
    9hills  
       2016-07-21 15:04:28 +08:00
    现在的开源监控方案,都不是很完美,传统的就不说了,新兴的 TICK ,这个的缺点是 InfluxDB 开源版本以后只有单机版,扩展性&性能非常成问题,其他的 TCK 也比较新兴,可能需要大量的二次开发。 哦中间的 Chrograf 建议换成 Grafana

    还有 Prometheus ,这个项目还没来得及了解,看文档还可以

    此外这种完整解决方案基本没有了,都是一些零散的模块,需要大量的二次开发和整合,比如 OpenTSDB (只存储时间序列)
    knightdf
        3
    knightdf  
       2016-07-21 15:19:09 +08:00
    nagios,graphite
    m31271n
        4
    m31271n  
    OP
       2016-07-21 15:23:37 +08:00
    @9hills 确实 InfluxDB 0.11 以前还有集群设置的文档,到 0.13 就完全剔除了。马上就要发 1.0 了,希望能再次出现。感谢你的回复。
    9hills
        5
    9hills  
       2016-07-21 15:39:10 +08:00
    @m31271n 集群版用来卖钱了,开源版应该不会有了。

    需要自己在业务层做 sharding
    c0878
        6
    c0878  
       2016-07-21 16:12:52 +08:00
    直接买监控宝 自己架设太麻烦
    m31271n
        7
    m31271n  
    OP
       2016-07-21 18:01:37 +08:00
    @9hills 你所说的在业务层做 sharding ,是指 “针对某一特定部分的业务架设一个 InfluxDB ”,然后再 “针对另一部分的业务架设一个 InfluxDB ” 吗?
    daocheng
        8
    daocheng  
       2016-07-21 18:12:14 +08:00
    额。。就用的之前推广的 OneAPM, 我是低端玩家
    Tony1ee
        9
    Tony1ee  
       2016-07-21 19:02:23 +08:00 via Android
    只有我看成 dadiao 吗…
    huson
        10
    huson  
       2016-07-21 19:20:25 +08:00
    zabbix
    jhaohai
        11
    jhaohai  
       2016-07-21 19:22:19 +08:00 via iPhone
    prometheus ,搭配各种 sd
    m31271n
        12
    m31271n  
    OP
       2016-07-21 19:27:20 +08:00
    @jhaohai sd 是啥?(就俩字, 很难检索,求告知)
    jhaohai
        13
    jhaohai  
       2016-07-21 20:02:29 +08:00 via iPhone   ❤️ 1
    @m31271n 服务发现, prometheus 可以配合 consul , etcd , zookeeper 之类的工具自动获取监控目标
    mytsing520
        14
    mytsing520  
       2016-07-21 20:04:45 +08:00
    zabbix
    shiny
        15
    shiny  
       2016-07-21 20:06:46 +08:00   ❤️ 1
    分两块,系统运行状态的监控和应用状态的监控, APM 类以及云服务器自带的系统监控
    m31271n
        16
    m31271n  
    OP
       2016-07-21 20:24:06 +08:00
    @jhaohai 感谢。
    pc10201
        17
    pc10201  
       2016-07-22 09:10:27 +08:00
    小米的监控系统
    Ryan817
        18
    Ryan817  
       2016-07-22 11:17:46 +08:00   ❤️ 1
    open-falcon
    prometheus
    influxdb 0.12 以后的版本就是坑,弃用
    m31271n
        19
    m31271n  
    OP
       2016-07-22 14:41:57 +08:00
    @Ryan817 谢。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2501 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 01:32 · PVG 09:32 · LAX 17:32 · JFK 20:32
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.