一个多前在 v2 发了[分享]阿里云的 Prometheus Exporter这个项目的第一版. 之后陆续有一些反馈, 其中有不少反馈表示对 Prometheus + Alertmanager + Grafana 这一套不熟悉, 以为拉起 exporter 之后所有监控和看板就都有了.
于是当时就考虑那就写一个 docker-compose 帮助需要搭建监控告警系统的用户一键完成整套技术栈的部署好了. 磨磨蹭蹭一直拖到了今天晚上才一口气搞完. 主要是这个活确实比较脏, 没有啥乐趣, 因此目标也很明确了, 就是单纯来舔一波用户, 攒 star 和人气(不过也不知会不会有人需要呢...)
正式介绍下功能, 开箱即用的版本中包含了针对阿里云的看板, 诊断, 告警(钉钉通知)功能, docker-compose 会拉起 prometheus, alertmanager, grafana 以及 aliyun-exporter. 因此在这套基础上扩展自有 IDC 的监控和应用监控也很简单. 整体的感觉如下:
就是这样了, 项目地址: github
1
Jven 2019-01-25 00:29:46 +08:00 via Android
你难道不觉得 alert 规则才是最重要的吗,一般没人盯着面板看的
|
2
yylucifer 2019-01-25 10:49:56 +08:00
alertmanager 我不喜欢,太技术化了,用户不友好。
有两个东西我觉得很重要: - grafana 一键视图。 - 简单傻瓜的 alerting rule。 |
3
rayingecho OP @Jven
警报规则没有比较好的开源项目可以解决, 就用 prometheus 自己的解决方案了 |
4
rayingecho OP @yylucifer
是的, Prometheus +Alertmanager 这套警报偏向给运维用, 用户的学习成本挺高的, 基本难以自助式 Grafana 本身的警报模块足够傻瓜, 可惜功能太弱了, 一条规则无法追踪多条警报状态是个硬伤 一键视图不知道指什么, 能说明下吗? |