共计 565 个字符,预计需要花费 2 分钟才能阅读完成。
1.前言
服务的健壮稳定离不开优秀的代码,同时服务的运行也需要进行监测,使得我们可以第一时间发现问题。本文将简述Prometheus 如何接入企业微信机器人报警,实现服务运行状态监测
2.配置
首先我们要启用Prometheus的alert manager
配置报警规则
groups:
- name: instanceDown
rules:
- alert: InstanceDown
expr: up == 0
for: 1m
labels:
severity: '紧急'
env: '开发环境'
annotations:
description: '服务失联'
启动我们的机器人webhook
docker run --name wecomhook -e HOOK_KEY=yours -p 6666:6666 -d mysteriousman/prometheus-wecom-webhook:0.1
添加alertmanager webhook
receivers:
- name: 'wecom.hook'
webhook_configs:
- url: 'http://127.0.0.1:6666/webhook'
至此就可以监测我们服务的运行状态了,最终效果如下,注意需要service_id标签指定服务名称,env标签指定运行环境
3.小结
本文简述了如何接入企业微信机器人报警,达到监测服务状态的目的
正文完
你好,感谢你的分享,尝试了一下,一直会有 no value, 这个获取不到信息,这个no value 通过那个变量获取的
<no value>-服务恢复通知
当前状态:正常
当前实例:192.168.1.8:9100
当前服务:<no value>
通知详情:服务已恢复
恢复时间:2023-05-06 10:47:37
prometheus抓取目标的配置,你可以参考下
官方文档
labels下指定service_id