elastalert2钉钉告警

elastalert2 是一个日志告警服务,原理其实很简单,就是查询 es 数据,并触发告警信息。刚好最近在自建 k8s 和 efk 相关的内容,顺便更新到博客吧。

我们的日志通过 efk 套件采集、查询。

日志数据是存储在 es 内部的,所以我们的告警可以通过查询 es 数据来实现

因为我们采用 docker 部署,因此我们优先写好配置文件,然后放到容器中

1
2
3
elastalert.yaml # 主配置文件
rules/ # 存在告警规则
  demo1.yaml # 单个告警规则的配置文件
 1
 2
 3
 4
 5
 6
 7
 8
 9
10
rules_folder: /opt/elastalert/rules
run_every:
  seconds: 10
buffer_time:
  minutes: 15
es_host: es的主机ip
es_port: 9200
writeback_index: elastalert_status
alert_time_limit:
  days: 2
 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
name: "demo1"
type: "frequency"
index: "xxx-index*" # 查询日志所在的索引
is_enabled: true
num_events: 1 # 出现几次就告警
timeframe: 
  minutes: 1 # 1分钟 出现了 num_events次 匹配记录,就告警
realert: 
  minutes: 1 # 1分钟内忽略重复告警
timestamp_field: "@timestamp"
timestamp_type: "iso"
use_strftime_index: false
# 下面是在邮件中可能用到的字段
#alert_subject: "Test 测试alter_subject \n {} "
#alert_subject_args:
#  - "message"
#  - "@log_name"
alert_text_type: alert_text_only 
# 下面是告警模板
alert_text: | 
  > 正式环境 告警信息
  > 时间: {0}
  > 主机名: {1}
  > 触发次数: {2}
  > 匹配次数: {3}
  > 日志信息: {4}
alert_text_args: # 告警模板中用到的参数
  - log_time
  - host.name
  - num_hits
  - num_matches
  - message
filter:
  - query:
      query_string:
        query: "LEVEL: ERROR" # 告警查询语句
alert:
  - "dingtalk" # 告警类型
dingtalk_access_token: "asidoijdosajdsao" # 钉钉机器人访问地址
dingtalk_msgtype: "text" # 消息类型
1
2
3
4
5
6
7
# docker命令
docker run -d --name elastalert --restart=always \
-v $(pwd)/elastalert.yaml:/opt/elastalert/config.yaml \
-v $(pwd)/rules:/opt/elastalert/rules \
jertel/elastalert2 --verbose
# 查看日志
docker logs -f elastalert
1
2
3
4
5
6
> 正式环境 告警信息
> 时间: <MISSING VALUE>
> 主机名: mall-trade-service-7b5459d68b-fmqm2
> 触发次数: 1
> 匹配次数: 1
> 日志信息: |dubbo-client-idleCheck-thread-1|TID:N/A|ERROR|o.a.d.r.e.s.header.ReconnectTimerTask:51|doTask| [DUBBO] Fail to connect to HeaderExchangeClient