Skip to main content

报警规则配置

AutoMQ 基于 Prometheus 集成,将 Metrics 数据推送到 Prometheus 后,用户可以使用 Prometheus 配置自定义报警规则,用于监控业务压力水位等异常情况。

报警模板

AutoMQ 团队基于生产环境高频使用的 Metrics 沉淀了一系列报警模板,用户可根据实际需求选择配置其中的报警规则。

tip

您可以通过填写表单联系 AutoMQ 团队获取下方 Prometheus 报警规则模板。

报警规则模板列表如下:

报警规则项
作用和场景
HighTopicBytesInPerSec
  • 报警规则:Topic 数据写入吞吐过高报警
  • 作用和场景:针对指定 topic 监控该 topic 每秒写入数据量是否超过阈值,一般用于监控突发写入流量。
HighTopicBytesInPerSecDayToDayChange
  • 报警规则:Topic 数据写入吞吐日同比增长过高报警
  • 作用和场景:针对指定 topic 监控该 topic 每秒写入数据量日同比增长比例超过阈值,一般用于监控突发写入流量。
LowTopicBytesInPerSec
  • 报警规则:Topic 数据写入吞吐过低报警
  • 作用和场景:针对指定 topic 监控该 topic 每秒写入数据量是否低于阈值,一般用于监控是否出现写入链路受损跌零。
LowTopicBytesInPerSecDayToDayChange
  • 报警规则:Topic 数据写入吞吐日同比下跌报警
  • 作用和场景:针对指定 topic 监控该 topic 每秒写入数据量日同比下跌比例超过阈值,一般用于监控写入链路受损,或者业务波动。
HighTopicBytesOutPerSec
  • 报警规则:Topic 数据读取吞吐过高报警
  • 作用和场景:针对指定 topic 监控该 topic 每秒读取数据量是否超过阈值,一般用于监控突发读取和 Fanout 流量。
HighTopicBytesOutPerSecDayToDayChange
  • 报警规则:Topic 数据读取吞吐日同比增长过高报警
  • 作用和场景:针对指定 topic 监控该 topic 每秒读取数据量日同比增长比例超过阈值,一般用于监控突发读取流量。
LowTopicBytesOutPerSec
  • 报警规则:Topic 数据读取吞吐过低报警
  • 作用和场景:针对指定 topic 监控该 topic 每秒读取数据量是否低于阈值,一般用于监控是否出现读取链路受损跌零。
LowTopicBytesOutPerSecDayToDayChange
  • 报警规则:Topic 数据读取吞吐日同比下跌超过阈值报警
  • 作用和场景:针对指定 topic 监控该 topic 每秒读取数据量日同比下跌比例超过阈值,一般用于监控读取流量受损或者业务波动。
HighGroupConsumeRatePerTopic
  • 报警规则: Consumer Group 消费速率过高报警
  • 作用和场景:针对指定 Consumer Group 监控该 Group 每秒消费消息数量是否高于阈值,一般用于监控是否出现读取异常。
LowGroupConsumeRatePerTopic
  • 报警规则: Consumer Group 消费速率过低报警
  • 作用和场景:针对指定 Consumer Group 监控该 Group 每秒消费消息数量是否低于阈值,一般用于监控是否出现读取异常。
HighGroupConsumerLag
  • 报警规则: Consumer Group 消费堆积告警
  • 作用和场景:针对指定 Consumer Group 监控该 Group 消费堆积数量是否高于阈值,一般用于监控是否出现读取异常。