如何解决“最旧消息平均值的近似年龄”矩阵中的未知峰值
我每天同一时间从我的Amazon SQS收到以下警报消息。
您收到此电子邮件是因为{my region}区域中的Amazon CloudWatch警报“ SQS中的旧消息”已进入ALARM状态,因为“阈值交叉:最后1个数据点中有1个[183.0(30/09 / 20 00:06:00)]大于或等于阈值(180.0)(“ OK-> ALARM transition”的最小1个数据点)。在“世界标准时间2020年9月30日星期三00:07:22”。
警报详细信息:
- 名称:SQS中的旧邮件
- 说明:Abc更新花费的时间太长。检查处理器和队列。
- 状态更改:确定->警报
- 状态更改的原因:越过阈值:最近1个数据点中的1个[183.0(30/09/20 00:06:00)]大于或等于 阈值(180.0)(至少1个数据点为OK-> ALARM 过渡)。
- 时间戳:世界标准时间2020年9月30日星期三00:07:22
阈值:
- 度量标准为GreaterThanOrEqualToThreshold 180.0达60秒时,警报处于ALARM状态。
受监控的指标:
- MetricNamespace:AWS / SQS
- MetricName:roxAgeOfOldestMessage
- 期间:60秒
- 统计数据:平均值
- 单位:未指定
状态更改操作:
- 好的:
- INSUFFICIENT_DATA:
所以我检查了cloudwatch,看看发生了什么。因此,我确定在用于处理SQS中消息的实例的同一时间,CPU利用率正在降低。因此,我决定由于服务器停机而增加了SQS中的消息。
但是我无法确定为什么服务器每天都在同一时间关闭。我检查了以下内容
- EC2快照-没有自动计划
- RDS快照-当时没有自动计划
- 服务器中的Cron作业
是否有任何拥有这种经验的人能确定确切的问题是什么?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。