如何解决Fargate 服务 CPU 在重新部署后跳跃或下降
我有一个 ECS 服务,其中包含 1 个 Fargate 任务。有一个 ALB 将流量路由到它。此任务是从负载测试器接收到一个端点的连续流量流。我注意到每当我重新部署相同的任务定义时,平均服务 CPU 会出现跳跃或下降,然后它似乎在新的更低或更高的 CPU 上达到稳定状态。我一直在检查不同的指标和日志,但似乎找不到规律,因为传入请求的数量保持相对稳定,并且日志中没有抛出任何警告或错误。
有人知道要探索什么吗?
编辑
以下是用于上述任务的大致任务定义(去除任何空值或空值,或其他描述性值,如“家庭”)。请注意,它是一个 2 容器任务:(1)一个应用程序,(2)一个 nginx sidecar
{
"networkMode": "awsvpc","cpu": "1024","memory": "2048","compatibilities": [
"EC2","FARGATE"
],"containerDefinitions": [
{
"logConfiguration": {
"logDriver": "awslogs","options": <options>
},"portMappings": <ports>
"image": <image>,"name": "app"
},{
"logConfiguration": {
"logDriver": "awslogs","portMappings": <ports>,"image": <http_image>,"dependsOn": [
{
"containerName": "app","condition": "START"
}
],"essential": true,"name": "http"
}
],"requiresAttributes": [
{
"name": "com.amazonaws.ecs.capability.logging-driver.awslogs"
},{
"name": "ecs.capability.execution-role-awslogs"
},{
"name": "com.amazonaws.ecs.capability.ecr-auth"
},{
"name": "com.amazonaws.ecs.capability.docker-remote-api.1.19"
},{
"name": "com.amazonaws.ecs.capability.docker-remote-api.1.17"
},{
"name": "com.amazonaws.ecs.capability.task-iam-role"
},{
"name": "ecs.capability.container-ordering"
},{
"name": "ecs.capability.execution-role-ecr-pull"
},{
"name": "com.amazonaws.ecs.capability.docker-remote-api.1.18"
},{
"name": "ecs.capability.task-eni"
}
],"requiresCompatibilities": [
"FARGATE"
]
}
解决方法
您可能误读了图表,从平均 CPU 下降或跳跃为 2 的事实来看。
当您在任务达到 70% 的情况下重新部署时,ECS 将启动一个新任务(使用新版本的映像)。当第二个任务启动时,您有 2 个容器共享负载(好吧,就图表而言,因为它可能尚未收到实际流量)。所以平均 CPU 变为 35%(下降 50%)。
当新容器稳定(探测、烟雾测试等通过)时,ECS 将耗尽并关闭旧任务。发生这种情况时,您会注意到 CPU 平均值增加了 100%,这仅仅是因为现在计算了一个(而不是两个)任务的平均值。
您可以通过将图表上显示的跳跃和下降与重新部署时添加/删除任务的日志时间相关联来验证(或不)这一点。
当使用 ECS 自动扩展时同样适用:随着任务的添加,平均 CPU 使用率下降。
,这可能是您的任务定义配置错误。你能在这里发帖吗?这是关于 ecs resource tuning
的文档版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。