Fargate 服务 CPU 在重新部署后跳跃或下降

如何解决Fargate 服务 CPU 在重新部署后跳跃或下降

我有一个 ECS 服务，其中包含 1 个 Fargate 任务。有一个 ALB 将流量路由到它。此任务是从负载测试器接收到一个端点的连续流量流。我注意到每当我重新部署相同的任务定义时，平均服务 CPU 会出现跳跃或下降，然后它似乎在新的更低或更高的 CPU 上达到稳定状态。我一直在检查不同的指标和日志，但似乎找不到规律，因为传入请求的数量保持相对稳定，并且日志中没有抛出任何警告或错误。

有人知道要探索什么吗？

编辑

以下是用于上述任务的大致任务定义（去除任何空值或空值，或其他描述性值，如“家庭”）。请注意，它是一个 2 容器任务：（1）一个应用程序，（2）一个 nginx sidecar

{
  "networkMode": "awsvpc","cpu": "1024","memory": "2048","compatibilities": [
    "EC2","FARGATE"
  ],"containerDefinitions": [
    {
      "logConfiguration": {
        "logDriver": "awslogs","options": <options>
      },"portMappings": <ports>
      "image": <image>,"name": "app"
    },{
      "logConfiguration": {
        "logDriver": "awslogs","portMappings": <ports>,"image": <http_image>,"dependsOn": [
        {
          "containerName": "app","condition": "START"
        }
      ],"essential": true,"name": "http"
    }
  ],"requiresAttributes": [
    {
      "name": "com.amazonaws.ecs.capability.logging-driver.awslogs"
    },{
      "name": "ecs.capability.execution-role-awslogs"
    },{
      "name": "com.amazonaws.ecs.capability.ecr-auth"
    },{
      "name": "com.amazonaws.ecs.capability.docker-remote-api.1.19"
    },{
      "name": "com.amazonaws.ecs.capability.docker-remote-api.1.17"
    },{
      "name": "com.amazonaws.ecs.capability.task-iam-role"
    },{
      "name": "ecs.capability.container-ordering"
    },{
      "name": "ecs.capability.execution-role-ecr-pull"
    },{
      "name": "com.amazonaws.ecs.capability.docker-remote-api.1.18"
    },{
      "name": "ecs.capability.task-eni"
    }
  ],"requiresCompatibilities": [
    "FARGATE"
  ]
}

解决方法

您可能误读了图表，从平均 CPU 下降或跳跃为 2 的事实来看。

当您在任务达到 70% 的情况下重新部署时，ECS 将启动一个新任务（使用新版本的映像）。当第二个任务启动时，您有 2 个容器共享负载（好吧，就图表而言，因为它可能尚未收到实际流量）。所以平均 CPU 变为 35%（下降 50%）。

当新容器稳定（探测、烟雾测试等通过）时，ECS 将耗尽并关闭旧任务。发生这种情况时，您会注意到 CPU 平均值增加了 100%，这仅仅是因为现在计算了一个（而不是两个）任务的平均值。

您可以通过将图表上显示的跳跃和下降与重新部署时添加/删除任务的日志时间相关联来验证（或不）这一点。

当使用 ECS 自动扩展时同样适用：随着任务的添加，平均 CPU 使用率下降。

这可能是您的任务定义配置错误。你能在这里发帖吗？这是关于 ecs resource tuning

的文档

Fargate 服务 CPU 在重新部署后跳跃或下降

如何解决Fargate 服务 CPU 在重新部署后跳跃或下降

解决方法

相关推荐