如何解决AWS ECS 任务错误 -- 可用的 GPU 资源不足
当我发布具有下一个 GPU 要求的任务(所需计数为 1)的服务时,我在启动类型为 EC2 的 AWS ECS 集群上遇到以下错误:
"resourceRequirements": [
{
"type":"GPU","value": "1"
}
]
错误信息: 服务 XXXXXXX 无法放置任务,因为没有容器实例满足其所有要求。 最匹配的容器实例 YYYYYYYYY 的可用 GPU 资源不足。
附加到集群的 EC2 实例是 p2.8xlarge,有 8 个 GPU,应该足以满足我的要求。
欢迎提供有关 ECS 如何计算这些要求的任何帮助或信息。
谢谢
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com(将#修改为@)