我正在通过Kubernetes集群提供jupyter笔记本.我设置了resources.limits来防止有人耗尽所有主机服务器的内存.
虽然一个问题是jupyter笔记本内核崩溃并自动重启后,它们不会在容器超出内存后抛出任何OOM错误,这将使用户非常困惑.
那么如何在使用Kubernetes运行时让jupyter笔记本引发OOM错误?
如果您只有一个特定的pod,则可以监视事件/日志,as in here:
kubectl get events --watch
kubectl logs -f podname
话虽这么说,但并未正确报告pod lifecycle中的所有事件,如kubernetes/kubernetes
issue 38532和(废弃)PR 45682所示.
但你仍然应该看到OOMKilled:当码头工人检查吊舱时是真的.
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。