如何解决如何找到已完成 SLURM 作业的排队时间?
我试图找到一种方法来查看已完成作业的等待时间,直到它们在以 SLURM 作为工作负载管理器的集群上启动为止。
我知道“sacct”命令可以打印很多关于已完成作业的信息,但我没有发现任何对我的任务有用的信息。
完美的是:
- 作业在开始之前排队的时间
- 我提交作业的时间戳或日期(然后我可以计算出等待时间,因为“sacct”通过“开始”字段提供有关作业开始时间的信息)
你有什么有用的提示吗?
解决方法
sacct
命令具有:sacct -o start,submit
应该提供您需要的所有信息。
可以从 sacct
命令中获取作业的排队时间,如下所示:
sacct -X -j <jobid> -o Reserved
Reserved
列是,(来自 sacct manpage)
保留 多少挂钟时间用作此作业的保留时间。这是根据作业从符合条件的时间到实际开始的时间等待的时间得出的。格式与 Elapsed 相同。
请注意,这与 Slurm 中所谓的“高级资源预留”无关。
基本上,“提交”作业和“合格”作业的时间通常是相同的,但在某些情况下除外,例如,当作业使用 --hold
或 {{1} 提交时}.
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。