如何解决GCloud VM 实例在重启后卸载了 Nvidia 驱动程序
我已经在 GCP 上使用虚拟机实例有一段时间了,我不得不重新启动它,因为我在通过 SSH 登录时遇到了问题。我在 GCP 网站上的虚拟机实例管理器中使用了“重置”选项,之后 Nvidia 驱动程序似乎关闭了。
我尝试运行 nvidia-smi
并得到以下结果:
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
我不知道如何重新设置它,也不知道为什么会发生这种情况。因此,我无法恢复我的 Docker 容器。
解决方法
有一个 PIT-1,PIT-2 并且注意到有一些适用于 Ubuntu 的 WA,你可以试试;否则在我看来,您目前遇到的问题是预期行为。
这些是在 CentOS 7 上成功安装驱动程序的步骤:
- 运行 sudo yum -y 更新内核
- 运行 sudo yum -y update
- 停止和启动实例
- 运行 sudo yum install kernel-devel kernel-headers -y
- 按照从第 3 步 1 开始的文档进行操作。
如果您在按照说明并停止和启动实例后运行“nvidia-smi”,您将能够看到文档中提到的正确输出。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。