如何解决Tensorflow 2.3.x Cudnn故障Windows 10 CUDA 10.1 CUDNN 7.6.5 Anaconda3
运行TensorFlow 2.3.x,然后停止然后再次运行它似乎导致Tensorflow无法初始化cudnn。在微调和调试前后处理时,不可避免的停止和启动。每次cudnn失败,我都必须重新启动计算机。每次运行该故障的可能性似乎都是50%。
我的设置是Windows 10,CUDA 10.1 Update 2,CUDN 7.6.5,Anaconda3 python 3.7 / 3.6,TensorFlow 2.3.0 / 2.3.1,NVIDIA RTX2080ti。我遵循了https://www.tensorflow.org/install/gpu中列出的确切要求,但这几乎无法使用。
我尝试了python 3.7,python 3.6,cudnn 7.6.x和CUDA 10.1原始版本,更新1和更新2以及TensorFlow 2.2.0。所有结果相同。 Tensorflow打印输出显示所有dll已成功加载,包括cudnn64_7.dll。为什么这么不稳定?
任何见识都会受到赞赏。
解决方法
经过几天的调试,我发现问题不在于CUDA,CUDNN,TensorFlow,Python,Anaconda,而实际上是Windows 10。
为了使Linux虚拟机在Windows中运行,我错误地加入了Windows Insider程序。那行得通,但随后TensorFlow在Windows中停止正常运行。我已经了解到内部程序有副作用,所以我重新安装了(这是10天或更新后回到标准版本的唯一方法)。我没有意识到Windows发布了主要版本更新V2004,并以为我会回到原来的状态。因此,当我完成安装过程时,我下载了最新版本的TF,并认为这是问题所在。
我启动了一台旧计算机,并在其上运行了我的代码。然后,我注意到Windows版本的差异,并将旧计算机升级到2004年。一切仍然正常。然后我找到了1909的ISO,并将其安装在我的主计算机上,一切随后又开始正常工作。
总而言之,似乎Windows 10 V2004不允许工具正确安装,但是只要您不必重新安装任何工具,从V1909升级到V2004仍然可以进行。谁知道当TF支持CUDA 11时会发生什么。Windows 10 V2004用户可能必须坚持使用旧版本的TF。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。