Windows10创建Tensorflow-GPU环境(简单详细)

查看自己显卡支持的最高CUDA配置

打开NVIDIA控制面板,找不到的话在搜索NVIDIA Control Panel。
点击系统信息——组件,此处显示CUDA 11.5.125,这里的CUDA版本号指的是你的显卡支持的最高CUDA版本,需要下载不高于此版本的CUDA。
Windows10创建Tensorflow-GPU环境(简单详细)

确定tensorflow,keras,CUDA,cuDNN对应版本

tensorflow,CUDA,cudnn对应版本号查看
这里我选择的是TensorFlow=2.3.0,keras=2.4.3,CUDA=10.1,cuDNN=7.6.5

下载CUDA和cudnn

CUDA所有版本下载链接
Windows10创建Tensorflow-GPU环境(简单详细)

这里我选择的是CUDA Toolkit 10.1 update2 (Aug 2019), Versioned Online Documentation

cuDNN所有版本下载链接
Windows10创建Tensorflow-GPU环境(简单详细)

这里我选择的是Download cuDNN v7.6.5 (November 5th, 2019), for CUDA 10.1
Tips:下载cuDNN需要登录英伟达账号。

安装CUDA和cuDNN

安装CUDA

将安装包下载到自己指定的位置,双击运行cuda_10.1.243_426.00_win10.exe开始安装CUDA。这里采用NVIDA推荐的模式安装(不采用自定义),直接一路无脑点击即可。

安装cuDNN

解压下载好的cuDNN,打开后有如下目录
cuDNN目录
将bin,include,lib三个文件夹中的文件复制到CUDA对应的文件夹中
CUDA目录
如果你采用了推荐的无脑安装模式,那CUDA路径就如上所示在C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1中。如果自定义安装的就要去自定义的文件夹中找。

验证CUDA和cuDNN是否下载成功

此时我们已经下载完了CUDA和cudnn,接下来验证是否下载成功。
打开cdm命令行:输入nvcc –version。可以看到我们已经成功下载了CUDA10.1版本。
Windows10创建Tensorflow-GPU环境(简单详细)
打开C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\include,找到cudnn.h
Windows10创建Tensorflow-GPU环境(简单详细)
红框内显示的即为版本号,7.6.5。

配置环境变量

打开系统变量——选择Path编辑——新建——浏览Windows10创建Tensorflow-GPU环境(简单详细)
单击编辑-新建-浏览,将以下两个目录添加到环境变量中。
Windows10创建Tensorflow-GPU环境(简单详细)

下载tensorflow

这里推荐使用Anaconda,新建一个虚拟环境来安装tensorflow,安装时强烈建议使用pip不使用conda。因为conda下载容易有文件缺失。
如果没有添加pip清华源的话先添加一下清华源

pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

使用清华源的时候记得关掉VPN,不然会有URL ERROR
激活我们的虚拟环境(env-name为自定义的虚拟环境名):

conda activate env-name

使用pip命令下载tensorflow指定版本和keras指定版本:

pip install tensorflow==2.3.0
pip install keras==2.4.3

注意,不需要pip install tensorflow-gpu,因为pip下载的tensorflow默认可以使用GPU。

验证tensorflow是否能检测到GPU

运行以下代码

import tensorflow as tf
print(tf.config.list_physical_devices('GPU'))

输出[] 失败。
以下输出成功:
Windows10创建Tensorflow-GPU环境(简单详细)
这个时候就可以用GPU进行运算了!
运行代码查看时间:
Windows10创建Tensorflow-GPU环境(简单详细)
之前CPU运算时每个例子要跑4ms,GPU只要300us。
还可以从任务管理器查看GPU是否工作:
Windows10创建Tensorflow-GPU环境(简单详细)
如果是CPU工作的话,运行机器学习代码的时候,CPU使用率会飙到100%。

问题总结

安装不成功有两个主要原因:
1,tensorflow,CUDA,cuDNN版本不匹配。
2,使用conda安装了tensorflow和keras。
我遇到的主要是第二点问题。如果帮到你了点个赞再走吧QAQ。

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
扎眼的阳光的头像扎眼的阳光普通用户
上一篇 2022年3月28日 下午2:36
下一篇 2022年3月28日

相关推荐