AMD GPU驱动,ROCM,Pytorch安装教程(A卡6700xt)

我用的操作系统为ubuntu20.04,其他系统应该类似,只是命令稍有不同。

安装AMD GPU驱动

AMD驱动下载地址:https://www.amd.com/en/support/kb/release-notes/rn-amdgpu-unified-linux-22-20

进去之后找到你想安装的版本,这里是闭源驱动。

下载好后运行sudo apt install amdgpu-install_5.4.50403-1_all.deb

这个名字根据自己下载的文件进行更改,直接Tab就行。

如果报依赖错误可以尝试sudo apt-get -f install命令来修复依赖错误。

之后更新依赖sudo apt update.

安装ROCM

安装ROCM,这里要–no-dkms不安装内核,看资料好像现在的ubuntu自己带内核,所以加上好像会有问题。有知道的可以评论区讨论。

sudo amdgpu-install –usecase=rocm,hip,mllib –no-dkms

到这里驱动和ROCM就安装完了。

安装Pytorch

可以在pytorch官网找到安装命令

https://pytorch.org/

 

例如我用pip安装

pip3 install torch torchvision torchaudio –index-url https://download.pytorch.org/whl/rocm5.4.2

测试安装

打开python3

import torch

torch.cuda.is_available()

如果返回True

恭喜你,安装成功。

安装完之后可能还需要进行一些操作。

#添加环境
sudo usermod -a -G video $LOGNAME
sudo usermod -a -G render $LOGNAME

#在文件执行
vim ~/.bashrc #添加下面
export HSA_OVERRIDE_GFX_VERSION=10.3.0 #我这里的显卡是amd的RX6700xt
export LD_LIBRARY_PATH=/opt/rocm/lib
source ~/.bashrc#通重新执行刚修改的初始化文件
# 如果运行import之后报错找不到这些文件,复制一下链接文件
cd $LD_LIBRARY_PATH
cp librocblas.so.0 librocblas.so
cp libMIOpen.so.1 libMIOpen.so
cp librocrand.so.1 librocrand.so

其它问题:

Process finished with exit code 139 (interrupted by signal 11: SIGSEGV)
我还遇到了这个报错,原因是我没有添加
export HSA_OVERRIDE_GFX_VERSION=10.3.0 #我这里的显卡是amd的RX6700xt
export LD_LIBRARY_PATH=/opt/rocm/lib
到对应的用户下,只加了root,所以只有root能用。

有热心网友指出:

dkms可以安装。跟系统内核不冲突,只有在装多版本ROCm时不能装dkms。
export HSA_OVERRIDE_GFX_VERSION=10.3.0一般不用。我的同学时7900xtx被这个坑了一下,不用export就行。
也不用export LD_LIBRARY_PATH=/opt/rocm/lib ,hipconfig命令执行应该能获得准确的环境变量。rocmdev和mlsdk也可以安装一下。

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
扎眼的阳光的头像扎眼的阳光普通用户
上一篇 2023年6月26日
下一篇 2023年6月26日

相关推荐