@TOC运行报错 ‘CUBLAS_STATUS_INVALID_VALUE’. An unsupported value or parameter was passed to the function (a negative vector size, for example). To correct: ensure that all the parameters being passed have valid values. ]
问题陈述
使用Paddle深度学习平台运行相关程序时,报错信息如下:
OSError: (External) CUBLAS error(7).
[Hint: ‘CUBLAS_STATUS_INVALID_VALUE’. An unsupported value or parameter was passed to the function (a negative vector size, for example). To correct: ensure that all the parameters being passed have valid values. ] (at /paddle/paddle/phi/kernels/funcs/blas/blas_impl.cu.h:35)
目的
本人旨在记录自己实践过程中遇到的问题,希望能帮助到遇到相同问题的同学;鉴于相同报错信息的情况下,致错原因也可能是不同的,因此本文的适用情况也只是某些特定的环境 [若不适用,勿喷]:
简单说下运行环境:
Windows11 + WSL(Ubuntu 20.04), Windows11搭建AI训练环境-CUDA/cuDNN/paddle
前提:环境CUDA和cudnn是匹配的;
本人结合自身情况分析的原因及解决方案:
1、检查CUDA和cudnn环境是否是匹配的;
2、检查paddle在python版本下是否是安装成功的;
python 3.7 环境
程序训练中报错,报错信息 OSError: (External) CUBLAS error(7).
[Hint: ‘CUBLAS_STATUS_INVALID_VALUE’. An unsupported value or parameter was passed to the function (a negative vector size, for example). To correct: ensure that all the parameters being passed have valid values. ] (at /paddle/paddle/phi/kernels/funcs/blas/blas_impl.cu.h:35)
原因:Paddle没有成功安装,(或者不严谨的说法没有成功启动)
至此,可以得知报错的原因是Paddle, 简述:python 3.7环境下,Paddle 没有安装成功;
python 3.9 环境
python 3.9 环境下Paddle 成功安装
问题解决,代码可正常运行,
Windows11搭建AI训练环境-CUDA/cuDNN/paddle
可参考言午日尧耳总B站教程 https://www.bilibili.com/video/BV1Td4y1M7Va/?spm_id_from=333.999.0.0&vd_source=8971cc61860bce9fa06365b3d0ae5bff
(我只是知识的搬运工!)
文章出处登录后可见!