Pytorch报错解决——(亲测有效)RuntimeError: Distributed package doesn‘t have NCCL built in

在我跑SLADD模型的时候,出现了如下报错:

上网搜寻一番后,发现了解决方法
第一步:在本文件的开头机上这样两行代码:

import os
os.environ["PL_TORCH_DISTRIBUTED_BACKEND"] = "gloo"

第二步:在本文件代码中找到这样一部分代码:

dist.init_process_group(backend='nccl', init_method='env://', world_size=args.world_size, rank=rank)这一行中的nccl换成gloo
若要解释原因就是windows系统不支持NCCL,只能换用GLOO

亲测这个报错就没了,然而接下来还有好多别的报错…我继续去解决了,解决完再分享别的~

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
青葱年少的头像青葱年少普通用户
上一篇 2023年8月2日
下一篇 2023年8月2日

相关推荐