深度学习环境搭建

前言

入坑了深度学习,作为一个小白,我想开始做笔记,一则记录学习生活,二来写点东西可以消解一下我的独处时光。手持MacBook奈何没有GPU,只能选择远程ssh连接我们机房的“图形工作站”,老说3090多强,都没机会试一试,到手打开一看还是个Windows系统,给同学都整笑了,于是我开始操作起来

基于Windows系统的ssh

我直接公布答案吧,Windows系统是不支持作为“远端服务器”用pycharm和vscode远程ssh连接的,折腾了半天,用了各种方法, 到了半夜还是睡不着觉,用Google一查,pycharm官方工作人员给出了权威答案,如图,我看到去年也有人问这个问提,依然是not yet。
深度学习环境搭建

基于Linux系统的ssh

我决定在组会上哭穷,师兄告诉我可以把楼下那台吃了许久灰的2070搬来用,泪目。而且直接一步到位就是Ubuntu,我狂喜。直接ifconfig查ip地址,没能如愿查到ip,提示的是net啥东西没安装,需要sudo install一下,装上后重新在终端ifconfig就能查到ip了,有个疑问,好像出来了三个网络服务,对应着2-3组ip,我选择的是192开头的那一组,这地方还涉及到内网和公网的问题,有需要的可以搜索“内网穿透”,我这次用不到,先不说了。满怀期待地用我的mac终端再输入一串神秘代码,ssh username@ip_address里面的关键词懂得都懂吧,可是connect confused还是拒绝来着?总之就是没连上,Windows好歹还能从终端看看文件,Linux反而不行了?于是找了资料,发现可能是Linux的ssh服务没有开启。

Ubuntu开启ssh服务

这就引出了新的问题,不是Linux系统默认开启ssh吗?终端测试一下dpkg -l |grep ssh果然啊找不到服务,那就安装吧sudo apt-get install openssh-server给我报错,找不到软件包,此时的我濒临吐血,频频爆粗,拿到新机器的新鲜感全没了。强行给自己下机,第二天再搞。第二天我信心满满,一定要搞定这ssh,接着昨天的思路,找不到软件包怎么办呢?查了很多资料,两种解决方式:1.sudo apt upgrade;2.Linux换源,换成国内的。经过我的测试,第一种方法对我的Linux无效,第二个方法把“找不到软件包”的问题解决了,我还顺带学了一手终端文件夹的操作指令,wq q q!之类的。而且又出了新的问题,他跟我说依赖冲突“无法修正错误,因为您要求某些软件保持现状…”???我要求?我要求啥了?再找资料吧,我一度以为要重装系统了,但是我还是找到了一个办法,再次输入神秘代码sudo apt-get install openssh-server -ce=(version也就是上面的报错)哎嘿,终于让我安装上了!!这里我没有改端口,我在mac上测试输入密码后成功被Welcome了,芜湖。
深度学习环境搭建

Nvidia-smi失败

远程连接才仅仅是个开始而已,我想看看我的显存使用情况,听说需要这么个代码?nvidia-smi您猜怎么着?又又又出问题,这次的错误是“failed to initialize NVML…”绝了,我连个显卡信息都不配看?再查资料,说是驱动版本与内核版本不一致导致的。跳到下一步。

更新显卡驱动

既然驱动版本不一致,就让它们保持一致吧。我将首先卸载当前的驱动程序。

sudo apt-get purge nvidia*

然后查找这台电脑的内核版本

cat /proc/driver/nvidia/version

这台是470的大版本,装470版本的显卡驱动。

sudo apt-get install nvidia-driver-470 nvidia-settings nvidia-prime

还是让我给整明白了吧?成功看到显卡状态,可以看到是8G的显存,至此硬件部分应该都调教完毕了。
请添加图片描述

安装cuda+torch

接下来要跑程序,我忽然意识到一个问题,我的程序能调用GPU吗,或者说我的torch是GPU版本的吗?虚拟环境啥的对我来说已经太熟练了(辛酸)在虚拟环境里装torch,安装代码可以在官网获取,cuda版本对照表在下面链接。GPU的torch大约1个G多点吧,等一会就装好了。用那个什么available的命令输出true就OK了,至此,硬件部分已经全部搭载完成,接下来就是技术问题了,我要开始另一段旅程了(背影)。
Release Notes :: CUDA Toolkit Documentation

p.s.多讲一句

smi输出的process里面的type,我还以为是代表GPU还是CPU,但其实是别的意思,官方文档如下图。请添加图片描述
我还找到了一个简单的解释,所以我可以理解它。
请添加图片描述

还是忍不住多说一句,来到新的环境大概有半年的时间了吧,可能跟我的性格有关,总感觉在这里我只是个来往匆匆的行人,习惯性地跟别人说起,还是习惯性的“你们学校/这个学校“这样的话,其实我蛮喜欢这里的环境的,我分配到的办公楼门口是一个带着小亭子的水塘,虽然夏天在两边经过经常会被“天外来物”偷袭,但也是一种人鸟和谐的状态了,最近天气很好,我常在下午去晒一晒太阳。我对我的导师、同门、同学很满意,我很庆幸我不会为经费不足、横向工作繁重而苦恼。这半年唯一让我苦恼的就是我自己,我质疑自己,包括能力、背景和其他的什么东西,我也学会了走向成年最重要的是要独立,这包括我要有独当一面的能力和勇气,自己规划人生,然后承担自己规划的后果。最重要的,我要学会不依靠父母家庭,即使他们总会给我帮助的。人生是一个需要终生学习的过程,我要学着不那么古板,我学滑板、去live house、多采纳别人的观点,还有很多…我不想因为要不断获取知识和研究领域的局限而变得盲目而狭隘,我想给人生以色彩,不白来一趟人间。还有什么要说的呢?哦,对了,这段时间对这些设备的探索,让我发现钻研还是会有收获的,算是让我重拾了一部分信心吧。我现在的研究方向是“基于弱监督学习的点云数据智能处理”,如果有同仁对这一领域有所了解,我很希望可以共同学习。

O Captain! My Captain!那就先做自己的船长吧。

请添加图片描述

版权声明:本文为博主苦行生i原创文章,版权归属原作者,如果侵权,请联系我们删除!

原文链接:https://blog.csdn.net/weixin_43010839/article/details/123317499

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
xiaoxingxing的头像xiaoxingxing管理团队
上一篇 2022年3月6日 下午9:35
下一篇 2022年3月7日

相关推荐