保姆级人工智能学习成长路径

0. 前言

  最近有很多小伙伴想学习人工智能,其中不少同学渴望从事相关职业。虽然网上的资料很多,但是很多内容不够接地气,导致他们看不懂,所以很迷茫,不知何去何从。作为获得AI比赛Top名次的老司机,就给大家讲讲如何系统学习人工智能,最终达到一名合格的算法工程师。希望大家能够跟随我一步步迈进人工智能的殿堂,一起冲鸭~~~
保姆级人工智能学习成长路径

  先简单说一下学习的最大误区就是一上来闷头看视频。看视频是非常低效的学习方式,相比于阅读来说,在同样的时间内看视频学习到的知识量是远远小于阅读的。当然,国内外著名大学的经典视频有时间也可以看看。所以在后续的每个阶段学习中,都会介绍重点的学习教材。

1. 第一阶段:编程语言学习

  在IT届,最让人朗朗上口的谚语是:Talk is cheap, show me the code。这也充分表明了在计算机领域中代码的重要性了。而人工智能作为计算机领域的分支,同样满足实践是检验真理唯一标准。推荐Python语言作为学习人工智能领域的入门语言。一来是因为Python简单易学,二来是因为在人工智能领域中,很多库和框架可以通过Python语言来调用。

  在这里推荐两个课程:简明Python教程Python官方教程,前者比较适合完全零基础的同学,后者更适合具有了一定基础的初学者。之所以推荐官方教程,是因为官网教程和论文都是最权威的一手资料。如果大家对于学习官网教程没有信心,可以学习我的专栏:Python新手快速入门。系统讲解了学习方法、官网教程的核心概念和重要内容,教你快速理解官网教程。以及最常用的几个机器学习库:Numpy、Pandas、re(正则表达式库)。

2. 第二阶段:机器学习基本理论

  学习完Python语言后,就需要进一步学习机器学习的基本理论。推荐的学习教材是李航老师的统计学习方法。其中的常用模型包括:

  • 朴素贝叶斯
  • 决策树
  • 支持向量机
  • 提升树
  • 其他模型

  作为一名老司机,先介绍初学者最容易犯的误区,仅仅关注于学习机器学习模型,而忽略了对机器学习核心概念和核心思想的理解,可以通过下列几个问题来进行大概的判断:

  • 如何有效划分数据集
  • 如何解决过拟合现象
  • 模型之间的关联和区别是什么
  • 规则和模型如何选择
  • 如何根据业务场景选择合适的算法

  如果课本内容已经学的很明白,建议同学可以阅读或者动手实现模型代码。大家对上述问题不是很清晰的话,如果反响热烈,后续也会通过系列专栏的形式来讲解这一部分。

3. 第三阶段:深度学习理论与实战

  学习完机器学习基本理论后,就需要进一步学习深度学习的理论与实战。这是由于在工业界中的数据集数量庞大,只有使用拟合能力更强的深度学习才能取得更好的效果。在此推荐邱锡鹏老师的神经网络与深度学习。在学习过程中重点把握不同神经网络的结构和适用场景。比如最常用的三种神经网络结构:

  • 前馈神经网络
  • 卷积神经网络
  • 循环神经网络

  与此同时,一定要动手使用深度学习框架来完成实践项目,比如使用深度学习框架(Tensorflow或者Pytorch)完成简单的分类或者回归的任务。然后再逐渐深入,从而加深对神经网络和深度学习的理解。

4. 第四阶段:细分领域深入学习

  再进一步就是选择细分领域进行学习了,相对主流的几大方向和细分方向分别是:

  • 计算机视觉(CV):图像分类、目标检测、关键点检测(如人体姿态估计)、图像分割、OCR等。主要提取的是颜色、形状和纹理等特征。

  • 自然语言处理(NLP):文本分类、命名实体识别、事件抽取、文本摘要、阅读理解等。主要提取的是词汇、语义等特征。

  • 推荐系统:热门推荐、Feed流、猜你喜欢等。推荐系统一般分为召回、粗排、精排、重排四个阶段。

  • 金融风控等:客户群体筛选、欺诈风险鉴别、信用评定等。近些年的金融风控也开始使用图神经网络。

  之前的几个阶段都可以通过教材的方式进行学习,而这一阶段的学习方式为工作或者比赛。如果没有合适的工作机会,但也想拿到进入人工智能领域的入场券,最简单直接的方式就是打比赛拿到top名次。

  本篇文章为机器学习入门之工具篇专栏中的指引性的文章。本专栏包含了Python基础、Numpy、Pandas、Linux和Git常用命令、TensoFflow、Pytorch的入门教程以及最常用的软件和网站。希望能对初学机器学习以及入门AI比赛的同学有所帮助。

  如果已经掌握了基础,也可以进一步学习个人精心打磨的另一个专栏: Al比赛教程。分享各类Al比赛(阿里云天池、科大讯飞等)前几名队伍的成功经验,包括NLP,CV、语音、时序预测、信息安全等方向。其中也包括自己取得的阿里云第一名的经验分享。也包括打比赛提分的一些实用tricks ,从而更好的帮助新手入门数据科学竞赛。

5. 第五阶段:集大成者

  如果我们想成为人工智能领域的大佬,就不能局限于某个细分领域了。因为很多领域之间其实是互相借鉴,互相成就的。举两个例子,一个是在NLP大杀四方的Transformer模型也被迁移到了CV领域,同样实现了佛挡杀佛。另外一个是先在CV领域中实现效果较好的simCLR(对比学习),后面被NLP领域借鉴实现了simCSE,也取得了极佳的效果。

  除此之外,也需要长期坚持对新事物的不断学习与探索,比如在2023年年初爆火的ChatGPT,不管是哪个细分领域的从业者,一定要多花时间学习和了解。刚好我也开了一个专栏:ChatGPT使用技巧和论文解读,更新频率为一周一更,希望能对大家有所帮助。

  最后再简单介绍下需要长期培养的几大能力,祝大家早日实现自己的梦想:

  • 实际业务建模
  • 论文阅读与复现
  • 代码阅读与优化

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
青葱年少的头像青葱年少普通用户
上一篇 2023年2月25日 下午4:39
下一篇 2023年2月25日 下午4:40

相关推荐