机器学习基础学习笔记【一】

一.机器学习

1.1机器学习定义

  • 一个计算机程序被称为可以学习,是指它能够针对某个任务T和某个性能指标P,从经验E中学习。这种学习的特点是,它在T上的被P所衡量的性能,会随着经验E的增加而提高
  • 任务T:编写计算机程序识别菊花和玫瑰
  • 经验E:一大堆菊花和玫瑰的图片(即训练样本)
  • 性能指标P:不同的机器学习算法会有不同(比如可以使用识别率作为性能指标,即把更多的菊花识别为菊花,更多的玫瑰识别为玫瑰,识别的正确率称为识别率)
  • 根据定义,机器学习就是针对识别菊花和玫瑰的任务,构造某种算法,这种算法的特点是,当训练的菊花和玫瑰的图片越来越多的时候,也就是E越来越多的时候,识别率P也会越来越高。

1.2机器学习的特点

  • 数据=特征
  • 答案=标签
  • 规则=模型
  • 样本=数据+答案

1.3关于数据的基本概念

  • 处理的数据格式和excel表格或者结构化数据表格相同。
  • 整个表格称为数据集(即所有样本组成的集合)
  • 行称为样本或实例
  • 列称为特征或属性

二.机器学习的主要工作

  • 根据学习方式:监督学习、非监督学习、强化学习等
  • 根据学习任务:分类、回归、聚类、降维等

2.1从数据中学习【监督学习】

  • 常见的监督学习任务是分类和回归
  • 当模型被用于预测样本所属类别时,就是一个分类问题,例如要区别某张给定图片种的对象
    是猫还是狗
  • 所要预测的样本结果为连续数值时,就是一个回归问题,例如要预测某股票未来一周的市
    场价格。

2.2分析无经验的新问题【无监督学习】

  • 无监督学习(有些书籍也称为非监督式学习),则是在没有训练集的情况下,对没有标签的数据进行分析并建立合适的模型,以便给出问题解决方案的方法。
  • 无监督学习中样本没有对应的标签或目标值。
  • 半监督学习是有监督学习和无监督学习的综合。
  • 无监督学习任务中常用的是聚类和降维

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
乘风的头像乘风管理团队
上一篇 2022年5月11日
下一篇 2022年5月11日

相关推荐