structure
感知机(perceptron)是神经网络的基础结构。下图是一个感知机的例子:
图解感知器的结构(从下到上)解释如下:
- 两个输入节点(黄色),接受来自外部输入的输入值:和(这是为了帮助感知器感知外部环境,比如预测一个人的癌症患病率,感知器需要先知道这个人的年龄、性别, ETC。)
- 一个输入节点(黄色),其阈值由内部模型决定:(这是为了让感知器更加灵活,而不是仅仅依靠外部输入值来确定输出值)
- 三个输入节点到中间节点的连接权重(实线箭头):~(这是感知器将学习的内容:不同环境因素对预测结果的影响有多大)
- 通过输入节点和连接权重的加权求和计算的一个中间值(深黄色):(这是先计算输入层带来的基本结果,为计算最终输出值做准备)。计算方法是:将每个输入值~乘以对应的权重~(对应公式中的)加上阈值乘以阈值节点对应的权重(对应公式中的。因为固定为,所以)
- 一个激活函数(虚线箭头),用于对中间值进行特殊变换以获得最终输出结果:(在这一步中,可以使用各种函数对初始计算的中间值进行各种变换,使感知器可以输出更灵活,达到不同的效果,解决不同的问题。当然你也可以保持原值不做任何变换)
在大多数情况下,感知器的结构通常表示为:
effect
神经网络作为一种监督学习方法,主要解决两大问题:
- 回归问题:处理连续值。比如预测某只股票明日的价格,有无限种可能,因为价格可以是0到无穷大的任意一个。
- 分类问题:处理离散值。比如预测一张图片中的动物是猫还是狗,只有两种可能,例如输出为0表示图片中是猫,输出为1表示图片中是狗。
在回归问题中,激活函数可以是不做任何处理,保留原值的函数:
在分类问题中,激活函数可以是阶跃函数:
文章出处登录后可见!
已经登录?立即刷新