算法原理

在开始步入算法之前，可以很明显的看到回归的两字，这分类相比是另一类问题，而Sigmoid函数将回归问题也应用到了分类问题上来。
$%5Csigma%28z%29%3D%5Cfrac%7B1%7D%7B1-e%5E%7B-z%7D%7D$
机器学习（四）Logistic回归
作出声明：Logistic是一个分类算法。

我们回顾一下之前的分类算法是什么样子。是通过样本的某一些特征来进行该样本的标签（Label），其特征往往是离散的数据，因为往往离散的数据是可以做到线性可划分的。

问：遇到连续数据怎么办❓

回归：非学术的解释是用一条直线对已知的点进行线性拟合，得到一条线形的方程类似于y=ax+b。

假设：在不知道摄氏度和华氏度的换算关系的情况下，如何从一些样本值计算出这个公式？
F%3DaC%2Bb
当然我们可以通过百度得到a=1.8，b=32。但是现在我们有一部分数据（摄氏度，华氏度）这样子对应的数据，当然测量的本身是存在一定的误差，所以不能直接使用两个值来进行二元一次的方程的求解。所以在这个时候我们会用一条线就可能的去将所有的点都串到线上去。
这个过程很合适。这也是处理连续数据的一种非常常用的方法。在计算未知参数时，可以使用梯度上升法或梯度下降法。

梯度上升：是一种使用偏导数进行优化的方法。
往往我们在求解最小值或者最大时，通常会去计算倒数值为0的时候，因为这个时候的值处于一个没有增量的状态（稳定状态）。但由于已知数据存在测度误差无法直接找到最值，所以我们可以通过一个缓慢学习的过程来找到所需要的值，这个思想在深度学习中应用广泛。

y%3Dwx%2Bb
我们在获得连续数据的方式之后，对于其分类通常能想到的是y大于某一个阀值的是就是某一类，或在某一个范围的时候。这里存在一个问题，y的值是不知道的，范围也是不知道的，这种情况是不利于求解的。
我们这里给出的解法也是仅适用于二分类的问题。我们可以看到sigmoid函数在越往正方向靠的时候越接近于1，越靠近负方向的时候越靠近0.同时处处可微，这是非常好的品质。也就是说我们可以使用梯度上升方法来进行优化算法。我们可以以0.5为阀值来进行分类，这样子就解决了上述的难点。
$p%20%3D%20%5Cfrac%7B1%7D%7B1%2Be%5E%7B-wx%5ET%2Bb%7D%7D$
其中x表示的是向量，我们可以有多个连续的数值进行输入,w也是与之对应的向量，我们需要优化计算的就是w。

提前计算梯度的公式
实现过程比较简单，直接复现公式，难点在于梯度的计算。损失函数是使用最大似然计算的，这就是使用梯度上升的原因。
$loss%EF%BC%88w%EF%BC%89%20%3D%20%5Cprod_isigmoid%28x_i%29%5E%7By_i%7D%281-sigmoid%28x_i%29%29%5E%7B1-y_i%7D%20%5C%5C%20log%28loss%29%3D%5Csum_i%28y_i%2Asigmoid%28x_i%29%2B%281-y_i%29%2Alog%281-sigmoid%28x_i%29%29%29%20%5C%5C%20log%28loss%29%3D%5Csum_i%28y_i%2A%28w%5ETx_i%29-log%281%2Be%5E%7Bw%5ETx_i%7D%29%29%20%5C%5C%20%5Cfrac%7B%5Cpartial%20loss%28w%29%7D%7B%5Cpartial%20w%7D%3D%20yx%20-%20%5Cfrac%7B1%7D%7B1%2Be%5E%7Bw%5ETx%7D%7D%2Ae%5E%7Bw%5ETx%7D%2Ax%20%5C%5C%20%3Dx%28y-sigmoid%28x%29%29$
现在万事俱备，只欠东风🚢

算法实现

和之前一样我们先导数据，（数据我会单独上传的testSet.txt）

def loadDataSet():
    dataMat = []; LabelMat = []
    fr = open('testSet.txt')
    for line in fr.readlines():
        linedata = line.strip().split()
        dataMat.append([1.0,float(linedata[0]),float(linedata[1])])
        LabelMat.append(int(linedata[2]))
    return dataMat,LabelMat
x,y = loadDataSet()

然后定义好sigmoid和梯度上升就可以了

def sigmoid(x):
    return 1/(1+np.exp(-x))
def AscengGrad(data, label):
    data = np.mat(data)
    label = np.mat(label).transpose()
    m,n = data.shape
    lr = 0.001
    epoch = 500
    weight = np.ones((n,1))
    for i in range(epoch):
        sigma = sigmoid(data*weight)
        loss = label - sigma
        weight = weight + lr * data.T * loss
    return weight
 AscengGrad(x,y)

当然这个算法也不是不可以改进的，改进的话可以考虑通过数据的大小，这里的想法就是用小批量进行训练和深度学习的batch训练思路一样，关于这部分内容以后会在深度学习内出现。

文章出处登录后可见！

已经登录？立即刷新

机器学习（四）Logistic回归

算法原理

算法实现

相关推荐