三、对数几率回归

  1. 线性回归不仅可以用于回归任务,还可以用于分类任务。

3.1 二分类模型

  1. 考虑二分类问题。

    给定数据集 三、对数几率回归 - 图1

    • 考虑到 三、对数几率回归 - 图2 取值是连续的,因此它不能拟合离散变量。

      可以考虑用它来拟合条件概率 三、对数几率回归 - 图3,因为概率的取值也是连续的。

    • 但是对于 三、对数几率回归 - 图4(若等于零向量则没有什么求解的价值),三、对数几率回归 - 图5 取值是从 三、对数几率回归 - 图6,不符合概率取值为 ,三、对数几率回归 - 图7因此考虑采用广义线性模型。

      最理想的是单位阶跃函数:

    三、对数几率回归 - 图8

    • 但是阶跃函数不满足单调可微的性质,不能直接用作 三、对数几率回归 - 图9

      对数几率函数(logistic function)就是这样的一个替代函数:

      三、对数几率回归 - 图10

      这样的模型称作对数几率回归(logistic regressionlogit regression)模型。

  2. 由于 三、对数几率回归 - 图11,则有:

    三、对数几率回归 - 图12

    • 比值 三、对数几率回归 - 图13 表示样本为正例的可能性比上反例的可能性,称作几率(odds)。几率反映了样本作为正例的相对可能性。

      几率的对数称作对数几率(log odds,也称作logit)。

    • 对数几率回归就是用线性回归模型的预测结果去逼近真实标记的对数几率。

  3. 虽然对数几率回归名字带有回归,但是它是一种分类的学习方法。其优点:

    • 直接对分类的可能性进行建模,无需事先假设数据分布,这就避免了因为假设分布不准确带来的问题。
    • 不仅预测出来类别,还得到了近似概率的预测,这对许多需要利用概率辅助决策的任务有用。
    • 对数函数是任意阶可导的凸函数,有很好的数学性质,很多数值优化算法都能直接用于求取最优解。

3.2 参数估计

  1. 给定训练数据集 三、对数几率回归 - 图14,其中 三、对数几率回归 - 图15。可以用极大似然估计法估计模型参数,从而得出模型。

    为了便于讨论,将参数 三、对数几率回归 - 图16 吸收进 三、对数几率回归 - 图17 中。

    令:

    三、对数几率回归 - 图18

    三、对数几率回归 - 图19

    则似然函数为:三、对数几率回归 - 图20

    对数似然函数为:

    三、对数几率回归 - 图21

  2. 由于 三、对数几率回归 - 图22,因此:

    三、对数几率回归 - 图23

    则需要求解最优化问题:

    三、对数几率回归 - 图24

    最终 logistic 回归模型为:

    三、对数几率回归 - 图25

  3. logistic 回归的最优化问题,通常用梯度下降法或者拟牛顿法来求解。

3.3 多分类模型

  1. 可以推广二分类的 logistic 回归模型到多分类问题。

  2. 设离散型随机变量 三、对数几率回归 - 图26 的取值集合为: 三、对数几率回归 - 图27,则多元 logistic 回归模型为:

    三、对数几率回归 - 图28

    其中 三、对数几率回归 - 图29

    其参数估计方法类似二项 logistic 回归模型。