二、广义线性模型

2.1 广义线性模型的函数定义

  1. 考虑单调可微函数 二、广义线性模型 - 图1,令 二、广义线性模型 - 图2 ,这样得到的模型称作广义线性模型 (generalized linear model)。

    其中函数 二、广义线性模型 - 图3 称作联系函数 (link function) 。

  2. 对数线性回归是广义线性模型在 二、广义线性模型 - 图4 时的特例。即:二、广义线性模型 - 图5

    • 它实际上是试图让 二、广义线性模型 - 图6 逼近 二、广义线性模型 - 图7
    • 它在形式上仍是线性回归,但是实质上是非线性的。

2.2 广义线性模型的概率定义

  1. 如果给定 二、广义线性模型 - 图8二、广义线性模型 - 图9二、广义线性模型 - 图10 的条件概率分布 二、广义线性模型 - 图11 服从指数分布族,则该模型称作广义线性模型。

    指数分布族的形式为:二、广义线性模型 - 图12

    • 二、广义线性模型 - 图13二、广义线性模型 - 图14 的线性函数: 二、广义线性模型 - 图15
    • 二、广义线性模型 - 图16二、广义线性模型 - 图17 的函数
    • 二、广义线性模型 - 图18二、广义线性模型 - 图19 的函数

2.3 常见分布的广义线性模型

2.3.1 高斯分布

  1. 高斯分布:

    二、广义线性模型 - 图20

    令:

    二、广义线性模型 - 图21

    则满足广义线性模型。

2.3.2 伯努利分布

  1. 伯努利分布(二项分布,二、广义线性模型 - 图22 为 0 或者 1,取 1的概率为 二、广义线性模型 - 图23 ):

    二、广义线性模型 - 图24

    令:

    二、广义线性模型 - 图25

    则满足广义线性模型。

  2. 根据 二、广义线性模型 - 图26,有 二、广义线性模型 - 图27 。 则得到:

    二、广义线性模型 - 图28

    因此 logistic 回归属于伯努利分布的广义形式。

2.3.3 多元伯努利分布

  1. 假设有 二、广义线性模型 - 图29 个分类,样本标记 二、广义线性模型 - 图30 。每种分类对应的概率为 二、广义线性模型 - 图31。则根据全概率公式,有

    二、广义线性模型 - 图32

    • 定义 二、广义线性模型 - 图33 为一个 二、广义线性模型 - 图34 维的列向量:

      二、广义线性模型 - 图35

    • 定义示性函数 :二、广义线性模型 - 图36 表示属于 二、广义线性模型 - 图37 分类; 二、广义线性模型 - 图38 表示不属于 二、广义线性模型 - 图39 分类。则有: 二、广义线性模型 - 图40

    • 构建概率密度函数为:

      二、广义线性模型 - 图41

    • 二、广义线性模型 - 图42

      则有:

      二、广义线性模型 - 图43

      二、广义线性模型 - 图44,则满足广义线性模型。

  2. 根据:

    二、广义线性模型 - 图45

    则根据:

    二、广义线性模型 - 图46

    于是有:

    二、广义线性模型 - 图47

    .