一、生成式半监督学习方法

  1. 生成式generative methods 半监督学习方法:直接基于生成式模型的方法。

  2. 生成式半监督学习方法假设所有数据(无论是否有标记),都是由同一个潜在的模型生成的。

    • 该假设使得能够通过潜在模型的参数将未标记样本与学习目标联系起来。
    • 未标记样本的标记可以视作模型的缺失参数,通常可以基于EM算法进行极大似然估计求解。
  3. 生成式半监督学习方法其实是一个算法框架,内部不同算法的主要区别在于生成式模型的假设:不同的假设将产生不同的方法。

1.1 生成式高斯混合半监督学习

  1. 给定样本 一、生成式半监督学习方法 - 图1 ,其真实类别标记为 一、生成式半监督学习方法 - 图2

    假设样本由高斯混合模型产生,且每个类别对应一个高斯混合成分。即数据样本是基于概率密度:

    一、生成式半监督学习方法 - 图3

    来产生的。其中:

    • 一、生成式半监督学习方法 - 图4 是样本 一、生成式半监督学习方法 - 图5 的第 一、生成式半监督学习方法 - 图6 个高斯混合成分的概率。
    • 一、生成式半监督学习方法 - 图7 为该高斯混合成分的参数。
    • 混合系数 一、生成式半监督学习方法 - 图8
  2. 一、生成式半监督学习方法 - 图9 为模型 一、生成式半监督学习方法 - 图10一、生成式半监督学习方法 - 图11 的预测标记,一、生成式半监督学习方法 - 图12 表示样本 一、生成式半监督学习方法 - 图13 隶属的高斯混合成分。

    根据最大化后验概率,有:

    一、生成式半监督学习方法 - 图14

    • 考虑到 一、生成式半监督学习方法 - 图15, 则有:

      一、生成式半监督学习方法 - 图16

    • 由于 一、生成式半监督学习方法 - 图17, 则有:

      一、生成式半监督学习方法 - 图18

      • 一、生成式半监督学习方法 - 图19 为已知样本 一、生成式半监督学习方法 - 图20 ,则它由第 一、生成式半监督学习方法 - 图21 个高斯混合成分生成的后验概率

        一、生成式半监督学习方法 - 图22

      • 一、生成式半监督学习方法 - 图23 为已知 一、生成式半监督学习方法 - 图24 由第 一、生成式半监督学习方法 - 图25 个高斯混合成分生成,则其类别为 一、生成式半监督学习方法 - 图26 的概率

  3. 一、生成式半监督学习方法 - 图27 中,一、生成式半监督学习方法 - 图28 需要知道样本的标记 一、生成式半监督学习方法 - 图29 ; 而 一、生成式半监督学习方法 - 图30 并不需要样本的标记。因此有标记和无标记的数据均可利用。

    因此通过引入大量的未标记数据,对 一、生成式半监督学习方法 - 图31 的估计可以由于数据量的增长而更为准确,于是上式的整体估计可能会更准确。

  4. 给定标记样本集 一、生成式半监督学习方法 - 图32 ,和未标记样本集 一、生成式半监督学习方法 - 图33,其中 一、生成式半监督学习方法 - 图34

    假设所有样本独立同分布,且都是由同一个高斯混合模型 一、生成式半监督学习方法 - 图35 生成的。

    • 高斯混合模型的参数 一、生成式半监督学习方法 - 图36 采用极大似然法来估计。

    • 一、生成式半监督学习方法 - 图37 的对数似然是:

      一、生成式半监督学习方法 - 图38

      • 第一项对数项中,为联合概率 一、生成式半监督学习方法 - 图39

        一、生成式半监督学习方法 - 图40

      • 第二项对数项中,为概率 一、生成式半监督学习方法 - 图41

        一、生成式半监督学习方法 - 图42

  5. 高斯混合模型参数估计可以用EM算法求解。迭代更新步骤为:

    • E步:根据当前模型参数 一、生成式半监督学习方法 - 图43 计算未标记样本 一、生成式半监督学习方法 - 图44 属于各高斯混合成分的概率:

    一、生成式半监督学习方法 - 图45

    • M步:基于 一、生成式半监督学习方法 - 图46 更新模型参数。

      一、生成式半监督学习方法 - 图47 为第 一、生成式半监督学习方法 - 图48 类的有标记样本数目,则:

  1. ![](/projects/huaxiaozhuan-ai/ae1bb6632307b74988980a3dd7fc7a92.svg)
  2. 以上过程不断迭代直至收敛,即可获得模型参数。
  1. 预测过程:根据式子:

    一、生成式半监督学习方法 - 图49

    来对样本 一、生成式半监督学习方法 - 图50 进行分类。

1.2 性质

  1. 如果将上述过程中的高斯混合模型替换成其他模型,则可以推导出其他的生成式半监督学习方法。

  2. 生成式半监督学习方法优点:方法简单,易于实现。在有标记数据极少的情况下,往往比其他方法性能更好。

    缺点:模型假设必须准确,即假设的生成式模型必须与真实数据分布吻合,否则利用未标记数据反倒会降低泛化性能。

    在现实任务中往往很难事先做出准确的模型假设,除非拥有充分可靠的领域知识。