五、EM 算法的推广

来源:华校专浏览 879 扫码分享 2020-06-07 18:14:48

五、EM 算法的推广

五、EM 算法的推广

5.1 F 函数

F函数：假设隐变量的概率分布为，定义分布与参数的函数为：

其中是分布的熵。

通常假定是的连续函数，因此为和的连续函数。
函数有下列重要性质：
- 对固定的，存在唯一的分布使得极大化。此时，并且随着连续变化。
- 若，则。
定理一：设为观测数据的对数似然函数，为 EM 算法得到的参数估计序列，函数，则：
- 如果在和有局部极大值，那么也在有局部极大值。
- 如果在和有全局极大值，那么也在有全局极大值。
定理二：EM算法的一次迭代可由 F 函数的极大-极大算法实现：设为第次迭代参数的估计，为第次迭代函数的估计。在第次迭代的两步为：
- 对固定的，求使得极大化。
- 对固定的，求使得极大化。

5.2 GEM算法1

GEM算法1（EM算法的推广形式）：
- 输入：
  - 观测数据
  - 函数
- 输出：模型参数
- 算法步骤：
  - 初始化参数，开始迭代。
  - 第次迭代：
    - 记为参数的估计值，为函数的估计值。求使得极大化。
    - 求使得极大化。
    - 重复上面两步直到收敛。
该算法的问题是，有时候求极大化很困难。

5.3 GEM算法2

GEM算法2（EM算法的推广形式）：
- 输入：
  - 观测数据
  - 函数
- 输出：模型参数
- 算法步骤：
  - 初始化参数，开始迭代。
  - 第次迭代：
    - 记为参数的估计值，计算
    - 求使得
    - 重复上面两步，直到收敛。
此算法不需要求的极大值，只需要求解使它增加的即可。

5.4 GEM算法3

GEM算法3（EM算法的推广形式）：
- 输入：
  - 观测数据
  - 函数
- 输出：模型参数
- 算法步骤：
  - 初始化参数，开始迭代
  - 第次迭代：
    - 记为参数的估计值，计算
    - 进行次条件极大化：
      - 首先在保持不变的条件下求使得达到极大的
      - 然后在的条件下求使得达到极大的
      - 如此继续，经过次条件极大化，得到，使得
    - 重复上面两步，直到收敛。
该算法将 EM 算法的 M 步分解为次条件极大化，每次只需要改变参数向量的一个分量，其余分量不改变。

当前内容版权归华校专或其关联方所有，如需对内容或内容相关联开源项目进行关注与资助，请访问华校专 .

本文档使用 BookStack 构建

展开/收起文章目录