生成模型
生成模型是区别于判别模型而言的一种监督学习模型,它是一种概率模型,比如决策树、朴素贝叶斯、HMM、GMM、条件随机场等。 而非概率模型有感知机、支持向量机、kNN、AdaBoost、K-means、神经网络等。
# EM 算法
EM 算法是一种迭代算法,用于含有隐变量的概率模型的极大似然估计。
其核心是 Q 函数的确定,
Q函数就是完全数据的对数似然函数 在给定观测数据 Y 和当前参数 的情况下关于未观测数据 Z 的条件概率分布 的期望。写作 。
当确定了 Q 函数之后,通过 E 步和 M 步分别求 Q 和 极大化 Q 即可迭代求解参数 。
# HMM
隐马尔科夫模型(HMM)是关于时序的概率模型,描述一个由马尔科夫链随机生成不可观测的状态序列,再由各个状态随机生成一个观测从而产生观测序列的过程。 其三要素为
- 初始状态向量
- 状态转移概率矩阵
- 观测概率矩阵
在给定三要素的情况下,HMM 模型表示为 ,它是一个生成模型,表示状态序列和观测序列的联合分布。 HMM 涉及到三个问题
- 概率计算问题:给定 和观测序列 ,计算 ,前向-后向算法可以高效进行概率计算。
- 学习问题:已知观测序列 ,估计模型 的参数,使得在该模型下观测序列概率 最大,此时需要 EM 算法的支持。
- 预测问题:已知模型 和观测序列 ,求使得 最大的状态序列,维特比算法应用动态规划算法求解路径结构中的最优路径。