智能搜索和推荐系统:原理、算法与应用
上QQ阅读APP看书,第一时间看更新

1.3.4 随机过程与隐马尔可夫模型

随机过程:设(Ω,F,P)为一个概率空间,T为一个参数集,且TR,若对于每一个t∈T,均有定义在(Ω,F,P)上的一个随机变量X(ω,t),(ω∈Ω)与之对应,则称X(ω,t)为(Ω,F,P)上的一个随机过程。

马尔可夫链:已知一组随机变量{X1,X2,X3…Xt,Xt+1}组成的随机过程为{Xt,t=0,1,2,…},其中这些变量的取值范围构成状态空间{xi}。如果Xt+1在时间t+1的概率依赖于历史{X1,X2,X3,…,Xt}的情况,则可以简化成Xt+1的历史条件概率仅仅依赖Xt的取值,即:P(Xt+1=x|X1=x1,X2=x2,…,Xt=xt)=P(Xt+1=x|Xt=xt)。

具有这种性质的随机过程称为马尔可夫过程。马尔可夫链是指时间、状态都是离散情况下的马尔可夫随机过程。

齐次马尔可夫链:如果一条马尔可夫链中Xu=i转移到Xt+u=j的概率为pij=P(Xt+u=j|Xu=i),pij的取值只依赖于时间t,而与起始时间u无关,我们称之为齐次马尔可夫链。

马尔可夫链常用于对一些有内在规律的问题的预测,最常见的就是天气预测问题。

隐马尔可夫模型:隐马尔可夫模型也具有马尔可夫性,是隐藏状态序列为马尔可夫链的一种变形。它的观测状态并不像隐藏状态一样可以直接构成马尔可夫链,但可以通过隐藏状态到观测状态的转移矩阵,间接求出观测状态的概率。隐马尔可夫模型如图1-10所示。

图1-10 隐马尔可夫模型

隐马尔可夫模型的主要元素包括S、O、Π、A、B,具体含义如下。

1)S代表HMM的隐藏状态:隐马尔可夫的隐藏状态(S1,S2,…,Sn)满足马尔可夫性。

2)O代表HMM的观测状态:观测状态是通过直接观测得到的,本身没有马尔可夫性,通过观测状态转移矩阵和隐藏状态发生关系。

3)Π代表初始化状态概率矩阵:用于初始化各个状态在t=1时的矩阵。

4)A代表隐藏状态间的转移概率:隐藏状态序列可以构成马尔可夫链,Aij=P(it+1=Sj|it=Si)(1≤i≤N,1≤j≤N)表示隐马尔可夫链在t时刻,隐藏状态Si已知的条件下,t+1时刻的隐状态Sj的概率。

5)B代表观测状态转移矩阵:

表示在t时刻,隐藏状态Sj已知的情况下,观测状态是Oi的概率。

一般地,我们可以用λ=(A,B,Π)三元组来简洁地表示一个隐马尔可夫模型。