模式识别
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

4.4 最小平方误差算法

4.3节介绍的感知器算法是在已知样本集线性可分的基础上采用的,但对于给定的样本集,往往不能预先知道是否线性可分。本节介绍的最小平方误差准则函数可以在训练过程中判定训练模式集是否线性可分。最小平方误差准则函数引进了最小均方误差。

定义一个误差向量:

img

(4-40)

由于最小平方误差以最小均方误差为准则,因此定义准则函数为

img

(4-41)

然后找一个使img极小化的img作为问题的解,即求解使img的梯度为0的img值。

首先对式(4-41)中的img求梯度,即

img

(4-42)

img,得

img

(4-43)

得到

img

(4-44)

式中,矩阵img为矩阵img的规范逆矩阵;img为式(4-41)所示的最小平方误差准则函数的解。可见,img的解依赖于向量b,选择不同的b可以赋予解不同的性质,而且计算量很大,因为要求解矩阵的逆矩阵。为了避免上述缺点,可以采用梯度下降法。

梯度下降法计算过程如下。

(1)任意指定初始权向量:

img

(4-45)

(2)如果第k步不能满足img,那么按下式计算第k+l步的权向量。

img

(4-46)

式中,img为修正系数。这个算法产生的权向量img满足方程img,且不管img是否为奇异矩阵,这个梯度下降法总能产生一个解。

每次迭代时的误差向量img

img

(4-47)

式中,img是判断样本集是否线性可分的重要指标。若满足img(每个分量均为正值或零),则样本集是线性可分的;若满足img,则样本集不是线性可分的,不具有收敛性。