1.1 模式识别的基本概念
模式识别(Pattern Recognition)就是机器识别、计算机识别或机器自动识别,目的在于让机器自动识别事物。例如,手写数字的识别,结果就是将手写的数字分到具体的数字类别中;智能交通管理系统的识别,就是判断是否有汽车闯红灯,闯红灯的汽车车牌号码;还有文字识别、语音识别、图像中物体识别,等等。该学科研究的内容是使机器能做以前只能由人类才能做的事,具备人所具有的对各种事物与现象进行分析、描述与判断的部分能力。模式识别是直观的、无处不在的,实际上人类在日常生活的每个环节,都从事着模式识别的活动。人和动物较容易做到模式识别,但对机器来说却是非常困难的。让机器能识别、分类,就需要研究识别的方法,这就是这门学科的任务。
模式识别研究的目的是利用计算机对物理对象进行分类,在错误概率最小的条件下,使识别的结果尽量与客观物体相符合。机器辨别事物最基本的方法是计算,原则上讲是对计算机要分析的事物与标准模板的相似程度进行计算。例如,要识别一个手写的数字,就要将它与从0~9的模板做比较,看跟哪个模板最相似,或最接近。因此首先要能从度量中看出不同事物之间的差异,才能分辨当前要识别的事物,因此最关键的是找到有效地度量不同类事物的差异的方法。
在模式识别学科中,就“模式”与“模式类”而言,模式类是一类事物的代表,而“模式”则是某一事物的具体体现,例如,数字0、1、2、3、4、5、6、7、8、9是模式类,而用户任意手写的一个数字或任意一个印刷数字则是“模式”,是数字的具体化。
1.模式的描述方法
在模式识别技术中,被观测的每个对象称为样品,例如,在手写数字识别中,每个手写数字可以作为一个样品,如果共写了N个数字,我们把这N个数字叫做N个样品(X1,X2,…,Xj,…,XN),其中0表示有N0个样品,1表示有N1个样品,2表示有N2个样品,3表示有N3个样品,……,一共有ω1,ω2,…,ωM(M=10)个不同的类别。
对于一个样品来说,必须确定一些与识别有关的因素,作为研究的根据,每一个因素称为一个特征。模式就是样品所具有特征的描述。模式的特征集又可用处于同一个特征空间的特征向量表示。特征向量的每个元素称为特征,该向量也因此称为特征向量,一般我们用小写英文字母x,y,z来表示特征。如果一个样品X有n个特征,则可把X看做一个n维列向量,该向量X称为特征向量,记做
若有一批样品共有N个,每个样品有n个特征,这些数值可以构成一个n行N列的矩阵,称为原始资料矩阵,如表1-1所示。
表1-1原始资料矩阵
模式识别问题就是根据X的n个特征来判别模式X属于ω1,ω2,…,ωM类中的哪一类。待识别的不同模式都在同一特征空间中考察,不同模式类由于性质上的不同,它们在各特征取值范围内有所不同,因而会在特征空间的不同区域中出现。要记住向量的运算是建立在各个分量基础之上的。
因此,模式识别系统的目标是在特征空间和解释空间之间找到一种映射关系。特征空间由从模式得到的对分类有用的度量、属性或基元构成的空间。解释空间由M个所属类别的集合构成。
如果一个对象的特征观测值为{x1,x2,…,xn},它可构成一个n维的特征向量值X,即
X=(x1,x2,…,xn)T
式中,x1,x2,…,xn为特征向量X的各个分量。
一个模式可以看做n维空间中的向量或点,此空间称为模式的特征空间Rn。在模式识别过程中,要对许多具体对象进行测量,以获得许多观测值,其中有均值、方差、协方差与协方差矩阵等。
2.模式识别系统
一个典型的模式识别系统如图1-1所示,由数据获取、预处理、特征提取、分类决策及分类器设计五部分组成。一般分为上下两部分:上半部分完成未知类别模式的分类;下半部分属于分类器设计的训练过程,利用样品进行训练,确定分类器的具体参数,完成分类器的设计。而分类决策在识别过程中起作用,对待识别的样品进行分类决策。
图1-1 模式识别系统及识别过程
模式识别系统组成单元功能如下。
(1)数据获取
用计算机可以运算的符号来表示所研究的对象,一般获取的数据类型有以下几种。
① 二维图像:文字、指纹、地图、照片等。
② 一维波形:脑电图、心电图、季节震动波形等。
③ 物理参量和逻辑值:体温、化验数据、参量正常与否的描述。
(2)预处理
对输入测量仪器或其他因素所造成的退化现象进行复原、去噪声,提取有用信息。
(3)特征提取和选择
对原始数据进行变换,得到最能反映分类本质的特征。将维数较高的测量空间(原始数据组成的空间)转变为维数较低的特征空间(分类识别赖以进行的空间)。
(4)分类决策
在特征空间中用模式识别方法把被识别对象归为某一类别。
(5)分类器设计
基本做法是在样品训练集基础上确定判别函数,改进判别函数和误差检验。
研究模式识别的主要目的是利用计算机进行模式识别,并对样本进行分类。执行模式识别的计算机系统称为模式识别系统。设计人员按需要设计模式识别系统,而该系统被用来执行模式分类的具体任务。
3.统计模式识别研究的主要问题
统计模式识别主要研究的问题有:特征的选择与优化、分类判别、聚类判别。
(1)特征的选择与优化
如何确定合适的特征空间是设计模式识别系统一个十分重要的问题,对特征空间进行优化有两种基本方法。一种是特征选择,如果所选用的特征空间能使同类物体分布具有紧致性,可以为分类器设计成功提供良好的基础;反之,如果不同类别的样品在该特征空间中混杂在一起,再好的设计方法也无法提高分类器的准确性。另一种是特征的组合优化,通过一种映射变换改造原特征空间,构造一个新的精简的特征空间。
(2)分类判别
已知若干个样品的类别以及特征,例如,手写阿拉伯数字的判别是10个类的分类问题,机器首先要知道每个手写数字的形状特征,对同一个数字,不同的人有不同的写法,甚至同一个人对同一个数字也有多种写法,就必须让机器知道它属于哪一类。因此对分类问题需要建立样品库。根据这些样品库建立判别分类函数,这一过程由机器来实现,称为学习过程,然后对一个未知的新对象分析它的特征,决定它属于哪一类。这是一种监督学习的方法。
(3)聚类判别
已知若干对象和它们的特征,但不知道每个对象属于哪一个类,而且事先并不知道究竟分成多少类,用某种相似性度量的方法,即“物以类聚,人以群分”,把特征相同的归为一类。例如,手写了若干个阿拉伯数字,把相同的数字归为一类。这是一种非监督学习的方法。
机器识别也往往借鉴人的思维活动,像人类一样找出待识别物的外形或颜色等特征,进行分析、判断,然后加以分门别类,即识别它们。模式识别的方法很多,很难将其全部概括,也很难说哪种方法最佳,常常需要根据实际情况运用多种方法进行实验,然后选择最佳的分类方法。