智能计算:原理与实践
上QQ阅读APP看书,第一时间看更新

1.1.1 机器学习问题的基本框架

机器学习(Machine Learning)是现代智能技术中重要的一个方面,是一个系统自我改进的过程,可以从观测样本去研究、分析对象,去预测输出。机器学习问题的基本模型框架如图1.1.1所示。输入信号x经过系统得到输出信号y,学习机根据训练样本对系统的输入/输出做出估计,得到最准确的预测输出。其数学表述为:输入变量x与输出变量y之间存在一定的未知依赖关系,即服从某一未知的联合概率密度pXYxy)。机器学习的目的就是根据N个独立同分布的观测样本(x(1),y(1)),(x(2),y(2)),…,(xN),yN)),在一组函数{fxw)}中求出最优的函数fxw0)对依赖关系进行估计,使期望风险Rw)最小。

图1.1.1 机器学习问题的基本模型框架

式中,{fx,w)}为预测函数集,w为函数的广义参数,所以{fx,w)}可表示为任何函数集。Ly,fx,w))为损失函数,表示由于对y进行预测而造成的损失。

机器学习问题根据不同的学习目的可分为三类基本的学习问题,即模式识别、函数拟合及概率密度估计。

在模式识别问题中,输出变量y即为类别,可用二值函数{0,1}或{-1,1}来表示。此时,预测函数fx,w)称为指示函数,损失函数定义为

在函数拟合问题中,变量yx的函数,y是连续变量,所以损失函数可以用平方误差表示,即

在概率密度估计问题中,学习的目的就是根据训练样本确定输入变量x的概率密度,所以设估计的概率密度函数为px,w),则损失函数可定义为