图深度学习从理论到实践
上QQ阅读APP看书,第一时间看更新

1.2 感知机与神经网络

1.2.1 单层感知机

神经网络的概念源于生命科学中的神经系统。在生命科学中,神经元是动物脑神经系统中最基本的单元,数百亿的神经元相互连接,组成复杂的神经系统,用来完成学习、认知和体内对生理功能活动的调节。如图1-2所示,神经细胞按照功能大致可分为树突、细胞体和轴突。按照对逻辑电路的理解,每个神经细胞可被视为一个只有兴奋或者抑制两种状态的器件,当某个神经元从其他神经细胞接收到的信号强度超过某个阈值时,细胞体就会兴奋,产生电脉冲并传递到其他神经元。

图1-2 生物神经单元与感知机

受生物神经细胞的启发,计算机科学家提出感知机(Perceptron)来模拟动物神经细胞,对人工神经网络的发展具有里程碑式的意义。感知机可以认为是一种人工神经元,其本质是一种线性模型,它接收多个信号输入,产生一个信号输出,如图1-2(b)所示。其数学含义可以表达为

其中,b是实数,称为偏置,包含神经细胞信息的阈值,可以视为各个树突传入信息的求和。fx)为阶跃函数,满足

其函数图像如图1-3所示。

感知机输出两个数值结果,因此可以用于解决一些二分类问题。对于输入信息x1x2,…,xn,处理方式为

图1-3 单位阶跃函数

在几何数学中,式(1.3)可以认为是一个超平面方程。因此,感知机可以认为是采用一个超平面将n维空间中的数据切分为两部分。当然,现实中大部分的数据并不能够恰好被一个超平面分割。如果一个数据集的正负样本能够被一个超平面区分开,那么称这个数据集是线性可分的。总而言之,感知机已经可以用于解决部分线性问题,但是其结构相对简单,存在不能处理线性不可分问题的缺陷。