1.4 生物意义上的神经元
“神经元”(Neuron)事实上就是“神经细胞”(Nerve Cell)的别称。
1.4.1 神经元是如何工作的
图1-2所示为生物神经元的基本结构。如果把大脑比作一间工厂,这个工厂干的事情就是接受货物和送出货物,这个工厂处理接受到的货物,并决定送出去的是什么货物。这些神经元就能对这些货物进行打包、拼装并储存起来;有时会将另外一些已经储存的货物打包或拆散送出。如何处理这些货物呢?我们可以想象这个工厂里有很多人员,有负责进货处理的,有负责出货处理的,决定什么货物送出、决定如何送出,这不是由其中一个人完成的。这跟公司的组织形式很像,工厂划分了很多部门,人们在各个部门中处理相应的货物。这个工厂非常特殊,每个在里面工作的人都可以互相组织形成一个新的部门,负责新的货物处理方式。
图1-2 神经元的构成
工厂里的“人”就是大脑中的神经元,也叫神经细胞。神经元是神经系统结构和功能的基本单位。神经系统主要由神经元和神经胶质组成。神经元的形状和大小不一,但多数神经元具有一些共同结构。大致可以分为细胞体和突起两部分。胞体的中央有细胞核。细胞核是细胞的能量中心。通过化学反应,胞体为神经活动提供能量,并大量制造用于传递信息的化学物质。自胞体伸出两种突起:呈树枝状的被称为树突,它接收其他神经元的信息并传至胞体;那一根细长的突起称为轴突,它把冲动由胞体传至远处,传给另一个神经元的树突或肌肉与腺体。髓鞘由胶质细胞构成,包裹在轴突上,起着绝缘作用。一个神经元的轴突有许多分支末梢膨大,呈葡萄状,称为突触小体,它是传递信息给另一个神经元的发放端。
这里对神经元的结构描述可能有些枯燥,大家要注意几个关键词,因为我们以后讲人工神经元时就知道:人工神经元是模拟了生物神经元的仿生工程。
细胞轴突是一条长长的纤维,它把细胞体的输出信息传导到其他神经元。树突用来接收其他神经元的输入信号。细胞体接收所有树突的输入,并通过细胞体内复杂的化学变化,确定细胞体是否需要对轴突产生输出。
神经元具有两个最主要的特性,即兴奋性和传导性。神经元的兴奋性具有一种很特殊的现象,当刺激强度未达到某一阈限值时(限值的概念为人工神经元模仿提供了理论依据,传输函数中大多数函数都是依据此原则来输出的),神经冲动不会发生,而当刺激强度达到该值时,神经冲动发生并能瞬时达到最大强度,此后刺激强度即使再继续加强或减弱,已诱发的冲动强度也不再发生变化。请大家深刻理解这个特性,兴奋性的原理解释了我们为什么需要传输函数,通过了解神经元的构造也可以推出传输函数的数学构成。
神经元的功能表现多种多样,归纳起来可分为三类。
(1)感觉神经元(传入神经元),其树突的末端分布于身体的外周部,接受来自体内外的刺激,将兴奋传至脊髓和脑。
(2)运动神经元(传出神经元),其轴突达于肌肉和腺体。运动神经元的兴奋可引起它们的活动。
(3)联络神经元(中间神经元),介于上述两种神经元之间,把它们联系起来或组成复杂的网络,起着神经元之间机能联系的作用,多存在于脑和脊髓里。
我们从幼儿认知世界来看神经元存储数据的方法。2岁左右的幼儿对于火这个东西没有任何认知能力,有一天他偶然看到了蜡烛,然后让妈妈给他点着蜡烛,他很吃惊地看着蜡烛上的火光,既好奇又紧张(与蜡烛保持一定的距离,并紧紧地抓住妈妈的手)。妈妈鼓励他在注意安全的前提下靠近火光,感到热量。幼儿又问这是什么,回答这是“火”。(实际上,在人类的漫长遗传演化中,人从出生就有着敬畏火的记忆,这是遗传性在起作用,这里为了说明过程,不考虑遗传等因素。)
神经元在整个过程中是怎么配合并记录对“火”的认知的呢?首先,眼睛捕捉到相应的火的信号后会将信号传递给视神经(感觉神经元、传入神经元),视神经也是一种神经元,接受到的是外界刺激,这个刺激就是来自自然界的反射和散射的光线,由视神经传递给脑神经元(联络神经元),多次看到之后,其中一个神经元将火的形象存储下来。接下来,皮肤(感觉神经元)感觉到热,将热这个信号传递给脑神经,并且和刚才的视觉形象建立了联系;孩子如果离火太近感觉到很热时,就会将手缩回来(运动神经元)。
这种建立是双向的,例如,如果幼儿日后看到黄色发光物体,会认为它很热;如果闭着眼睛摸着很热的东西,那脑海中肯定反映出火的视觉形态。如果没有其他信息干预的话,甚至会产生一看到类似火的东西就把手缩回来的条件反射。
我举的这个例子不是很严谨,但足以让大家明白神经元的工作原理。接下来,我们看看神经元是如何组成神经网络的。
1.4.2 组成神经网络
神经元之间的连接不是固定不变的,在人的学习和成长过程中,一些新的连接会被逐渐建立起来,还有一些连接可能会消失。外界刺激就是神经网络的输入,在接收刺激后,刺激信号将传递到整个网络中,影响所有的神经元状态,神经元之间彼此连接并相互制约影响,不断调整彼此间的连接强度,直到达到稳定状态,并最终对刺激做出反应。神经元之间的关系变迁形成了生物体的学习过程。
生物神经网络是由很多神经元相互连接的,神经网络系统是一个极为庞大又错综复杂的系统。虽然每个神经元都十分简单,但如此大量的神经元之间非常复杂的连接却可以演化出丰富多彩的行为方式。同时,如此大量的神经元与外部感受器之间的多种多样的连接方式也蕴含了变化莫测的反应方式。总之,连接方式的多样化导致了行为方式的多样化。
脑神经系统的主要组成部分如图1-3所示。人脑具有阶层结构,其中最复杂的部分是处于大脑最外层的大脑皮层。在大脑皮层中密布着由大量神经元构成的神经网络,这就使它具有高度的分析和综合能力。它是人脑思维活动的物质基础,是脑神经系统的核心部分。
图1-3 脑神经系统的主要组成部分
人们通过长期的研究,进一步探明了大脑皮层是由许多不同的功能区构成的。例如,有的区专门负责运动控制,有的区专门负责听觉,有的区专门负责视觉等。在每个功能区中,又包含许多负责某一个具体功能的神经元群。例如,在视觉神经区,存在着只对光线方向性产生反应的神经元。更进一步细分,某一层神经元仅对水平光线产生响应,而另一层神经元只对垂直光线产生反应(这个特性跟卷积神经网络有些关联度)。看到这里大家都觉得很熟悉,这不就是之前说的自组织(Self-Organization)工厂吗?这里需要特别指出的是,大脑皮层的这种区域性结构,虽然是由人的遗传特性所决定的,是先天性的,但各区域所具有的功能大部分是人在后天通过对环境的适应和学习而得来的。神经元的这种特性称为自组织特性。所谓自组织,就是每个神经元都自己决定和另外哪些神经元链接,甚至不链接,没有从一个“领导”的角色去安排大家的工作,而这种自己决定的特性构成了神经元的自主学习(对应于神经网络模型的训练),不存在外部教师的示教。还应指出,神经元的这种自组织特性来自于神经网络结构的可塑性,即神经元之间相互连接的突触随着动作电位脉冲激励方式与强度的变化,其传递电位的作用可增加或减弱,简单地说就是输入(树突)输出(轴突)部分是可以由链接强度来表示的,这直接决定了神经元A在传递信号给神经元B时,信号是有强度的。
还应指出,功能的分区定位并不是机械的一对一关系。许多功能,特别是高级思维功能,通常都可以分为若干子功能块,这些子功能块存在并行关系。对于一个特定功能的神经加工往往是在大脑皮层的许多部位分布式进行的。正因为如此,某一部位的损伤才不至于导致整个功能的丧失。
本节信息量比较大,希望大家能很好地理解,后面讲人工神经网络时会把这节讲的绝大部分特性都模拟到,使读者更深刻地理解为什么要这样设计神经元。