第一节 知觉信息与知觉过程
知觉是在刺激直接作用于感官下产生的。长期以来,在心理学中常将知觉看作刺激在神经系统或脑中留下的烙印,将知觉当作一种只具有直接性质的心理现象。支持这种看法的论点大体上可概括于下:(1)知觉是在刺激作用下即刻产生的,而且似乎是自动的;(2)人常意识不到知觉的各种过程;(3)某些空间特性的知觉似乎是先天制约的,不依赖过去的经验或学习;(4)某些几何错觉甚至不依赖于人掌握的有关概念。这些论点不可避免地给知觉过程的理解带来消极被动的色彩。虽然上述这些论点涉及知觉的一些真实的方面。但是,认为知觉只具有直接性质的看法有着严重的缺点,它贬低乃至取消了知觉的组织问题,似乎知觉的一切都是刺激所赋予的,并与人的已有知识和经验的作用无关。第二次世界大战以后,心理学逐渐摆脱这种被动的观点。随着认知心理学的兴起,知觉被看作一种主动的和富有选择性的构造过程(Bruner,1957;Neisser,1967;Gregory,1970)。依照目前的一般看法,这种知觉过程就是对刺激的解释。感觉是对刺激的觉察,知觉是将感觉信息组成有意义的对象,即在已贮存的知识经验的参与下,把握刺激的意义。因此,知觉是现实刺激和已贮存的知识经验的相互作用的结果。相对而言,感觉信息是具体的、特殊的;知觉信息是较抽象的、一般的。知觉既具有直接性质,也具有间接性质。
一、知识经验在知觉中的作用
认知心理学认为,知觉与人的知识经验是分不开的,并因此而具有间接性质。然而,关于已有的知识经验在知觉中的作用,长期以来就存在着争论。但是心理学早就确定了许多事实,如斑点图的知觉,言语对知觉的影响,定势效应等,肯定了已有的知识经验在知觉中的作用。现在则获得更多的证据,例如Warren等(1970)在音素恢复的实验中确定,当给20名被试听下述句子“The state governors met with their respective legi * latures convening in capital city”,其中星形表示该处字母(s)被一个持续120ms的纯音取代。在全部被试中间,只有一人说他听到该纯音,但不能正确指出它的位置,而所有其他被试都没有发现s字母缺失。后来他们将这个实验加以扩充,让不同的被试分别听一个不同的句子。所应用的句子如下:
It was found that the * eel was on the axle.
It was found that the * eel was on the shoe.
It was found that the * eel was on the orange.
It was found that the * eel was on the table.
在每个句子中,星形仍表示某个字母缺失。结果发现,听第一个句子的被试倾向于将缺失一个字母(即*eel)的词听成wheel,听第二个句子的被试则会听成heel,听第三个和第四个句子的被试会分别听成peel和meal。这些实验结果表明,人在知觉一个句子时,可以依据上下文和对整个句子的理解,而把一个词所缺失的字母(音素)恢复起来,上下文不同,所恢复的音素也不同。这种音素恢复现象是已贮存的知识作用的结果,依赖于现实刺激的信息和已贮存的信息的相互作用。
Miller和Isard(1963)的实验也证实已有的知识对句子知觉的作用。他们在噪音的背景上,让被试听一些句子,要求被试将听到的句子报告出来。这些句子分成3类,第一类为正常的句子,即合乎语法并有一定意义的句子,如
A witness signed the official document.
Sloppy fielding loses baseball games.
第二类为异常的句子,这些句子合乎英语语法,但没有任何意义,如
A witness appraised the shocking company dragon.
Sloppy poetry leaves nuclear minutes.
第三类句子为非语法句,它们既不合乎英语语法,也没有任何意义,只不过是一些字词的随机组合而已,如
A legal glittering the exposed picnic knight.
Loses poetry spots total wasted.
这3种句子的正确知觉的百分数见图2-1。从图中可以见到,句子的正确知觉是句子的类型和音噪比的函数。在强的噪音背景上,3种句子的正确知觉都很少。但随着音噪比的增大即噪音相对减弱,句子知觉也得到改善。引人注目的,是正常句子的知觉在所有的音噪比水平都优于异常的句子,而异常的句子又优于非语法句。正常句子和异常句子在知觉上的差别说明人可应用句子的意义,而异常句子与非语法句的差别则说明人可将语法应用于知觉,两者都表明人已有的语言知识对知觉的作用。
图2-1 句子知觉是句子类型和音噪比的函数
近来视知觉研究也提供新的证据。其中Biederman(1972)的工作常被引用。他用速示器让被试迅速地看一些不同场景的照片,如校园、街道、厨房等,被试的任务是指出在某个场景中的一个特定位置上的一个熟悉的东西(靶子)。所用的场景照片有两类,一类是正常的场景,另一类是将正常的场景分成几个部分,然后再杂乱地拼凑起来的,参看图2-2。在图2-2中,照片为街景,靶子为自行车,上下两幅照片的左下部分是一样的,均包含自行车。在每一个场景内,靶子的位置在适当的地方用箭头指出来。一种情况是箭头在场景呈现之前呈现(线索在前),另一种情况是箭头在场景呈现之后呈现(线索在后)。在每次试验时,被试要在照片簿中展现的4个东西中,选出一个他确认的靶子。在一半试验中,被试在场景呈现之前就看要从中作出选择的东西(备择物在先);在另一半试验中,被试要在看了场景之后才看备择的东西(备择物在后)。这个实验得到的结果(图2-3)表明,在上述任何一种情况下,正常场景中的靶子的辨认率均高于杂乱的场景,后来的实验还确定,在正常场景中,搜寻一个靶子的速度要快于在杂乱场景中的搜寻(Biederman,Glass,& Staey,1973)。这些实验结果清楚地说明,人在知觉自然环境中的对象时,是以已有的关于自然环境中诸景物的知识为依据的,有关诸景物的自然的空间关系的知识引导我们的知觉活动。
图2-2 两种场景
图2-3 两种场景中的靶子对象的辨认
二、两种对立的知觉理论
已有的知识经验对知觉的影响是多方面的,最引人注目的是体现为上下文的作用。我们在前面引述的几个实验都是有关上下文的。类似的实验还有许多,我们在后面还将涉及。当前一些心理学家认为,总的看来,过去的知识经验主要是以假设、期望或图式的形式在知觉中起作用的。人在知觉时,接收感觉输入,在已有经验的基础上,形成关于当前的刺激是什么的假设(Bruner,1957;Gregory,1970),或者激活一定的知识单元而形成对某种客体的期望(Neisser,1967)。知觉是在这些假设、期望等的引导和规划下进行的。依照Bruner和Gregory的看法,知觉是一种包含假设考验的构造过程。人通过接收信息、形成和考验假设,再接收或搜寻信息,再考验假设,直至验证某个假设,从而对感觉刺激作出正确的解释,这被称作知觉的假设考验说。照这个学说看来,感觉刺激的物理特征、刺激的上下文和有关的概念都可激活长时记忆中的有关知识而形成各种假设。知觉因而是以假设为纽带的现实刺激信息和记忆信息相结合的再造。在通常情况下,人们在知觉时意识不到假设的参与,但在某些特殊条件下,如在弱的照明下看东西,有时是可以体验到这种假设考验的。假设考验说赋予知觉过程以主动性和智慧性的色彩,是目前在认知心理学中有相当影响的知觉理论。
知觉的假设考验说是一种建立在过去经验作用基础上的知觉理论。支持这个理论的还有其他的重要论据。例如,Rock(1983)就指出,外部刺激与知觉经验并没有一对一的关系,同一刺激可引起不同的知觉(双关图),不同的刺激却又可以引起相同的知觉(常性)。因此,感觉刺激的维量是模糊的,具有双关性质。感觉输入也是模糊的和片断的,不能对外部刺激提供真实而完整的描述。近端刺激如视网膜像只提供关于外部刺激的线索,需要在过去经验的基础上,应用这些线索作出推断,对近端刺激进行评价或解释,才能实现对外部刺激的知觉。这些看法显然是有利于假设考验说的。Moates等(1980)也重视过去的知识经验在知觉中的作用。他们认为,知觉是定向、抽取特征,与记忆中的知识相对照,然后再定向、再抽取特征并再对照,如此循环,直到确定刺激的意义,这与假设考验说有许多相似之处。
在本章中,我们一开始便提到那种认为知觉只具有直接性质的观点。现在,这方面的主张以知觉的刺激物说为代表。刺激物说与假设考验说相反,主张知觉只具有直接性质,否认已有知识经验的作用。其著名代表Gibson(1950,1966,1979)认为,自然界的刺激是完整的,可以提供非常丰富的信息,人完全可以利用这些信息,直接产生与作用于感官的刺激相对应的知觉经验,根本不需要在过去经验基础上形成假设并进行考验。例如,照他的看法,距离就是我们直接知觉到的。这是由于距离并不是抽象的空间,而是有着一定的物理光线分布。自然环境中不同大小和位置的物体受到来自各种方向的光线照射,同时这些物体又不同地反射出光线,因此人在任何一个位置上观察周围空间时,都有其特定的光线分布,在周围空间的每一个点上的光线分布都含有一定的差别。当人站在一条砖路上向远方眺望,近处的砖显得大而清晰,远处的砖显得小而模糊。这种近处稀疏、远处密集的光线结构显示出表面质地的密度级差,而且随着视线引向远方,砖的视网像变小,视网膜的单位面积所包含的砖的数目增加,也显示出同样的密度变化。换句话说,光线分布的结构或表面质地的密度与物体的视网像都是按照视角规律而变化的,因此人可以直接知觉距离。如果在二维平面上,画出这种表面结构的密度级差,如使上端的结构单元较小而密度较大,下端的结构单元较大而密度较小,则可将画面知觉为向远方延伸,有明显的距离感或深度感。但是如果画面没有这种结构密度级差,则看起来仍然是垂直于视线的平面图形。这就是著名的Gibson结构密度级差的实验。Gibson本人的实验以及其他人的实验(Epstein,1962;Flock,1964;Newman,1970)都支持上述看法。照Gibson看来,感觉刺激所具有的丰富信息在实验室条件下被排除了许多,例如用速示器来迅速呈现刺激就是这样。但人在日常生活中,通常是有足够时间去观察的,而且人可以走动,改变观察的角度。随着观察点的改变,光流的一些特征发生变化,另一些特征则保持不变。像前面指出的那样,在空间的任一点上,都有其特定的光线分布,观察点的改变必然导致光线分布的变化,但光线分布总是含有一定结构的。Gibson认为知觉系统从流动的系列中抽取不变性。他的理论现在称作知觉的生态学理论,并形成已有不小影响的一个学派。
Gibson的理论给认为知觉只具有直接性质的观点以新的活力,成为在当前知觉争论中与假设考验说相对立的另一方。知觉依赖外部刺激的直接作用,这是没有争论的。没有相应的现实刺激,只可能产生幻觉。争论的焦点在于现实刺激信息是否需要在过去经验的基础上进行组织才能产生知觉。上述Gibson的距离知觉研究似乎提示,某些知觉或知觉的某些方面是受神经系统的构造所决定的,不需要过去经验的参与。以前格式塔心理学确定的知觉组织的各种现象也似可归于此类。但是,从总体上来看,就像前面所说的,认知心理学有理由认为,知觉依赖于过去的知识和经验,知觉信息是现实刺激的信息和记忆信息相互作用的结果。从目前的研究状况来看,以过去的知识经验的作用为焦点的知觉实质问题的争论还将继续下去。
三、知觉加工
1.自下而上加工和自上而下加工
认知心理学既已强调过去的知识经验和现实刺激都是产生知觉所必需的,因此它认为知觉过程包含相互联系的两种加工:自下而上(Bottom-Up)加工和自上而下(Top-Down)加工。自下而上加工和自上而下加工两个术语是从计算机科学引来的。自下而上加工是指由外部刺激开始的加工,通常是说先对较小的知觉单元进行分析,然后再转向较大的知觉单元,经过一系列连续阶段的加工而达到对感觉刺激的解释。例如,当看一个英文单词时,视觉系统先确认构成诸字母的各个特征如垂直线、水平线、斜线等,然后将这些特征加以结合来确认一些字母,字母再结合起来而形成单词。由于信息流程是从构成知觉基础的较小的知觉单元到较大的知觉单元,或者说从较低水平的加工到较高水平的加工,这种类型的加工因而称为自下而上加工。与此相反,自上而下加工是由有关知觉对象的一般知识开始的加工。由此可以形成期望或对知觉对象的假设。这种期望或假设制约着加工的所有的阶段或水平,从调整特征觉察器直到引导对细节的注意等。自上而下加工常体现于上下文效应中。如音素恢复实验所表明的那样,字词的上下文迫使对缺失一个字母的字词作出相应的解释。由于是一般知识引导知觉加工,较高水平的加工制约较低水平的加工,这种类型的加工因而称为自上而下加工。Lindsay和Norman(1977)将自下而上加工称作数据驱动加工(Date-Driven Processing),而将自上而下加工称作概念驱动加工(Conceptually-Driven Processing)。自下而上加工和自上而下加工是两种方向不同的加工,两者结合而形成统一的知觉过程。像我们在前面指出的那样,如果没有刺激的作用,那么单靠自上而下加工则只能产生幻觉。但是,只有自下而上加工也是不够的。因为在没有自上而下加工的情况下,自下而上加工所要负担的工作必将太重,甚至可以说是无法承担的;同时人接收外界信息的速度也是较慢的,据Gregory(1970)推算,人的视觉系统接收外界信息的极限大约是每秒12比特(bit);此外,单是自下而上加工也难于应付一些刺激所具有的双关性质或不确定性。这些困难只有在自上而下加工的参与下,才能得到克服。
现在一般都承认,知觉过程包含互相联系的自下而上加工和自上而下加工。但是,在不同的情况下,知觉过程对这两种加工也可有不同的侧重。Eysenck(1984)指出,在良好的知觉条件下,知觉主要是自下而上的加工,而随着条件恶化,自上而下加工的参与也将逐渐增多。他甚至认为,前面已提到的Gibson与Gregory和 Bruner的观点对立与此有关。照他看来,Gibson强调的是在良好条件下的知觉,而Gregory和Bruner则强调在非良好条件下的知觉。对于进一步研究这个问题,Tulving,Mandler和Baumal(1964)得到的实验结果是有意义的。他们在字词识别实验中,通过改变刺激呈现时间来研究自下而上加工,而通过改变作为上下文的字词的数目来研究自上而下加工。他们应用的刺激材料为一些句子,例如:
Countries in the United Nations form a military alliance.
The political leader was challenged by a dangerous opponent.
A voter in municipal elections must be a local resident.
The huge slum was filled with dirt and disorder.
每个句子的最后一个字为要识别的靶子词,在这之前的字词即为上下文。实验时先给被试呈现4个或8个上下文的字词,然后再呈现靶子词,或者径直呈现靶子词,而不呈现任何上下文。被试在上述各种情况下看到的刺激材料的类型有3种:
无上下文 disorder
4字上下文 filledwith dirt and disorder
8字上下文 The huge slum was filled with dirt and disorder
靶子词呈现的时间从0到140ms,梯度为20ms。呈现时间为0意味着未呈现靶子词。实验结果见图2-4。从图中可以看出,随着呈现时间的增加,无论有无上下文,靶子词的正确识别率都逐步提高了;而且不论呈现时间如何,有上下文的靶子词的正确识别率均高于无上下文的,其中8字上下文的又高于4字上下文的,甚至当靶子词未呈现时,在有上下文的条件下,被试还可以正确地猜出一些靶子词。实验结果还表明,当靶子词的呈现时间为60~80ms时,有上下文的靶子词的识别率高出无上下文的最多,其中有8字上下文的高出达40%。但是,随着靶子词呈现时间进一步增加,有上下文的和没有上下文的靶子词的识别率的差别反而缩小了。当靶子词的呈现时间为140ms时,有8字上下文的靶子词的识别率比没有上下文的只高出约30%。这意味着较长的刺激呈现时间更有利于无上下文的靶子词的识别,也即促进了自下而上加工,而上下文的作用这时却减弱了。以上这些结果说明,字词识别既依赖于自下而上加工,又依赖于自上而下加工,并且在不同的条件下,也可有不同的情况。
图2-4 靶子词的识别是呈现时间和上下文的函数
关于自下而上加工和自上而下加工及其联系,目前仍有不少细节还不清楚。例如,现在一般设想,自下而上加工和自上而下加工似乎是同时进行的,但也不排除两者的启动在时间上有先后;在自上而下加工中,人的期望或假设可能一开始是一般的、粗略的,而随着更多的刺激信息的获得,期望会逐渐变得更加具体。这些问题都有待于进一步的研究。
2.整体加工和局部加工
知觉过程还涉及另一个重要问题。这就是整体和部分的知觉问题:对于一个客体,是先知觉其各部分,进而再知觉整体,还是先知觉整体,再由此知觉其各部分?自格式塔心理学兴起以来,这个问题在知觉研究中,一直尖锐地存在着。格式塔心理学认为,整体多于部分之和,整体决定着其部分的知觉。照这种观点来看,整体是在其部分之前被知觉的。长期以来,针对这个观点还很少进行过实验研究。近年来,Navon(1977,1981)进行了一系列实验,并且提出了一些引人注目的看法。
Navon(1977)区分总体特征(Global Feature)和局部特征(Local Feature),前者可看作整体,后者可看作部分。例如,一个大的字母“H”可由一些小的字母“S”构成。这样,大的字母“H”就是整体或总体特征,小的字母“S”就是部分或局部特征。Navon在实验中应用的视觉刺激材料就是这样制作的,详见图2-5。图中每个黑方框的边长为33mm,构成视角3°47′,而大字母的最长的直径为28mm,构成视角3°12′,小字母的大小为大字母的1/8。但有一半被试接受的刺激为上述刺激的1.5倍大。从图中可以看出,所用的视觉刺激为大的字母H、S和长方形,它们分别由小的字母H、S和长方形所构成。实验采用Stroop作业的一种变式-视听干涉。实验时先呈现一个视觉刺激,持续80ms,在视觉刺激开始呈现后40ms,被试通过耳机可以听到字母H或S的读音,听觉刺激持续300ms,被试的任务在于判定他听到的是哪个字母,按键作出相应的反应,记录其反应时。实验中,被试要始终注视视觉刺激,视听两种刺激的作用有40ms的重叠。在这样的实验安排里,任何一个听觉刺激,即读出的字母H和S,与作为视觉刺激的大的字母H,S和长方形有3种关系:(1)一致,即被试听到的和看到的字母相同;(2)无关,即被试听到某个字母,但看到的是长方形;(3)冲突,即被试听到的是一个字母,而看到的是另一个字母。以上3种关系是就大的字母和长方形来说的,故称作总体的一致关系。从图2-5中可以看到,上述3种视觉刺激各由3种不同的成分所构成,如大的字母H有3种,其成分分别为小的字母H,S和长方形。这样,在上述任何一种总体的一致关系内,听觉刺激又与局部的成分有一致、无关和冲突3种关系,这称作局部的一致关系。Navon依照这种总体的和局部的一致关系整理出所得到的实验结果,见图2-6。此外,他还作了无视觉刺激的听觉辨别的反应时实验。
图2-5 Navon应用的视觉刺激材料
图2-6 听觉反应时是总体的一致关系的函数
图中的实验结果表明,听觉辨别的反应时依赖于听觉刺激与视觉刺激的总体的一致关系;在一致的情况下,反应时最短;在冲突的情况下,反应时最长;无关情况下的反应时居中。经成对的统计考验,其差异均达到显著水平。但是,听觉辨别反应时在3种局部的一致关系下,并没有显著的差异。视觉刺激的大小对实验结果也没有显著的影响。这些实验结果说明,当视觉的总体特征(大字母)与听觉刺激相一致时,听觉辨别的速度加快;当视觉的总体特征不同于听觉刺激时,听觉辨别就会受到干涉,速度就变慢了;但是,听觉辨别的速度不受局部特征(小字母)的影响。Navon因而认为,在一些情境中进行的视觉加工有着有限的深度,只有总体特征可被知觉,而局部特征则不被知觉。在上述实验里,大多数被试甚至未看出大的视觉刺激是由小的字母构成的。
Navon(1977)在另一个实验里,改用视觉的字母识别作业。所用的视觉刺激材料同前,每次试验时呈现一个刺激。实验按注意的对象分为两组:(1)注意整体,要求被试指出他看到的大字母是H还是S(在这组实验中,图2-5第二行的3个刺激弃而不用);(2)注意局部,要求被试指出他看到的小字母是H还是S(在这组实验中,图2-5第二列的3个刺激弃而不用)。这些都事先分别告知有关的被试。实验时先给被试以预警,要求被试注视荧光屏上的光点,接着呈现一个刺激,持续40ms,然后呈现掩蔽刺激。被试要尽快作出判定,并尽可能少犯错误。记录被试的反应时和判定的正误。得到的反应时结果见图2-7。
图2-7 反应时是一致关系的水平和注意情况的函数
图2-7中的横坐标是大字母和小字母的3种关系,即一致、无关和冲突。从图中可以看出,大字母的识别要快于小字母。差异达到统计学的显著水平;此外,在大小字母的3种不同关系下,大字母识别的反应时没有显著的差异,但是小字母的识别却有不同的速度,在冲突条件下的小字母识别最慢,它与另外两种条件下的反应时的差异达到显著水平。在正确识别率上,大字母和小字母没有显著的差异。根据这些实验结果,Navon认为,总体特征的知觉快于局部特征的知觉,而且当人有意识地去注意看总体特征时,知觉加工不受局部特征的影响,但当人注意看局部特征时,他不能不先知觉总体特征,否则就不会出现小字母识别在冲突条件下的反应时最长。这意味着总体特征是先于局部特征被知觉的,总体加工是处于局部分析之前的一个必要的知觉阶段。Navon将这种知觉加工的顺序称作总体特征优先。照他的看法,知觉过程开始于总体的组织,然后才是对局部特征的分析。这也就是说知觉是从整体到部分的。
Navon的这项研究引起人们的关注。一些心理学家(Kinchla & Wolfe,1979;Hoffman,1980)做了类似的实验,提出了不同的解释。Kinchla和Wolfe(1979)发现,当小字母达到视角8°时,它比总体特征(大字母)更易识别。他们认为,有着最佳大小的对象被首先加工。后来Navon(1981)指出,总体优先效应的大小乃至其存在是依赖于一定因素的,其中最重要的是刺激的视角大小和网像的位置,这些问题的研究还很少,目前难以作深入分析。但是,Navon提出的总体优先对进一步研究知觉过程,无疑是有意义的。从这里可以看到,由格式塔心理学提出的整体和部分的知觉问题,仍然是当前知觉研究的核心问题之一。我们在后面还将涉及这个问题。
从前面可以看出,整体的和局部的加工问题与自下而上加工和自上而下加工有密切联系。前面说过,自下而上加工是从较小的知觉单元转向较大的知觉单元,似乎可以说是从局部到整体的加工,而自上而下加工是关于知觉对象的一般知识,期望或假设引导的加工,也可说是从整体开始的加工。但是,Navon所说的总体优先或从整体到局部的加工,是针对刺激的物理特征的,而不是说刺激的意义的作用,虽然刺激的意义也是刺激的整体特征,但两者不能等同。在承认自下而上加工和自上而下加工以后,仍然存在从局部到整体的加工与从整体到局部的加工问题。
综上所述,认知心理学对知觉的理解较过去有了进步,它强调知觉的主动性和选择性以及过去经验的重要作用,并且明确提出了自下而上加工和自上而下加工,给一般知觉过程以新的解释。但是,一些重要的问题还没有得到解决,需要进行深入的研究。目前一个值得注意的趋势,是将心理学、生理学和人工智能等学科的观点加以综合来研究具体的知觉问题。