第2章心理学的研究方法_应用心理硕士（MAP）考试专用教材-QQ阅读男生历史网

上QQ阅读APP看本书，新人免费读10天

设备和账号都新为新人

第2章　心理学的研究方法

一、实验法

（一）定义

实验法是指通过人为地、系统地操纵环境，导致某些行为发生变化，并对之进行观察、记录和解释的科学方法。

（二）特点

1．带着特定的实验目的；

2．实验者设置的实验条件为他的观察创造了最好的条件；

3．实验者设定了明确的实验条件，其他研究者可以重复实验，对他的结果做独立的检验；

4．实验者可以合理控制实验条件，判断实验结果是否由此条件引起。

（三）变量与控制

1．变量与控制

变量是指在实验中呈现给被试的数量上或质量上可变的刺激信息。实验中的变量可以分为自变量、因变量和额外变量。操纵或控制变量，人为地创设一定的情境，这是实验法的显著特征。

（1）自变量的种类与控制

自变量即刺激变量，是由主试选择、控制的变量决定着行为或心理的变化。

①自变量的种类

a．刺激特点自变量；

b．环境特点自变量；

c．被试特点自变量；

d．暂时造成的被试差别。

②对自变量的操作

主要分为以下几个步骤：

a．对自变量下操作定义

第一是抽象定义，指对研究变量或指标本质的概括，以揭示其内涵，并将其与其他变量或指标区别开来；

第二是操作性定义，指用可感知、度量的事物、事件、现象和方法对变量或指标做出具体的界定、说明。

b．规定操作性定义的好处

第一，使研究者的思路具体而清晰；

第二，增进科学研究者之间沟通的正确性；

第三，可减少一门学科所用概念或变量的数目。

c．设计操作定义常见的方法

第一，方法与程序描述法，即通过特定的方法或操作程序给变量或指标下定义的一种方法；

第二，静态特征描述法，即通过描述客体或事物所具有的静态特征给变量下定义的一种方法；

第三，动态特征描述法，即通过描述客体或事物所具有的动态特征给变量下定义的一种方法。

d．确定自变量的各个水平

第一，因素型实验的自变量一般不超过4个水平，并应尽量使自变量变化范围（全距）较大，各个水平在全距上分布平均；

第二，函数型实验的自变量水平需要更多，如果预期实验考察的是线性函数关系，可以取3～5个水平，各水平平均分布即可；如果是关于更复杂函数关系的，则至少需要5个水平，如符合对数函数关系，则各水平间的间距应按对数单位变化。

（2）因变量的种类与控制

因变量即被试的反应变量，它是自变量造成的结果，是主试观察或测量的行为变量。

①因变量的种类

对于实验研究来讲，因变量的种类是很多的，也是很复杂的。一般而言，对于因变量的测量有客观指标也有主观指标。

因变量的客观指标主要有以下几种：

a．反应速度；

b．反应速度的差异；

c．反应的正确性；

d．反应标准；

e．反应的难度。

因变量的主观指标主要是指被试的口语记录。

②因变量的控制

因变量的控制主要着眼于如何精确客观地记录下它的变化。一般而言，有几种主要方法可以用于因变量的控制。

a．反应控制

b．选择恰当的因变量指标

恰当的因变量指标必须满足以下标准：

第一，有效性；

第二，客观性；

第三，数量化。

c．避免量程限制

（3）额外变量及其控制

额外变量就是指与实验目的无关，但又对被试的反应有一定影响的变量，在实验中应该进行控制。

①额外变量的种类

a．系统的额外变量；

b．随机的额外变量。

心理学实验中最典型的额外变量：

a．实验者效应

主试在实验中可能以某种方式（如表情、手势、语气等）有意无意地影响被试，使他们的反应附和主试的期望，这种现象称为实验者效应。

b．要求特征

在心理学实验中，被试总是以某种动机、态度来对待实验，因而实验结果在很大程度上也依赖于被试对实验的态度。因此被试会很有可能自发地对主试的实验目的产生一个假设或猜想，然后再以一种自以为能满足这一假想的实验目的的方式进行反应，这种现象称为要求特征。

②额外变量的控制

对部分被试变量及暂时被试变量的控制方法，可从指导语、主试对被试的态度等方面来考虑。对环境变量及部分被试变量的控制方法主要有以下几种：

a．排除法；

b．恒定法；

c．匹配法；

d．随机化法和抵消平衡法；

e．统计控制法；

f．无关变量的纳入。

2．实验的信度和效度

（1）实验研究的信度

实验信度是指实验结论的可靠性和前后一致性程度。

①影响实验信度的因素

a．观察量：观察量越大，人们就越有理由相信样本统计值接近总体参数值，也就是样本更能够代表其所在的总体。

b．对结果的统计检验：若不同实验条件下所得出的结果之间差异很大，且这种差异由偶然因素造成的概率低于0.05，则可以排除偶然因素造成实验结果的可能性，认为该结果是由自变量造成的。

②实验信度的验证

为保证实验信度，应鼓励研究者进行验证性实验，这样即使推断统计显示仍存在犯错误的可能，实验结果也是可信的。实验信度的验证有以下三种方法：

a．直接验证，指在尽可能保持原实验方法的情况下在实际中重复实验。

b．系统验证，指实验者试图变化那种先前被认为与实验结果不相关的因素，即在实验中引入原来未加控制的变量进行验证。若原始实验中发现的某种现象是真的，那么尽管重做时其中一些因素发生了变化，原来的实验结果应该仍然会出现。若重做时原始实验的结果不再产生，那么研究者就在他的实验中发现了重要的边界条件。

c．概念验证，指研究者试图验证一个现象，但在某种程度上又与原先的实验有很大的不同，其目的也在于描述某一心理现象的边界条件。

直接验证的目的是能否在第二次得到相同的结果，而系统验证和概念验证的目的是描述某一心理现象的边界条件。边界条件是指保证某一实验结果出现的条件，超过这一条件，则该实验结果不会出现。

2．实验研究的效度

（1）实验效度的定义

实验效度是指实验方法能达到实验目的的程度，也就是实验结果的准确性和有效性程度。实验效度主要包括内部效度和外部效度。这两者的前提是实验具有良好的构思效度，即研究题目的来源具有一定的重要性和独特性，对实验研究中的自变量和因变量给出严格的操作定义，并对自变量的操作水平和因变量的测量指标做出明确的界定。

（2）内部效度

①内部效度的定义

实验的内部效度是指实验中的自变量与因变量之间因果关系的明确程度。如果在实验中，当自变量发生变化时因变量随之发生改变，而自变量恒定时因变量则不发生变化，也就是说确实是自变量而不是其他因素引起了因变量的变化，那么这个实验就具有较高的内部效度。由此可知，内部效度与无关变量的控制有关。当实验中未得到控制的无关变量越多时，因变量的变化不是由自变量引起的可能性就越大，实验的内部效度就越低。当实验结果未受到任何其他变量的干扰，自变量与因变量的因果关系明确时，实验的内部效度就是高的。

②内部效度的影响因素

a．主试－被试间的相互作用：主要指要求特征和实验者效应。心理学实验中，有效消除主试—被试间不恰当的相互作用的通用手段是双盲实验法。即主试和被试都不清楚实验的具体目的，因而可最大程度地避免主试的暗示和被试的顺从。

b．统计回归：即测量分数向常态分布的平均数回归。为避免统计回归对实验效度的影响，通常建议实验者在匹配被试时必须考虑两组被试本身是否同质。如果不同质，就必须以几组被试各自的相对水平进行匹配。此外，利用统计控制进行协方差分析，在某种程度上也能降低统计回归对实验效度的影响。

c．其他影响内部效度的因素：包括被试某些固有和习得的差异，如性别、年龄等；被试选择的偏差；在一些长期实验中被试的流失，个体本身的生长和成熟因素。

为避免这些因素对内部效度的影响，在对被试进行分组时，应随机选取和随机分配被试；另外，还可以增设控制组，解决由于实验程序本身、控制方式的不一致以及测量程度的变化对实验内部效度的影响。

③零结果对内部效度问题的提示

a．零结果是指在一项实验研究中，由于上述种种原因造成了严重的混淆，导致自变量的操纵和变化没有引起因变量相应的变化的现象。若零结果不是真正意义上说明自变量和因变量毫无关系，那么就必然提示了实验的内部效度存在大问题。

b．一般来讲，要在以下几方面寻找原因以改进实验的内部效度。一是自变量的操纵是否有效；二是因变量的测量是否充分；三是额外变量是否得到有效控制。

④内部效度的特例——统计结论效度

a．实验研究的统计结论效度是指有关决定实验处理效应的数据分析程序的有效性和准确性，涉及到研究误差的变异来源和如何恰当运用统计显著性检验的问题。

b．它取决于两方面条件：

一是数据的质量，二是统计检验的假设。

（3）外部效度

实验的外部效度是指实验结果能够普遍推论到样本的总体和其他同类现象中去的程度，即实验结果的普遍代表性和适用性，研究者也将之称为生态效度。实验外部效度的影响因素主要有以下几个方面：

①实验环境的人为性；

②被试样本缺乏代表性；

③测量工具的局限性。

（4）内部效度与外部效度的关系

实验的内部效度和外部效度是相互联系、相互影响的。实验的内部效度越高，其结果就越能确认是由实验处理所造成的；而实验的外部效度越高，其结果的可推论范围就越大。在一项实验中，研究者通常会在保证内部效度的前提下，采取适当措施以提高外部效度。

3．信度和效度的关系

信度是效度的必要非充分条件。即信度低，效度不可能高；信度高，效度未必高；效度低，信度可能高；效度高，信度必然高。

实验研究的效度和信度是相互联系、相互影响的，良好的效度和信度是评价实验设计成功与否的关键，而雄厚的理论基础、周密的思考和设计、谨慎科学的态度则是达到实验效度和信度的必备素质。

（三）反应时法

1．反应时的含义

（1）反应时是心理学研究中最重要的反应变量和指标之一，是指刺激作用于有机体后到明显反应开始时所需要的时间，即刺激与反应之间的时间间隔。它包含以下几个时段：

①第一时段，刺激使感受器产生了兴奋，其冲动传递到感觉神经元的时间；

②第二时段，神经冲动经感觉神经传至大脑皮质的感觉中枢和运动中枢，从那里经运动神经到效应器官的时间；

③第三时段，效应器官接受冲动后开始效应活动的时间。

以上三个时段的总和即是反应时间。反应时为心理学家观察心理操作打开了一个窗口。

（2）反应时的研究意义

反应时是心理学研究中最重要的反应变量和指标之一，使用反应时作为指标的实验研究，曾对解决心理学理论问题和生活实际问题起到相当大的作用。反应时研究，几乎奠定了当代认知心理学的方法论基础。它对认知心理学和实验心理学的贡献都是巨大的。

①反应时间是一种反应变量，它可以作为成就的指标及内部过程复杂程度的指标。对一件工作越熟悉，反应时间就越快；内部过程越复杂，反应时间就越长。反应时间随多种原因而变化，因此它可以作为一个很方便的反应变量来运用。由于这些原因，反应时的研究就在实验心理学的研究中占有很重要的地位。

②心理实验中常用速度作为反应变量，这个速度称作反应的时间，而反应时只是它的基本成分和最简单的例子。

速度包括两方面的内容：做一定的工作所需要的时间；在一定的时间之内所完成的工作。这两种情况都是测量工作速度。速度之所以能够成为一个有用的量数，是因为每个动作都需要时间，而时间是可以测量的。速度可以作为成就的指标，对一件工作完全精通，就会做得很快。速度也可以作为内部过程复杂程度的指标，内部过程越复杂，所需要的时间就越多。因而测量反应的时间，即执行反应的时间就成了很重要的工作，而反应时，就是测量反应的时间中最简单的例子。

（3）反应时研究的历史发展

反应时的实验已有100多年的历史，反应时在心理学中的研究历史分为以下两个阶段：

①唐德斯反应时ABC时期

a．1850年，赫尔姆霍茨等关于青蛙运动神经传导速度的测定标志着反应时研究的开始。他发现刺激离大脑近的皮肤，反应时要短，刺激身体的各个部位反应时变动很大。

b．天文学研究提出了著名的人差方程，它反映了两个观察者之间的个体差异。这一发现引起了天文学家经久不衰的兴趣。此后，他们确定了不同观测者的人差方程式及其校正方法。

c．荷兰生理学家唐德斯将反应时正式引入心理学领域，赫尔姆霍茨测定神经传导速度的研究使他意识到可以利用反应时来测量各种心理活动所需的时间，并发展了三种反应时任务，后人将它们称为唐德斯反应时ABC（Donders ABC of reaction time）。

d．1873年，厄克斯奈指出准备定势在反应时测量中的作用并首先提出“反应时间”这个名词。

现代心理学家把自1850年赫尔姆霍茨的研究至1969年长达一百多年的时间称之为唐德斯反应时ABC时期。这是反应时研究的第一阶段，这一阶段方法学的核心是减数法。

②1969年心理学家斯腾伯格提出加因素法之后，反应时研究进入第二阶段，开始了反应时研究的新时期。

这种方法假定，完成一个作业所需的时间是一系列信息加工阶段分别所需时间的总和，如果两个因素的效应是相互制约的，即一个因素的效应可影响另一因素的效应，那么这两个因素只作用于同一个信息加工阶段；如果两个因素的效应是分别独立的即可相加，那么这两个因素各自作用于某一特定的加工阶段。

2．反应时的种类

（1）简单反应时

①简单反应时是指给被试以单一的刺激，只要求作单一的反应，这时刺激显现与被试做出反应之间的时距就称为简单反应时。

②简单反应时实验中被试的工作很简单。他预先知道刺激是什么以及他要做的反应是什么。

（2）复杂反应时

复杂反应时包括选择反应时与辨别反应时，选择反应时又称B反应时，辨别反应时又称C反应时。

①选择反应时实验中，给被试呈现几种不同的刺激，要求被试做出几种相应的反应。

②辨别反应时是指被试对所呈现的多个刺激当中的某一个刺激（由主试确定）进行反应，而对其余的刺激不进行反应。

三种反应时的时间长短不一，简单反应时最短，辨别反应时稍长些，选择反应时最长。

（3）上述三种反应时的分类模式是反应时早期研究的基本模式，有不少学者不同意这种分类方式，认为A、B、C三种反应时不能简单相加，即C反应时不是在A反应时上简单相加分辨时间，B反应时也不是在C反应时上简单加上选择时间，三者之间不存在简单相加关系。但自19世纪60年代至20世纪60年代这一百多年的时间里，在应用反应时作指标的研究中一直遵照这种反应模式。

3．反应时的影响因素

反应时受到刺激变量和机体变量的影响。

（1）外部因素

①反应时与刺激强度有关。这里所指的刺激强度除了刺激的物理强度外，还包括与物理刺激有关的心理强度。受刺激强度影响一般的情况是，当刺激强度很弱时，反应时就会延长；而当刺激增至中等或较高强度时，反应时就缩短了。但是反应时的缩短会受到有机体结构的限制，无法突破某一极限。

②反应时间与刺激的时间特性以及空间特性有关。当物理刺激的强度本身保持不变，而增加作用于感官的时间，即造成时间的累积作用，这样便会增加刺激的心理强度。

如果物理刺激强度保持不变，刺激的时间也保持不变，仅增加刺激的面积时，由于感受器神经兴奋的空间累积的作用，也会增加刺激的心理强度。

③反应时间与所刺激的感觉器官有关。不仅不同的感觉器官的反应时不相同，而且同一感觉器官受到不同刺激物刺激，其反应时间也不同，甚至同一刺激作用于同一感觉器官的不同部位，其反应时间也不同。

（2）机体因素

简单—复杂反应时任务的区别以及速度—准确性权衡，是影响反应时的两个最基本因素。除此之外，影响反应时的机体变量还有适应水平、被试的准备状态、动机、年龄、练习和个体差异等。

4．反应时技术

反应时技术是用反应时分析信息加工过程的技术方法，反应时技术在认知心理学的研究中具有十分重要的地位，是现代认知心理学实验室研究中最广泛使用的手段之一。

（1）减法反应时技术

减法反应时技术即减法法，又称减数法、唐德斯反应时ABC或唐德斯三成分说，是一种用减法方法将反应时分解成各个成分，然后来分析信息加工过程的方法。

①减法法的基本逻辑思想

在安排两种或两种以上的反应时作业中，其中一个作业包含有另一个作业所没有的加工阶段，而其他方面则相同，从这两种作业的反应时差异即可判断那个特有的加工阶段所需要的时间。简单反应时、辨别反应时和选择反应时的差异可归结为辨别过程、选择过程所需要的时间和基本的时间——即简单反应时间三者都相同。该方法可从测得的总反应时间中，分析出研究者感兴趣的过程，这一过程可通过设计不同的任务，插入或删去一个加工阶段、不改变其他加工阶段来实现，原则上连续相减可获得每个加工阶段的持续时间。

该方法要求实验者对实验任务引起的刺激与反应之间的一系列心理过程有精确的认识，并要求在相减的两种反应时作业中有严格的相同或匹配的部分。

只有满足上述两点，才能应用减法法对信息加工过程进行分析。

②对减法法的评价

减法法的两个要求有时不能得到满足，复杂的信息加工过程难以区分出不同的加工阶段，有时不同作业的匹配也难以做到，这使其在心理学研究中的应用受到一定的限制。尽管如此，在认知心理学中，分析信息加工过程还是经常应用减法法来提出很多信息加工过程的分析和一些新的理论构思。

（2）加法反应时技术

加法反应时技术即加法法，是加因素法的简称，由斯腾伯格提出，该方法是减法法的发展和延伸，与减法法是同一个问题的两个不同侧面。

①该方法的逻辑

如果两个因素的效应相互制约，即一个因素的效应可以改变另一个因素的效应，那么这两个因素只作用于同一个信息加工阶段；如果两个因素的效应分别独立，那么这两个因素各自作用于不同的信息加工阶段。如果事先可以发现或观察到完成作业所需时间的一些因素，通过单独地或成对地应用这些因素进行实验，就可以将各因素所需时间相加，从完成各阶段的时间变化来确定这一信息加工过程的各个阶段以及所需要的时间总和。

②加法反应时应用的前提

加法法是以信息的加工方式是系列加工而不是平行加工为前提的，如果这一前提不能得到满足，就不能应用加法法。

③对加法法的评价

两个因素可能以相加的方式对同一个加工阶段起作用，也可能对不同的加工阶段起作用，并且相互发生影响，这两种情况目前尚不能排除，这也使加法法的应用受到限制。

（3）开窗技术

①含义

Hockey等发展了一种新的反应时实验技术即“开窗”实验。开窗实验能够比较直接地测量每个加工阶段的时间，并且能比较明显地看出这些加工阶段，这是反应时实验的一种新形式，他们以一种字母转换实验来说明这种新实验技术，其优点是能够比较直接地测量每个加工阶段的时间以及这些加工阶段是什么。

②研究举例

实验过程：给被试呈现1～4个字母并在后面标上一个数字，例如“F+3”、“KENC+4”等，四个字母一个个相继呈现，由被试自行按键控制，当呈现“F+3”时要求被试念出字母表上F后面第三个字母（应为I）。同理“KENC+4”呈现后被试的反应应为“OIRG”，因为K后第四个字母为O，E后第四个字母为I，N后第四个字母为R，C后第四个字母为G，其他类同。通过分析反应时数据，明显可看出字母转换作业的三个加工阶段。

在四个刺激字母实验里，可以获得12个数据，从中可以看到完成字母转换的整个过程和所有加工阶段。通过对数据归类处理后可得到总的结果。

根据该实验的反应时数据，可以清楚地看出，完成字母转换作业的3个加工阶段分别为：

a．编码阶段，即从被试按键看到一个字母到开始出声转换所用的时间。在这一阶段中，被试对所看到的字母进行编码并在记忆中找到该字母在字母表中的位置；

b．转换阶段，即转换所用的时间；

c．贮存阶段，即从前一个字母转换结束到按键看下一个字母的时间，在此阶段中，被试将转换结果贮存于记忆中，而且从第二个字母开始，还需将前面的转换结果加以归并和复述。

“开窗”实验通过对字母转换作业的分析，可把每一种认知加工成分所经历的时间都比较直接地估计出来。

（4）内隐联想测验

①含义

内隐联想测验由格林沃尔德在1998年提出。它是以反应时为指标，通过一种计算机化的分类任务来测量两类词（概念词与属性词）之间的自动化联系的紧密程度，继而对个体的内隐态度等内隐社会认知进行测量的。

②基本逻辑

a．依据唐德斯减数法的原理，反应时的不同阶段对应着不同的加工过程，反应时越长,心理加工过程越复杂。

b．在社会认知研究中，由于所呈现的刺激多具有复杂的社会意义，刺激所暗含的社会意义不同，被试的加工过程的复杂程度就会不同，从而反应时的长短也会不同。相容任务中，概念词和属性词的关系与被试的内隐态度一致或二者联系较紧密，此时辨别任务更多依赖自动化加工，因而反应时短；不相容任务中，概念词和属性词的关系与被试的内隐态度不一致，这往往会导致被试的认知冲突，此时辨别任务更多依赖复杂的意识加工，因而反应时长。所以，两种联合任务的反应时之差可以作为概念词和属性词的关系与被试的内隐态度相对一致性的指标。

c．内隐和外显测试间的高相关表示内隐联想测验结构效度高。内隐联想测验效应与简单反应时的相关应尽可能低。

③内隐联想测验的各种变式

a．Go/NO Go联想测验

在内隐联想测验中如果只使用反应时作为考察指标，可能忽略错误率所包含的信息；其次，只能考察被试对两个对象的相对态度，而不能测量被试对某一对象的态度。Go/NO Go联想测验要求被试对一些刺激做出反应而忽视另外的刺激。对数据分析采用信号检测论的方法，以辨别力指数d′为指标。

b．外在情感性西蒙任务

霍福尔设计了外在情感性西蒙任务（简称EAST）。

外在情感性西蒙任务与内隐联想测验最大的不同是：内隐联想测验效应的计算依赖于两个联合任务反应时均数之差，而外在情感性西蒙任务则是要比较被试在同一任务的不同实验条件下的行为差异。

对于外在情感性西蒙任务而言，被试很难将任务的要求进行简化或重新编码；外在情感性西蒙任务的实验设计能有效控制被试有意识重新编码对内隐联想测验效应的影响；由于外在情感性西蒙任务只要求个体完成一个任务，从而有效避免了内隐联想测验中任务顺序对内隐联想测验效果的影响。它可应用于对多个态度对象的评价。

（四）心理物理学方法

心理物理学方法主要用来揭示心理量与物理量之间的关系。心理物理学方法的先驱是费希纳，传统的心理物理法在心理学中得到了广泛的应用，对实验心理学的发展也产生了深远的影响，后来的研究者在费希纳提出的三种心理物理法的基础上发展了很多心理物理法的范式。

1．传统心理物理学

在《心理物理学纲要》一书中，费希纳把心理物理学定义为一门精密的关于身体和心理之间函数依附关系的理论，其目标就是最终用精确的数学函数的形式来描述外部的物理刺激与由此而发生的感觉和知觉之间的定量关系。

感觉阈限，又称阈限，是传统心理物理学的核心概念。

（1）阈限的分类：

①绝对阈限，指刚好能够引起心理感受的刺激大小；

②差别阈限，指刚好能引起差异感受的刺激变化量。

根据统计学原理，可以把阈限的操作定义设定为：有50％的实验次数能引起反应的刺激值；同理，把差别阈限定义为有50％的实验次数能引起差别感觉的两个刺激强度之差。

（2）测量感觉阈限的方法：

①最小变化法

最小变化法又称极限法、系列探索法或最小可觉差法。

其基本特点是刺激按强度的递增序列和递减序列交替的方法呈现，各序列的刺激由小到大或由大到小以小步阶梯变化，探索从一类反应到另一类反应的转折点或阈限值。在测定绝对感觉阈限时，首先须确定刺激的范围，安排递增或递减的实验程序，其结果是递增系列的绝对阈限值和递减系列的绝对阈限值的算术平均数：

最小变化法测定差别感觉阈限时，给被试呈现一个标准刺激（St），然后呈现比较刺激（Sv），按递增及递减系列呈现，让被试判断比较刺激比标准刺激“大些”、“小些”还是“相等”，最后得出被试的差别感觉阈限。采用最小变化法时，会产生由习惯和期望所引起的误差，也会产生由练习及疲劳引起的误差，通过改善实验程序可以减少误差，但不会完全消除。

②平均差误法

平均差误法（或均误法）又称调整法、再造法、均等法，是最古老且基本的心理物理学方法之一。虽然它最适用于测量绝对阈限和等值，但也可用以测量差别阈限。

平均差误法的特点是呈现一个标准刺激，令被试再造、复制或调节一个比较刺激，使它与标准刺激相等。该方法是要求被试判断什么时候比较刺激和标准刺激相等。被试判断为与标准刺激相等的比较刺激，并不总是一个固定的数值，而是围绕着一个平均数变化的一个数。这个变化的范围就是不肯定间距。不肯定间距的中点就是主观相等点。通过对主观相等点和不肯定间距的测量，就可以估计差别阈限。

③恒定刺激法

恒定刺激法又称次数法或正误法。

其特点是在整个实验中始终应用若干恒定的刺激量，并以随机顺序反复呈现这些刺激来测定绝对感觉阈限和差别感觉阈限。一般选用5-7个恒定的、从被试感觉不到至感觉到的等距刺激。每种强度的刺激随机呈现，被试报告感觉到与否，然后根据各个刺激所引起的正、负反应的次数，运用一定的统计方法求出有50%次被感觉到的刺激值作为绝对感觉阈限值。在测定差别感觉阈限时，首先确定一个标准刺激和5-7个比较刺激，要求被试报告比较刺激比标准刺激“大”、“小”或“相等”，然后根据被试所做的各种反应次数，运用一定的统计方法求得差别感觉阈限。

此法虽然要求较大量的实验次数，但每次实验只用很短的时间，因此也比最小变化法节省时间，并且测得的阈限也更准确。

2．信号检测论

信号检测论又称为信号侦察论、信号觉察论，是一种测量感受性的理论，它以感觉阈限作为测量感受性指标时，除感受性外，被试的主观判定标准对感觉阈限是有影响作用的。信号检测论则是要将两者加以区分，用一条“接受者的操作特点曲线”代替阈限来测量感受性。

（1）信号检测论的基本思想

信号检测论认为，在感觉刺激时存在着两个过程，一个是感觉过程，其反映了刺激的强度；另一个是随之而来的独立的判断过程，其反映了被试的反应偏差。信号检测论的测量，是将所要觉察的刺激或刺激的差别视为信号，将可能与信号相混淆的刺激视为噪音，将信号出现时报告说有信号时称为击中，将信号出现而报告无信号时称为漏报，将信号未出现而报告无信号时称为正确否定，将信号未出现而将噪音报告有信号称为虚报，错报比正确否定愈少，表明判断标准愈高。在同等判断标准下，虚报比击中愈少，表明判断力愈高。信号检测论就是通过将被试者的辨别力，即感觉分辨力（d＇）和被试的反应偏差（β）的测定，把被试者的主观态度、动机因素等产生的干扰作用从感受性中排除，从而得到比较准确的结果。

（2）接受者操作特性曲线

接受者操作特性曲线又称为感受性曲线。得此名的原因在于曲线上各点反映着相同的感受性，它们都是对同一信号刺激的反应，只不过是在几种不同的判定标准下所得的结果而已。接受者操作特性曲线就是以虚惊概率为横轴、击中概率为纵轴所组成的坐标图，根据被试在特定刺激条件下由于采用不同的判断标准得出的不同结果画出的曲线。

二、观察法

（一）观察法的概念

观察法是心理学研究中最基本、最普遍、历史最悠久的方法之一。观察是日常生活和科学研究中不可缺少的活动和手段。观察法是研究者通过感官或借助于一定的科学仪器，在一定时间内有目的、有计划地考察和描述人的各种心理活动和行为表现并收集研究资料的一种方法。

（二）观察法的优缺点

1．观察法的优点

（1）能动性

科学的观察是具有能动性的感性认识活动，它与一般所说的观察不同，不是简单反射式的感觉，而是有目的、有意识的观察与研究。这样的观察是自觉的，不是盲目的，是能动的，不是被动的。它要求观察者充分发挥观察中的主观能动作用。

（2）选择性

科学的观察并不是一般地认识现象和事实，而是从大量客观事实中，选择观察的典型对象，选择典型条件、时间、地点，获得典型事物的现象和过程。只有把注意力有意地集中和保持在经过选择的观察对象上，把观察始终和有意注意结合在一起，不为无关现象所分散，尽量排除外界无关刺激的干扰，这样的观察才能获得预期的成效。

（3）客观性

观察所获得的事实材料是认识事物的依据，是科学研究的基础。但是，这里有一个前提，即获得事实材料的观察是否具有客观性的品质。观察中获得的结果，实际上是观察者通过观察手段对观察对象的现象或过程的一种反映和描述。

2．观察法的局限性

（1）人的生理局限

主要表现为：人的感官使观察范围受到局限。感官是有一定阈值的，超过一定的限度，就听不到、看不到、感觉不到。人的感官也使观察的精确度受到局限。这样观察常常就只局限于了解表面的现象，不能直接深入到事物的本质，难以分辨是偶然的事实还是有规律性的事实，这是观察法最主要的局限。

（2）观察仪器的局限

观察仪器的认识功能也有其局限性，主要表现为：缺乏直观性，间接观察还不能完全取代直接观察，仪器设计的错误或不精确，制作和操作仪器的误差，都会导致观察结果的错误，观察仪器容易产生对观察对象的干扰等等。

此外，观察者对所获材料的解释，也往往容易受观察水平的局限而带上主观色彩。

（三）观察法的分类

1．自然观察与实验观察

（1）自然观察主张在自然发生的条件下，即在对观察对象不加干预和控制的状态下进行观察，自然观察能搜集到研究对象在日常生活中的真实、典型的行为表现，但研究者处于被动，难以揭示那些较少在自然状态下表现出来的心理特点；

（2）实验观察则通过人为地改变和控制一定的条件，有目的地引起被研究对象的某些心理行为反应，进而在最有利的条件下进行观察。实验观察能使研究者获得更全面、更精确、更深入的事实和资料，但要求较高，难度较大。

2．直接观察与间接观察

直接观察和间接观察的区别在于前者通过人的感官进行直接观察，后者则借助于各种仪器或装置（如录音机、录像机、摄像仪、照相设备等）进行观察和记录。由于人类感官的局限和科学技术的进步，从凭借感官进行直接观察到通过仪器作为中介来进行观察，是观察法发展的必然趋势。

3．参与观察与非参与观察

（1）参与观察即局内观察，指观察者参与到被观察者的实际环境之中，并通过与被观察者的共同活动从内部进行观察。根据参与程度的不同，参与观察可分为完全参与观察和不完全参与观察。

（2）非参与观察即局外观察，指观察者完全以局外人或旁观者的身份进行观察。显然，参与观察能搜集到较为完整且具有深度的资料，但易带主观情感成分，而且比较费时、难度较大。

4．有结构观察与无结构观察

根据观察内容是否有统一设计的、有一定结构的观察项目和要求，观察法可划分为有结构观察和无结构观察。较之无结构观察，有结构观察能获得大量确定、详实的资料，并可进行定量和对比分析，但缺乏弹性，比较费时。

5．叙述观察、取样观察与评价观察

叙述观察、取样观察与评价观察是根据观察内容是否连续完整以及观察记录方式的不同来划分的。

（1）叙述观察指详细观察和记录被观察对象连续、完整的心理活动和行为，日记描述法、轶事记录法等属于这种方法；

（2）取样观察指依据一定的标准选取被观察对象的某些心理活动和行为表现来进行观察，或选择在特定的时间内进行观察；

（3）评价观察指按照事先制定好的评价量表进行观察并作出评价。

四、观察法的基本步骤

1．观察准备，明确观察目的、观察重点和范围、观察的注意事项等。

2．进行实际观察，如参观、听课、个别谈话等。

3．进行观察时必须注意的事项，如选择最佳观察位置、善于辨别重要的和无关的因素等。

4．观察材料的记录和整理。

三、个案法

个案法就是对某一个体或群体组织在较长时间内（几个月、几年乃至更长时间）连续进行调查、了解，收集全面的资料，从而研究其心理发展变化的全过程的方法。个案法有时会和其他方法（如观察法、传记法、测验法等）配合使用，这样可以收集更丰富的个人资料。用个案法研究儿童的心理发展，在现代心理学中曾起了重要的作用。

由于个案法限于使用少数案例，研究的结果可能只适合于个别情况，因此，在推广运用这些结果或作出更概括的结论时，必须持谨慎的态度。一般地说，个案法常用于提出理论或假设，要进一步检验理论或假设，则有赖于其他方法的帮助。

四、心理测量

心理测量是心理学的重要研究方法。通过心理测量把心理特性量化，在社会生活、教育工作和理论研究中发挥着重要的功能。

（一）心理测量的基本概念

1．测量的含义

测量就是根据一定的法则用数字对事物加以确定。测量包含两个要素，即参照点和单位。

（1）参照点是计算事物的量的起点。参照点有两种：

①一种是绝对零点，如测量轻重、长短时使用的零点都是绝对零点，这个零点的意义为“无”，表示什么都测不到；

②另一种是人为确定的参照点，即相对零点，例如海拔高度，就是以海平面作为测量陆地高度的起点。理想的参照点是绝对零点，但心理测量中很难找到绝对零点，多采用人为标定的相对零点。

（2）单位是测量的基本要求，没有单位无法进行测量。理想的单位需要具备两个条件：有确定的意义和有相等的价值。一般来说，心理测量的单位不够完善，既无统一的单位，也不符合等距的要求，还需要心理测量学家的进一步努力。

2．测量中量表的使用

由于制定量表的单位和参照点不同，量表的种类也不同。不同量表的精确度不一样，如将测量水平从低级到高级排列，可分为4种测量水平，即命名量表水平、顺序量表水平、等距量表水平和比例量表水平。

（1）命名量表是水平最低的一种测量量表，它只是用数字来代表事物或把事物归类，没有任何数量的意义。

（2）顺序量表比命名量表精确，它不仅指明类别，还能指明不同类别的大小等级，或具有某种属性的程度。在顺序量表中，既无相等单位，又无绝对零点，数字仅表示等级。

（3）等距量表不仅有大小关系，而且有相等的单位。其数值可以相互做加、减运算，但没有绝对的零点，因此不能做乘、除运算。

（4）比例量表是最高水平的量表，既有相等单位又有绝对零点。但在心理测量中，由于难以找到有意义的零点，因此大多数采用等距量表。

3．心理测量的含义

（1）心理测量，就是根据一定的法则用数字对人的行为加以确定，即根据一定的心理学理论，使用一定的操作程序，给人的行为确定出一种数量化的价值。

（2）心理测量与测验的关系体现在：

（1）测验是心理测量的一种工具和手段，是根据一定法则对人的行为用数字加以确定的方法。

（2）心理测量则是把测验做为工具来运用，以达到了解人类心理的实践活动。心理测量测的是人的行为，严格地说，是一个人对测量题目所进行的反应。一个测量不可能包含所要测量的行为领域的所有可能的题目，它所包含的只是全部可能题目的一个样本。另外，在编制、施测、评分和解释方面要依据一套系统的程序。这种按照严格的科学程序编制和使用的测验称为标准化测验。标准化有3点好处：

①可以减少无关因素对测验目的的影响，使测量准确、客观；

②有统一标准，便于对不同人的测验成绩进行比较和交流；

③同一份测验可用于许多人并可反复使用，较为经济。

一般来说，心理测量是在顺序量表上进行的。但通过统计方法，可以把测量数据转换为等距数据。

4．心理测量的特性

（1）心理测量的间接性

研究者无法直接测量人的心理，只能测量人的外显行为，也就是说，只能通过一个人对测量题目的反应来推论他的心理特质。

（2）心理测量的相对性

在对人的行为做比较时，没有绝对的标准，也就是没有绝对的零点，有的只是一个连续的行为序列。所谓测量就是看每个人处在这个序列的什么位置上。

（3）心理测量的客观性

测量的客观性实际就是测量的标准化问题。经过长期努力，测量的标准化有了很大改进。首先，测量用的题目或作业、施测说明、施测者的言语态度及施测时的物理环境等均经过了标准化。其次，评分记分的原则和手续经过了标准化。最后，分数的转换和解释都经过了标准化。

（二）心理测验的信效度

1．信度

心理测验的信度是指测验结果的可靠性或一致性，亦即多次测验分数的稳定、一致程度。它既包括时间上的一致性，也包括内容和不同评分者之间的一致性。常用的估计信度的方法有重测信度、复本信度、分半信度和评分者信度。

2．效度

心理测验的效度是指测验的有效性或准确性，亦即测验能够测量出其所欲测量的心理特性的程度。效度越高则表示该测验结果所能代表要测量行为的真实度越高，能够达到所要测量的目的。对于一个标准测验来说，效度比信度更为重要。一般将效度分为内容效度、构想效度和实证效度。

（三）心理测验的标准化

1．测验标准化的含义

测验标准化是指测验的编制、实施、记分以及测验分数解释程序的一致性。如果把心理测量定义为应用法则给与人有关的心理结构指派相应的数字，那么标准化就是这些法则的决定因素并使其明确化。没有标准化，测量仅是一种非正式的过程，它随施测者的不同而变化。

2．测验标准化的内容

（1）内容标准化

给所有被试实施相同的一组测题，即给所有被试实施相同内容的刺激（处理），这样对被试的行为或反应才能进行比较。另外要使测量的物理特性保持一致，这就要求在编制测验时，测题的印刷和成批生产的器具能保证物理特性上的一致，而使测验条件保持一致，使测验结果更可靠。

（2）实施标准化

只有对所有的被试都使用相同的测题，并且是在相同的条件下进行测验，他们的分数才能进行比较。标准实施主要包括：

①统一的指导语，指导语有两个方面，一种是对被试的，另一种是对主试的。对被试的指导语应尽量做到清晰，应简单扼要地向被试解释应如何对测题作出反应，如果测题的格式对于被试是生疏的，应举出一个例题。对主试的指导语包含对测验细节的进一步解释，也包含着其他有关事情的交代。如熟悉测验、测验的场所安排、测验材料的分配、计时和记分，还包含假如在测验进行中途出现问题或其他意外事件时应该如何处理的指示。

②统一的施测时间。测验的时限是测验程序中的一个重要方面，一般每一测验都要求被试在一定的时间内完成。大多数人格测验在实施时不受时间限制，但速度测验的目的是测量作业的快慢，所以测验的时间要求相当严格，一般在测验时限内，作业最快的被试也不能把测验全部做完。施测时要注意按指导语要求准确计时。难度测验在理论上不应有时间的限制，但在实际使用时为避免个别被试过分拖延测验时间，仍有一定的时间限制，但一般足以使90%以上的被试能在规定时间内做完全部测验。

（3）客观记分。它意指在两个或两个以上有能力的记分者之间有一致性。不同记分者之间取得完全的一致似乎是最理想的。但实际上对主观题即论文式的测题进行评分时，很难完全一致。一般认为在成对的受过训练的记分者之间平均一致性达到90%以上，就认为记分是客观的。只有保证记分是客观的，才能够把分数的差异归于被试的差异。客观记分可归纳为三个要点：对反应要及时和清楚地记录；应用标准反应表即记分键作为对照加以评分；将被试的反应与标准反应表进行比较。

（4）分数解释标准化

从某个测验中得出的单个分数往往并不能说明什么问题，只有把这个分数与常模进行比较，才能对测验分数进行很好的解释。建立常模以对测验分数进行客观、公正的解释是标准化的又一个重要步骤。常模是指某一标准化样组在某一测验上的平均分数。它的功用在于给测验分数提供比较的标准，从而对测验分数加以解释。为了建立测验的常模，测验编制者应在标准化的条件下，对一具有代表性的大规模样组施行测验。样组的代表性可以通过随机抽样或随机分层抽样和采用大规模样组来达到。这样得到的测验组的平均成绩可作为常模，给分数解释提供参考。根据常模，并结合该测验信度、效度的资料，就能对测验所得的分数作一较合理妥贴的解释，也使测验整个过程更具客观性。

3．标准化测验的优点

与一般测验相比，标准化测验有以下几个优点：

（1）标准化测验具有较高的质量。它的效度、信度都较高，增加了测验的客观性，所得的结果较为真实。

（2）测验经过标准化后，能得到广泛的运用。可使心理学家和其他专业工作者不必把大量的时间花在测验的编制、实施和评价上，而是致力于其他更重要的活动如治疗、指导及对分数进行解释。

（3）使用标准化测验促进了心理学家之间的交流。测验分数体现了有关个体或团体的一些有用信息甚至是科学发现，对其他心理学家或专业工作者来说可能具有参考和研究的价值。

4．提高测验标准化程度的方法

（1）测验编制过程要标准化。在确定测验维度、题目编制、题目分析、测验信度和效度分析等方面严格按规定程序进行。

（2）测验实施过程要标准化。要统一指导语、统一步骤、统一时限，防止噪音和无关人员干扰等。

（3）测验评分和解释要标准化。评分和解释要制定详细、统一的标准，并据此进行严格的评分和解释。

（四）人格测验

1．人格测验的定义

人格测验是以人格为测量对象的测验。它测量的是个性中除能力以外的部分，亦可看作是非能力测验。主要测量性格、情绪、需要、动机、兴趣、态度、焦虑、气质及自我概念等方面的个性心理特征及其相关行为。

由于依据的人格理论不同，所采用的方法也不同，主要有自陈法、投射法、评定法、情境法等。

2．自陈测验

（1）定义

自陈测验又称自陈问卷，是测量人格最常用的方法和形式。自陈量表是依据所测量的人格特征编制客观问题，要求被试根据自己的实际情况或感受去逐一回答，以此衡量个人的性格特征。自陈测验是采用客观测验的形式，使用自陈量表来测量人格。

编制自陈量表的基本假设是只有受测者最了解自己的人格特征。因为个人随时随地都在观察自己的行为，而他人不可能了解自己行为的所有方面。

（2）自陈量表的编制

自陈法多采用客观测验的形式，即测验的编制者预先拟定一系列陈述句或问题，每个陈述句或问题描述一种行为特征。若干个描述行为特征的陈述句或问题共同组成测量一种人格特质的量表。同时，在每一个陈述句或问题之下提供两个或两个以上的选项，供受测者根据自己的实际情况选择。

编制自陈人格量表的第一项任务是确定所要测量的人格特质，并明确给出该特质的操作性定义，然后围绕着该特质选择能够表现该特质的行为情境和反应。

编制自陈量表的具体方法主要有三种：

①合理建构法（逻辑法）、

②因素分析法

③实践标准法（经验法）。

相应地，可分成三种自陈量表：

①内容效度人格问卷

②因素分析人格问卷

③经验效标人格问卷。

（3）自陈量表的特点

①测量工具一般为调查表。

②题目数量多。

③在同一个测验中往往包含几个量表，可同时测量几个特质。

④测验通常采用纸笔形式，因而可以团体施测。

⑤自陈量表的计分规则简单而客观，施测手续比较简便，测量分数容易获得解释。因此一般对测验情境和施测者的要求不像智力测验那样严格。

（4）常用自陈量表

①明尼苏达多相人格测验（MMPI）

a．MMPI是美国明尼苏达大学教授郝兹威与莫金利于20世纪40年代初采用经验法编制的，它共有566个自我报告形式的题目。题目的内容范围很广，包括生理状况、精神状态以及对家庭、婚姻、宗教、政治、法律、社会等问题的态度。MMPI的临床量表有10个，均以所采用的效标组命名，即：疑病、抑郁、癔病、精神病态、男性化—女性化、妄想狂、精神衰弱、精神分裂、轻躁狂和社会内向。其中男性化—女性化和社会内向只能说明人格的趋势，与疾病无关。从这10个量表可得到10个分数，即代表10种人格特质。

b．MMPI设置了四个量表去识别被试是否作假，即：说谎分数、诈病分数、校正分数和疑问分数。

c．MMPI的记分是将原始分数转换为T分数后进行解释的。

d．MMPI是目前应用最广的人格测验，它的各个量表都是根据经验法编制的，较为客观。另外，MMPI在编制时采用正常与异常两组人为样本，因此也可用于正常人的个性评定。MMPI还提供了一个丰富的题目集，可用于编制新量表和各种类型的研究工作。

e．MMPI的缺点和局限在于信度较低，常模不充分，施测时间较长，测验结果不易解释。

②16种人格因素测验（16PF）

a．16种人格因素测验是美国心理学家卡特尔教授编制的。这16种因素是：乐群性、聪慧性、稳定性、恃强性、兴奋性、有恒性、敢为性、敏感性、怀疑性、幻想性、世故性、忧虑性、实验性、独立性、自主性、紧张性。

b．这些人格因素是各自独立的，每一种因素与其他因素的相关度极小。经研究这些因素普遍地存在于年龄及文化背景不同的人群之中，由于这些因素的不同组合，就构成了一个人不同于其他人的独特个性。

c．16PF能根据测验结果推算出许多种可以形容人格类型的次元因素，如：适应与焦虑性、内向与外向性、感情用事与安详机警性、怯懦与果断性。

d．16PF适用于16岁以上的青年和成人，现有5种版本，A、B本为全版本，每本各有187题；C、D本为缩减本，各有106个项目；E本适用于文化水平较低的被试。每一种人格因素由10～13个测题组成的量表来测量。16种因素的测题按序轮流排列，以便于计分，并保持受测者作答时的兴趣。为防止被试勉强作答或不合作，每一测题都备有三个可能的答案，使受测者有折中的选择。为了克服动机效应，尽量采用“中性”的测题，避免含有一般社会所公认的“对”或“错”的题目，而且，被选用的问题中有许多表面上似乎与某人格因素有关，但实际上却与另外一人格因素相关，因此，受测者不易猜测每一测题的用意，从而据实作答。

③爱德华个性偏好量表（EPPS）

a．美国心理学家爱德华于1953年编制的“爱德华个性偏好量表”，是以美国心理学家默里1938年提出的人类15种需要为理论基础编制的。全量表包括225个题目（其中15个重复题目，用以检查反应的一致性），每题包括两个第一人称的陈述句，要求受测者按自己的个性偏好从二者中圈选其一。这15种需求是：成就、秩序、表现、自主、亲和、省察、求助、支配、谦逊、慈善、变异、坚毅、性爱、攻击。

b．全量表的题目平均分配测量这15种需求，成为15个分量表，另有一个稳定性量表施测后每人得到15个分数。根据个人所得的15个分数绘制的剖析图，即可对个人的心理倾向有个概括的了解。EPPS的主要特点是采用强迫选择法来控制社会称许性。所谓社会称许性指的是题目内容受社会舆论赞许和反对的程度。强迫选择法，就是要求受测者在两个或多个具有相同的社会称许性而又测不同特质的题目中做一个选择。

④艾森克人格问卷（EPQ）

a．艾森克人格问卷是英国心理学家艾森克教授编制的，他收集了大量有关人格方面的特征，并通过因素分析归纳出三个维度，从而提出决定人格的三个基本因素：内外倾性、情绪性和心理变态倾向。人们在这三方面的不同倾向和不同表现程度，便构成了不同的人格特征。

b．EPQ目前有成人问卷和青少年问卷两种，适用于16岁以上的受测者。成人问卷包括90个条目，让被试根据自己的情况回答“是”或“否”。然后按E、N、P、L四个量表记分。E、N、P分别代表艾森克人格结构的三个维度，L是后来加进去的一个效度量表。

E：内外倾性。分数高表示人格外向，分数低表示人格内向。

N：情绪性。其两极是情绪稳定和神经过敏。

P：心理变态倾向，又称精神质。并非指精神病，它在所有人身上都存在，只是程度不同，但如果某人在此维度上的分数明显较高，则易发展成行为异常。

L：测量被试的掩饰、假托或自身隐蔽的程度。L与其他量表的功能有联系，但它本身也代表一种稳定的人格功能。

c．艾森克将外倾性和神经质两个维度作了垂直交叉分析，得到4种典型的人格类型：

外向稳定型：善领导，无忧虑，活泼，悠闲，易共鸣，健谈，开朗，善交际；

外向易变型：主动，乐观，冲动，易变，易激动，好斗，不安定，易怒；

内向易变型：文静，不善交际，缄默，悲观，严肃，刻板，焦虑，忧郁；

内向稳定型：镇静，性情平和，可信赖，有节制，平静，深思，谨慎，被动。

3．投射测验

（1）投射测验的简介

①定义：投射测验指测验中所用的刺激多为意义不明确的各种图形、墨迹或数字，让受测者在不受限制的情境下，自由地做出反应，由对反应结果的分析来推断其人格。

投射的意义是指一个人把自己的思想、态度、愿望、情绪等个人特征无意识的投射到外界事物上，通过对外界事物的反应，表达出自己内心的感受。这种方法的机理是精神分析心理学理论中的投射机制。这类测验主要以罗夏墨迹测验、主题统觉测验（简称TAT）、文字联想测验、画人或画树测验为代表。

②投射测验的理论假定

a．人们对外部事物的解释性反应都是有其心理原因的，同时也是可以给予说明和预测的；

b．人们对外部刺激的反应虽然决定于所呈现的刺激的特征，但反应者过去形成的人格特征、他当时的心理状态以及他对未来的期望等心理因素也会渗透在他对刺激的反应过程及其结果之中；

c．因为个人的人格会无意识地渗透在他对刺激情境的解释性反应之中，所以，通过向受测者提供一些意义模糊的刺激情境，让受测者对这种情境做出自己的解释，然后通过分析他解释的内容，就有可能获得对受测者自身的人格特征的认识。

③投射测验的特点

a．测验材料没有明确的结构和确切的意义，这就为受测者提供了针对测验材料进行广阔自由联想的机会和空间；

b．受测者对测验材料的反应不受限制，可以根据自己对测验材料的理解作任何想像式解释，因此受测者对测验材料的解释在很大程度上不是决定于测验材料的性质，而是决定于受测者的人格特征和当时的心理状态；

c．测验的目的具有明显的隐蔽性，受测者事先并不知道施测者对他的反应作何心理学的解释，这就在很大程度上避免了受测者的伪装和防卫，使测验的结果更能反映受测者真实的人格特征；

d．测验结果的解释重在对受测者的人格特征获得整体性的了解，而不是对某个或某些人格特质的关注；

e．测验的内容多为无明确意义的图片，在测验时不受语言文字的限制，所以，被广泛地应用于人格的跨文化研究；

f．相对于自陈量表，投射测验的最大局限是计分上的困难，这使得研究者对测验结果难以进行确定的定量分析。

（2）罗夏克墨迹测验

①基本程序

a．自由联想阶段。罗夏克测验有10张墨迹图，施测时每次出示一张，同时问受测者：“你看这像什么？”或“这使你想到了什么？”并允许受测者转动图片从不同角度去看，然后让受测者按照自己所想像的内容作自由描述，以此为自由联想阶段，没有时间限制。主试者要逐字逐句详细地记下受测者的话，并记下每张图片从出现到第一次反应所需的时间，各反应之间较长停留的时间、每张图片反应所需的总时间、受测者的情绪表现、附带的动作及其他重要行为等。

b．询问阶段，主试再将各图片逐一交于受测者，并询问受测者是根据墨迹的哪一部分做出反应的，以及引起反应的因素是什么，对其回答也要做详细记录。受测者在此期间可能进一步对其先前的反应加以补充或澄清。

c．类比阶段。当利用经过提问获得的资料仍不能搞清记号化的问题时，可在类比阶段作进一步的商讨。

d．极限阶段。在这一阶段，主试对受测者的反应产生疑问时，进行进一步确认。

②对墨迹测验的评价

墨迹测验的主要应用是在精神医学的临床诊断方面，由于该测验不受语言文字的限制，可以广泛用于人格发展和跨文化研究。对该测验的主要批评是记分困难，未受过专门训练的人不易掌握，而且对结果的解释带有主观性，测验本身的效度与测验者解释分数的效度难以分清。

（3）主题统觉测验（TAT）

a．主题统觉测验是由默瑞与莫根于1938年在美国哈佛大学创制的，其理论基础是默里的“需要—压力”理论。全套测验包括30张内容模糊的黑白图片，另加一张空白卡片，图片内容多为人物，兼有部分景物。就刺激情景而言，TAT较墨迹测验有组织有意义。但是TAT对受测者的反应不加限制，任其自由凭想像去编造故事，因此其结果也属投射性质。

b．主题统觉测验的基本假设：

个人面对图画情景所编造的故事与其生活经验有密切的关系，受测者在编造故事时，常是不自觉地把隐藏在内心的冲突和欲望等穿插在故事的情节中，借故事中人物的行为宣泄出来，亦即把个人的心理历程投射在故事中。主试者如能对受测者编的故事善加分析，便可了解个人心理的需求。

c．TAT的评分分两部分：一是在每一种需要变量和情绪变量上的分数，评分规则是根据每一种需要或情绪的强度在1～5之间记分；二是在每一种压力变量上的分数，评分规则是根据每一种压力的强度在1～5之间记分。最后在每一变量上都得到两个分数，一是总体平均分（AV），二是分数的分布（R）。

d．被评定的主要的需要变量、情绪变量有：恭顺、成就、攻击、自责、关怀、顺从、性、受保护、进取、归属、自主、矛盾、情绪变化、沮丧、焦虑、怀疑等；被评定的主要的压力变量有：归属、攻击、支配、关怀、拒绝、身体危险等。而评定这些变量的分数的依据是受测者在所编的故事中对主人公的行为、需要、动机、情感和主人公所处的环境的描述，以及整个故事所反映出的主题的性质。

e．解释TAT分数有两个基本假设：

第一个假设是主人公的归因（需要、情绪状态和情感）代表着受测者人格的倾向性。这种倾向性是受测者的过去和他所预期的将来，即：

他已做过的事；

他想去做的事；

他未意识到的一些基本的人格力量；

他当时所体验的情绪和情感；

他对将来行为的预测。

第二个假设是受测者所统觉的环境压力也代表着过去、现在和将来，即：

他真正遇到过的情境；

他出于愿望或恐惧而想像到的情境；

他正在统觉的情境；

他期望遇到的或害怕遇到的情境。

主试应当根据上述两个基本假设，参照手册中对各种需要、情绪及压力变量的基本描述去解释受测者投射在所编的故事中的人格状态和特征。同时要特别在需要、情绪的力量和压力的力量之间进行强度上的比较，并分析它们之间的相互作用所导致的结果。

（4）对投射测验的评价

投射测验的优点：可以对人格作综合的、完整的探讨，对受测者的内心生活作深层的探索，并做出动态解释；测验本身不显示任何目的，受测者不至于有意防范而作虚假的反应。

投射测验的缺点：评分缺乏客观标准，难以量化；缺少充分的常模资料，测验结果不易解释；信度和效度不易建立；原理复杂深奥，非经专门训练者不宜使用；与其他测验相比，被试的反应更易受实施情景的影响。

4．情景测验

情景测验法属于行为观察法的一种，是将被试置于特定情境下，由主试观察被试行为反应，从而判定人格的方法。该方法常用于教育及军事等领域或特殊人才的选拔中。

（1）品格教育测验（简称CEI）采用的情境是学龄儿童生活或学习中所熟悉的实际生活情境，用来测量诸如诚实、自我控制及利他主义等品格或行为的特点。

（2）情景压力测验主要应用于军事或领导人才的选拔上。通常采用设计好的情境，使被试产生情绪上的压力，然后观察被试如何应付情境，从而了解其人格特征。

（3）情景测验的评价

①情景测验的优点：情景测验比自陈法和投射法更自然、更接近真实生活。而且，多数情况下，受测者不知道测量的真实目的，因而在实际反应中不大可能作假。

②情景法的弱点是：施测困难，费时费钱，一次只能测一人或少量被试；需要受过训练的主试来观察和评定行为，并要综合地处理测验中所得的各种资料，因而易受各种误差影响，不够可靠和有效；受试者的行为，常因所在情境的不同而反应互异。

（五）智力测验

1．智力测验的定义及目的

（1）智力测验是一种测量的工具，它要让被试表现（显示）智力水平的行为（样组），然后对表现出的这些行为做出数量化的描述，以此最后决定被试的智力水平。

（2）智力测验的目的是在一定的条件下，使用特定的标准化的测验量表对被试施加刺激,从被试的一定反应中测量其智力的高低。智力测验能很好地预测学术成就，也能预测职业上的成功。分为：个体智力测验，如比奈—西蒙智力量表、斯坦福—比奈智力量表、韦克斯勒智力量表等；团体智力测验，例如，陆军测验、瑞文推理测验、认知能力测验等。

2．个体智力测验

个体智力测验是多采用开放式问题，对个体进行施测，并由施测者评分以测量个体智力水平的测验。个体智力测验多用于诊断及弥补工作。个体测验标准化样本一般只用几千名精心挑选的被试。

（1）比奈量表

①比奈—西蒙量表

1905年量表，这是比奈和西蒙出于诊断异常儿童智力的需要，于1905年编制而成的世界上第一个智力量表。它包括30道测验项目，种类繁多，可以测量智力的多方面表现，以通过多少项目作为区分智力的标准，并且显现出年龄量表的雏形，比奈和西蒙在此已指明不同年龄的儿童所能通过的项目。

1908年量表，这是第一个年龄量表，比奈和西蒙在此对1905年量表作了如下修订：测验项目增至59个；测验项目以年龄分组（3～13岁，每岁一组）；以智力年龄来评估个体智力，即儿童最后通过哪个年龄组的项目，说明他具有这一年龄的智力水平，而不论他的实际年龄是多少。

1911年量表，比奈在1908年量表的基础之上对其做最后一次修订，除了改变一些项目内容及其顺序之外，还将其适用范围扩大，增设了一个成人题目组。

②斯坦福—比奈量表的发展

1916年量表，推孟在1916年的斯坦福—比奈量表中，对于比—西量表中的项目或者保留，或者修改，或者删除，并在此基础上又增设了39个新项目。该量表首次引入比率智商的概念，开始以IQ作为个体智力水平的指标。并且量表对每个项目施测规定了详细的指导语和记分标准。

1937年量表，1937年推孟对斯坦福—比奈量表作了第一次修订，修订后的斯坦福—比奈量表由L型和M型两个等值量表构成，该量表适用年龄由1916年的3～13岁扩展到1．5～18岁，并在修订时选取了更大的代表性样本以获得信度、效度资料，不过其样本仍局限于白人，且偏重于社会经济地位较高家庭的儿童，因而仍未能全面反映美国当时人口的状况。

1960年量表，该量表汇集了1937年量表的L型和M型中最佳项目而成LM型单一量表，适用于2岁到成人。该量表的重大改变在于舍弃了比率智商，引入了离差智商概念，以平均数为100，标准差为16的离差智商作为智力评估指标。

1972年量表，此量表保持1960年量表的测验内容不变，重新修订常模，所选常模团体包括了美国各地区、各社会阶层、各种经济状况、各民族的2100名儿童，取样代表性有了很大提高。

③斯坦福—比奈量表的信度与效度

斯坦福—比奈量表对年龄大的被试比年龄小的被试信度高，对于智商低的被试比智商高的被试信度高，计算L型和M型量表的复本信度，在2.5～5.5岁为0.83～0.91，在6～13岁为0.91～0.97在14～18岁为0.95～0.98。再测信度与复本信度的研究结果大体一致，总体来讲，斯坦福—比奈量表是一个信度高的测验。

斯坦福—比奈量表的特点：

从内容效度上看，斯坦福—比奈量表中所包含的项目涉及多方面的内容，这些内容又被公认为在智力范畴之内。从效标关联效度上看，由斯坦福—比奈量表而得的智商分数与学业成绩、教师评定、受教育年限等外在效标分数间存在普遍正相关，效标关联效度系数大多介于0.4～0.75之间。从结构效度上讲，斯坦福—比奈量表的理论构想主要基于以下两方面：智力随年龄而发展，其成长曲线特征为先快后慢，智力结构中存在一般因素G，它渗透于每一智力行为之中，是智力的核心，斯坦福—比奈量表对于其理论构想的测量有效性已得到了一定程度的证明。

④中国比奈测验

19世纪20年代，我国心理学家陆志伟和吴天敏已开展了斯坦福—比奈量表的中国版修订工作。1982年完成《中国比奈测验》。该测验共有51道题，从易到难排列，每题代表4个月的心理年龄，这样从2～18岁，每个年龄段有3道题，智力评定指标采用离差智商。中国比奈测验必须个别施测，并且要求主试必须受过专门训练，对量表相当熟悉且有一定经验，能够严格按照测验手册中的指导语进行施测。

（2）韦克斯勒量表

①韦氏成人智力量表的产生与发展

韦克斯勒—贝尔韦智力量表Ⅰ型是美国心理学家韦克斯勒通过临床经验，认为斯坦福—比奈量表的内容和题目是针对儿童设置的。过分强调速度而又缺乏难度，对成人而言，表面效度很低，无法引起成人的兴趣，而且斯坦福—比奈量表的常模资料来自儿童，智龄的概念也不适用于成人。因此在1939年发表了W-BⅠ。

W-BⅠ是第一个成人智力量表，它的内容是以特别适合成年人使用的眼光来选择的，并用一系列不同的子测验的形式来编制整个测验，每个子测验内的题目皆由易到难顺序排列。之后又于1949年增加了Ⅱ型（W-BⅡ）。

②韦氏成人智力量表修订版

1955年韦克斯勒对W-B进行了修订和重新标准化，编制了韦氏成人智力量表（WAIS），1981年又出版了再次标准化后的WAIS，即为韦氏成人智力量表修订版（WAIS-R）。其每个分测验独立记分，再转化为平均数为10，标准差为3的标准分数。六个言语分测验的标准分数相加可得言语量表分，五个操作分测验的标准分数相加可得操作量表分，所有分测验的标准分数相加可得全量表总分。最后，将这些量表分数转换成平均数为100，标准差为15的离差智商分数，便可得到言语智商、操作智商和总智商。WAIS-R的常模团体由1880人组成，男女各半，分配在16～17，18～19，20～24，25～34，35～44，45～54，55～64，65～69，70～74岁9个年龄组。

③韦氏成人智力量表的信度和效度

全量表的信度在各年龄组上的分布为0.96～0.98，言语量表的信度分布为0.95～0.97，操作量表的信度分布为0.88～0.94，分测验的信度相对低一些，但11个分测验在各年龄组上的89个信度系数中也只有5个低于0.70，最高达到0.96。

从结构效度上讲，韦氏量表的11个分测验是从各个方面来测量智力，对其因素分析结果表明：在测验分数的总变异中，有50%的变异来自智力一般因素，在WAIS-R中，各分测验之间和分量表之间存在着普遍的、显著的正相关，也表明智力G因素渗透于智力行为的各个方面。从内容效度上讲，韦氏量表设计的11个分测验，均取自于前人，它们在早期智力量表中皆被成功地使用过，并在临床实践中显示了它们的价值，被公认为智力行为的主要范畴。从效标关联效度上讲，在异质性较高的团体中，韦氏量表与斯坦福—比奈量表的相关在0．80左右，与各种教育与职业效标间也有相关。

④韦氏成人智力量表中国修订版（WAIS-RC）

WAIS-RC的主要内容有：言语量表，包括常识测验，理解测验，算术测验，背数测验，词汇测验；操作量表，包括数字符号测验，填图测验，积木图案测验，图片排列测验，拼图测验。

WAIS-RC的信度与效度：WAIS-RC各分测验的分半信度在不同年龄组的分布为0．30～0．85之间，各分量表和全量表的再测信度在0．82～0．89之间。在高考成绩上差异显著的被试，在WAIS-RC测得的智商上同样表现出显著差异，说明WAIS-RC具有一定的效度。

⑤韦氏儿童智力量表

产生与发展：韦氏儿童智力量表（WISC）是韦氏成人智力量表向较低年龄水平的扩展，是1949年由韦克斯勒在W-BⅠ的基础上修订而成的，并于1974年修订和重新标准化后完成了韦氏儿童智力量表修订版（WISC-R）。WISC-R共包括12个分测验，分别构成言语量表和操作量表，其中背数和迷津两个分测验是备用测验，可作为某一同类测验的替换或补充测验。WISC-R适用于6～16岁的儿童，每四个月为一个年龄组，分别建立了常模表，可直接由原始分查得言语智商、操作智商和总智商。

信度和效度：WISC-R中各分测验的分半信度分布在0.70～0.86之间，再测信度在0.65～0.88之间；各分量表和全量表的分半信度在0.90～0.96之间，再测信度在0.90～0.95之间。WISC-R还获得了来自效标关联效度和结构效度的效度证据。

适用范围：韦氏儿童智力量表中国修订本只适用于中等以上城市的儿童。

⑥韦氏幼儿智力量表

韦氏幼儿智力量表（WPPSI）于1967年出版，适用于4～6岁半的儿童。包括11个分测验，其中3个分测验（句子复述、动物房、几何图案）是为了适应幼儿特点而新编的，另外8个（常识、理解、词汇、算术、类同、填图、迷津、积木图案）则与WISC相同。WPPSI亦给出言语智商、操作智商和总智商，它们的分半信度在0.84～0.94之间，再测信度在0.86～0.92之间，同时有证据表明WPPSI的各分量表及全量表的智商与斯坦福—比奈量表的智商的相关系数在0.56～0.76之间。

⑦对韦氏智力量表的评价

韦氏从实践出发所编制的WSS系列，不仅受到临床心理学家和教育家的关注，也广泛应用于其他专业，成为当今最通用的个体智力测验。它与SB（西蒙—比奈的简称）量表相比，具有以下一些优点；

a．韦氏智力量表具有复杂的结构，不但有言语分测验，还有操作分测验，可同时提供三个智商分数和多个分测验分数，能较好地反映一个人智力的全貌和测量各种智力因素。整个韦氏智力量表的三套量表互相衔接，适用的范围可从幼儿直至成年，是一套比较完整的智力量表。

b．韦氏智力量表用离差智商代替比率智商，既克服了计算成人智商的困难，又解决了在智商变异上长期困扰人们的问题。当然，离差智商的概念并不是韦克斯勒发明的，如奥蒂斯测验、宾特纳一般能力测验中也曾用过离差智商，但自韦克斯勒之后，离差智商这一概念才在智力测验中广为应用。

c．韦氏智力量表临床应用多，积累了大量的资料，已成为临床测验中的重要工具。除可测量智力外，还可研究人格，而且可以作为神经心理学的主要测量量表。韦克斯勒提出，如数字广度、数字符号、木块图案等分测验的成绩随年龄增高而降低，这些测验与另一类不受年龄影响的分测验（词汇、知识和图片排列等）成绩的比值，即“退化指数”，可作为脑功能退化的商数。

韦氏智力量表的主要缺点是：

a．韦氏智力量表的三个独立量表的衔接欠佳，表现在同一被试者用两个相邻量表如WAIS和WISC测验时，其智商水平在WAIS的系统性高于WISC。

b．测验的起点偏难，有的分测验（如相似性测验）方法对低智力者难以说明，故不便测量低智力者。

c．有的分测验项目过多（如词汇测验），增加测验时间；有的相反，项目过少（如物体拼凑测验），难以调整项目难度，且不便作分半相关信度检验。

为了克服测验程序复杂费时这一缺点，韦氏三个智力量表均有简式版本，如二合一、三合一至五合一（或六合一）简式。Sattle（1982）认为使用词汇和木块图案来估计智商为最理想的二合一简式组合，而四合一的简式组合通常选用词汇、算术、图片排列和木块图案四个分测验。龚耀先（1983）计算了WAIS-RC各分测验与言语量表、操作量表和全量表得分的相关，结果言语部分以知识、相似性和词汇分测验为代表测验，操作部分以图画填充、木块图案和图片排列三个分测验为代表测验，这六个分测验可组合成各种形式的二合一至六合一简式。但使用简式量表要慎重，因其效度和信度比全量表低。

尽管韦氏智力量表有某些不足，到目前为止还是被广泛用作智力诊断的工具。至1981年，有关韦氏智力量表的资料已在各种出版物上刊登了三千多次，足见其影响之大。

3．团体智力测验

团体测验是采用多项选择，客观的计算机评分，对团体施测以测量智力水平的测验。团体测验标准化样本极大。

（1）陆军测验

第一次世界大战期间，美国心理学会主席耶克斯和桑代克、推孟等许多著名心理学家提出用测验招募和选拔士兵。但面对短时间内动员数百万兵员的任务，采用个别施测的智力测验显然无法完成任务。于是，在推孟的学生奥蒂斯编制的团体智力测验的基础之上产生了陆军甲种测验，后来又针对不识英文或有阅读障碍的人编制出陆军乙种测验。

①陆军甲种测验由8个分测验组成，包括指使测验（照令行事测验）、算术测验、常识测验、异同测验、字句重组测验、填数测验、类比推理测验和理解测验。陆军乙种测验属于非文字测验，由7个分测验组成，包括迷津、立方体分析、补足数列、译码、数字校对、图画补缺和几何图形分析。

②陆军甲种测验的效度资料来自它与军官评定的相关（0．50～0．70），与斯坦福—比奈量表的相关（0．80～0．90），与教师评定的相关（0．67～0．82），以及与学业成绩的相关（0．50～0．60）。陆军乙种测验与甲种测验的相关达到0．80。

（2）瑞文推理测验

①瑞文推理测验的产生与发展

瑞文标准推理测验，由瑞文于1938年编制出版，适用于5.5岁以上智力发展正常的人，属于中等水平的瑞文推理测验；瑞文彩图推理测验，是瑞文于1947年编制，适用于幼儿和智力低于平均水平的人，属于瑞文推理测验的3个水平中最低水平的测验；瑞文高级推理测验，初编于1941年，经1947年、1962年两次修订成为现在的形式，适用于智力高于平均水平的人，是最高水平的瑞文推理测验。

以上3种水平的瑞文推理测验均由两种题目形式组成，一种是从一个完整图形中挖掉一块，另一种是在一个图形矩阵中缺少一个图形，要求被试从提供的几个备选答案中，选择出一个能够完成图形或符合一定结构排列规律的图案。

②瑞文推理测验的假设

源于斯皮尔曼的智力一般因素理论，瑞文将智力G因素划分为两种相互独立的能力，一种称再生性能力，表明个体经过教育之后达到的水平；一种称推断性能力，表明个体不受教育影响的理性判断能力。瑞文认为，词汇测验是对再生性能力的最有效测量，而非言语的图形推理测验则是对推断性能力的最佳测量，这就是瑞文推理测验的来源。

③瑞文测验的优点

测验对象不受文化、种族与语言等条件的限制，适用的年龄范围也很宽，从5岁半直到老年，而且不排除一些生理缺陷者。测验可个别进行，也可团体进行，使用方便，省时省力，结果以百分等级常模解释，直观易懂。

④瑞文标准推理测验中国修订本

1985年，我国张厚粲教授开始主持瑞文标准推理测验中国城市版的修订工作。修订过程中基本保留了原测验的项目形式及指导语，测验共由60道题目组成，分为A、B、C、D、E共5个系列，每一系列包含12个题目。项目系列由易至难排列，每一系列内容的项目亦由易至难排列。每一项目均为“1”、“0”计分，最后根据总分查得常模表中相应年龄组的百分等级。

测验常模团体根据人口普查资料取自全国大、中、小城市，取样时注意到性别、文化、职业等人口比例分配，从5岁半到16岁半每半岁为一年龄组，20岁以上每10岁为一年龄组，17岁至19岁为一年龄组，70岁以上为一年龄组。分半信度为0.95，再测信度为0.79～0.82之间。它与WISC-R的中国修订本的各分量表及全量表的相关系数在0.54～0.71之间，与高考总分的相关系数为0.45，这些为其效度提供了支持。

（3）认知能力测验

认知能力测验由桑代克等美国心理学家于1968～1972年间编制成功，共有四个部分：

①初级型：适用于小学低年级儿童，使用图片资料和口头指导语，包括口头、词汇、关系概念、多重智力和数量概念。

②文字测验：适用于小学四年级以上，由词汇、句子填充、词汇分类、词语类推测验组成。

③数量测验：适用于小学四年级以上，由数的大小比较，数列补充和建立关系等式测验组成。

④非文字测验：适用于小学四年级以上，由图形分类、图形推理和图形综合测验组成。

所有测验的题目由易至难排列，每个测验均有几套不同水平的题目，以便对智力成熟水平不同的人提供适当难度的测验，结果以离差智商、百分等级、标准九分数等解释。认知能力测验具有相当详细的信度和效度资料，表明其各部分测验的再测信度系数在0．72～0．95之间；同时它对学业成就、工作成就、职业类型等有相当的预测能力。

4．智力测验的评价

（1）优点

智力测验通过编制十分严格的标准化量表所给出的一群测题（刺激）引起人们认知方面行为的反应，从而使得人们能根据反应的程度来估计其智力水平，是评价一个人的智力水平的有效方法。与学业考试相比较，与教师的经验性评定相比较，智力测验在评价学生智力水平上有其独特的长处。

①就评价内容来讲，智力测验中严格选定的测题比较有利于考察被试的各种能力，而不像学业考试侧重于了解某一阶段性知识的掌握程度——虽然一个人的智力和知识之间并无截然分别的界线。

②就被评价者的范围来讲，学业考试往往局限于一个班级或年级作比较，而智力测验则把一个人的分数与一个更广大的地区（例如上海市区）内的同龄人进行比较。

③对智力快速而有效的评定。一个好的智力测验量表是评定学生智力发展水平的快速和有效的工具，花费一两个小时所做出的评定往往与教师经过一两年甚至更长时间观察所作的评定有较高的相关。

（2）缺点

①智力测验主要进行了量的分析，它的结果一般是用智商报告的，一般智商分数只提供了量的数据，只有数量说明，没有质的分析。

②智力测验只测了当时的智力，没有考虑发展的速度和趋势。

③智力测验只是部分地反映了一个人的智力水平。

④智力测验还有其他一些不足之处，如智力测验的正确答案一般是事先确定的，因而它只考虑到收敛性的抽象概括、推理思维能力，而对于创造性思维，尤其是发散性思维方面考虑不够。另外它的测题不可避免受到文化知识的影响等等。

（3）斯腾伯格对传统智商测验的批评

①测验的实际情景性问题。他认为传统智商测验在内容上是不全面的，它未能把构成智力本质的一个重要方面，即社会智力涵盖在内。

②对于先前学习知识的要求。斯腾伯格认为传统智商测验一般未能很好地控制知识和经验因素的作用，因而其学业成就色彩过重。

③速度问题。斯腾伯格对渗透于当今社会的“快即聪明”的说法提出异议。传统智商测验一般都是限时测验，他认为这实际上是受世俗偏见之累。

④测验的焦虑。在测验过程中无法排除不同被试的焦虑影响的差异。

⑤关于测验依据的智力理论。智力测验应该依据一种在实际中被证明有效的关于智力本质的理论，然而至今为止，对于智力的本质仍没有一致的看法。

（六）常用临床心理测验

临床上常用的心理测验包括：

1．韦克斯勒智力量表

2．明尼苏达多项人格调查表

3．艾森克人格问卷

4．症状自评量表

5．抑郁自评量表

6．焦虑自评量表。

（七）心理测验的合理使用策略

心理测验是从事心理学与教育学研究的一种重要方法，也是解决实际应用问题的一种重要的辅助工具，但是，目前的心理与教育测验的科学性还不够高，有待于在使用中进一步改进和完善。

五、心理统计

心理统计是专门研究如何运用统计学原理和方法，搜集、整理、分析心理与教育科学研究中获得的随机性数据资料，并根据这些数据资料传递的信息进行科学推论，找出心理与教育活动规律的一门学科。

（一）描述统计

描述统计主要研究如何整理心理与教育科学实验或调查得来的大量数据，描述一组数据的全貌，表达一件事物的性质。

具体内容包括：

1．数据如何分组，如何使用各种统计图表描述一组数据的分布情况。

2．怎样计算一组数据的特征值，简缩数据，进一步描述一组数据的全貌。

3．表示一事物两种或两种以上属性间相互关系的描述及各种相关系数的计算及应用条件，描述数据分布特征的峰度及偏度系数的计算方法等等。

（二）推论统计

推论统计主要研究如何通过局部数据所提供的信息，推论总体的情形。具体内容大致包括以下几个方面：

1．如何对假设进行检验，即各种各样的假设检验，包括大样本检验方法（Z检验），小样本检验方法（t检验），各种计数资料的检验方法（百分数检验,X2检验等），变异数分析的方法（F检验），回归分析方法等等。

2．总体参数特征值的估计方法，总体参数的估计方法。

3．各种非参数的统计方法等等。

六、研究中的道德和伦理问题

处于道德和伦理的考虑，心理学研究需要遵循以下一些原则：

1．知情同意

2．随时都可自由退出实验

3．询问执行任务的情况

4．保护被试不受到伤害、保密。

第2章 心理学的研究方法

第2章　心理学的研究方法