第三节 人格测量
特质既不是可见物体,也不是具体动作,而是个人的某些特性,因而,摆在研究者面前的中心问题是如何测量它们。
首先,他们要明确自己打算测量的是什么。早期的人格研究者选择少量直觉上非常明显的特质,比如内向、支配性和自足。但不久,他们就放开眼界,将许多其他东西拿进来一并加以测量,从而使整个领域很快变成一团乱麻。
因为这里有着太多的可能性。工作勤奋的奥尔波特和一位同事曾数过字典中专指人类不同行为或品质的词条,总数竟达1.8万之多。并非所有的词条都指特质:有些是观察者对他人的反应,而不是那人的特质(“令人敬佩”“讨厌”等);有些只指一时的状态,而不是长期的特质(“局促不安”“心烦意乱”等);有些只是比喻(“活灵活现”“多产的”等),但还是有4000—5000个词条是表示特质的。经过近70年的研究,研究人员认为以上词条中的很大一部分并没有价值,并将它们剔除了,但发表于2001年的一份相对简明的评论性文章,还是列出了41个主题,它们仅是有意义的人格特质或人格表现中的“一部分”,其中包括:
延迟满足的能力、加工社会信息的能力、进攻性、亲和性、行为抑制、粗心大意、强制行为、从众、严谨性、犯罪行为、好奇心、注意力分散、酒后驾驶、表达能力、外向、恐惧、冲动性、勤奋、易激怒、工作满足感、领导能力、情绪化、自恋、神经质、开放性、政治态度、宗教态度、躁动、自信、自我控制、自我管理、害羞、社交能力、社会潜能、社会责任、虐待配偶、服从性、滥用药物、感觉被他人虐待或欺骗的倾向、发脾气的倾向、冒险或避险的倾向。
在奥尔波特的清单中,有几百个词条已通过各种方法被探索,这些方法从利用主观印象到在实验室进行实验,从进行精神分析到使用行为数据不等。主要的方法如下所示:
个人材料和史料:在信件、回忆录、自传、日记等材料中,存在大量关于受试者人格的信息,当然也有错误信息,因为写给他人阅读的自我描述所表现的,肯定是经过伪装的自我,而非赤裸裸的现实。(佩皮斯的日记里含有大量放荡、淫秽的段落和无耻的想法,他是写给自己看的,而且是用密码写成的。)那些著名的人格分析,都是基于个人材料的,但口味和理论却在每一代都有所不同,同样的原始资料可能产生作者的不同形象。基于这些原始资料的人格分析有时是非常优秀的文学作品,但鲜有符合科学标准的。
面谈:这也许是最常用的人格评估方法,但也是效率最低的一种。一些就业面试的面试官、大学入学考试的考官和精神治疗医师可以通过与受试者的谈话得出大量有关他的信息,但另一些就未必可以。研究证明,即使是几名有经验的面试官,对同一个人也可能给出完全不同的评价。另外,面试虽可得出描述和解释,但并不是特质的定量性测量。面试比较适合辨别一个人是否有明显的精神或情绪障碍。对于正常人来说,它的最大用处是被当作个人资料、态度、回忆及其他细节的信息源,可阐明以其他方法收集的关于此人的更客观的数据。
由观察者评定:研究者经常请某人的朋友或熟人来评定他或她的若干具体特质。为求得准确结果,研究者会让接受询问者在量表上评定每个特质。量表从0—5或0—10不等——基本上是托马修斯在1692年提到的方法。但该方法仍有许多问题:评定者各有自己的风格(有的避免极端,有的喜欢走极端),受试者在不同时间对同一个问题的回答不同,评定还受到“光环效应”的影响(在某种特质上得分高的受试者,在其他特质上也倾向得高分)。
那么,总的说来,大家认为,定级的办法既不可靠,也非有效(所谓可靠,即每次测试均得出相同结果;所谓有效,即测出的正好就是要测试的东西)。但在某些情况下,评定法却是有效且可靠的。著名特质心理学研究者雷蒙德·卡特尔就据此进行研究。他大多采用评定者在多种情况下对受试者长期(可能的话,以一年为限)观察所得出的数据,且一次只采集一种特质的得分,以避免光环效应。这个前提大大改善了可靠性和有效性,但又使整个方法极为昂贵,也极费时间,且只能在人口相对固定、彼此能常见面的机构中进行。
问卷法:目前最通用的人格评估工具。如我们所见,这种方法扩展得很快,超出了简单自我评估的范围,成为准客观的技巧,比如,提供现实生活情形,征询受试者在这些情境中最可能的行为方式。其他的早期测试继续关注受试者的态度和感觉,而不关注可能的行为,不过,措辞的方式使受试者难以像在“个人数据清单”中那样美化自我形象。大多数问卷要求在“是/不是”或“正确/错误”中作出选择,但也有部分问题包含“不知道”之类的中间答案。
心理学家斯塔克·哈撒韦和精神病学家J.C.麦金利均为明尼苏达大学教授,20世纪30年代两人合作设计出著名的明尼苏达多项人格调查表(Minnesota Multiphasic Personality Inventory, MMPI)即包含中间答案。该调查表中有550句话,其中包括:
大部分时间里我是快乐的。
我喜欢社交性的聚会,只是因为想与人相处。
显然,我缺乏自信心。
我认为自己口碑不好。
受试者针对每个问题回答“是”“不是”或“?”(不确定)。这些问题被归入十个量表,可测定疑病症、抑郁症、癔症、精神病态、男性化-女性化、偏执狂、精神衰弱、精神分裂症、轻躁狂、社会内向。这些名字给人一种印象,即MMPI主要关心的是精神疾病;它的确能检测出精神疾病,但同样也能检测出正常的人格。比如,那些对“大部分时间里我是快乐的”和同一个量表里的大部分其他问题均回答“不是”的人,可被认为是精明、心存戒备和容易烦恼的人。那些对“我喜欢社交性的聚会,只是因为想与人相处”和相关问题回答“是”的人,可被评定为善于社交、引人注目和有雄心者,而那些回答“不是”的人则被认为是谦逊、害羞和不爱出风头的人。
这些解释不是以直觉或常识为基础,而是建立在经验的证据之上。在设计MMPI时,哈撒韦和麦金利将一大批问题拿到因神经症或心理疾病住院的人身上测试,再用同样的问题向来探病的正常人提问,然后将可以区分两类人群的问题保留下来,用来组成MMPI。比如,面对一些问题,抑郁者和不抑郁者给出的答案不同,MMPI中的抑郁量表即由这些问题组成。
尽管在超过半个世纪的时间里,MMPI是使用最广泛的人格问卷,但它也有自己的局限和错误。比如,问卷非常冗长。再比如,许多受试者认为,其中许多项目直露得令人尴尬,如果回答得诚实,就给人不安的感觉(如“坏字眼,通常是可怕的字眼,总是出现在我的脑海里,且挥之不去”“我受到同一性别者的强烈吸引”等)。另外,其他项目明显是针对病理的,正常人在受试时会觉得可笑或觉得受辱。前一阵子,幽默专家阿特·布赫瓦尔德嘲笑MMPI问卷,认为它应该再加上一些问题,如:
领带过宽是有病的征兆。
我年轻时,常喜欢嘲弄蔬菜。
我使用过多的皮鞋光亮剂。
1949年,一组人格心理学家得到洛克菲勒基金会的一笔款项,计划在加州大学伯克利分校建立一个新的研究机构——人格评估与研究学院。它最初的宗旨是研究出一种更好的人格评估方法。在过去40年中,它的确设计了大量的研究方法和新的心理测试方法,其中最知名、使用最广泛且至今使用不衰的就是加州心理测验(California Psychological Inventory, CPI)。这个问卷完成于该组织成立后的头两年。
CPI是该学院研究员、伯克利教授哈里森·高夫博士的研究成果,他一直致力于使用适合正常人的材料去改善MMPI。他收集了1000个问题作为原始材料,其中部分来自MMPI,其余的由他和同事们共同编写而成。在助手和同事的帮助下,他开始对这些项目进行测试,受试者起初是80名研究生,接着是医学院的80名高年级学生。在接下来的几年中,共有1.3万人接受了这项测试,其中有男有女,且年龄不同,社会经济地位不同。为评估这些项目的有效性,或评估这些问题所引出答案的有效性,高夫和他的同事们让受试者的朋友们为受试者作评定,然后以此为样本,将评定结果与受试者自己的答案进行对比,再剔除一些不可信的东西。
最后的CPI定稿包括480项(1987年版中有462项),比如:
人们常常对我期望过多。
我连坐下来放松一下都非常难。
我喜欢聚会,喜欢社交活动。
受试者根据每句话回答“是”或“不是”,这些答案可得出支配性、自我接纳、自我控制、共情等15个人格特质的分数。每个量表,不管是销售情况、其他语种的翻译情况(36种语言,包括阿拉伯语、汉语、罗马尼亚语和乌尔都语),还是在超过2000个词条的文献目录中,在评估专家的重要性评估中,都名列前茅,尽管它问世已有几十年之久。
其他许多人格测试所提供的答案远比MMPI或CPI广泛,下面举出3个例子:
1.大多数警察待人真的十分友善。(圈出表示你同意或不同意程度的数字。)
2.坠入情网的麻烦远大于它的价值。(在最适合你感觉的地方做记号。)
3.我对别人的愤怒一般是:(在最能描述你的地方做记号。)
与”是-否“式反馈相比,用上述反馈标准能获得有关态度与感觉的更精确的测量方法。
在过去的许多年里,心理学家们设计出成百套人格问卷,并由研究机构和商业出版机构出版,其中一些的确代表着优异的科学实践,另一些却不是,但在商业上都很成功。例如,CPI的销售数字——其中包括指南书、可重复使用的测试册子、答题卡等其他项目——尽管仍处于保密状态,但估计相当惊人。
投射测验:从20世纪30年代早期开始,越来越多的心理学家开始接受精神分析理论,认为无意识过程是人格的主要决定因素,与戈登·奥尔波特一样,他们找出许多检测方法,用以测量这些过程及由此产生的特质。最可行的办法是给受试者提供一些模棱两可的刺激——模糊或暗示性的图形或图画——再请他或她来描述它们。一般来说,他们的回答往往能揭示他们的部分或全部无意识幻想、恐惧、期望和动机。
这些测试中最有名的是多年前——约1912年至1922年间——由瑞士精神病学家赫尔曼·罗夏设计的。他创造出若干墨迹图案,请病人说出每个图案看起来像什么。经过多年实验,他把这种测试的内容减少至10种墨迹图案,有黑白的,有彩色的。
进行罗夏测试时,测试者往往将一张卡片出示给受试者,再问他该图案可能是什么或让人想起什么,并将回答写下来。所有的卡片展示完毕后,测试者给答卷评分。打分需要仔细培训,还要查看手册。评分的依据是:受试者是对整个墨迹还是只对部分墨迹作出反应?墨迹的哪一部分受到重视?回答是针对墨迹呢还是其背景?图17是几个与此类测试相似的图案(原罗夏图案不允许复制),还有对典型反应所作出的解释。
图17 罗夏型墨迹与典型解释
20世纪30年代,罗夏测试法在美国的心理学家中极受欢迎,并得到广泛使用。此后几十年中,它一直是临床心理学博士论文中使用最多的论题,研究论文数以千计,可最终的结论总是含糊不清。有的认为它的解释既可靠又有效,有的并不这么认为。然而,不管怎么说,它仍是临床心理学家和精神病学家们使用最广泛的测试法之一。
另一种有名的投射测验是主题统觉测验(Thematic Apperception Test, TAT),由心理学家亨利·默里及其助手克里斯蒂安娜·摩根开创。
默里气宇轩昂,但内心深处却受某个魔鬼驱使,在经历一段曲折的旅程后才找到自我。他先学历史,后接受医学培训,专攻外科,后来又用5年时间从事生化研究。在向前摸索的过程中,他曾到苏黎世拜访荣格,并在他身边待了3周,期间每天参加讲习会,周末参加心理治疗。如他所说,在“爆炸性的体验当中”,他“获得了新生”。他摆脱了久治不愈的口吃,并对心理学产生浓厚的兴趣,转而学习它,成为一位精神分析学家,最后找到了使命所在,成为哈佛心理诊所的精神分析研究员。他与奥尔波特进行过短暂合作,但自此之后,他在人格分析中所持的心理动力学观点使他们,按照奥尔波特的说法,“处于友好的分离状态”。
默里对人格研究所作出的最有意义的贡献,是他和其他20多位心理学家耗时3年所进行的临床研究项目。他们深入研究了51个处于大学学龄阶段的人的人格特质,他们将评估技术分类,这些评估技术包括促膝谈心、挫折测试(如玩根本不可能取胜的拼字游戏)等,或在实验者说出如“骗子”“同性恋”等挑衅性词语时,测试受试者手指的抖动;还有投射测验,在投射测验中,TAT法最能说明问题。
在实施默里和摩根于1935年为该研究项目开发的TAT法时,测试者让受试者观看19张黑白图片,图片所描述的事情或其原因他们并不知情。测试者要求他们为每张图片编一个故事,每个故事约5分钟,可凭感觉自由发挥。对这些故事进行的心理学解释,在很大程度上依赖一张由项目研究小组编制的、列着35条人格“需要”或动机的清单,这些需要包括获取成就、支配性、秩序及成为他人救星等。
在描述TAT开发过程的报告中,默里和摩根还印制数张图片作为范例。在一张图片中,有一位面朝左的中年妇女的侧影,她身边靠近观察者的地方,一位穿戴整齐的年轻男士稍稍背向她,头稍下垂,眉头略皱(只有这些描述,该测验的出版人不允许复制这些图片)。默里和摩根说,下面这个故事,是一位受试者根据上述图片编写的。
母亲和孩子幸福地生活着。她没有丈夫,儿子是她的唯一支柱。但这个孩子交上了坏朋友,并作为从犯参与集体抢劫活动。事情败露后,他被判刑5年。该图片表现他与母亲告别的场景。母亲非常伤心,并为他感到羞耻。孩子也深感羞耻。他关注的似乎不是步入监牢,而是此事给母亲造成的伤害。
这孩子(故事还在继续)因为表现好而出狱;他的母亲去世了;他坠入爱河,但很快又犯罪;他再度被关进监狱;出狱时,他已是老人,他的余生在忏悔与潦倒中度过。
默里和摩根在解释这个故事时说,讲故事者感到的是外部的不良影响可支配人的行为。故事还显示出几种深层的需要,其中有供养(母亲)、获取金钱和自我贬低。默里和摩根说,这个例子说明了TAT的特别价值。
本测试所依据的事实众所周知:当某人解释内容模糊的社会情境时,很容易像他关注某种现象时一样暴露出自己的人格来。他完全倾心于解释那个客观的现象,变得非常天真,根本没有意识到自己,也没有想到别人正在审视他。就这样,他不那么警惕了……受试者暴露出自己内心深处的幻想,但他完全没有觉察。
尽管TAT法有其价值,但使用起来相当麻烦。一些人能讲出冗长的故事并给出大量信息,而另一些人却无话可说,也给不出什么信息。尽管如此,事实证明,它仍是一种可靠且有效的工具,可用来检测人格特质,在某种程度上还具有预测力。1952年,测试者对57位30岁左右的哈佛毕业生进行TAT测试,并在15年后对他们进行跟踪研究,结果发现,在1952年的测试中显示出较高亲密动机的人,在婚姻、工作及其他需要互动的领域里,适应度明显更好。尽管TAT受到过尖锐的批评,且不像罗夏测试法那样应用广泛,但多年来它一直被人运用,并引发出许多类似的测试。
近几十年来,大量投射测验相继出现,有许多至今昌盛不衰,其中包括以下4种方法:布莱基测试法,即一套关于一只小狗的图片故事(小孩子为每张图片编一个故事);词汇联想法(在一些测试中,受试者在听到或读到一个词时,将闪入脑海的第一个词说出来;在另一些测试中,受试者用给定的词造句);完成句子法(“但愿我母亲……”“最烦我的一件事是……”等);图画测试法(有一种是这样的,要求受试者画一幢房子、一棵树和一个人。用心理动力学分析画面,例如,死树暗示情感空洞,树叶很多表示有活力,尖尖的树冠暗示攻击性)。
行为取样或操作测验:在这类评估中,一位经过培训的心理学家在特定情形下观察某人,测量或评定其行为。观察者通过单向镜观察孩子们在教室里一起完成某个项目,玩耍或对人为刺激作出反应,如听到从隔壁教室里传来的呼救声。或者,这位不会被受试者看到的观察者也可观察一群人在特定情境下的表现,他们试图解决某个需要合作的问题时会怎样做。
在另一种形式的操作测验中,心理学家与某人面对面,让他或她进入困难或压抑的情境里,再根据他或她由此产生的行为,对其进行评定。第二次世界大战中,参训的空军飞行员候选人就经过了一系列测试,其中之一是,受试者要捏住一根在管子里的、很细的金属棒(只要碰上管子,灯就亮一次),同时测试者会说一些令人不快或吓唬人的话,甚或突然在他旁边大吼一声。
也是在二战期间,战略服务处将一些特工候选人送到一个与世隔绝的地方连续测试3天。在那里,他们除接受常规面试和完成问卷以外,还要面对一系列的困难任务:在没有任何指导的情况下搭一座木屋,丈量一堵高墙,渡过一条溪流,喝酒之后仍保持头脑清醒,等等。心理学家对他们的领导能力、抗压能力和抗挫折能力等进行评定。这些方法听起来不错,但小组成员们在最后的报告中承认,他们几乎没有收到反馈,因此丝毫不清楚所作评估的准确度有多高,用处有多大。不管怎么说,对于评估人格来说,这种方法成本太高,难以实施,对于普通用途来说要求也过高。
人们还设计出更实用的操作测验。然而,大部分测验都要求测试者的参与,且必须在实验室里进行,因而不适合在学校、工厂、诊所、公共场所及军队中作大规模的人格测试之用。
下面列出几例:
——受试者要走4道印制的迷宫,每道用时不得超过15秒,且不能让铅笔轨迹碰到迷宫边缘。如果成功,说明该人有决断力。
——受试者按正常方法大声念一篇故事,然后倒过来念。费时差距越大,受试者死板和不灵活的可能性也越大。
——一组受试者就一个有争议的话题表示态度,测试者私下告知每一个受试者,他或她的观点与大多数人不同(出于测试目的,不一定是事实)。一会儿之后,受试者再度接受测试,他或她对该话题态度的改变程度,可用以测试其对从众压力或适应性压力的易感性。
——受试者坐在椅子里等待一件计划好的事件发生,可该事件却推迟发生。他或她并不知情的是,这把椅子是一个“小动作记录器”,可将所发生的所有动作记录下来。动作过多的人往往是容易紧张或容易受挫者。
这只是一小部分例证。想拿学位的研究生或追求适销产品的心理学家还编制出其他数以百计的测试法。他们在开发这些产品时,也许还有一些非物质的动机:为使结果值得信赖,这些测试的真正目的不能被受试者知道,因此,编制测试法还有某种做游戏或设计恶作剧的意味。也许情况是这样的,设计这些测试法的心理学家发现这样做非常有趣。