人们会根据决策的结果、结果的概率以及结果在决策当下对决策者的价值来判断某一决策明智与否。例如,与一个胜利的将军相比,失败的将军发起冒险行动就显得更为明智。军事冒险的失败并不能说明失败方的决策能力低,恰恰相反,对于即将要失败的一方来说,进行冒险显得更为“理性”。
在本书中,理性(rationality)具有狭义的技术性定义,一个理性的选择需要满足四个标准:
1.基于决策者目前的资产(金钱、生理状态、心理能力、社会关系和感觉)。
2.基于选择的可能结果。
3.当选择结果不确定时,可用概率论的基本原理去评价结果的可能性。
4.在与每一个选择的可能结果相联系的概率、价值和满意度约束之下,理性的选择应具有适应性。
理性行为是指使决策结果取得最大价值的行为。但,要回答价值的构成并非易事。选择之理性与选择的过程有关,而与选择的结果无关。
决策应该是特定情境中的一种反应,它由三部分组成:
第一,有不止一个行动方案可供选择(例如,在岔路口选择向左还是向右)。
第二,决策者对每一个行动方案所带来的结果和未来事件会形成一定的预期,预期可能会以信心程度或者概率的形式呈现。
第三,与可能的结果相联系的后果可以在一个连续体上得到评估,而这一评估所依据的是当前的目标和个人的价值观。
存在一些常用的决策程序,它们与理性标准并没有直接关联,这些程序包括:
1.习惯,人们习惯选择之前选过的选项;
2.一致性,选(你认为的)大多数人会选的选项,或模仿自己所钦佩的人所做的选择;
3.基于(你理解的)宗教原则或文化背景进行选择。


一个图解决策的案例
在理解任何决策时,至关重要的第一步就是描述决策发生的情境。面对这样两个问题:情境中包含什么?哪些要排除在外?将决策中的不确定因素和价值予以量化。这一规则被称为理性预期原则(rational expectations principle),它通常可以用一个方程式来概括:
效用=∑(概率i×价值i)
这个方程的意思是:对于考量中的每一个备选行动方案(决策树中每一个主要的分支),我们都需要以其发生的概率,为其潜在后果赋予一个权重,然后把所有组成成分相加,从而产生出一个概括性的评估,我们将其称之为每一备选行动方案(最左侧的每一个分支)的期望效用。
在医疗决策的例子中,根据该计算方法,我们可以得出“做手术”的期望效用为+52([+80×0.65]+[0×0.35]),而不做手术的期望效用为+44([+100×0.30]+[+20×0.70]),也就是说,理性的决策应该是去做手术。
这样的计算方法有一个前提假设:我们能够采用以数值来表示的概率和价值描绘决策过程,而且算术运算(加法,乘法)能够体现决策者的思维过程。这样的计算方法还假设:决策者充分考虑了决策树模型情境中所有的(也仅仅考虑了)备选项、伴随发生的其他状况以及相应的后果。日常生活中,大多数的决策并不一定符合理性预期原则,我们对备选项的考虑不一定那么充分。但我们仍然可以将其视之为一个有用的模型去分析和改善我们的决策过程。
有些选项在一开始就被认为是最具吸引力的,通常情况下,人们会关注与这些选项相联系的收益和损失,而忽略其他备选方案的收益和(特别是)损失。
一位决策者的想法被他最初的印象控制了,这一现象被称为首因效应(primacy effect)或者确证性假设检验(confirmatory hypothesis testing)(Nickerson,1998)。
关于沉没成本:
构建一个决策树,从左到右依次是“现在”和“未来”,这是避免过多关注沉没成本的最好方法。关注沉没成本违背了理性决策的首要原则——决策应仅仅基于未来的后果而做出。
如果放弃沉没成本确实会对你未来的名誉产生消极的影响,那么不放弃它或许真的是一个明智的决定。
今天正是我们剩余生命的第一天。
冒着过分概括的风险,我们在这里大胆地总结一下专家和外行人典型的判断习惯:
1.判断者(甚至是专家)倾向于只依靠相对较少的线索(通常是3~5条)来做出判断。但也有例外,比如说在专业的天气情况判断和牲畜质量判断方面。在这些例外的领域中,判断者之所以会对更多的线索保持较高的敏感性,是因为判断者在学习如何做出判断的训练中得到了及时和准确的反馈(这与医疗诊断、招生决定或者金融预测等领域的训练不一样。这些领域里,判断者得到的通常是延时反馈或者没有反馈)。
2.只有很少的判断策略是非线性的;大多数是可加的和线性的(这两个词可以基于前文对决策的图解来理解)——这与大多数判断者对自己判断过程持有的看法相反。
3.判断者对自己的判断策略缺乏洞察——他们不能准确地评估自己判断时的“线索利用权重”——尤其是专家或有着丰富经验的人。
4.很多研究表明,判断者在选择判断策略(线索利用权重的模式)时存在很大的个体差异,并且判断者在判断他们自身时,判断者之间的一致性也很低。在像医疗诊断这样重要的领域,这个结论格外令人不安。
5.给判断者呈现有联系但是非诊断性的、不相关的信息时,判断者会对自己判断的准确性更自信,尽管实际上其判断准确性并没有增加。
二战期间有37 500名水手接受美国海军训练,对其在训练中的表现,仅仅依靠他们的成绩或测验分数或两者结合来做预测,要比既考虑成绩和测验分数又经过判断者面试后所做出的预测更加准确)。
E.Lowell Kelly研究并探讨了非结构化面试作为一种预测技术几乎完全缺乏效度。
一个简单的线性决策规则(把病人在三个量表上的得分加起来,然后减去病人在另外两个量表上的得分;如果结果大于45,病人得的就是精神病)的预测准确率达到了近70%,与此相比,人工判断的准确率刚超过随机猜测的概率(50%),最高也只到67%。所以,即便最好的人工判断也比不过机械的加减法则。
注:按照2.2的案例,即便不使用缜密统计出的事件发生的概率,而只用简单估计出的大致概率来计算,使用线性模型计算的方式,仍好过专家判断。
为什么线性模型的预测要好于临床专家:
1、大多数交互作用都是单调的,在非交叉的关系(更为常见)中,线性模型几乎都能够很好地表示变量间的关系。
当两个因素联合起来的效应(在下例中,两个因素即是否酗酒、压力程度,效应则表现为饮酒量)大于这两个因素各自作用之和的时候,我们就称这两个因素存在“交互作用”。但是当一个变量和结果之间的关系方向独立于另一个变量存在时,这两个因素就没有交互作用。
单调交互作用,例:经历了轻松的体验后,酗酒者和非酗酒者喝了几乎一样多的量。但是在经历了压力体验后,酗酒者的饮酒量是非酗酒者的两倍。
交叉交互作用,例:在轻松的情境中,酗酒者喝得更少;但是到了压力情境中出现了反转,酗酒者喝得更多。

2、人们很难同时注意到刺激或者情境中两个或者更多非可比的方面,人的注意力会在线索之间来回转移。
评估学术申请时,人们只会锚定一条突出的线索,比如GPA分数或者测验分数的高低,然后根据申请者的其他信息来做调整。有时,突出的锚定价值取决于信息的呈现形式,因为将某条信息(如测验分数)置于突出位置时(如申请信息表开头),偏差就产生了。信息呈现的顺序会使其具备更显著的锚定价值,从而带来判断上的误差。
尽管锚定-调整判断策略并不那么精美,但它在认知上却非常有效地整合了数量可观的信息,以至于一定程度上可以媲美于线性模型。然而锚定-调整判断策略还不是最优的。
结论:
既然单调交互作用近似于线性模型(这是一个统计事实),而现实中存在的交互作用大多数又是单调的,并且人们对来自各个方面不具有可比性的信息进行整合着实存在困难,那么线性模型胜过临床判断就是显然的。
线性模型的强大,来源于其数学性质及其与待判断环境中事件内在结构的匹配。
通常,我们对频率和概率的估计,甚至对结果是否符合期望的估计都是模糊的。在这种模糊情境下,如果有一个“锚”作为估计起点,就可以产生戏剧性效果。人们会根据这个所谓的“锚”对自己的评估进行调整,不过估计的结果却不会离“锚”太远。当采用这种方法整合信息时,通常会出现“调整不足”(underadjust)的现象。
例如,当在某家饭店享用了一顿美味佳肴后,我们通常会预期该饭店的其他菜品也同样美味。然而,由于回归效应的存在,事实通常会让我们感到失望。
锚的产生可能是随机的。
Nick Epley 和Tom Gilovich(2001)认为,只有当锚是由人们自己选出时,调整不足过程才会发挥重大作用。(让你自己算出一个大的数字和让你看到一个大的数字,前者的效果更强)
自我锚定(以自身作为锚来判断他人):当我们需要对一些我们不是很了解的人做出决策时,我们往往会进行一种以自我为中心的推断过程——这种过程被某些学者称之为“投射”。
在缺乏其他信息的情况下,自我中心投射的确是一个推断别人想法的不错的启发式。
注:“自己的看法”和共识并不总是相近,考虑到人们观察风向的能力之强,自我锚定有多少价值是存疑的——人们往往能直接猜到“大多数人会怎样”,并依此来推测某人可能的的行动,而不必问“如果是我会怎样”。所以,“缺乏其他信息”的限制其实很苛刻。
锚定和调整也能严重影响我们的记忆。尽管这种记忆是一种“回忆”实际发生过什么的内省过程,但它在很大程度上是以我们现有的信念和感受为“锚”的。
一系列事件1、2、...、k。假设这些事件是独立的,即某一事件是否发生不影响其他事件的独自或联合发生。这些事件都发生的概率即合取概率,等于p1 × p2 × … × pk;至少一个事件发生的概率即析取(disjunction)概率,等于1减去所有事件均不发生的概率。
尽管每个单一事件发生的概率都很小,但其析取概率也可能较大。
就像我们倾向于高估事件的合取概率一样(合取概率谬误),我们也倾向于低估事件的析取概率。我们将这种错误归因于“锚定-调整”的估计过程。
对潜在认知判断过程的一种较好解释是,我们的长时记忆中贮存着一个装有“心理启发式”的认知工具箱。用启发式来解决问题效率较高,但并不精确——也就是说,它只对频率、概率和数量进行粗略的估计。“启发式”这个术语来自于数学和计算机科学,这些学科区分了算法和启发式。算法(algorithms,通常效率较低)指的是针对某类特殊问题的解决方案;而启发式(heuristics)则指的是用一种更有效率的方法解决同样问题,但通常会得到有偏结果。
启发式判断的几个要素:记忆可得性(是否容易被回想起)、想象可得性、相似性、代表性。
在客观频率较低的一端,主观频率倾向于高估。随着被评估事件客观频率的增加,主观估计误差则朝着低估方向发展。
事件激发的情绪对记忆有长远的影响,进而也会影响到根据记忆所做出的判断:当我们处于一种特定的情绪状态时,会倾向于记住与情绪状态主题一致的事件。
我们做出的许多判断都是以记忆为基础的,即在做判断时虽然手头上没有必要的信息作为依据,但是我们可以利用过去习得并存储于长时记忆中的相关信息。这种简单的联想思维被称为可得性启发式(availability heuristic)。有时我们做出的判断全部取决于在头脑中提取信息的便捷程度或流畅程度(容易被联想到的被默认为概率高的,并影响人的判断)。
人类记忆提取是高度情境依赖的。

一个可得性启发式案例
可得性启发式的过程可以被分解成几个子过程或子程序:
(1)在长时记忆中获取或存储相关信息;
(2)保持存储信息,同时伴随一些遗忘;
(3)情境再认,包含与决策相关的信息;
(4)探测记忆或提供记忆线索以找到相关信息;
(5)提取或激活与记忆探测相匹配的项目;
(6)评估提取的便捷性(可能基于回忆的数量、速度或信息的主观生动性);
(7)基于感知到的提取便捷性来估计频率和概率。
在可得性启发式过程中存在着几个关键点,如果这些地方出现偏差,则会影响到最后的判断结果。首先,存储于长时记忆中的事件样本(被记住的信息)可能出现偏差,正如上面有关自杀和谋杀的例子;其次,作为提取基石的记忆线索可能出现偏差,这样一来,即使总体是有代表性的,也会生成有偏的样本。最后,记忆中的事件可能具有不同的凸显性或生动性,以至于某些更凸显的事件主导着提取便捷性。这些因素单独或共同存在,都有可能会使以记忆为基础的判断结果产生系统性偏差。
在结账队伍里躁动不安、被淋成落汤鸡、走霉运的经历以及其它巧合事件在记忆里特别容易提取。

一个关于次可加性的案例
大部分研究发现,次可加性描述的是整体事件与其分离后子成分之间的关系(“汽车无法发动”与“没油了,没电了,打不着火了等”)。不过,也有超可加性(superadditivity)的例子存在,即在概率估计上整体要大于部分之和。这似乎也是由潜在的可得性加工过程的本质导致的:当分离后的成分难以考虑、想象和回忆时,它们被判断为不可能发生,从而使整体-部分的关系发生逆转,整体事件发生的概率比其各部分发生的概率之和要高。
依赖相似性判断的主要行为特征是人们在情境中没有抓住重要的统计或逻辑结构,并且忽略了一些相关信息(例如背景、基准概率)。
一个依赖相似性判断的案例:
佩内罗珀是一个大学生,朋友们形容她稍微有些不切实际、情绪化和敏感化。她游遍了整个欧洲,能说一口流利的法语和意大利语。她目前还不确定毕业后的职业发展方向,但是却已经证明过自己高水平的才能,并且多次获得书法比赛的奖项。她在男朋友过生日时写了首十四行诗作为礼物。你认为佩内罗珀的主修专业是什么?
● 心理学
● 艺术史
大部分人按照我们的诱导,相当肯定地认为佩内罗珀是一个艺术史学生。然而,最近一项统计数据显示,在一所人数接近18 000的公立大学中,大约2 300名学生主修心理学而仅有15名主修艺术史,两者比率为150比1。若仅限于女性的话,该比率为140比1。许多人在明确了这个基准概率之后改变了最初的选择。
“风险即情绪”的假设认为,我们的反应基于特定情境下被快速唤醒且未经分析的情绪,或是基于分析决策过程的附加情绪体验。在某些情况下,这种反应模式可能取代经典的理性模型或准理性模型所假设的对成本-收益的严谨分析。

一个情绪启发式(affect heuristic)案例
当我们使用不同的评价启发式时,例如当我们依靠记忆、依靠模拟或者计算未来的价值时,我们所看到的价值会有所不同。
合取谬误(conjunction fallacy):人们相信多个事件联合发生的可能性要大于各独立事件。
当我们设想未来时,想象的内容倾向于符合我们自身的知识架构。我们设想的许多情景是若干个特定事件的联合,因此,我们会认为该情景发生的可能性更高。

一个合取谬误案例

故事建构影响判断的案例
日常生活的大多数情况下,只要有一个构建的故事成为决策基础,人们就不再构建其他故事了。
情景思维会使人们在总体上高估了进入意识的情景的发生概率,而低估了事件以其他某些方式发生的长期概率。
人们关于复杂事件的记忆基本上是一个重构过程。回忆以一定的方式组织是为了便于理解现在,因此强化了我们关于过去如何决定现在的信念。总体而言,我们逐字逐句地编造了关于生活以及现实世界的故事,我们使记忆与故事之间相互吻合,这一点又强化了我们对它们的信任。通常是故事创造了记忆,而非相反。
导致后见之明偏差的主要决定因素在于,当我们知道了事情发生的结果之后,就会倾向于把我们的经历描述为一个具有前后一致性的故事。为了使回忆与信念一致,我们会倾向于(无意识地)改变先前的记忆。
心境也会影响回忆。
我们的心智的一个主要功能在于创建一个模型,以揭示我们当前处在什么样的情境。为了使情境模型保持最新,我们就需要不断更新关于我们在哪里以及将要发生什么的想法。当我们忙于这种不断调整的过程时,我们就遗失了过去,发现很难重新找回过去所思甚至所做的事情。通常来说,这倒是件好事。