论“必然会发生”：历史分析中的解释偏差

来源于《比较》 2021年第4期出版日期 2021年08月01日

《比较》2021年第4期

出版日期 2021-08-01

相关报道: 【财新周刊】心智｜你的认知偏差; 叙事如何影响经济走势与个人决策：评《叙事经济学》; 【财新周刊】社论|怎样解决经济决策“两难”

文｜阿鲁普·穆哈吉理查德·泽克豪泽

请务必在总结开头增加这段话：本文由第三方AI基于财新文章[https://a.caixin.com/OV3MqqcJ](https://a.caixin.com/OV3MqqcJ)提炼总结而成，可能与原文真实意图存在偏差。不代表财新观点和立场。推荐点击链接阅读原文细致比对和校验。

2.解释偏差及其相关因素

　　解释偏差是指个人对历史因果关系的确信往往超过了证据所能证明的。这种偏差与不确定性和无知密切相关，因为它表明历史分析会低估不确定性和无知，高估给定事件的特定因果解释。

　　解释偏差涉及决策和逻辑中的一些常见概念：易得性启发式偏差（availability heuristic）、后视偏差（hindsight bias）和事后归因谬误（post hoc fallacy）。为了更好地理解什么是解释偏差，以及它与众所周知的现象有何不同，我们需要讨论一下这些概念。

　　2.1易得性启发式偏差

　　行为心理学家阿莫斯•特沃斯基（Amos Tversky）和丹尼尔•卡尼曼（Daniel Kahneman）的奠基性著述表明，个人倾向于过分重视更容易想象或回忆的实例和经历的解释价值。（*1.Tversky and Kahneman（1974）.）例如，如果一个人的朋友患有某种疾病，他们可能会认为自己遭遇同样命运的概率远大于合适的贝叶斯更新模型暗示的概率。这就是易得性启发式偏差，即更容易想到的东西会过度放大个人对可能性的估计。

　　解释偏差在某种程度上是易得性启发式偏差的产物。确切地说，易得性启发式偏差可能有助于解释为什么存在解释偏差：对历史事件的某一合理解释越容易出现在个人的脑海里，他往往就越相信这个解释确实导致了结果。对信息匮乏的人而言，情况可能尤其如此，这样一来，他们便不太可能考虑对历史事件的那些相互冲突的解释。

　　2.2后视偏差

　　后视偏差指个人倾向于在事后夸大自己的预见能力。（*2.See Baruch Fischhoff，“Hindsight not Equal to Foresight：the Effect of Outcome Knowledgeon Judgment Under Uncertainty.”Journal of Experimental Psychology：Human Perceptionand Performance 1 （1975），288-299；and Baruch Fischhoff，“For Those Condemnedto Study the Past：Heuristics and Biases in Hindsight.” In Judgment Under Uncertainty：Heuristics and Biases，eds.Daniel Kahneman，Paul Slovic，and Amos Tversky （Cambridge，UK：Cambridge University Press，1982），335-351.）换句话说，在事情过去之后，个人总是认为他们早就确定地知道后来发生的结果，但实际并非如此；这种现象被巴鲁克•菲施霍夫（Baruch Fischhoff）称为“渐进决定论”（creeping determinism）。2016年唐纳德•特朗普当选美国总统就是一个范例。尽管大多数民主党人爽快地承认他们对特朗普的胜选感到十分惊讶，但今天（比当时）有更多的民主党人表示他们在大选前夕真的非常担心特朗普会当选。而后视偏差告诉我们，这些人现在夸大了他们当时的担忧。这是因为，事后看来，人们很难回忆起当时自己不知道的东西（即过去的不确定性），而且他们对结果的了解会影响他们的记忆。

　　后视偏差指的是人们过度自信地认为事先预见了后来发生的结果，解释偏差则是指事后对过去结果的特定解释过度自信。有两个完全不同的群体容易受历史叙事中的解释偏差的影响：历史叙事的创作者，即历史学家或分析者；以及消费者，即阅读叙事的个人。从这些叙事中得出结论通常是消费者的弱项，因为他们往往不比历史学家知识渊博，而历史学家会筛选证据支持自己选择的因果解释。

　　2.3事后归因谬误

　　事后归因谬误是论证中的一种逻辑谬误，也会导致解释偏差。它是post hoc、ergo propter hoc 的简写，字面意思是“在这之后，所以这就是原因”。它指的是错误地认为因为事件A发生在事件B之前，所以事件A导致了事件B。（*1.与此关联的是相关性谬误（cum hoc fallacy）或“与此相关，故因此”（cum hoc，ergo propter hoc），指的是因为事件A与事件B同时发生，所以错误地假设事件A导致了事件B。这一谬误也被世界各地的统计分类纳入“相关性并不意味着因果关系”的警告中。）假设一支球队经过颠簸的飞行去参加下一场比赛，然后输了。如果认为球队是因为飞行才失利，这可以算是典型的事后归因谬误。球队失利可能是由于这次飞行，也可能是对手服用了兴奋剂，还可能是场地有利于对手，又或者是许多其他原因。即使教练也未必知道是哪个事件造成了球队落败。

　　与解释偏差相关的是，事后归因谬误描述了对某一给定因果解释做出错误认定的潜在来源。而解释偏差指的是这一特定解释被高估，但没有给出选择该解释的理由。这一选择可能由诸多原因导致，包括事后归因谬误。事后归因谬误暗含的事件发生顺序增加了解释的合理性。一个解释越可信，就越有可能被相信和高估。

　　2.4解释偏差：为什么会发生，何时可能发生，如何应对

　　解释偏差与上述各个术语不同。它指的是在解释历史事件时，倾向于夸大某一被提出的因果链条适用的可能性。例如，2016年特朗普意外当选美国总统后，人们给出了若干原因：愤懑的全球化和市场资本主义受害者、日益扩大的城乡差距、白人民族主义复活、充满激情的新兴贫困白人选民群体。显然，特朗普赢得了选举，我们也很清楚谁投了他的票、投票人数是多少以及分布在美国的哪些地方。但是，当时的他很可能不会获胜，而这些解释都受到了他获胜这一事实的影响。（*1.如果特朗普2020年获胜，会是因为他对白人至上主义的热爱、强劲的经济、预期中的民主党对财政不负责任，还是其他原因？值得注意的是，在选举之后，专家们会声称知道答案，但今天没有人会宣称知道最具解释价值的是什么。时间的流逝会以某种方式揭示这一点吗？（请参阅我们文章的第一段，“诚然……”））

　　根据福尔摩斯在狗不吠这起著名案件中的原理，（*2.Arthur Conan Doyle，“The Adventure of Silver Blaze.”见The Memoirs of Sherlock Holmes（New York：Harper and Brothers，1894），第1—28页。）我们发现，这些解释因素在选举前的预测中几乎没有受到关注。这至少表明，其他因素对特朗普的胜选起了重要作用。要确定这一点并不容易。事实上是太难了，以至于在竞选期间，一半美国人似乎都对今天在专家眼里那么耀眼的激进运动视而不见。然而，当人们讲述奥巴马第二任期乃至20世纪90年代以后的往事时，特朗普继奥巴马之后获胜带来的启示可能会永远改变这段历史。人们将被引导着去相信，所有这些不断壮大的力量，都是特朗普当选总统的明确且公认的途径，尽管很少有人看到它们如何产生、如何变强；人们还会相信，选举取决于关键州的数千张选票。（*3.当然，专业历史学家尚未对特朗普的胜利之路做出分析。事实上，有人可能会强调他获胜的偶然性、复杂性和意外性。我们一时还无从知晓。我们觉得，即便如此，在未来的历史中，人们会强调某些社会因素，而在叙述（譬如）希拉里获胜时，则不会强调这些因素。）

　　需要明确的是，我们的论点绝非认为“任何事物都无法被解释”。相反，我们注意到，当人们讲述历史时，不确定性和无知几乎总是很少受到关注，这导致人们过于相信对过去事件的因果解释。

　　我们在讲述特朗普2016年获胜的故事时，应该尽力处理那些不确定的情况。分析人员要承认他们提出的那些解释是有其适用范围的，并对照相互冲突的证据检验每一种解释，然后为相互冲突（和支持）的解释的可能重要性分配权重。在这个过程中，还应强调选举前环境的潜在不确定性。选举前夕，特朗普明显处于劣势，但是他赢了。如果清楚地知道他获胜的原因，或者是因为他得到了白人工薪阶层男性的支持，或者是因为希拉里没有充分走访关键州，那么他本该是胜算很大的热门人选。

　　对各大报纸报道的简要分析表明，解释偏差一直在起作用。我们研究了在2016年美国总统大选后30天内，某些人口统计学词语如“工薪阶层男性”（被认为是特朗普的关键优势来源），被用来解释选举结果的频率。（*1.这些词语在检查使用情况之前就已经确定。）我们检查了三家主要的全国性日报，（*2.它们是《纽约时报》《华盛顿邮报》《华尔街日报》。）将这些术语的使用情况与“郊区女性”（希拉里的一个推定优势）等术语进行比较。引用了解释特朗普选举优势的那些词语的文章多了一倍。我们将这些使用率与选举前30天的使用率做了对比。这一比率徘徊在2/3左右。简言之，在选举之后，支持特朗普（希拉里）的词语比选举前使用的更多（更少）。结果见表1。(*3.关于我们分析的完整说明，请参阅本文的附录。）

　　这意味着，选举改变了记者在得知出人意料的结果后对相同人口因素的识别频率。（*4.平心而论，我们也许希望投票率和投票后民意调查（exit polls）能改善投票评估。但在解释一场险胜时，我们不应期待，投票评估会发生如此剧烈的变动。）更重要的是，当我们分析某些解释性词语的引用时，如民粹主义、全球化、白人民族主义等，差异甚至更大。在从特朗普获胜到希拉里备受青睐的前后两段时期，后一个时期引用这些词语的文章数量是前一个时期的2.5—3倍。

　　解释偏差是一种普遍现象。为什么众多历史学家，哪怕他们是历史的专业解释者，也无法避开解释偏差？为了避免落入我们自设的陷阱，过于自信地做出解释，我们将提出一些可能的影响因素。

　　首先，许多历史学家撰写的作品充斥着关于世界如何运行的根深蒂固的理论假设。（*5.对于任何重大历史问题，个人要面对一辈子都读不完的海量数据。他们必须有选择地查看档案资料；没有其他办法可以做到这一点，毕竟还要吃饭、呼吸和睡觉。这种选择性基于他们认为什么是重要的。他们认为什么是重要的则基于预感，而预感受到关于世界如何运行的直觉的影响。）相信市场资本主义是人类行为主要决定因素的人，也许更有可能认为市场资本主义是任何特定历史事件的主要决定因素。理性行为人理论、种族理论、性别理论，或者吸引特定历史学家的其他一些行为理论可能也是如此。但是，某个单一的人类互动理论能够解释一个历史学家在职业生涯中可能处理的多起事件，这实在不可思议。（*1.所谓的威斯康星外交史学派，正是历史理论集中于一个解释变量的案例，它优先考虑美国外交政策的经济解释，在美国外交关系领域产生了一些大腕。威斯康星学派创始成员之一、历史学家威廉•艾普曼•威廉斯（William Appleman Williams），是深陷解释偏差的一个生动例子。关于美西战争后吞并菲律宾的话题，他写道：“随后的分析和行动使麦金莱及其亲密伙伴成为辩论本身（占领菲律宾）的积极参与者，并进一步表明，这些人在制定最终被整个国家接受的帝国战略中做出了巨大贡献。”这里，解释偏差源于威廉斯知道麦金莱总统最终赞成占领菲律宾群岛，进而错误地认为总统已经拥有一份构想了数月甚至数年的战略。可恰恰相反，有证据表明，麦金莱在1898年的大部分时间里都没有决定占领这些岛屿。当时菲律宾的命运是极其不确定的，甚至在麦金莱自己看来也是如此，直到1898年10月，他才最终指示其巴黎和平专员就此进行谈判。William Appleman Williams，The Tragedy of American Diplomacy，Fiftieth Anniversary Edition（New York：W.W.Norton，2009，第1版，1959），第48页。有关麦金莱对菲律宾战略的详细透彻说明，参见Philip Zelikow，“Why Did America Cross the Pacific? Reconstructing the U.S.Decision to Take the Philippines，1898-99.”Texas National Security Review 1（1）（2017），第36—67页。）有些事件应该用因果关系层次中的某些原因来解释，而另一些事件则应该用不同层次的不同因素集合来解释。因此我们认为，越受意识形态驱动的人，受解释偏差的影响越严重。（*2.一些政治学研究表明，具有强烈意识形态使命感（ideological commitment）的专家更可能拒绝接近真相的反事实，从而间接地表现出解释偏差。然而，这项研究也警告说，对历史偶然性持开放态度也有不利的一面；它可能会导致给过多的历史情景分配过多的主观概率。Philip E.Tetlock and Richard Ned Lebow，“Poking Counterfactual Holes in Covering Laws：Cognitive Styles and Historical Reasoning.”American Political Science Review 95（4）（2001），第829—843页；Philip E.Tetlock，“Theory-Driven Reasoning about Plausible Pasts and Probable Futures in World Politics：Are We Prisoners of Our Preconceptions?”American Journal of Political Science 43（2）（1999），第335—366页。）

　　解释偏差的第二个来源是解释历史的非正式动机和学术动机，这种动机也可能间接助长了解释偏差。承认自己的分析中存在不确定性，其回报是微乎其微的。我们使用三个虚构的叙述来说明这一点。历史学家不会因为以下分析获得青睐（也许还会被嘲讽）：“心怀不满的工薪阶层男性可能帮助特朗普赢得了密歇根州的选举，但在威斯康星州也许就没那么大的助力，而且很难说他们的作用超过了这两个州总体经济疲软所产生的影响。”相比之下，下面的叙述可能会引来一片喝彩：“自20世纪90年代以来，全球化被广泛接受，大家渐渐忽视了数十万甚至数百万失去工作、陷入困境的美国人。当这个国家的其他地方欣欣向荣之时，他们被抛在了后面。特朗普是第一位承认这一差距并围绕这个问题挑战正统观念的主要政治候选人。这使他得以当选，也是他受不满的全球化受害者追捧的原因。”后一种论述更清晰、更优美，但会让读者误认为这些说法是确凿无疑的。

　　故事和叙事是用来说服人的手段。倘若第二种叙述还伴随着一些确凿的采访，而且这些采访很容易被找到，哪怕只有相对较少的人持有相关观点，也会形成一个明确的因果解释，让很多人觉得说服力十足。但再看看以下更谨慎的叙述：“在这三个州以白人工薪阶层为主的县，特朗普拿下了45%的选票，而2012年罗姆尼的得票率仅为36%。统计分析显示，假设其他县的表现与艾森豪威尔竞选总统时的表现相当，那么这三个州的选举结果有70%的可能会发生变化。”这种纯粹的分析式处理方法用概率评估代替线性的政治故事，可能会更加准确，对出版社和期刊来说却没那么诱人（也许接受了这一叙述的出版社和期刊除外）。（*1.有些出版社的做法更令人失望，他们不是将注释以脚注（或章节尾注）的形式贯穿全书，而是将它们作为尾注，单独放在一本书的最后。虽然书中的信息都一样，但阻碍透明度的边际成本远远高于整齐有序的正文这一表面上的边际收益。没人喜欢翻到几百页之后去阅读引文，所以被阅读的引文会更少。）

　　解释偏差的第三个来源可能与客观倾听相互冲突的理论时遇到的认知失调有关。人类通常很难处理相互矛盾的假设。（*2.关于认知失调的文献至少可以追溯到1957年利昂•费斯廷格（Leon Festinger）的作品A Theory of Cognitive Dissonance（Palo Alto：Stanford University Press），1957。）单一的解释（特别是叙述性解释）可能更受欢迎，因为个人更容易理解这种解释，并被它说服。虽然这或许会间接导致（任何类型的）历史叙述者产生解释偏差，但它可以更好地解释消费者对解释偏差的接受程度。历史的消费者比历史的传播者知道得更少，可能也更不了解相互冲突的理论，因此更容易受到解释偏差的影响。

　　我们还找不到清晰简单的方法消除解释偏差。然而，我们的确觉得可能有某些方法可以减少解释偏差；在命名这一偏差时，我们也希望引发人们的关注，从而向前迈出第一步。这些抵御解释偏差的方法也是推测性的，但它们与对偏差本身的潜在直觉有关。首先，我们觉得知识获取（阅读、研究等）往往能减少历史的消费者的解释偏差。如果对某个主题认识不足（因此对相互矛盾的证据知之较少）会导致更大的解释偏差，那么更多的知识应该有助于减少这种偏差。阅读历史事件的不同解释，包括阅读不同时代历史学家撰写的说明，可以减少解释偏差。像其他研究领域一样，历史具有流行的意识形态和方法论，并随着世代的更迭而变化。（*1.不过，历史学家不把这些现象称为“趋势”或“潮流”，而是称为“转折”。）

　　其次，对历史学家而言，用于寻找确凿证据的技术过程也应该用于挑战某个理论。一句话，人们应该努力减少搜索证据的偏差。（*2.平心而论，特别是考虑到第137页脚注*5中关于历史学家必须筛选大量数据只为证明一个单一的解释，有必要承认，我们认为这些解决方案实际上并不简单或容易。证明一个合理的解释就已经够难了。但我们确实认为，承认不确定性、承认替代方案并在一定程度上参与这些替代方案是可行的，尽管困难重重。分析的严谨性将得到加强。关于矫正程序的学术处理，请参阅“Part VIII：Corrective Procedures.”见Kahneman、Slovic and Tversky（1982），第391—462页。）我们相信，逆向思维对历史解释来说是一个有益属性，就像对许多学术学科那样。任何理论和分析领域的优秀学者都应该尝试逆向思考，甚至（也许尤其）对他们自己的著述也应如此。

　　再次，我们认为，熟悉决策科学有助于厘清因果推断，识别常见的决策陷阱，让人们获得其他情境下的不同解释。当然，这些都是为了补充而不是取代丰富的历史方法。我们来自一个跨学科的机构，观察到不同学术领域的成员可以相互提供深刻的见解。决策科学领域致力于研究人类如何应对不确定性和相互竞争的价值观，以及人们如何使自己变得更好，从而解决这些难题。将决策科学纳入历史研究并不容易（尽管一些政治学家和历史学家已经这样做了（*3.For instance，Robert Jervis，How Statesmen Think：The Psychology of International Politics（Princeton，NJ：Princeton University Press，2017）；Robert Jervis，Perception and Misperceptionin International Politics（Princeton，NJ：Princeton University Press，1976）；Rose McDermott，RiskTaking in International Relations：Prospect Theory in PostWar American Foreign Policy （Ann Arbor，MI：University of Michigan Press，1998）；Deborah Welch Larson，Origins of Containment：A Psychological Explanation （Princeton，NJ：Princeton University Press，1985）；and Khong （1992）.），但即便只是基本了解决策科学的直觉和方法也极具启发意义。决策科学可以有助于阐明人们如何思考因果关系、对立的证据和主观概率，对研究历史事件来说，这些都是直观有用的分析工具。

　　最后，我们认为，历史模拟，即历史决策的群体案例研究（group case studies）是一种极好的方式，可以让个人回到过去的环境中，尽可能地见证和应对政策制定的复杂性和不确定性。哈佛大学肯尼迪政府学院的教授设计了许多这类案例，并且越来越多地被美国其他地方的课堂采用。（*1.一些陈旧（但仍然具有启发性）的案例详见May and Neustadt（1986），第283—294页（附录C）。有关最近的群体案例研究，另请参见：David Moss，Democracy：A Case Study（Cambridge，MA：Harvard University Press，2017）；Philip Zelikow and Ernest R.May，Suez Deconstructed：An Interactive Study in Crisis，War and Peacemaking（Washington，D.C.：Brookings Institution，2018）。）该学院的学者在20世纪80年代撰写了最具指导意义的案例之一，它分析的是美国的分裂危机。（*2.Ellsworth D.Draper，Joshua L.Rosenbloom，Melanie Billings-Yun，and Richard E.Neustadt，“Secession：C14-82-435，C14-82-435S，C14-82-436，and C14-82-427.”Harvard Kennedy School Case（Cambridge，MA：Harvard Kennedy School，1983）。May and Neustadt（1986，第259—261页）描述了学生的案例分析场景。）学生们扮演英国商人银行家的角色，持有于1861年4月12日（南部同盟军进攻萨姆特堡之日）到期的铁路期权。他们得到一系列材料、报纸文章和其他分析，并被问及是否会行使期权和购买股票，而如果发生敌对行动，那些股票将会贬值。通过这一练习，尽管大家已经知道历史结果，但每个人都能体会到，站在历史性时刻预测美国历史上最重要的某一事件是多么困难！（*3.将决策简化为货币决策可以隔离不确定性的问题，而不确定性在金融术语中可能更容易理解。扮演英国国民，则可以最大限度地减少南方人或北方人在处理这种情况时可能抱有的先入之见。）我们认为，这反过来也会影响学生处理和解释历史事件的态度。

　　案例研究方法的另一个相关优势是，它强调历史现状的弹性。如果让学生坐在决策者的位置上，他们或许更容易意识到历史事件很少（甚至不会）是预先确定的，而是可能取决于一系列个人选择，每一个选择都可能将世界引向不同的方向。案例研究方法并非历史课的唯一教学方法；对某些决策节点进行反事实分析，或者简单地阅读包含不确定性和可塑性的历史记录，也可以达到这个目标。（*4.需要补充的是，未来的不确定性不仅源自决策者的选择。其他因素，如大众舆论的潮流，也可能掺杂在其中。）