法和经济学简史

　　* 本文摘自中信出版集团即将出版的《信念共和国》（The Republic of Belief）一书，文字略有调整。

法律及其执行：一些案例

　　目前法和经济学的主要部分均存在断层线问题，这也解释了为什么该学科尽管取得了不少重要进展，但仍在一些根本方面受到挑战。法和经济学的缺陷在发展中经济体表现得尤为突出。在许多发展中经济体，经常发生的情景是纸面上的法律很好，但并未在实践中得到执行。对此的已有解释通常是腐败、治理不善以及某些政治领导人缺乏决心等。但我要关注的是一个理论概念上的不足，这一不足存在于当代法和经济学的绝大部分领域以及该学科的思考方式之中。

　　然而，最大的挑战不在于发现问题，因为问题一旦被指出便不难掌握，而在于发现了学科的根本缺陷后还能重建学科。这是一项艰巨的任务，它需要我们利用多个学科——法律、博弈论、经济学和哲学——来解决一些有趣的逻辑难题（logic puzzles）。但是，如果能为法和经济学学科构建一个新的理论概念框架，也会带来丰厚的回报，它将帮助我们制定出更好的法律，使其具有良好的经济效果,法律的执行也更为有效。

　　法和经济学的新古典模型可以追溯到很远的历史。但在20世纪60年代，罗纳德·科斯（Ronald Coase, 1960）、奎多·卡拉布雷西（Guido Calabresi，1961）和加里·贝克尔（Gary Becker, 1968）等人为建立该学科的正式框架迈出了开创性的步伐。（*1.另见Becker and Stigler（1974），Cooter and Ullen（1988），Baird、Gertner and Picker（1994），Mercuro and Medema（1997），Schafer and Ott（2005），Persson and Siven（2006），以及Paternoster（2010）。关于犯罪和惩罚更广泛背景的精彩讨论，请参阅Murphy and Coleman（1997，第3章），这些探讨已经超越了法和经济学的层面，进入法律哲学和伦理学的领域。)贝克尔（1968）建立了一个完整的犯罪和惩罚模型，在特定意义上，此项工作对于后来的研究及其相关的批评，都至关重要。贝克尔并未试图创建一个法和经济学的框架，而是简单地使用了新古典经济学的一些主流方法，分析如何更好地控制犯罪行为（包括腐败）。但由于他建立的是一个数学模型，从而形成了一个正式的理论框架，并迅速成为法和经济学的模板。

　　法律学者和法律哲学家长期以来一直试图将法律的作用、合法性的基础以及遵守法律的原因等内容概念化和形式化，其中最著名的是哈特（HLA Hart，1961）。我评论并借鉴了其中的一些论述，但我从事的法和经济学研究，主要遵循贝克尔、卡拉布雷西和科斯运用的方法，而非哈特。因此，在下一节中我将抱着谨慎的态度，介绍经济学家构建的犯罪和惩罚模型背后的核心思想。要了解这些思想，从实际问题入手是有益的，我们将从现实中法律执行的一些具体问题开始。

　　这些例子主要来自我作为印度政府顾问的经历。印度目前有一个受到法律支持的庞大计划(*2.2013年的《国家粮食安全法案》（National Food Security Act，2013），通常被称为《粮食权利法案》（Right to Food law），是印度政府保护穷人免受粮食市场极端变化冲击的政策措施之一，也是印度粮食政策的重要组成部分，这一话题一直受到经济学家的关注（参见Johnson，1976）。)，试图为所有公民提供最低限度的粮食，当然政策针对的目标是穷人。该计划运行如下：首先，印度政府根据1964年颁布的《粮食公司法案》（Food Corporations Act，1964）成立了一家国有企业，即印度粮食公司，该公司负责执行政府的粮食价格稳定计划和面向穷人的粮食补助计划。其次，印度政府每年都会宣布粮食的“最低支持价格”（Minimum Support Price），农民有权根据这一价格向印度粮食公司出售粮食。通常情况下，最低支持价格设定得足够高，以吸引农民将粮食卖给政府。在一些邦，有着大量收购农民粮食的窗口，粮食收储系统运转有效。政府，即印度粮食公司在这个计划下收购了大量的大米和小麦。但也有一些邦和地区，粮食的最低支持价格纯粹只是个概念，因为这些邦和地区根本没有相应的窗口收购农民希望出售的粮食。[*1.因为粮食的最低支持价格设定得相当高，所以农民向政府出售粮食的积极性很高，但印度政府通过在大部分区域内不设置粮食收购窗口的方法，有效地控制收购粮食的过剩量（尽管政府中没有人会承认这一种策略），这的确给印度不同地区的农民造成了不公平的竞争环境，因而值得批评，但这并非是我在这里想挑战的内容（当然，我作为政策制定者曾经想对此加以改革，但未获成功，在此仅做说明）。]

　　政府收购粮食的一部分会被存储起来，作为未来粮食短缺时的储备；但绝大部分是准备出售给那些获得政府颁发的“贫困线以下”证书的家庭。对“贫困线以下”家庭的粮食销售通过所谓的“配给商店”或“公共分销商店”来完成，在全国大约有50万家这样的商店。印度粮食公司以低于市场的价格将粮食出售给上述商店，并下达指令，要求商店以低于自由市场的预定价格，并根据政府规定的每个家庭所得的最高限额将粮食出售给贫困家庭。该计划依据的理念是：贫困家庭有权利以低廉的价格获得一定数量的基本食物。印度在这个配给体系的设计上付出了巨大的努力，目前该配给体系已经成为议会颁布的法律的一部分。

　　然而，问题是这部法律被大规模地违反。有很好的研究表明：过去10年中，在该体系下由印度粮食公司配给的粮食中，有43%—54%的漏出（Jha and Ramaswami, 2010；Khera，2011）。有意思的是，不同类型的粮食还存在着不同的漏出方式，小麦的漏出率要明显高于稻米。在2004—2005年，粮食的总体漏出率达到了峰值，当时为贫困家庭发放的粮食中有一半以上没有分配给这些家庭。从那以后，情况虽然有了好转，但也只是略有改善。这些都是非常值得关注和分析的问题，但我在此的目的只是表明这部善意的法律如何被肆意践踏[*2.我在《政策制定的艺术》（中文版见中信出版集团，2016年）中曾详细描述和评论了这一粮食配给体系。]，它本可以对印度社会产生巨大的积极影响。

　　问题不在于法律的意图，而在于其设计。大量的粮食漏出意味着穷人没有得到应有的援助，国家的财政平衡却因此承受了本不应有的压力。法律执行如此糟糕，直接原因显而易见。因为在这部法律以及之前的粮食配给计划中，均假设政府官员和相关的参与人员，包括配给商店的店主，都会勤勉有加、一丝不苟地实施计划，即从印度食品公司得到补贴的粮食，然后主动把它卖给穷人。[*1.腐败与治理结构甚至政治制度之间的关系已得到广泛探讨（例如参见Mishra，2006；Rose-Ackerman and Palifka，1999 \[2015\]）。对我而言，在印度的经历特别具有启发意义，因为这是我从学术文献中所获知识的一种实际应用。]不幸的是，个人理性起了干扰作用。许多店主从印度粮食公司那里得到粮食，却将其中一部分拿到公开市场上销售，以获得更高的价格；与此同时拒绝穷人领取补贴粮食，谎称粮食已经卖完或是还没有运达。此外，也有将粮食掺假卖给穷人的情况。

　　作为政府顾问，我曾提出相应的解决方案。对配给商店店主的行为至少要有更为现实的认识，所以不能把补贴的粮食直接交给他们。相反，粮食补贴应该以补贴券、粮食券或纯现金的形式直接发给穷人，作为他们的一项小额基本收入；然后允许他们从私人商家那里购买所需的粮食。通过将补贴发到穷人手上，并让他们直接从农户或私人供应商那里购买粮食，上述漏出就会大大减少。而且，如果穷人发现街角商店卖的是掺假粮食，他们就会去别处购买。的确，他们可能不会把得到的所有补贴都花在粮食上，但至少这些补贴是给了穷人，而不是像现在这样给了配给商店的店主。

　　当然，我目前关注的问题与上述方案并无密切关系。我想指出的是，发展中国家的法律往往效果不好，并非因为其意图欠佳（当然，无论是富国还是穷国，有时候都会存在这样的法律），而是法律往往并未得到有效的执行，此外干预政策的不当设计也加剧了问题的严重性。

　　我在印度参与的另一个与法律相关的辩论，是与1988年印度颁布的《防止腐败法案》（Prevention of Corruption Act, 1988）有关，它涉及如何用法律处理贿赂行为。这一立法之所以令人关注，因为从某种意义上说，它是一部元法律（meta law），即一部确保其他法律得到更好执行的法律。它试图通过控制贿赂政府官员的行为，堵住其他法律执行中可能产生的漏洞。我的观点是，一旦不仅对普通公民，也对公务员（如警察、治安法官和其他政府官员）采取更为现实的看法，这部法律就是有缺陷的。关键问题在于：根据这部法律尤其是第12条，行贿者和受贿者将被视为犯有同样的罪行、接受同等的惩罚。[*2.值得指出的是，根据该法第24条，行贿者确实也有免于处罚的豁免权。然而多年来，这一豁免条款实际上只适用于那些想对官僚实施诱捕行动而故意行贿的人，他们主要是一些记者（Basu，2011b），除此之外根据印度法律，行贿者和受贿者同样有罪。]如果相关条款能做出修改，打破行贿者和受贿者同等有罪的规定，而只惩罚受贿者，那么面对贿赂的官员就会预期行贿者更有可能揭发，如此他们一开始就不敢接受贿赂。[*1.关于贿赂和执法者弱点的议题，已有大量文献探讨过，其中一些参见Basu、Bhattacharya and Mishra（1992），以及Basu、Basu and Cordella（2016）。最近也有分析贿赂问题和执法者动机的研究，参见Pethe、Tandel and Gandhi（2012），Abbink、Dasgupta、Gangadharan and Jain（2014），Spengler（2014），Suthankar and Vaishnav（2014），Dufwenberg and Spagnolo（2015），Oak（2015），Dharmapala、Garoupa and McAdams（2015），以及Pani（2016）。]这部法律与我们想探讨的话题密切相关，它提醒我们如果模型没有合理地刻画国家工作人员的行为，就会带来严重的问题。(*2.在此处及以后详细讨论这个话题时，我不会涉及关于贿赂和其他形式的腐败能否提高经济效率的争论，有些经济学家对此持肯定的观点。无可否认的是，在某种直接意义上腐败确实可能有助于经济效率的改善。然而我的观点是：贿赂和腐败严重损害了一个社会的道德形成并导致信任受到侵蚀，因此对经济、社会和政治生活的质量极其有害。当然，对于如何更好地遏制贿赂和其他腐败的争议，无需在此做出定论。)

　　通过对每一部立法的深思熟虑，我们或许能够做得更好，正如上文所述的印度政策显示的那样，可以努力确保穷人有足够粮食或者有效地遏制贿赂行为。但更重要的是，这些案例让我们意识到，目前标准（或新古典）的法和经济学概念及模型还存在根本性缺陷，而且这种有缺陷的思考方式已经渗透到现实的政策世界。因此，在我描述上述缺陷并试图纠正它之前，简要介绍一下法和经济学的标准模型是有益的。

传统的法和经济学简介

　　如果有人打算创办一家新企业，开采有价值的矿物，例如煤矿开采。首先，假设煤矿开采是一种合法活动。因此，此人要考虑的仅仅是这项投资是否具有商业价值。经济学的标准模型告诉我们，这位投资者会大致计算在地下发现有价值煤矿的概率以及他能得到的预期收益；再估算企业的总成本，包括租用或购买必需的设备、劳动力成本等。将前者（预期收益）减去后者（总成本），就可以得到此项投资的预期净回报或净利润，可称之为净回报B。标准的经济学理论告诉我们，如果B是正数，企业家就会考虑开展此项投资；否则，就会放弃这个煤矿项目。

　　上述理性决策的标准观点存在着缺陷，有一些批评正确地指出了这些缺陷，挑战了上述理论中隐含的人们天生自利、具有无限计算能力等假设，并质疑人们的行为是否仅仅由利润驱使，或者也会受到嫉妒、耻辱、追求社会地位等其他因素的影响。这些批评非常重要，并产生了大量的研究文献[*1.对此有大量的文献，从Veblen（1899）到Sen（1973，1997），Tversky and Kahneman（1986），Basu（2000），Bowles（2004），Thaler and Sunstein（2008），Gintis（2009）， Kahneman（2011），Benabou and Tirole（2006），Ellingsen and Johannesson（2008），World Bank（2015）。]，但这并非我关注的焦点。我认为理性行为者的假设是有效的。在后面的章节中，我会对更为宽泛的人类行为问题进行一些探讨。

　　接下来，假设政府出于对环境的考虑颁布了一部新法律，宣布煤矿开采非法。它进一步规定，任何被发现采矿的人将被罚款F元。给定警察的水平和治理的能力，假设采矿行为被抓住的概率是p。由于新法律的实施，上述投资者或企业家的计算和决策条件也会改变。我们很容易得出，煤矿项目要想继续，当且仅当：B>pF

　　也就是说，当采矿的净收益超过相关违法活动的预期成本，简言之即“犯罪”成本时，采矿行为将会继续。这也意味着，如果政府急切地想要制止这种犯罪行为，它必须选择p和F，使得(*2.为了严格起见，需要指出我对人们的偏好做了一个武断的假设：在收益相同的条件下，在犯罪和不犯罪之间，人们倾向于选择后者。我想补充的是，我希望事实的确也是如此。)

　　B≤pF

　　以上是法和经济学标准模型最简要的描述。该模型在很多方面为我们提供了很好的帮助，给出了一些新的见解，并使我们摆脱了一些关于法律遵从性问题的模糊解释，早期的法律学者曾对此问题争论不休。模型明确地告诉我们，政府可以有两个行动变量以控制犯罪，即p和F。在大多数情况下，对一国而言提高p比提高F的成本更高。因为要提高p，即增加抓住罪犯的可能性，就会需要更多的警察、更多的监控摄像头、更多的警用吉普车，等等。而提高F只需一个一次性的决定，即一旦罪犯被抓和被判有罪，就会被罚款F元。

　　因此，从上述新古典模型能得出一个有趣的政策含义：如果我们将F提到很高来匹配较低的p值，这样对犯罪控制是最有效率的。换言之，虽然被抓的机会很小，但如果被抓，惩罚就会很重。然而，我们能将此策略运用到何种程度是受到限制的。例如，许多国家，尤其是所有的工业化国家，都会制定有限责任的法律，以防政府施加过高的惩罚。(*1.如果缺乏这样的限制，我们就会遇到Stern（1978）强调的问题。)在一些贫穷国家，即使没有这样的法律，但是因为罪犯可能非常穷困，也难以承担超过一定水平的罚金。当然我们还可以拓宽一下惩罚的内容，F不仅可以是金钱上的罚款，也可以是施加酷刑，这样F就能被提到很高的水平。然而在大多数社会，类似的做法在道德伦理上是不可接受的。因此，F必定会有一个上限。在这种情况下，政府必须提高p以确保pF至少与B一样大。简言之，即使利用这种简单的模型，也产生了丰富的研究和政策议题；无论是讨论相关的政策设计还是对此的批评，均已有建构在这个模型基础上的大量文献。(*2.例如参见Rose-Ackerman（1975），Lui（1986），Klitgaard（1988），Bardhan（1997），Mishra（2006），Borooah（2016），Burguet、Ganuza and Montalvo（2016）。)

　　上述模型受到了一些直接的批评，这反过来也帮助了模型的充实和完善。例如有研究指出，只要一个人受到处罚或罚款，就有可能进行贿赂。因此，上面的犯罪控制方程可能并不像乍看起来那么简单。罪犯一旦被抓，可能会试图与警察讨价还价、进行贿赂。因此，我们需要一种贿赂理论，用以确定怎样一开始就阻止犯罪。而且，如果贿赂是一种犯罪，那么肯定会有人为了逃避贿赂罪的惩罚而行贿，这显然是一个二阶问题（即如何防止为了避免贿赂罪的惩罚而进行的贿赂）。按照同样的逻辑以此类推，又会产生三阶问题、四阶问题，五阶问题，等等。(*3.Cadot（1987）,Basu、Bhattacharya and Mishra（1992）探讨了上述观点和相关的争议。另参见Mookherjee and Png（1995），Hindriks、Keen and Muthoo（1999），Rahman（2012），Chernushkin、Ougolnitsky and Usov（2013），以及Spengler（2014）。)

　　简而言之，对上述问题的探究能够产生非常多的研究议题，但我并不打算对这些议题进行一一分析，而是要着重为贝克尔模型构建一些概念基础，这些概念常常是隐含的，并被人们不假思索地加以接受。贝克尔模型建立在主流新古典经济学的基础上，它通常假定人们有清晰界定的偏好或效用函数，满足诸如人是自利的这样的标准假设，并断言每个人都倾向于消费更多。此外，它还假设个人的边际效用递减，或者更一般地说，具有凸性的偏好。

　　在上述情形中，道德并不起作用。上述模型中的罚款，就如同商品或服务的一个价格。(*1.从道德哲学的角度对在法和经济学中运用此类理性行为人模型的批判，参见Nussbaum（1997）。)如果你被告知，车速超过65英里/每小时是非法的，若超速将被罚款100美元。那么在贝克尔模型中，这就等于说，超过65英里/小时速度行驶的价格是100美元。贝克尔模型表明这是一个强有力的假设，可以帮助我们深入理解人类的许多行为。(*2.法律之所以有效，仅仅因为它是一项由制裁支持的命令，这通常被称为“强制性法律理论”（imperative theory of law）。对此的详细评述，请参见Raz（1980）。)正如库特（Cooter，2000，第1577—1578页）指出的，经济学家与法学家使用的方法截然不同，“几乎所有经济学家……都是道德实践的怀疑论者……对法律开展经济分析的成功，展示了怀疑论模型的力量”。这也就是所谓的耶鲁学派和芝加哥学派之间的方法差异（参见Calabresi，2016；Sunstein，2016）。就卡拉布雷西而言，虽然其关于风险和侵权法的著名论文（Calabresi, 1961）仍存在争议，但他应属于芝加哥学派。(*3.卡拉布雷西（Calabresi，1961，第502页）援引Pigou（1920）的说法，这是“资源分配的正当性”问题，并指出“解决问题的基础是某些确定的基本伦理假设。其中之一，也许是最重要的，是大体上人们知道什么对自己最好”。如果卡拉布雷西是一位新古典主义经济学家，那么他就不会使用“大体上”这个词。)

　　需要指出的是，虽然我们把法律的经济方法起源与加里·贝克尔和其他几位20世纪60年代学者的工作联系在一起，但它的根源还可以向上追溯到法律哲学家汉斯·凯尔森（Hans Kelsen，1945）的研究。凯尔森强调，法律是对国家官员而非普通公民的直接命令，国家官员被要求在普通人违法时采取某些特定的行动（如惩罚）。而正是这种对官员行动的恐惧，使得普通百姓会依法行事。

　　在某种程度上，博弈论比新古典经济学的要求要低，因为它并不需要假设人们具有消费更多的无止境欲望。但它假设每个人都被赋予了外生给定的偏好、效用函数或回报函数，人们会选择行动以使其最大化。

　　上述基本假设受到了各方批评，例如对自利的假定，如果人们的确如此，那么飞机上发布的安全声明：“在帮助他人之前，应该先将自己的氧气面罩戴好”，将是多余的。幸运的是，事实并非如此。教科书中关于人类理性的其他观点，如一致性，也受到了质疑，如森（Sen，1993）的一些著作以及最近来自行为经济学的挑战（参见World Bank，2015）。法律学者已经意识到了这一点。例如有研究发现：人们在纳税时并不总是遵循纯粹的成本收益分析（Posner，2000），他们指出，“虽然基于自利原则的经济学模型预言，人们会倾向于按照低税率纳税，但在一些国家如美国和瑞士，人们实际纳税的税率却高得多”（McAdams，2000，第1579页）。我需要补充的是，新古典经济学家不必为这些发现感到沮丧，因为在许多发展中国家和新兴经济体，甚至一些发达国家（在此最好不提及它们的名字），个人确实表现出高度的理性，他们纳税的实际税率与新古典经济学预测的一样低。

　　这些批评非常重要，其中很多来自法律学者。(*1.卡拉布雷西（2016）最近的反思性论文是一个很好的例子。Posner（2000，第3章）超越了自利假设，讨论了激励人们如何行为的一系列动机。当然，行为经济学对此也有非常丰富的讨论。)但我个人认为，新古典主义的假设虽然并不总是有根据的，却发挥了有益的作用。我首先想指出的是：主流法和经济学存在的断层线问题是其内部的不一致性，而不是这些假设。我认为其一部分的分析与另一部分的假设产生了矛盾。换言之，我在尝试一种更为直接的批评。我不是在质疑这些假设，而是表明这些假设综合起来是不一致的。或者说，无论你的意识形态是什么，无论对犯罪和惩罚采取怎样的规范立场，你都难以捍卫新古典主义的法和经济学模型，因为它有内在的缺陷。

　　基于以上论述，我将保留主流新古典经济学关于人类理性的假设。当然，除了对新古典方法假设的质疑外，也有人质疑这一方法的其他根本特征。根据对新古典经济学方法论背景的讨论，以下我将论述如何把新古典或芝加哥方法应用于犯罪和惩罚问题。(*2.在本文中，我对“传统法和经济学方法”、“新古典方法”和“芝加哥方法”三者不加以区别，可以互换使用。)

　　法律为什么可能改变人类的行为？如上所述，在新古典法和经济学方法下，法律被认为是通过影响个人从不同行为中获得的回报来改变其行为的，这也正是法和经济学领域的经济学者和实践者所持的假设（参见Baird、Gertner and Picker，1994）。麦克亚当斯（McAdams，2000，第1650页）指出：“国家通过施加责任或惩罚，改变个人行为的回报，从而使得遵守而不是违反法律成为人们的首要选择。”在书的同一页，麦克亚当斯继续论述：“法律影响个人行为因果链的第一环，是正式的法律制裁条款提高或降低了个人行为的成本。”用博弈论的术语，即法律改变了博弈的规则。因为博弈是由其规则描述的，所以我们也可说法律改变了人们所参与的博弈。(*1.Robson（2012，第1页）在其书中清晰地阐述了现代法和经济学的核心思想：“法律规则通过改变参与市场过程的个人所面临的激励，来影响市场结果。”)

　　上述看法与法律学者的观点非常一致，尤其是那些跳出自然法学派的学者，他们可被广义地称为法律实证主义者。对他们而言，法律就是一系列的行为规则，通常由国家或统治者发布，并规定了人们违反规则可能受到的各种惩罚和制裁。与早期学者杰里米·边沁（Jeremy Bentham）和约翰·奥斯丁（John Austin）的著作相呼应，近代的法律学者和哲学家如凯尔森（1945）和哈特（1961），更清晰明确地表述了这些观点，通常也使相关的研究更为完善，例如哈特对主要规则和次要规则的区分。需要强调的是，哈特比早期的学者走得更远，尤其是他超越了奥斯丁的命令理论（command theories）和凯尔森的基于制裁的理论（sanction-based theory）。(*2.然而，从Lacey（2004）为哈特所写的精彩传记中，我们可以有趣地发现，根据哈特的笔记，他的论述更多是从基本原理出发，而不是针对早期学者的回应，这与我们直接阅读他1961年的经典著作获得的印象正好相反。)正如一些评论家指出的，由法律和社会规范引导的行为是否应有区别，哈特留下了一些模棱两可的判断。

　　将法律视为一系列的博弈规则，类似的观点也可溯源到一些更早的思想流派，不过也有些严谨的学者并不认为法律实证主义和早期理论（如自然法）之间存在明显的区别（例如参见Starr，1984）。

　　在我继续展开论述之前，有必要向读者介绍博弈和博弈均衡的基本概念，因为这些概念被不断提及，所以尽可能地排除相关的歧义非常重要。

博弈论简介

　　博弈论是对互动理性的分析。当你做出理性决策时，如果对方是自然界事物，例如机械装置，它们并没有能力或意图想胜过你；但如果对方也像你一样具有理性，并试图猜测你可能会做什么，两者之间显然有着明显的区别。因此，当你根据天气预报并决定是否要带雨伞时，你通常不必担心大自然会根据你是否带伞而改变它关于下雨的决定。但1962年当苏联在古巴部署弹道导弹，约翰·肯尼迪在谋划他和美国应该做些什么的时候，他肯定思考了很多赫鲁晓夫在想什么。毫无疑问，赫鲁晓夫也在考虑肯尼迪会怎么想。这是一个典型的博弈论问题。(*1.需要澄清的是，即使是在天气预报的例子中，关于穿什么衣服的决定也可以被认为是一个博弈论问题，尽管有些琐碎，但本质上看这是一种单人博弈。从这个意义上说，标准的个人决策只是博弈论的一种特例。)用奥曼的话说，即“互动决策理论”，它也许是对博弈论这门学科更准确的称呼（Aumann, 1987, 第2页）。

　　在博弈论的场景中，你可能犯的最大错误就是没有考虑其他参与者的理性。几年前，我为《科学美国人》（Scientific American）杂志撰稿，面对的是一些可能不熟悉博弈论的读者，我用在印度听到的一个故事说明博弈论的中心思想（Basu，2007）。有一个卖帽子的人，从一个村庄赶往另一个村庄，在途中他感到昏昏欲睡，就把帽子集中放在一棵阴凉的树下，睡着了。当他醒来时，沮丧地发现所有的帽子都不见了。原来是一群猴子把帽子都带到树顶，并戴上了帽子。他又气又急，摘下自己的帽子扔了出去。众所周知，猴子是最好的模仿者。很快，所有猴子都扔下了它们的帽子。卖帽人松了一口气，捡起帽子就走了。

　　四十年后，他的孙子也成了一个帽商，在带着货物从一个村庄赶往另一个村庄时，也想打个盹，于是他放下帽子就睡了。当他醒来时，发现猴子们已经把帽子都带到树顶，并戴上了它们。他很绝望，该怎么办呢？然后他就想起了爷爷的故事。他松了口气，脱下自己的帽子扔了出去。然而，这时有一只猴子蹿下树来，捡起帽子紧紧地夹在胳膊下，然后走到卖帽子的人跟前，狠狠地拍了他一巴掌，说：“你以为只有你有爷爷吗?”

　　这个故事的寓意揭示了博弈论思维的本质。当你在做出自己的决策时，也要考虑别人的理性。许多政府福利项目出了问题，正如我们在前文看到的，是因为政府在设计这些项目时，没有考虑那些实施项目的代理人也有自己的想法和愿望。例如在印度粮食配给体系中的那些配给商店的店主。

　　形式上，要描述一个博弈，需要定义三个构成要素。(*2.我在此描述的是一种正常形式或策略形式的博弈。在本书的第四章，我们还会遇到扩展形式（extensive-form）的博弈并对其进行简要的介绍。对博弈论和法律之间的互动更为全面和杰出的研究，参见Baird、Gertner and Picker (1994)，他们探讨了扩展形式、不完全信息以及合作讨价还价理论等议题。的确，一个有趣的问题是：为什么合作博弈没有像本节所述的非合作博弈那样被广泛应用，可参见Maskin (2016)以了解要改变这种状况我们需要跨越的一些障碍。)首先，我们需要指定一组参与者；其次，对于每个参与者而言，都有可行的策略或行动集，参与者必须从中选择其一；最后，一旦所有参与者选择了各自的行动，每个参与者都会得到相应的回报或收益，这就是所谓的回报函数。每个参与者的目标，就是做出选择以最大化自己的收益，这种最大化自身收益的行为被称为理性行为。大多数博弈论模型建立在假设所有参与者都是理性的基础上，并假设这种理性已经成为参与者的共同知识，这意味着所有参与者都知道“所有参与者都是理性的”；所有参与者都知道“所有参与者都知道‘所有参与者都是理性的’”；所有参与者都知道（所有参与者都知道“所有参与者都知道‘所有参与者都是理性的’”），我相信读者肯定希望就此打住，但基本上所有这些高阶假设都必须成立。（*1.上述高阶假设并非总是成立的，关于理性的共同知识的存在或缺失往往会造成关键性的差异（Aumann，1976；Basu，1977）。关于高阶知识在不同领域的作用，有一些引人入胜的论述。参见Rubinstein（1989），Morris and Shin（1998），Gintis（2010）。）

　　一个博弈的均衡结果是什么？有许多不同的方法来回答这个问题，我们将在后面遇到其中的一些类型。但这里有必要介绍一个可能是应用最广泛的概念——纳什均衡。在博弈中，每个参与者都有一组策略或行动可供选择，如果没有一个参与者可以通过单方面地偏离他（或她）的选择来得到更好的回报，即为纳什均衡。

　　让我用一个例子解释刚刚引入的概念，这可能是博弈论中最著名的例子，即“囚徒困境”博弈。这个博弈的名字来自一则寓言故事，囚徒困境博弈中有两个参与者——参与者1和参与者2，每个参与者必须在行动A或B之间做出选择。行动代号的命名以有助于记忆，稍后将指出B代表“不好的行为”（bad behavior）。每个参与者通过选择所获得的回报，参见博弈1中的表格或回报矩阵。参与者1在行之间选择，参与者2在列之间选择，回报矩阵中显示了他们各自的收益。在回报矩阵中的每对数据，左边的数字是参与者1在行之间选择所获得的收益，右边的数字是参与者2在列之间选择所获得的收益。我通常以美元作为收益的单位，但也可以用“幸福”或“效用”为单位。

　　很明显，在囚徒困境博弈中，理性参与者最终选择的结果将是（B，B），因为无论对方选什么，选择B对每一个参与者来说都是更好的策略。这个结果对于双方来说都是悲剧性的，因为他们本来有机会都获得7美元，但最终却都只获得了2美元。这是一个熟悉的故事，我们在生活的许多不同领域和场景中都会遇到，例如“公地悲剧”，即每个人都利用自然环境满足他（或她）的个人利益，但最终导致了集体的糟糕行为，比如过度放牧。在朗西曼和森（Runciman and Sen，1965）对卢梭的“共同意志”（general will）的解释中，我们也看到了同样的观点。

　　很容易看出（B，B）是一个纳什均衡。因为参与者1如果单方面偏离B而选择A，那么他（或她）获得的收益就将从2变成1，所以参与者1不会因改变选择而获得更好的回报。参与者2面临的情景也是一样。

　　囚徒困境博弈也存在一个问题，虽然其纳什均衡的结果极其令人信服，几乎没有人会对此提出异议，因为无论对方做什么，你都会选择B。但这个问题的博弈论特征或参与者在做决策时的互动本质，就不那么明显了。为了说明这一点，让我介绍另一个相关的博弈，即“旅行者困境”博弈（Basu，1994b），它也是一个有用的例子。

　　旅行者困境博弈也来自一个故事，两位旅行者从一个偏远的岛屿度假归来，每个人都购买了同样的乡村纪念品，他们发现这些物品在托运中都被航空公司损坏了，因此要求赔偿。航空公司经理给出了这样的赔偿规则（*1.在最初的故事中，为了暗示接下来会发生什么，这位经理被下属描述为一个“公司老手”，即指“一个有些狡猾的人”。)：因为不知道这些特殊纪念品的真实价格，所以让每一位旅行者写下一个数值，即从2到100的整数。如果两人写的是同样的数值，经理会将其作为真实的价格，然后以美元赔偿他们。如果两人写了不同的数字，经理会以较低的数值作为物品的真实价格加以赔偿。与此同时，还有额外的奖励和惩罚，写较低数值的人将获得额外的2美元（作为诚实的奖励），写较高数值的人将被扣去2美元（作为惩罚）。因此，如果两人都写97，则每人将获得97美元。如果旅行者A写97而B写50，A将获得48美元而B将获得52美元。

　　容易得出上述博弈唯一的纳什均衡是（2，2），即A和B都会写下2。很明显在旅行者困境博弈中，参与者只要可能，总是最好选择一个恰好低于对手所写的整数。因此，没有人可以通过偏离原先选择而获得更好回报的唯一一对策略，是两人都写2。

　　这个博弈事实上建立在极其严格的推理上，每个参与者都是理性的，理性也作为参与者的共同知识，根据这个共同知识，双方都会预料到（2，2）的结局。为了理解这个结果，先假设从旅行者写下100开始。如果两人都写100，那么每人都将获得100美元。这是一个不错的赔偿结果（毕竟乡村纪念品其实很便宜）。然而，一个旅行者很快就会发现，如果两人都写100，那么自己最好是换成写99，因为那样就会得到101美元。然后，因为两位旅行者都是理性的，另外一位也会换成99。在这种情况下，两人都会得到99美元。但是更进一步，又有一位旅行者会写98（因为这样会得到100美元），同样另一位旅行者也会这么做。这个逆向推理的逻辑是残酷的，最终的结果是两个人均只能得2美元。

　　另一种推理方法如下：首先，很容易看出100不是合理的选择，因为无论对手怎么选，你写99的所得至少与写100的所得一样多，在对手的某些选择下实际所得会更多。因此，由于两位参与者都是理性的，所以双方都会把100从可选的策略中去掉。接着，一旦你划掉了100这个选项，又容易看出写98会比写99更好，这样你又会去掉99这个选项。同样，这也是个残酷的过程，最终只会导致一个可能的结果（2，2），这就是“迭代剔除劣势策略”的逻辑，在这种推理方式下，所导致的最终结果与上述“合理化”逻辑是一样的（Bernheim，1984；Pearce，1984）。

　　上述的推理过程不足为奇，因为旅行者困境博弈就是被设计成使所有的形式推理都得出相同的预测结果，这样做是为了故意造成与人们直觉的冲突（Basu，1994b，2007）。(*1.在哲学家Martin Hollis（1994）设计的类似博弈，即姜饼博弈（Gingerbread game）中，其哲学含义更为明显。)有大量实验和理论文献表明，这些形式化的博弈论预测是不正确的。(*2.例如参见Goeree and Holt（2001），Wolpert（2008），Pace（2009），Gintis（2009），Arad and Rubinstein（2012），Manapat、Rand、Pawlowitsch and Nowak（2012），Capraro（2013），Morone、Morone and Germani（2014）。)例如，逆向推理的论证，假设理性是两位参与者之间的共同知识，即A知道B是理性的，B也知道A是理性的；A知道（B知道A是理性的），B也知道（A知道B是理性的），以此类推，无穷无尽。对这种假设的合理性我们可提出质疑，稍后我将有机会探讨其中的一些问题。

　　上面两个博弈，让我们马上意识到了对法律的需要。市场这只“看不见的手”，据称会使个人的自利行为导致社会的最优结果，显然在这里并不成立，因此促使我们采用法律之手。（*1.在形式化的理论中，社会最优可被精确地定义，它采用的是最早由帕累托提出的概念，即“帕累托最优”。在一个“帕累托最优”的社会，不存在任何机会，能使一个人的处境变得更好的同时而不让其他人的处境变得更糟。）如果仅依据上述新古典的法和经济学方法，该如何做到这一点呢？这里的思路是利用法律使社会转向更好的结果。正如麦克亚当斯（2000，第1650页）指出的：“通过对个人施加责任或惩罚，国家法律改变了人们的回报，使得合作而不是背叛成为占优策略。”（*2.在Coase（1960），Calabresi（1961），R Posner（1977）和Schauer（2015）的作品中，也有类似的观点。）

　　很容易看出，法律干预如何能在囚犯困境博弈中发挥作用。（*3.囚徒困境博弈的核心任务之一，是显示政治机构如何发挥作用以使人们能够真正实现自身的利益。正如Swedberg（2005，第83页）所言：“囚徒困境博弈可以被看作一个例子，表明我们可以改变现有的制度安排，以便参与者能够最大化他们的个人利益。”他清楚地意识到了法律的特殊作用，继续补充道：“在这个特殊的例子中，现有的制度安排就是美国的司法体系。”）假设国家通过了一部法律，规定行动B是违法的，任何选择行动B的人都必须支付相当于2美元的惩罚。这一惩罚可以是实际罚款2美元，或者囚禁一段时间以造成相当于2美元的痛苦。这样就改变了原有的博弈，相应的回报矩阵参见博弈2。新的博弈与原先的唯一区别是，当有人选择行动B时，他的回报将被扣除2美元。

　　在新博弈中，选择行动A成了占优策略，无论对手选什么，你选A的所得都比其他选择要好。这样博弈的结果就被改变了。参与者获得了更好的社会结果（A，A），这也是一个纳什均衡。如果听任一个社会发展，可能会陷入一种糟糕的结果，而法律则可以使其偏离原有的轨道，以达到一种更优的社会处境，这就是法律最重要的目标之一。（*1.这并非法律的唯一目标，事实上还有正义、公平和个人自由等相关的其他目标，这些目标有可能与前面所述的“帕累托最优”目标相冲突，其中一个最著名的例子是“自由悖论”（Sen，1969）。参见Gaertner、Pattanaik and Suzumura（1992）。）

　　对于旅行者困境博弈，也可以进行类似的法律干预。例如制定一项法律，规定如果你选择任何数字n，则必须支付（100-n）的罚金。换言之，如果你选择100，不需要支付任何罚金；而你所选的数字越小，支付的罚金则越多。如果将此罚金加到旅行者困境博弈中的参与者回报上，很明显这一改进的旅行者困境博弈会有一个新的均衡结果，参与者会选择更大的数值，即（100,100），它现在也成了一个纳什均衡。

　　这些例子说明了法和经济学的传统观点，法律的作用是改变社会进行的博弈，在囚徒困境博弈中，博弈1就被改变成了博弈2。正如上面的例子所示，法律能够使社会达到一个帕累托更优的结果，或者是一个更公平公正的结果，或者是其他任何我们想要追求的结果。简而言之，这就是传统、新古典或芝加哥的方法。正是此方法中简洁和清晰明了的模型，使得模型方法脱颖而出，迅速成为开展法和经济学研究甚至政策设计的试金石，它赋予了法和经济学应有的地位。

“纸上的墨迹”批判与新古典谬误

　　传统新古典方法具有刚才提到的所有优点，但仍然存在根本的缺陷。要认识到这一点，考虑一部由国会或其他机构讨论并出台的新法律。一旦新法律颁布，事实上只不过是一些纸上的墨迹，或者在今天的世界中，则是一些电子文件。它通常规定：你不应该做诸如此类的事情，如果你这样做，将被罚款或被判入狱，等等。

　　由此产生的问题是：为什么仅仅是纸上的墨迹，也会影响个人能够选择的行为和获得的回报。如果每个人都选择忽略纸上的墨迹，做与之前同样的事情，所得的回报事实上并不会改变。举例而言，如果每个人选择的行为与没有法律的情况下完全一致，显然他（或她）的回报与原先也是相同的，因为仅仅是在纸上的一些文字，并不能马上影响人们的回报。因此，考虑到我们一般认为人们能够自由地选择行动策略和相应的回报，那么简而言之，新法律并不能马上改变人们所参与的博弈。这就是我指出的“纸上的墨迹”问题（Basu，1993）。（*1.事实上在某些情况下，法律既不存在数字形式，也不存在书面形式。我们发现了12世纪Ranulf de Glanville记录的一个有趣观察：“虽然英国的法律并未记录成文，但将它们称为法律似乎也不荒谬，这些法律旨在解决庭前会议上提出的一些问题，由大臣建议、获得国王的首肯。就此而言，那些能够愉悦国王的，就是法律。”）（Hall，2002，第2页）传统法和经济学的模型显然需要对此做出回应。

　　为了更深入地理解这个问题，我们要回到关于犯罪与惩罚的贝克尔模型。首先，为什么我们会认为博弈被新法律改变了？这可能是因为人们认为，在新法律出台之后，同样的采矿行为，先前可获得B的回报，现在则只能获得B-pF的回报。

　　所以乍一看，企业家的回报函数似乎被改变了。加里·贝克尔在创建这个著名的模型时，肯定也是这样想的。但很显然，如果回报的确发生了变化，那是因为警察试图抓住非法采矿的企业家，而且也成功地使其被罚款F美元。然而，即使没有法律，警察也可能做同样的事情。如果在法律颁布后，每个人都像在法律颁布前一样行为，那么他（或她）得到的回报也不会发生变化。因此，法律，即那些纸上的墨迹或者电脑上的文字，不能直接影响人们参与的博弈。如果所有的参与者在法律颁布前后都采取同样的行为，则必然获得同样的回报。法律（或纸上的墨迹）并不能带来变化。

　　类似的情况也存在于有关超速的法律中。假设有个国家颁布了一部新的超速法规，规定人们行驶时速不得超过100公里，如果被抓到超速则处以一定数额的罚款。初看起来，这似乎改变了人们参与的博弈。之前，当你决定以每小时100公里以上的速度行驶时，会根据节省的时间、车子打滑的风险等因素来综合计算相应的回报。现在，在所有上述因素之外，你似乎还得加上被罚款的预期成本。但这事实上暗含着一种假设，即交警会像机器人一样，只要法律有规定，就会去实施罚款。

　　法和经济学的新古典方法之所以产生错误，是因为它下意识地假设法律的执法者被排除在博弈之外，或者将他们视为机器人，会自动按照法律的要求行事。（*2.可以想象一旦法律颁布，成百上千的机器人将立刻被设置到不同的行为模式。但这并非我们如今生活的世界。）如果相关方——司机、交警、治安法官、首相——都参与到博弈中，事实上也的确应该如此，那么显然法律并不能直接改变博弈。因为每个人如果均像以前一样行为，那么即使法律颁布之后他也会获得相同的回报，仅仅写下法律并不能马上改变人们的回报。（*1.毫无疑问，随着我们进入一个更加数字化的时代，将会发生一些变化。我们可以利用计算机和机器人监控和执行一些法律；可能的情况是，将这些机器调节至一种特殊模式，一旦新法律颁布，就自动地执行相应的变化（World Bank，2015）。然而，我们还远未接近这一目标，而且有理由认为，即使我们进入了这样一个时代，人类的意愿和对人类行动的需求也永远不会完全消失。）这就是传统法和经济学方法的缺陷，这一缺陷动摇了我们的许多分析，并损害了我们在此概念基础上制定的政策。

　　让我们停下来想一想，法律是如何改变囚徒困境博弈的。（*2.类似的观察也适用于旅行者困境博弈。）这是因为，当一个参与者选择坏的行为B时，会被罚款2美元。但谁来执行罚款呢？在大多数正常情况下，必须有人去做，即警察、交通管理员或治安法官。但是，如果有这样一个人可以参与进来，对新法律不允许的行为进行罚款，那他（或她）为什么没有成为博弈最初描述的一部分呢？换言之，囚徒困境博弈1中描述的两人博弈，并没有完整地描述社会上发生的事情。至少，还有一个人也参与其中，他（或她）拥有施加惩罚的能力，并在那里等着采取行动。如果他（或她）参与了博弈且有能力给其他参与者造成痛苦，他（或她）也应该是博弈描述的一部分。

　　如果我们描述了一个完整的博弈，将所有参与者包括在内，即涵盖有能力罚款或制裁的人，以及囚徒困境博弈中的两位参与者，并不能确定新法律可以改变博弈的结果。这是因为第三位参与者也可以在没有法律的条件下实施处罚。所以，即使在法律通过后，博弈的三位参与者也能够做法律颁布之前的各种事情，如果每次他们都选择与之前同样的行为，每个人所得的回报也会与法律颁布之前相同。这样，我们又回到对标准法律观念的“纸上的墨迹”批判。虽然在一开始，我们就对社会博弈进行了更充分的描述，但法律并不一定能改变博弈的结果。

　　贝克尔模型对博弈的描述要么是不完整的，要么假设了国家的代理人——警察、治安法官和法官——总是会按照法律的要求行事。然而，如果假设国家的代理人会自动地执行其职责，那么芝加哥或新古典模型便使用了一组不一致的假设，即把普通人视为严格的理性行为人，总是会选择合理的行为以最大化其效用或收益；而国家的代理人却被假设成总是机械地执行其应做的任务。简而言之，传统的模型要么不完整，要么是建立在一套不一致的假设之上，即假设人们都是完全理性的，但在刻画公务人员时却隐含地违反了这一假设。

　　换言之，一旦我们要完整地描述博弈，将普通参与者和国家公务人员都包括在内，为了使传统法和经济学的模型成立，就必须做出一个奇怪的假设，即普通公民是新古典意义上最大化自身收益的行为人，而公务人员则是时刻等待执行国家法律的公正代理人。由于新古典模型非常坚定地认为所有参与者都是个体效用最大化者，因此上面假设的二分法并非有意为之，这种不一致性是不知不觉地溜进了20世纪60年代初出现的法和经济学模型，并导致了明显的缺陷。即使我在批评的同时，也想强调20世纪60年代发展起来的传统法和经济学的重要性，它给予我们一个有价值的原型。这是一个很好的起点。虽然这一模型现在需要被暂时搁置，但一旦它内在的根本缺陷得到修正，我们就可以建立一个更丰富、更一致的模型。这个模型还可以引入其他邻近学科的观念，例如心理学和社会学，以建立一个反映人类各种动机的更真实模型，由此更为严谨地描述人们想法的形成，这点也一直为从哈特到当代法律学者所强调。■

　　（国务院发展研究中心宣晓伟译）