有限理性 bounded rationality (Gregory Wheeler)

首次发布于 2018 年 11 月 30 日星期五

Herbert Simon 引入了术语‘bounded rationality’(Simon 1957b: 198; 另见 Klaes & Sent 2005)作为他反对新古典经济学的简要表述,并呼吁用一种适合认知有限的主体的理性概念来取代_homo economicus_的完美理性假设。

广义地说,任务是用与经济人的全局理性相容的理性行为来取代这种理性,这种理性行为与实际上由有机体(包括人类)在这些有机体存在的环境中所拥有的信息获取和计算能力相容。(Simon 1955a: 99)

‘有限理性’此后已经成为指涉广泛的有效行为描述性、规范性和规定性解释,这些解释偏离了完美理性的假设。本条目旨在突出来自决策科学、经济学、认知和神经心理学、生物学、计算机科学和哲学的关键贡献,以加深我们对有限理性的当前理解。


1. Homo Economicus and Expected Utility Theory

有限理性已经广泛涵盖了有效行为模型,这些模型削弱或完全拒绝了经济人模型所假设的完美理性的理想条件。在本节中,我们阐述经济人模型承诺的内容以及它们与期望效用理论的关系。在后面的部分,我们将审查有关偏离期望效用理论的提议。

有限理性的经济人设想了一个假设性的代理人,该代理人对可供选择的选项拥有完整信息,对选择这些选项的后果有完美的预见,并有能力解决一个识别最大化代理人个人效用的优化问题(通常具有相当复杂性)。“经济人”的含义已经从约翰·斯图尔特·密尔(John Stuart Mill)对一个寻求最大化个人效用的假设自私个体的描述(1844 年)演变为杰文(Jevon)将边际效用数学化以建模经济消费者(1871 年);再到弗兰克·奈特(Frank Knight)描绘的新古典经济学中的“老虎机人”(1921 年),这是杰文的“计算器人”加上完美预见和明确定义的风险;再到现代经济学理性经济主体的概念,这是以保罗·萨缪尔森(Paul Samuelson)的效用“显性偏好”公式(1947 年)为基础的,再加上冯·诺依曼和莫根斯滕(von Neumann and Morgenstern)的公理化(1944 年),将经济建模的焦点从推理行为转向选择行为。

现代经济理论始于这样一个观察:人类更喜欢某些后果,即使他们只是假设性地评估这些后果。根据在风险下进行同步决策的经典范式,一个完全理性的人是那样一个人,他对一组后果的比较评估满足最大化期望效用的建议。然而,这个最大化期望效用的建议预设了这样一个事实,即这些后果的定性比较判断(即偏好)被结构化为这样一种方式(即满足特定的公理),以便允许数学表示将这些比较对象放置在实数线上(即作为数学期望的不等式),从最差到最好排序。通过公理对偏好进行结构化以允许数值表示是期望效用理论的主题。

1.1 期望效用理论

我们在这里提出了一个这样的公理系统,用于推导期望效用理论,这是一个简单的公理集,用于二元关系 ⪰,表示“被弱偏好于”的关系。这个公理化的比较对象是_前景_,它们将概率与一组固定后果相关联,其中代理人已知概率和后果。举例来说,前景(−€10, ½; €20, ½)涉及两个后果,失去 10 欧元_和_赢得 20 欧元,每个后果的概率均为一半。一个理性的代理人会更喜欢这个前景,而不是另一个具有相同后果但失去的机会大于获胜的前景,比如(−€10, ⅔; €20, ⅓),假设他的目标是最大化自己的财务福利。更一般地,假设 X={x1,x2,…,xn}是一组互斥且穷尽的后果,pi 表示 xi 的概率,其中每个 pi≥0 且 ∑nipi=1。一个前景_P_简单地是后果-概率对的集合,P=(x1,p1; x2,p2;…; xn,pn)。按照惯例,一个前景的后果-概率对按照每个后果的价值顺序排列,从最不利到最有利。当前景_P_、Q、_R_在特定偏好关系 ⪰ 下可比较,并且(有序的)后果集_X_固定时,前景可以简单地用概率向量表示。

_期望效用假设_伯努利(1738)指出,理性代理人应该最大化期望效用。如果您对前景的定性偏好 ⪰ 满足以下三个约束条件,排序连续性_和_独立性,那么您的偏好将最大化期望效用(诺伊曼和莫根斯特恩 1944)。

A1.

有限理性。订购条件规定偏好既是_完备_又是_传递_的。对于所有前景_P_、Q,完备性意味着要么 P⪰Q,Q⪰P,或者两者都成立 Q⪰P 和 Q⪰P,记作 P∼Q。对于所有前景 P、Q、R,传递性要求如果 P⪰Q 和 Q⪰R,则 P⪰R。

A2.

阿基米德。对于所有前景 P、Q、R,使得 P⪰Q 和 Q⪰R,那么存在某个 p∈(0,1),使得(P,p; R,(1−p))∼Q,其中(P,p; R,(1−p))是产生前景_P_作为结果且概率为_p_,或者以概率 1−p 产生前景_R_的_复合前景_。[1]

A3.

独立性。对于所有前景 P、Q、R,如果 P⪰Q,则

(P,p; R,(1−p))⪰(Q,p; R,(1−p))

对于所有_p_。

具体来说,如果 A1,A2 和 A3 成立,则存在一个形式为

V(P)=∑i(pi⋅u(xi))的实值函数 V(⋅)

在这里_P_是任何前景,u(⋅)是定义在后果集合_X_上的冯·诺依曼和莫根斯特恩效用函数,使得当且仅当 V(P)≥V(Q)时,P⪰Q。换句话说,如果您对特定时间的前景进行的定性比较判断满足 A1、A2 和 A3,则这些定性判断可以通过形式为 V(⋅)的函数不等式在数值上表示,从而形成一个逻辑推理的区间尺度,用于确定您在那个时间对定性比较判断的后果。

1.2 从期望效用理论中公理化的偏离

探索公理系统的替代方案是司空见惯的,期望效用理论也不例外。需要明确的是,并非所有从期望效用理论中偏离的内容都适用于建模有限理性。然而,一些关于如何处理建模有限理性问题的混淆和误导性言论源于对当代统计决策理论广度的陌生。在这里,我们突出一些从期望效用理论中公理化偏离的内容,这些内容受到有限理性考虑的驱动,都以我们在 section 1.1 中的特定公理化表述为框架。

1.2.1 替代方案 A1

削弱排序公理引入了一个可能性,即一个代理人可以放弃比较一对替代方案,这是凯恩斯和奈特都提倡的想法(Keynes 1921; Knight 1921)。具体来说,放弃完备性公理使代理人有可能既不偏好一个选项也不对两者之间无所谓(Koopman 1940; Aumann 1962; Fishburn 1982)。决断力,完备性公理所编码的内容,更多是数学上的便利,而非理性原则。每个提出公理系统的问题都是,允许不完备偏好的系统会导致什么逻辑结果。由奥曼(1962)领导,最早对理性不完备偏好进行公理化的是吉尔斯(1976)和吉隆与里奥斯(1980),后来被卡尼(1985)、比尤利(2002)、沃利(1991)、赛登菲尔德、谢尔维什与卡丹(1995)、奥克(2002)、瑙(2006)、加拉巴塔尔与卡尼(2013)以及扎法隆与米兰达(2017)研究。除了适应犹豫不决,这些系统还允许你在了解其他代理人偏好不完备的情况下推断其(可能)完备的偏好。

放弃传递性限制会限制引发的偏好的可扩展性(Luce & Raiffa 1957),因为将传递性作为公理约束的省略允许出现循环和偏好反转。尽管传递性的违反长期以来被认为是司空见惯的,也是人类非理性的迹象(May 1954;Tversky 1969),但对实验证据的重新评估挑战了这一看法(Mongin 2000;Regenwetter,Dana,& Davis-Stober 2011)。这些公理对偏好施加了同步一致性约束,而对传递性的违反的实验证据通常混淆了动态和同步一致性(Regenwetter 等人 2011)。具体而言,一个人在某一时刻的偏好与他在另一时刻的偏好不一致,并不能证明这个人在某一时刻持有逻辑上不一致的偏好。主张在规范理性偏好的范围内限制传递性的论点同样指向历时或群体偏好,这也不与公理相矛盾(Kyburg 1978;Anand 1987;Bar-Hillel & Margalit 1988;Schick 1986)。指向随时间允许循环或偏好反转的心理过程或算法的论点也指向对排序条件的错误应用,而非反例。最后,对于涉及随时间明确比较选项的决策,违反传递性可能是理性的。例如,考虑到最大化食物获取速率的目标,一个生物体当前的食物选择可能会透露关于不久的将来食物供应的信息,表明当前的选择可能很快消失,或者更好的选择可能很快出现。关于随时间选项可用性的信息可以(有时)证明随时间最大化食物获取的非传递性选择行为是合理的(McNamara,Trimmer,& Houston 2014)。

1.2.2 A2 的替代方案

放弃阿基米德公理允许一个代理人拥有_词典偏好_(Blume, Brandenburger, & Dekel 1991); 也就是说,省略 A2 允许代理人更喜欢一种选择胜过另一种的可能性。发展非阿基米德版本的期望效用理论的一个动机是解决标准主观效用框架基础中的一个空白,该空白阻碍了_可接受性_(即,一个人不应选择一个在选择上处于弱支配地位的选项的原则)与_完全条件偏好_(即,对于任何事件,都有一个明确定义的条件概率来表示代理人的条件偏好;Pedersen 2014)的完全调和。具体来说,标准主观期望效用解释无法适应对零概率事件的条件,这对博弈论尤为重要(P. Hammond 1994)。期望效用理论的非阿基米德变体转向非标准分析技术(Goldblatt 1998)、完全条件概率(Rényi 1955;Coletii & Scozzafava 2002;Dubins 1975;Popper 1959)和词典概率(Halpern 2010;Brickhill & Horsten 2016 [其他互联网资源]),并且都与不精确概率理论相关联。

非补偿性单线索决策模型,如采用最佳启发式方法(第 7.2 节),吸引了词典顺序的线索,并以非阿基米德期望的形式进行数值表示(Arló-Costa & Pedersen 2011)。

1.2.3 替代 A3

A1A2 一起意味着 V(⋅)给前景分配一个实值指数,使得当且仅当 V(P)≥V(Q)时 P⪰Q。独立性公理 A3 对选择编码了一个可分离性属性,确保期望效用在概率上是线性的。放弃独立性公理的动机源于在应用期望效用理论描述选择行为时遇到的困难,包括早期观察到人类对可能的损失和可能的收益进行不同评估。尽管期望效用理论可以代表一个既赌博又购买保险的人,但弗里德曼和萨维奇在对冯·诺依曼和莫根斯滕的公理化进行早期批评时指出,它不能同时做到这两点(M.弗里德曼和萨维奇 1948)。

损失厌恶原则(卡内曼和特沃斯基 1979; 拉宾 2000)表明我们赋予潜在损失的主观权重大于我们赋予潜在收益的权重。例如,禀赋效应(塞勒 1980)——人们倾向于将一种商品的价值视为潜在损失时比视为潜在收益时更高的观察,得到了神经证据支持,即大脑的不同区域处理收益和损失(里克 2011)。然而,即使承认我们在处理损失和收益时的情感差异,这些差异不一定会转化为一般的“负面偏见”(鲍梅斯特、布拉茨拉夫斯基和芬肯奥尔 2001)在选择行为中(霍奇曼和耶希亚姆 2011; 耶希亚姆和霍奇曼 2014)。耶希亚姆及其同事报告了一些实验,参与者在其中的选择不表现出损失厌恶,例如参与者对发生损失和收益的重复情况以及涉及小赌注的单次决策的情况。尽管如此,对风险厌恶(阿莱 1953)和模糊厌恶(埃尔斯伯格 1961)的观察导致了对期望效用理论的替代方案,所有这些方案都放弃了 A3。这些替代方法包括前景理论(section 2.4)、后悔理论(贝尔 1982; 卢姆斯和萨格登 1982)和排名依赖期望效用(奎金 1982)。

大多数有限理性模型甚至都不符合刚刚概述的这个广泛的公理家族。一个原因是,有限理性在历史上强调了涉及做出决策、下判断或实现目标的程序、算法或心理过程(section 2)。然而,塞缪尔森从推理行为转向选择行为时,恰恰忽略了这些细节,将它们视为理性选择理论范围之外的内容。对于西蒙来说,这正是问题所在。第二个原因是,有限理性经常关注适应生物环境的行为(section 3)。由于生态建模涉及目标导向行为,受到生物体的构成和环境的稳定特征的调节,专注于(同时性地)一致的比较判断通常并不是直接、至少不是最佳的问题阐述方式。

尽管如此,人们应该谨慎对待有关决策理论工具在研究有限理性中所起的有限作用的一些概括。决策理论——广义上包括统计决策理论(Berger 1980)——提供了强大的数学工具箱,尽管在历史上,特别是在其经典形式中,它交易了心理神话,比如“信念程度”和逻辑全知(section 1.3)。研究与期望效用理论的公理偏离的一个好处是减弱贝叶斯教条的束缚,扩大应用日益增长的实用且强大的数学方法的可能性。

1.3 逻辑全知的限制

大多数关于判断和决策的正式模型都涉及_逻辑无所不知_——即对当前承诺的所有逻辑推论以及考虑选择的任何一组选项的完全了解,这在心理上是不现实的,技术上也很难避免(Stalnaker 1991)。一个描述性理论假设,或者一个建议性理论建议,当证据在逻辑上不一致时不相信一个主张,例如,当涉及的信念对于除了逻辑无所不知的代理以外的所有人来说足够复杂时,即使是对于尽管没有逻辑无所不知但仍然可以访问无限计算资源的代理,这将是行不通的(Kelly & Schulte 1995)。

逻辑无所不知的问题对于期望效用理论一般以及主观概率理论特别尖锐。因为主观概率的假设蕴含着一个代理知道她承诺的所有逻辑后果,从而要求逻辑无所不知。然而,这限制了该理论的适用性。例如,它禁止对数学和逻辑陈述有不确定的判断。在一篇 1967 年的文章“个人概率理论中的困难”中,报道于 Hacking 1967 和 Seidenfeld, Schervish, & Kadane 2012,但在 Savage 1967 中印刷错误,Savage 提出了主观概率理论中逻辑无所不知的问题:

分析应该小心,不要证明得太多;因为一些理论之外的偏差是不可避免的,有些甚至值得称赞。例如,一个人被要求在一个遥远的 π 的数字上冒险投资,为了完全遵守理论,他必须计算那个数字,尽管如果计算成本超过所涉及的奖金,这实际上是浪费的。因为理论的假设意味着你应该根据你所知道的一切的逻辑推论来行事。在这方面是否可能改进这个理论,为思考成本留有余地,或者这是否会导致悖论,正如我倾向于相信但无法证明的那样?(Savage 1967 摘自 Savage 的未发表草稿;请参阅 Seidenfeld 等人 2012 中的注释)

对 Savage 问题的回应包括 I.J. Good(1983)提出的一个博弈论处理,该处理交换了一个必然为真的外延变量,用一个代表知道必然真相但对你隐瞒足够信息以使你对他知道的事情(连贯地)感到不确定的内涵变量。这个技巧改变了你的不确定性主体,从一个你无法连贯怀疑的必然真命题,变成了由你的同谋的不完整描述促成的关于那个真相的连贯猜测游戏。另一个回应坚持经典观点,即逻辑全知的失败是对完美理性规范的偏离,但引入了一个不连贯性指数以适应具有不连贯概率评估的推理(Schervish, Seidenfeld, & Kadane 2012)。第三种方法,由 de Finetti(1970)提出,是将可能的事态限制在可观察的状态上,具有有限可验证程序—这可能排除了理论状态或任何不接受验证协议的状态。最初,de Finetti 追求的是一种有原则的方法,用于构建可能结果的划分,以区分实验的严肃可能结果和荒谬但逻辑上可能的结果,从而产生一种区分真正怀疑和纯粹“纸上怀疑”的方法(Peirce 1955)。其他提议遵循 de Finetti 的思路,通过收紧可容许性标准,包括_认识上可能_事件,即与代理人可获得信息逻辑一致的事件;_表面上可能_事件,除非代理人已确定其与他的信息不一致,否则包括任何事件;以及_实用上可能_事件,仅包括被判断为足够重要的事件(Walley 1991: 2.1)。

_表面上可能_的概念指的是一种确定不一致性的程序,这是一种有限程序理性的形式(section 2)。避免悖论的挑战是艰巨的,然而,对 Peano 算术的有限片段(Parikh 1971)的研究为探索这些思想提供了连贯的基础,这些思想已被专门采用,用于制定_表面可能性_的有限扩展的默认逻辑(Wheeler 2004),以及更普遍地在_计算理性_模型中(Lewis, Howes, & Singh 2014)。

1.4 描述、规范和规范标准

这种对比人们做出判断或决策的方式与他们应该如何做出判断或决策的方式是司空见惯的。然而,对有限理性判断和决策的认知过程、机制和算法的兴趣表明,我们应该区分三种研究目标,而不是这两种。简而言之,一个_描述性理论_旨在解释或预测人们实际做出的判断或决策;一个_规范性理论_旨在解释或推荐人们应该做出的判断或决策;一个_规范性理论_旨在指定用于评估判断或决策的规范标准。

为了说明每种类型,考虑一个领域,在这个领域中这三种研究途径之间的差异特别明显:算术。算术的描述性理论可能涉及算术推理的心理学、动物近似数能力的模型,或者在数字计算机上实现任意精度算术的算法。完整算术的规范标准是 Peano 的算术公理化,它将自然数算术提炼为一个数字接一个数字的函数和数学归纳。但人们也可以考虑罗宾逊的不依赖归纳的 Peano 算术片段(Tarski, Mostowski, & Robinson 1953)或者在大基数层次结构中某种基数算术系统的公理。算术的规范性理论将参考一个固定的规范标准以及执行算术的生物体或机器的算术能力的相关事实。一个旨在提高小学生算术表现的课程将不同于一个旨在提高成年人表现的课程。尽管 Peano 算术的规范标准对于儿童和成年人是相同的,但这两个群体之间稳定的心理差异可能需要为他们的算术表现制定不同的方法。继续下去,尽管 Peano 的公理是完整算术的规范标准,但没有人会建议使用 Peano 的公理来改进任何人的求和。毕竟,Peano 的公理并不是算术推理的描述性理论。即便如此,算术的描述性理论将假定 Peano 公理是完整算术的规范标准,即使只是隐含地。在描述人们如何求和两个数字时,毕竟,人们假定他们试图求和两个数字而不是连接它们、按顺序数出来或者用代码发送消息。

最后,想象一种有效的教学方法,用于教授算术给孩子们是已知的,我们希望向孩子们介绍基数算术。对于儿童基数算术的规范理论的合理起点可能是尽可能地借鉴成功的完整算术教学方法,同时预期其中一些方法将无法在从 Peano 到(比如)ZFC+的规范标准变化中幸存下来。其中一些差异可以看作是从一个标准到另一个标准的变化的直接结果,而其他差异可能意外地源自观察到的任务变化之间的相互作用,即从执行完整算术到执行基数算术,以及儿童执行每项任务的心理能力。

可以肯定的是,算术和有限理性行为之间存在重要差异。算术的对象,数字和它们所指代的数字,相对来说是清晰明了的,而有限理性行为的对象即使使用相同的理论框架时也会有所不同。以期望效用理论为例。一个代理人可以被视为在权衡选择选项,目的是选择最大化个人福祉的选项,或者被视为行为就像他在刻意这样做一样,而实际上并没有这样做,或者被理解为根本不这样做,而是在他种群的适应度中扮演一个小角色。

将如何选择规范标准的问题与如何评估或描述行为的问题分开是减少在讨论有限理性时出现的误解的重要工具。尽管 Peano 的公理永远不会被规定来改进,也不会被建议来描述算术推理,但这并不意味着算术的 Peano 公理与算术的描述性和规范性理论无关。虽然人类有限理性行为的规范标准是否允许公理化仍然是一个悬而未决的问题,但对于明确的规范标准在推进我们对人们如何做出判断或做出决策以及他们应该如何做出判断或做出决策的理解方面发挥的积极作用应该没有太多疑问。

2. 程序有限理性的出现

西蒙认为,从推理行为转向选择行为的关注是一个错误。因为在 20 世纪 50 年代,对于涉及判断或决策过程的了解甚少,我们无法自由地将所有这些特征从数学模型中抽象出来。然而,对决策心理学的无知也引发了如何继续的问题。答案是关注运行决策程序所需的努力成本,并将这些成本与使用该程序的有机体可用资源进行比较,反之亦然,比较有机体在准确性方面的表现(8.2 节)与其有限的认知资源,以便研究在这些资源限制内具有可比准确性水平的模型。有效地管理决策成本和质量之间的权衡涉及另一种类型的理性,后来西蒙称之为_程序有限理性_(西蒙,1976 年:69)。

在本节中,我们重点介绍了对有限理性判断和决策建模程序的早期关键贡献,包括_准确性-努力权衡_的起源,西蒙的_满足_策略,不当线性模型,以及最早系统化高级认知判断和决策的若干特征的努力:累积展望理论

2.1 准确性和努力

赫伯特·西蒙(Herbert Simon)和 I.J. 古德(I.J. Good)是最早之一提出主观预期效用理论认知需求的人,尽管在他们早期的著作中,两人都没有放弃预期效用原则作为理性选择的规范标准。例如,古德将最大化预期效用的建议称为理性的_普通原则_,而西蒙则将这一原则称为_客观理性_,并认为这是_全局理性_的核心信条。古德观察到,理性行为规则在时间和努力上都是昂贵的,因此真实的行动者有兴趣将这些成本最小化(Good 1952: 7(i))。效率要求我们从可用的选择中选择一个在给定资源下产生最大结果的选项,西蒙强调这不一定是一个在整体上产生最大结果的选项(Simon 1947: 79)。因此,如果不考虑相关成本而判断推理不足,一旦考虑到所有这些成本,可能会发现是值得的结论,这是一系列作者很快就认同的,包括阿莫斯·特沃斯基(Amos Tversky):

在没有对标准的敏感性和评估替代方案所涉及的成本进行详细分析的情况下,似乎不可能得出任何关于人类理性的最终结论。当考虑到评估的困难(或成本)以及判断的一致性(或错误)时,[违反传递性的方法]可能会被证明更为优越。(Tversky 1969)

平衡决策的质量与成本很快成为有限理性的一个流行概念,特别是在经济学中(斯蒂格勒 1961 年),在那里,将有限理性决策制定为受限制的优化问题仍然很普遍。从这个观点来看,有限理性代理是效用最大化者,毕竟,一旦所有约束都变得明确(阿罗 2004 年)。有限理性这一概念广受欢迎的另一个原因是它与弗里德曼的“仿佛”方法(M.弗里德曼 1953 年)兼容,该方法授权忽略支撑判断和决策的因果因素的行为模型。说一个代理行为“仿佛”他是效用最大化者,一方面是承认他并不是,但他的行为却像是他是的。同样,说一个代理在某些约束下行为仿佛他是效用最大化者,是承认他并没有解决受限制的优化问题,但仍然表现得好像他做了。

西蒙专注于计算效率高的方法,产生足够好的解决方案,与弗里德曼的“仿佛”方法形成对比,因为在西蒙看来,评估一个解决方案是否“足够好”涉及搜索过程、停止标准以及在做决策过程中信息如何被整合。西蒙提供了几个例子来激发对计算效率高方法的探究。这是其中一个例子。将博弈论的极小极大算法应用于国际象棋游戏需要评估的国际象棋局面比宇宙中的分子数量还要多(西蒙 1957a: 6)。然而,如果国际象棋游戏超出了精确计算的范围,我们为什么要期望日常问题更容易解决呢?西蒙的问题是解释人类如何在一个充满不确定性的世界中成功解决复杂问题,考虑到他们有限的资源。回答西蒙的问题,而不是应用弗里德曼的方法将受限制的优化模型拟合到观察到的行为中,就是要求一个具有更好预测能力的模型,关于有限理性判断和决策制定。在追问人类如何解决不确定推理问题的问题时,西蒙开启了两条至今仍在继续的探究线索,即:

  1. 人类实际上如何在“野外”做决策?

  2. 全球有限理性的标准理论如何简化以使其更易处理?

西蒙最早的努力旨在回答第二个问题,由于当时关于人们实际如何做决定的心理知识匮乏,只有一个外行人对“人类选择的总体特征的了解”(西蒙 1955a: 100)。他的建议是用一个更简单的决策标准——_满意_来取代最大化预期效用的优化问题,并通过更具有预测能力的模型来更普遍地解决问题。

2.2 满意

有限理性 是一种策略,即在考虑可供选择的选项,直到找到一个满足或超过预先设定的阈值(您的愿望水平)的最低可接受结果。尽管西蒙最初认为程序理性是对全局理性的一个不太准确的近似,并因此认为有限理性的研究涉及“那些由于没有足够智慧而只能做到‘满足’而不是最大化的人类行为”(西蒙 1957a: xxiv),但满足模型的应用范围涵盖了顺序选择问题、聚合问题和高维优化问题,这些问题在机器学习中越来越常见。

在确定了什么样的结果会被视为足够好之后,满足取代了期望效用理论中选择一个无支配结果的优化目标,转而选择一个符合您愿望的选项为目标。此模型后来被应用于商业(Bazerman & Moore 2008; Puranam, Stieglitz, Osman, & Pillutla 2015)、伴侣选择(Todd & Miller 1999)和其他实际的顺序选择问题,比如选择停车位(Hutchinson, Fanselow, et al. 2012)。忽略西蒙最初关于满足的程序性方面,如果对于给定的决策问题有一个固定的愿望水平,那么从满足中得到的可接受选择可以通过所谓的 ϵ-效率方法(Loridan 1984; White 1986)来捕捉。

在机器学习中,当有许多指标可用但没有可靠或实用的方法将它们组合成一个单一值时,会使用混合优化-满足技术。相反,混合优化-满足方法选择一个指标进行优化,而对其余指标进行满足。例如,机器学习分类器可能会优化准确率(即最大化模型产生正确输出的例子比例;请参见 第 8.2 节),但对误报率、覆盖率和运行时间设置愿望水平。

Selten 的_aspiration adaption theory_将决策任务建模为具有多个无法比较的目标的问题,这些目标抵制聚合为对所有替代方案的完整偏好顺序(Selten 1998)。相反,决策者将具有目标变量的向量,其中这些向量可通过弱支配进行比较。如果向量 A 和向量 B 是我的目标的可能分配,则 A 支配向量 B,如果在 B 分配一个严格小于 A 的值的顺序中没有目标,并且存在某个目标,其中 A 分配一个严格大于 B 的值。Selten 的模型设想了每个目标的愿望水平,该水平本身可以根据可行(可接受)选项进行向上或向下调整。愿望适应理论是一种高度程序化和局部化的解释,属于 Newell 和 Simon 对人类问题解决方法的传统方法(Newell&Simon 1972),尽管最初并未提供作为心理过程模型。类似的方法已在 AI 规划文献中进行了探讨(Bonet&Geffner 2001;Ghallab,Nau 和 Traverso 2016)。

2.3 适当和不适当的线性模型

适当的线性模型代表另一类重要的优化模型。适当的线性模型是指预测变量被分配权重的模型,这些权重被选择,以便这些加权预测变量的线性组合最佳地预测感兴趣的目标变量。例如,线性回归是一种适当的线性模型,它选择权重,使得模型对目标变量的预测值与实际值(在数据集中给出)之间的平方“距离”最小化。

保罗·米尔(Paul Meehl)在 1950 年代对使用统计方法与临床判断进行的心理研究进行的评论巩固了心理学中的统计转向(Meehl 1954)。米尔的评论发现,从数值预测者到数值目标变量的研究最好通过适当的线性模型来完成,而不是通过临床医生的直觉判断。同时,心理学家肯尼斯·哈蒙德(Kenneth Hammond)制定了布伦斯维克的透镜模型(Brunswik’s lens model)(第 3.2 节)作为适当线性模型的组合,以模拟临床与统计预测之间的差异(K. Hammond 1955)。适当的线性模型自那时起已成为认知心理学中的主力军,涉及决策分析(Keeney & Raiffa 1976;Kaufmann & Wittmann 2016)、因果推断(Waldmann, Holyoak, & Fratianne 1995;Spirtes 2010)和选择反应时间(Brown & Heathcote 2008;Turner, Rodriguez 等人 2016)等领域。

罗宾·道斯(Robin Dawes)回答米尔关于统计与临床预测的问题,发现即使不当的线性模型也比临床直觉表现更好(Dawes 1979)。不当线性模型的显著特征是线性模型的权重是通过某种非最优方法选择的。例如,可能会将相等的权重分配给预测变量,以使每个变量具有相等的权重,或者为支持正面或负面预测的特征分配单位权重,如 1 或-1。举例来说,道斯提出了一个不当模型,用于根据夫妻之间做爱和争吵频率的差异来预测夫妻对婚姻幸福的主观评分。结果呢?在 30 对幸福夫妻中,有两对争吵比做爱更频繁。然而,所有 12 对不幸福的夫妻都更频繁地争吵。这些结果在其他研究人类性行为的实验室中得到了复制。相等权重回归和单位权重的计数方法自那时以来被发现通常在小数据集上胜过适当的线性模型。尽管没有简单的不当线性模型在所有常见的基准数据集上表现良好,但几乎每个基准数据集都有一些简单的不当模型在预测准确性上表现良好(Lichtenberg & Simsek 2016)。这一观察以及启发式文献中的许多其他观察结果指出,简化模型的偏见可能导致在正确情况下使用时产生更好的预测(第 4 节)。

Dawes 的最初观点并非是不当的线性模型在准确性方面优于适当的线性模型,而是它们更有效,并且(通常)是适当线性模型的近似。“统计模型可能以最佳方式整合信息”,Dawes 观察到,“但始终是个体...选择变量”(Dawes 1979: 573)。此外,Dawes 认为,需要人类判断才能知道预测变量和目标变量之间的影响方向,这包括如何对这些变量进行数值编码以使这个方向清晰。机器学习的最新进展削弱了 Dawes 关于人类判断的独特作用的说法,而 Gigerenzer 的 ABC Group 关于单位权重计数在小样本外样本预测任务中优于线性回归的结果是不当线性模型优于适当线性模型的一个例子(Czerlinski,Gigerenzer 和 Goldstein 1999)。然而,Dawes 关于变量选择相对于变量加权的重要性的一般观察仍然成立(Katsikopoulos,Schooler 和 Hertwig 2010)。

2.4 累积效用理论

如果满足和不当线性模型都是在本节开始时 Simon 的第二个问题的例子,即如何简化现有模型以使其既易处理又有效,那么 Daniel Kahneman 和 Amos Tversky 的 累积效用理论 就是第一个直接融入关于人类实际决策方式的知识的模型之一。

在我们讨论 第 1.1 节 中关于独立公理的替代方案时,(A3),我们提到了几个人类选择行为的观察特征,这些特征与预期效用理论的规定相矛盾。卡内曼和特沃斯基围绕人类决策的四个观察结果发展了前景理论(卡内曼和特沃斯基,1979 年;瓦克尔,2010 年)。

  1. 参考依赖性。人们在做决策时,与预期效用理论规定的通过比较福利的绝对大小来做决策不同,他们倾向于根据相对于参考点的福利变化来评估前景。这个参考点可以是一个人当前的财富状态,一个愿望水平,或者一个用来评估选项的假想参考点。参考依赖性背后的直觉是,我们的感官器官进化成检测感官刺激的变化,而不是存储和比较刺激的绝对值。因此,论点是,我们应该期望看到参与决策的认知机制继承这种对感知属性值变化的敏感性。

在前景理论中,参考依赖性通过效用在估值曲线 v(⋅) 在 图 1(a)中在原点处改变符号来体现。 _x_轴表示欧元的收益(右侧)和损失(左侧), _y_轴绘制了估值函数 v(⋅) 对相对收益和损失的价值,该函数适用于人们选择行为的实验数据。

  1. 损失厌恶。人们对相同幅度的损失比对相同幅度的收益更敏感;胜利的喜悦无法与失败的痛苦相提并论。因此,卡内曼和特沃斯基认为,人们会更喜欢一种不会造成损失的选择,而不是一个带来等值收益的替代选择。对潜在收益和损失的评估差异也解释了资产效应,即人们倾向于比较价值相同的替代品更看重他们拥有的商品(塞勒尔 1980)。

在前景理论中,损失厌恶出现在 图 1(a)中,即 v(⋅)在参照点左侧(大致)更陡的斜率,代表相对于主体参照点的损失,而在参照点右侧的收益的斜率。因此,对于从参照点改变奖励_x_的相同幅度变化,获得_x_的后果的幅度小于失去_x_的幅度。

请注意,对于损失和收益的情感态度以及负责处理损失和收益的神经过程的差异不一定会转化为人们选择行为的差异(Yechiam & Hochman 2014)。损失厌恶在判断和决策中扮演的角色和范围并不像最初假设的那样清晰(1.2 节)。

  1. 收益和损失的边际递减。在固定的参考点下,人们对资产价值变化的敏感度(x图 1a 中)随着离开参考点的距离增加而减少,无论是在损失领域还是在收益领域。即使对期望效用理论进行修改以适应边际效用递减(M. Friedman & Savage 1948),这也与之不一致。

在前景理论中,估值函数 v(⋅) 对于收益而言是凹的,对于损失而言是凸的,代表着对收益和损失的敏感度递减。期望效用理论可以被修改以适应敏感度效应,但效用函数通常要么是严格凹的,要么是严格凸的,而不是两者兼具。

  1. 概率加权。最后,对于已知的外生概率,人们不通过直接推理来校准主观概率(Levi 1977),而是系统性地低估高概率事件,高估低概率事件,交叉点约为三分之一(图 1 b)。因此,非常小或非常大的概率变化对前景的评估产生的影响比在期望效用理论下更大。人们愿意为了将枪膛中的子弹数量从 1 颗减少到 0 颗而支付更多,而不是将子弹数量从 4 颗减少到 3 颗在一场虚拟的俄罗斯轮盘赌游戏中。

图 1(b) 绘制了与前景相关的外生概率_p_的概率加权函数 w(⋅) 的中位数值,如 Tversky & Kahneman 1992 所报告。大致而言,在一个三分之一以下的概率值以下,人们会高估结果(后果)的概率,而在一个三分之一以上的概率值以上,人们倾向于低估结果发生的概率。传统上,过度加权被认为涉及人们主观估计结果与已知外生概率_p_之间的系统性误校准,作为参考标准。支持这一观点的是,当人们通过抽样学习分布而不是通过描述学习相同的统计数据时,误校准似乎会消失(Hertwig, Barron, Weber, & Erev 2004)。在这种情况下,误校准应该与在决策任务的一部分中未提供相关统计数据时高估或低估主观概率区分开来。例如,电视上播放的飞机失事后的影像会导致对商用飞机失事这种低概率事件的高估。即使一个人对商用航空公司失事的风险的主观概率过高,给定的统计数据,负责的机制也是不同的:这里晚间新闻中的图像的_最近性_或_可获得性_让他感到恐惧,而不是统计表的冷静搞砸。另一种观点认为,人们明白他们的加权概率与外生概率不同,但仍然更喜欢表现得好像外生概率是这样加权的(Wakker 2010)。在这种观点下,概率加权不是一个(错误的)信念,而是一种偏好。

两个图,a 和 b

图 1:(a) 绘制了应用于前景后果的价值函数 v(⋅);(b) 绘制了应用于形式为 (x,p; 0,1−p) 的正面前景的概率加权函数 w(⋅) 的中位数值,其中概率为_p_。[有关此图的 扩展描述 在附录中。]

前景理论将这些组件纳入人类在风险下选择模型中,首先确定一个参照点,该点可以是指现状或其他期望水平。然后,考虑中的选项的后果被构建为相对于这个参照点的偏差。通过四舍五入简化极端概率,导致对给定的外生概率的误校准。然后应用支配推理,淘汰选择中的被支配替代方案,以及其他步骤来区分没有风险的选项,将与特定结果相关的概率结合起来,并应用消除无关替代方案的版本(Kahneman&Tversky 1979:284–285)。

然而,前景理论存在问题。例如,将概率从不利结果转移到有利结果应该产生更好的前景,但原始的前景理论违反了这种随机支配原则。然而,_累积前景理论_通过诉诸于一种基于排序的方法来转换概率(Quiggin 1982)来满足随机支配。有关前景理论和累积前景理论之间的差异的审查,以及累积前景理论的公理化,请参阅 Fennema&Wakker 1997。

3. 生态合理性的出现

想象一个草地,植物上挤满了昆虫,但只有少数在飞行。那么,这个草地对于一个捡食而不是捕食的鸟类来说是一个更有利的环境。类似地,一个决策环境可能对某种决策策略更有利,而对另一种决策策略则不然。正如鸟类选择在这片草地上进行捕食而不是捕食是“非理性的”一样,那么在一个环境中可能是一种非理性决策策略,在另一个环境中可能是完全理性的。

如果程序有限理性给做决策增加了成本,那么生态有限理性将这个程序定位在世界中。生态有限理性所提出的问题是,环境的哪些特征可以帮助或阻碍决策制定,我们应该如何建模判断或决策生态。例如,人们对他们观察到的协变模式进行因果推断,尤其是儿童,然后进行实验来测试他们的因果假设(Glymour 2001)。毫不奇怪,那些对真实因果模型做出正确推断的人比那些对错误因果模型做出推断的人做得更好(Meder,Mayrhofer 和 Waldmann 2014)。更令人惊讶的是,Meder 及其同事发现,那些做出正确因果判断的人比根本不做因果判断的受试者表现得更好。也许最令人惊讶的是,那些具有真实因果知识的人也击败了文献中忽略因果结构的基准标准;这些基准标准错误地假设我们所能做的最好就是根本不做因果判断。

在本节和下一节中,我们将介绍生态有限理性出现的五个重要贡献。在本节中,在审查 Simon 区分“行为约束”和“环境结构”的提议后,我们转向三个历史上重要的贡献: “透镜模型”、“理性分析”和“文化适应”。最后,在 第 4 节 中,我们将回顾“偏差-方差分解”,这在“快速和简约启发式”文献中起到了作用(第 7.2 节)。

3.1 行为约束和环境结构

西蒙认为,有限理性理论中应该包括行为约束和环境结构,但他警告说,不要将行为和环境属性与生物体的特征和其物理环境的特征等同起来:

我们必须准备接受这样一种可能性,即我们所谓的“环境”部分可能存在于生物体的皮肤内。也就是说,在优化问题中必须视为已知的某些约束可能是生物体(在生物学上定义)本身的生理和心理限制。例如,生物体可以移动的最大速度建立了其可用行为选择集的边界。同样,计算能力的限制可能是在特定情况下定义理性选择的重要约束因素。(西蒙 1955a: 101)

那么,什么被分类为行为约束而不是环境赋能在不同学科和运用的理论工具之间有所不同。例如,有限理性的一种计算方法,计算理性理论(Lewis 等人,2014),将生物执行最佳程序的成本分类为行为约束,将记忆限制分类为环境约束,并将搜索最佳程序的成本视为外生因素。另一方面,Anderson 和 Schooler 在 ACT-R 框架内对人类记忆进行的研究和计算建模(Anderson&Schooler,1991)将记忆限制和搜索成本视为对环境结构的适应性响应。另一类广泛的计算方法可在_统计信号处理_中找到,例如自适应滤波器(Haykin,2013),这在工程和视觉中很常见(Marr,1982;Ballard&Brown,1982)。信号处理方法通常假定设备和世界之间有明显区别,然而,仍有人挑战了行为约束和环境结构之间的区别,主张没有明确的方法将生物体与其栖息环境分开(Gibson,1979),或者主张认知特征看似与身体相关的可能并非一定如此(Clark&Chalmers,1998)。

牢记对行为和环境之间区别的不同划分方式,以及从这种区别中得出的具体挑战,生态理性的各种方法都支持这样一个命题:生物体如何管理其环境的结构特征对于理解决策发生的方式以及有效行为产生至关重要。在这样做的过程中,有限理性理论传统上至少关注以下一些特征,根据这种粗略分类:

  • 行为约束 — 可能指计算的限制,例如_搜索最佳算法的成本_、适用的规则或选择的满意选项;执行最佳算法、适当规则或满意选择的成本;以及存储算法的数据结构、规则的组成要素或决策问题的对象的成本。

  • 生态结构—可能指的是生物适应的任务环境的_统计_、拓扑_或其他_可感知的不变性;或者是负责有效行为的计算过程或认知机制的_建筑特征_或_生物特征_。

3.2 布伦斯维克的透镜模型

埃贡·布伦斯维克是最早将概率和统计应用于人类感知研究的人之一,并且在强调生态学在心理研究的普适性中起作用方面领先于他的时代。布伦斯维克认为,心理学应该致力于对适应性行为进行统计描述(Brunswik 1943)。心理实验不应该仅仅孤立地操纵少数独立变量以系统地观察对一个因变量的影响,而应该评估一个生物是如何适应其环境的。因此,心理实验的实验对象不仅应该代表人口,正如人们所认为的那样,而且他们所面临的实验情境应该代表实验对象所生存的环境(Brunswik 1955)。因此,布伦斯维克认为,心理实验应该采用_代表性设计_来保留生物自然环境的因果结构。有关代表性设计的发展及其在判断和决策研究中的应用的评论,请参见 Dhami、Hertwig 和 Hoffrage 2004。

Brunswik 的_镜头模型_是围绕他关于行为和环境条件如何影响有机体感知近端线索以推断其“自然-文化栖息地”的某个远端特征的想法而制定的(Brunswik 1955: 198)。举例来说,一个有机体可以通过反射在其视网膜上的光频率的对比来检测潜在伴侣的颜色标记(远端对象)。一些近端线索将比其他线索更多地提供关于感兴趣的远端对象的信息,Brunswik 理解为近端线索与目标远端客观之间的“客观”相关性的差异。因此,近端线索的_生态效度_指的是它们在特定环境中为有机体提供关于某个远端对象的有用信息的能力。因此,对有机体的表现的评估归结为比较有机体对线索信息的实际使用与线索信息容量之间的关系。

Kenneth Hammond 和同事(K. Hammond, Hursch, & Todd 1964)将 Brunswik 的镜头模型制定为线性双变量相关性系统,如 图 2 所示(Hogarth & Karelaia 2007)。非正式地,图 2 表明了一个主体对于一个数值目标标准 Ye 的判断(响应)Ys 的准确性,给定一些信息性线索(特征)X1,…,Xn,取决于主体的响应和目标之间的相关性。更具体地说,线性镜头模型想象了两个大型线性系统,一个是环境 e,另一个是主体 s,它们都共享一组线索 X1,…,Xn。请注意,线索可能彼此相关联,即可能 ρ(Xi,Xj)≠0,对于从 1 到 n 的索引 i≠j。

主体对于目标标准值 Ye 的判断 Ys 的准确性由一个_成就指数_ra 来衡量,该指数由 Pearson 相关系数 ρ(Ye,Ys)计算得出。主体对于线索的预测响应 Y^s 由主体分配给每个线索 Xi 的权重 βsi 决定,主体响应的线性 Rs 测量系统中的噪音 ϵs。因此,主体的响应被构想为主体加权线性总和加上噪音。环境中的^​^响应线性^​^的类比是^​^环境可预测性^​^Re。在这个模型中,环境被认为是概率性的,或者一些人说是“偶然的”。最后,环境加权线索总和 Y^e 与主体加权线索总和 Y^s 通过一个_匹配指数_G 进行比较。

图 2:Brunswik 的透镜模型

这幅图的扩展描述在附录中。

根据这种透镜模型的制定,回到西蒙关于环境可供性与行为约束分类的言论。透镜模型被看作是线性模型,这要归功于信号检测理论,该理论是为了提高早期雷达系统的准确性而发展的。因此,该模型从工程学中继承了主体和环境之间的清晰分割。然而,假设环境机制产生的标准值和主体预测的响应都是线性的。现在考虑误差项 ϵs。该项可能指的是对整个有机体的适应性压力做出响应的生物约束。如果是这样,ϵs 应该被归类为环境约束而不是行为约束吗?答案将取决于重新分类所带来的结果,这将取决于模型和研究的目标(第 8 节)。如果我们正在使用透镜模型来理解有机体判断的生态效度,那么将 ϵs 重新分类为环境约束只会带来混乱;如果我们的重点是区分受选择约束的行为和被排除在选择之外的行为,那么提出的重新分类可能会带来清晰——但那么我们肯定会放弃透镜模型转而寻找其他东西,或者无论如何将不再提及 图 2 中的参数 ϵs。

最后,应该指出,镜头模型(像几乎所有用于表示人类判断和决策的线性模型一样)作为描述性模型并不很好扩展。在涉及超过三个线索的多线索决策任务中,人们经常转向简化启发式方法,因为执行必要计算涉及的复杂性(第 2.1 节; 另请参阅 第 4 节)。更一般地,正如我们在 第 2.3 节 中所述,线性模型涉及难以为人们执行的权衡计算。最后,假设环境是线性的是一个强大的建模假设。除了人类执行必要计算所面临的困难之外,随着特征数量的增加,理论上更难以证明模型选择决策。匹配指数_G_是一个拟合度量,但对于具有五个或更多维度的模型,拟合度测试和残差分析开始导致误导性结论。现代监督学习的机器学习技术通过专注于成就指数的类似物,纯粹工具地构建预测假设,并完全放弃匹配来克服这一限制(Wheeler 2017)。

3.3 有限理性分析

有限理性分析是应用于认知科学和生物学的方法论,旨在解释为什么认知系统或生物体通过诉诸于生物体的假定目标、环境的适应压力和生物体的计算限制而从事特定行为。一旦确定了生物体的目标,明确了环境的适应压力,并考虑了计算限制,就可以在这些条件下推导出一个最佳解决方案,以解释为什么在这些条件下,一种在其他情况下无效的行为可能仍然有效地实现了该目标(Marr 1982; Anderson 1991; Oaksford & Chater 1994; Palmer 1999)。有限理性分析通常独立于解释生物体如何实现行为的认知过程或生物机制而制定。

有限理性受理性分析文献的一个主题影响,即记忆的研究(Anderson & Schooler 1991)。例如,考虑到我们环境的统计特征以及我们通常追求的目标,遗忘不是一种负担,而是一种优势(Schooler & Hertwig 2005)。记忆痕迹被使用的可能性各不相同,因此记忆系统将尝试使那些最有用的记忆变得容易获取。这是一种有限理性风格的论证,这是认知心理学中贝叶斯转向的一个共同特征(Oaksford & Chater 2007; Friston 2010)。更一般地说,环境中物体的空间布局可以简化感知、选择以及产生有效解决方案所需的内部计算(Kirsch 1995)。将这种观点与讨论最近性或可用性效应扭曲主观概率估计的讨论进行比较 section 2.4

理性分析将行为的目标与导致行为的机制分开。因此,当一个生物在环境中观察到的行为与理性分析为该环境规定的行为不一致时,传统上有三种响应。一种策略是改变问题的规范,通过引入一个中间步骤或完全改变目标,或者改变环境约束等(Anderson & Schooler 1991; Oaksford & Chater 1994)。另一种策略是认为机制确实很重要,因此人类心理学的细节被纳入另一种解释(Newell & Simon 1972; Gigerenzer, Todd, et al. 1999; Todd, Gigerenzer, et al. 2012)。第三个选择是通过直接将计算机制纳入模型来丰富理性分析(Russell & Subramanian 1995; Chater 2014)。例如,Lewis、Howes 和 Singh 提出从(i)任务环境的结构特征;(ii)决策过程将在其上运行的有限机器,他们考虑代理人可能拥有的四种不同类别的计算资源;以及(iii)一个效用函数来规定目标,从而提供一个客观函数来评估结果(Lewis 等人 2014)。

3.4 文化适应

到目前为止,我们考虑了强调个体生物和其周围环境的理论和模型,这通常被理解为物理环境,或者如果是社会环境的话,则被建模为物理环境。我们考虑了一些通常被理解为行为约束的特征是否应该被归类为环境提供的条件。

然而,人们及其对世界的反应也是每个人环境的一部分。Boyd 和 Richardson 认为,人类社会应被视为一种适应性环境,这反过来影响了对个体行为的评估。人类社会包含大量信息,这些信息通过世代传承并得到扩展,尽管人类社会成员的学习是有限的、不完美的。_模仿_是人类的一种常见策略,包括婴儿(Gergely, Bekkering, & Király 2002),它对文化传播(Boyd & Richerson 2005)和社会规范的形成(Bicchieri & Muldoon 2014)至关重要。在我们的环境中,只需要少数对改进民间传说感兴趣的个体,就足以推动文化的适应性。人类社会相对于其他社会动物群体的主要优势在于,文化适应比基因适应要快得多(Bowles & Gintis 2011)。根据这一观点,人类心理进化为促进快速适应。自然选择并未赋予我们大脑发展较为僵化的行为,而是选择了允许它们根据环境自适应地修改行为的大脑(Barkow, Cosmides, & Tooby 1992)。

但如果人类心理进化为促进快速社会学习,那就是以人类轻信为代价。通过模仿社会规范和人类行为来实现快速适应的风险是采纳不适应的规范或愚蠢的行为。

4. 有限理性的权衡

有限理性的权衡 指的是将估计器的整体预测误差分解为其中心倾向(偏差)和离散度(方差)的特定分解。有时,通过增加偏差以减少方差,或反之亦然,可以降低整体误差,有效地在增加一种类型的误差的同时实现对另一种误差的较大减少。为了举一个直观的例子,假设您的目标是最小化相对于以下目标的得分。

在下一个链接中进一步描述的四个目标

图 3

关于这幅图的详细描述 请参见附录。

理想情况下,您会更喜欢一种既有低偏差又有低方差的“射击”程序。如果没有这种选择,而是在低偏差和高方差程序与高偏差和低方差程序之间做选择,您可能会更喜欢后者,如果后者的总体得分低于前者,这在上述相应的图中是成立的。尽管决策者的学习算法理想上应该具有低偏差和低方差,但实际上常见的情况是,减少一种类型的错误会导致另一种类型的错误增加。在本节中,我们将解释估计量的期望平方损失与其偏差和方差之间的关系成立的条件,然后谈谈偏差-方差权衡在有限理性研究中的作用。

4.1 均方误差的偏差-方差分解

预测罗马明年夏天消费的意式冰淇淋的确切数量比预测明年夏天消费的意式冰淇淋比明年冬天更多更困难。因为尽管高温必然导致对意式冰淇淋需求量的增加,但罗马每日温度与_consumo di gelato_之间的确切关系远非确定。对随机变量之间的定量预测关系进行建模,比如罗马温度_X_与罗马意式冰淇淋消费量_Y_之间的关系,是_回归分析_的主题。

假设我们预测_Y_的值为_h_。我们应该如何评估这个预测是否准确?直觉上,我们能做的最好的事情就是选择一个尽可能接近_Y_的_h_,一个能使 Y−h 的差异最小化的_h_。如果我们对错误的方向无所谓,认为特定幅度的正误差与同样幅度的负误差一样糟糕,反之亦然,那么一个常见的做法是通过_h_与_Y_的平方差(Y−h)2 来衡量_h_的性能。(我们并非总是无所谓;想想瞄准那个苹果的威廉·特尔的困境。)最后,由于_Y_的值会变化,我们可能对计算其期望值 E[(Y−h)2]来得到(Y−h)2 的平均值感兴趣。这个数量就是_h_的_均方误差_。

MSE(h):=E[(Y−h)2].

现在想象一下,我们对 Y 的预测是基于一些关于 XY 之间关系的数据 D,比如去年罗马的日均温度和日销量总额。这个特定数据集 D 扮演的角色,与其他可能的数据集不同,这是一个细节,稍后会涉及。现在,将我们对 Y 的预测视为 X 的某个函数,写作 h(X)。在这里,我们希望再次选择一个 h(⋅) 来使 E[(Y−h(X))2] 最小化,但 h(⋅) 与 Y 的接近程度将取决于 X 的可能值,我们可以通过条件期望来表示

E[(Y−h(X))2]:=E[E[Y−h(X)∣X]].

如何评估这个条件预测呢?与以往一样,只是现在考虑 X。对于 X 的每个可能值 xY 的最佳预测是条件均值,E[Y∣X=x]。YX 的_回归函数_,r(x),给出了每个值 x∈X 的 Y 的最优值:

r(x):=E[Y∣X=x].

尽管回归函数代表了给定 XY 的真实总体值,但这个函数通常是未知的,通常很复杂,因此经常通过简化模型或学习算法 h(⋅) 进行近似。

我们可能将对 h(X) 的候选者限制为 X 的线性(或仿射)函数,例如。然而,使用简化的线性模型或其他简化模型对 Y 的值进行预测可能会引入一种称为 偏差 的系统预测误差。偏差是由真实模型生成的数据的中心倾向 r(X) (对于所有 x∈X)与我们的估计量 E[h(X)] 的中心倾向之间的差异导致的,写成

偏差(h(X)):=r(X)−E[h(X)],

其中对这对之间的任何非零差异的解释都被解释为估计量 h(X) 的系统正误差或系统负误差。

方差 衡量随机变量与其期望值的平均偏差。在当前设置中,我们将预测值 h(X) 关于 XY 之间关系的一些数据 D 进行比较,并将 h(X) 的平均值 E[h(X)] 与之写为

Var(h(X))=E[(E[h(X)]−h(X))2].

均方误差的偏差-方差分解根植于频率统计学,其目标是计算关于 XY 之间关系的一些数据 D 关于真实参数 r(X) 的估计 h(X) 。这里假定表征关于 Y 的真相的参数 r(X) 是固定的,而数据 D 被视为随机量,这正是贝叶斯统计的反面。这意味着数据集 D 被解释为由真实模型、确定性过程 r(X) 生成的相同维度的许多可能数据集之一。

根据 Christopher M. Bishop(2006)的观点,我们可以推导出对_h_的均方误差的偏差-方差分解如下。 让_h_指代我们对_Y_的估计_h(X)_ ,_r_指代_Y_的真实值,E[h] 指代估计_h_的期望值。那么,

MSE(h)=E[(r−h)2]=E[((r−E[h])+(E[h]−h))2]=E[(r−E[h])2]+E((E[h]−h)2)+2E[(E[h]−h)⋅(r−E[h])]=(r−E[h])2+E[(E[h]−h)2]+0=B(h)2 + Var(h)

其中术语 2E[(E[h]−h)⋅(r−E[h)] 为零,因为

E[(E[h]−h)⋅(r−E[h])]=(E[r⋅E[h]]−E[E[h]2]−E[h⋅r]+E[h⋅E[h]])=r⋅E[h]−E[h]2−r⋅E[h]+E[h]2=0.(1)(2)(3)

请注意,频率主义假设_r_是一个确定性过程对于推导是必要的;因为如果_r_是一个随机量,那么在第(2)行中将_E[r⋅E[h]]_ 减少为_r⋅E[h]_ 将是无效的。

我们忽略的最后一个细节是由噪声_N_引起的_h(X)_ 的预测误差,这种误差与所使用的模型/学习算法无关。因此,对于估计_h_的均方误差的完整偏差-方差分解是偏差(平方)、方差和不可减小的误差的总和:

MSE(h) = B(h)² + Var(h) + N(4)

4.2 有限理性和偏差-方差泛化

直觉上,偏差-方差分解揭示了在进行预测时两种极端方法之间的权衡。在一个极端情况下,您可能会采用一个产生相同答案的常数函数作为估计量,无论看到什么数据。假设 7 是您的幸运数字,您的估计器的预测为 h(X) = 7。那么 h(⋅) 的方差将为零,因为其预测始终相同。然而,您的估计器的偏差将非常大。换句话说,您的幸运数字 7 模型将极大地_欠拟合_您的数据。

在另一个极端,假设你的目标是使你的偏差误差为零。这仅在预测值_Y_和实际值_Y_完全相同时发生,即对于每个(xi, yi),h(xi)=yi。由于假定你不知道真实函数 r(X),而只能看到来自真实模型 D 的数据样本,你将努力从这个样本中构建一个能够泛化以准确预测训练数据 D 之外示例的估计器。然而,如果你将 hD(X)完全拟合到 D,那么你的估计器的方差将非常高,因为不同的数据集 D'与真实模型不同,根据定义,它与 D 不相同。D'与 D 有多大不同?在所有可能的数据集中,一个数据集到另一个数据集的变化是由真实模型生成的数据的方差或不可减少的噪音,这可能是相当大的。因此,在这种零偏差情况下,你的模型将极度过度拟合你的数据。

因此,偏差-方差权衡涉及一个问题,即模型应该有多复杂才能对未见或样本外示例做出合理准确的预测。问题在于在欠拟合模型和过拟合模型之间取得平衡,欠拟合模型错误地忽略了关于真实函数 r 的可用信息,而过拟合模型错误地包含了噪音信息,从而提供了关于真实函数 r 的误导性信息。

人类认知系统非常擅长从有限数量的示例中泛化。当我们比较人类如何学习复杂技能(如开车)与机器学习系统学习相同任务时,人类与机器之间的差异尤为显著。教导青少年如何开车可能是一次令人心惊的经历,但他们不需要撞到电线杆 10000 次才学会电线杆是不能穿越的。青少年在童年时通过玩耍和观察其他人开车所学到的关于世界的知识使他们明白电线杆是要绕过的,这是我们当前的机器学习系统所没有但必须从零开始逐个案例学习的常识。我们与我们的机器不同,具有出色的能力将我们从一个领域学到的知识转移到另一个领域,这种能力在一定程度上受到我们的好奇心的推动(Kidd & Hayden 2015)。

从偏差-方差权衡的角度来看,从稀疏数据中做出准确预测的能力表明方差是错误的主要来源,但我们的认知系统通常能够将这些错误控制在合理范围内(Gigerenzer & Brighton 2009)。事实上,Gigerenzer 和 Brighton 提出了更有力的论点,指出“偏差-方差困境在形式上展示了为什么一个头脑可以更好地使用一套有偏见、专门化的启发式工具箱”(Gigerenzer & Brighton 2009: 120);另请参阅 section 7.2。然而,偏差-方差分解是平方损失的分解,这意味着上述分解取决于如何衡量总误差(损失)。然而,根据所做推断的类型以及做出推断的风险,存在许多损失函数。例如,如果使用 0-1 损失函数,其中所有非零错误都被视为相同——意味着“失之毫厘,谬以千里”——上述分解就会崩溃。事实上,对于 0-1 损失,偏差和方差是乘法组合(J. Friedman 1997)!适用于各种损失函数 L(⋅)的偏差-方差分解的推广已经由(Domingos 2000)提出,

L(h) = B(h)² + β₁Var(h) + β₂N

其中原始的偏差-方差分解,Equation 4,出现为一个特殊情况,即当 L(h)=MSE(h)且 β₁=β₂=1 时。

5. 有限理性的优势

我们对不当的线性模型的讨论(第 2.3 节)提到了一个模型,它经常出奇地接近逼近一个适当的线性模型,我们对偏差-方差分解的讨论(第 4.2 节)提到了关于认知系统如何设法在很少的数据下做出准确预测的猜想。在本节中,我们将回顾一些偏离规范全局理性标准的模型的例子,但却产生了明显_改进_的结果——有时甚至产生了在全局理性条件下不可能实现的结果。因此,在本节中,我们将调查来自_小样本统计_和_博弈论_的例子,这些例子指出了偏离全局理性的明显优势。

5.1 Homo Statisticus 和小样本

在对 20 世纪 60 年代末发表的评估人类统计推理的实验结果进行回顾时,该研究考虑了心理学在完全接受统计研究方法之后进行的研究(2.3 节),彼得森和比奇(Petersen and Beach)认为,概率论和统计优化方法的规范标准是“推理心理学理论的一个很好的第一近似”(Peterson & Beach 1967: 42)。彼得森和比奇认为人类是_直觉统计学家_,其行为与_统计人_的理想标准非常接近,这与当时关于逻辑规范与智能行为之间密切关系的更广泛共识相吻合(Newell & Simon 1956, 1976)。认为人类判断和决策与概率和逻辑的规范理论非常接近的假设后来受到了卡尼曼和特沃斯基的实验结果以及偏见和启发式程序的更广泛挑战(7.1 节)。

卡尼曼和特沃斯基最早的发现之一是,人们倾向于从样本中进行统计推断,即使有机会控制抽样过程。卡尼曼和特沃斯基将这种效应归因于人们系统性地未能意识到与小样本相关的偏见,尽管赫特维格(Hertwig)等人提供了证据表明,从单一人口中抽取的样本接近于工作记忆的已知极限(Hertwig, Barron 等人 2004)。

过度自信可以被理解为小样本的产物。天真抽样模型(Juslin, Winman, & Hansson 2007)假设,代理人在需要做出判断时,基于从长期记忆中检索的小样本进行判断,即使代理人有多种其他方法可供选择。该模型假定人们是天真的统计学家(Fiedler & Juslin 2006),有时错误地假设样本代表了感兴趣的目标人口,并且样本属性可以直接用来产生对人口的准确估计。这个想法是,当样本属性被毫无保留地视为人口参数的估计量时,即使样本是无偏的、准确表示的,并且被代理人的认知机制正确处理,也可以通过过度自信做出相当准确的概率判断。当样本量受限时,这些效应会被放大。

然而,有时有效的行为受到不准确的判断或认知适应性幻觉的帮助(豪伊,2011)。小样本的统计特性就是一个例子。小样本的一个特点是相关性被放大,使其更容易被检测到(卡里夫,1995)。关于小样本的这一事实,结合人类短期记忆的已知限制,表明我们的工作记忆限制可能是我们在生活的不同阶段利用的一种适应性响应。成年人的短期工作记忆限制为七个项目,加减两个。对于 0.5 及以上的相关性,卡里夫证明,样本量在五到九之间最有可能产生一个大于人口真实相关性的样本相关性(卡里夫,2000),使得这些相关性更容易被检测到。此外,儿童的短期记忆甚至比成年人更受限制,因此使得环境中的相关性更容易被检测到。当然,没有免费的午餐:这种小样本效应是以夸大真实相关系数的估计和承认更高的假阳性率为代价的(尤斯林和奥尔松,2005)。然而,在许多情境中,包括儿童发展,由于欠采样而产生的错误成本可能会被简化选择(赫特维格和普莱斯卡克,2008)和加速学习的好处所补偿。在布伦斯维克为代表性实验设计辩护的精神中(3.2 节),越来越多的文献警告说,关于自适应决策的大部分实验是在与人类做决策的自然世界在重要方面不同的高度简化的环境中进行的(福斯特等,2014)。作为回应,休斯顿、麦克纳马拉和同事们主张,我们应该在我们的模型中加入更多的环境复杂性。

5.2 博弈论

亲社会行为,如合作,是很难解释的。进化博弈论预测个体会放弃公共利益,个体效用最大化将胜过集体合作。尽管这种结果经常在经济实验中看到,在更广泛的社会中,合作行为是普遍的(Bowles & Gintis 2011)。为什么?传统的人类合作的进化解释,涉及“声誉”、“回报”和“报复”(Trivers 1971;R. Alexander 1987),是不令人满意的,因为它们不能唯一解释为什么合作是一种稳定的行为。如果一个群体惩罚个体未能执行某种行为,而惩罚成本超过执行该行为的好处,那么这种行为将变得稳定,无论其社会好处如何。反社会规范可以说正是通过同样的机制扎根(Bicchieri & Muldoon 2014)。尽管声誉、回报和报复可能解释了人类社会中如何维持大规模合作,但它并不能解释这种行为是如何产生的(Boyd & Richerson 2005)。此外,合作行为在微生物中也有观察到(Damore & Gore 2012),这表明更简单的机制足以促成合作行为的出现。

20 世纪 70 年代人们更广泛地意识到不恰当模型的优势,因为它们通常能产生足够好的结果(section 2.3),而 80 年代和 90 年代见证了一系列结果,这些结果涉及不恰当模型产生的结果严格优于相应正确模型所预测的结果。20 世纪 80 年代初,Robert Axelrod 举办了一场锦标赛,以经验测试一系列囚徒困境博弈策略中哪种在循环比赛中表现最好。获胜者是一种简单的互惠策略,称为“以牙还牙”(Rapoport & Chammah 1965),它简单地开始每局游戏都合作,然后在每一轮中,复制对手在上一轮中采取的策略。因此,如果你的对手在这一轮合作,那么你将在下一轮合作;如果你的对手在这一轮背叛,那么你将在下一轮背叛。随后的锦标赛表明,以牙还牙对抗更复杂的替代方案具有非常强大的稳健性(Axelrod 1984)。例如,即使是一个理性的效用最大化玩家与一个只采取以牙还牙策略的对手对战(即,无论面对谁都会采取以牙还牙策略),也必须适应并采取以牙还牙策略,或者非常接近它(Kreps, Milgrom, et al. 1982)。

由于以牙还牙是一种非常简单的策略,在计算上,人们可以开始探索有限理性代理群体中出现的理性概念,甚至可以看到这些限制对于亲社会规范的出现有所贡献。Rubinstein(Rubinstein 1986)研究了玩重复囚徒困境的有限自动机,其目标是在最大化平均收益的同时最小化机器状态的数量。有限自动机捕捉到正则语言,乔姆斯基层次结构的最低级别,因此模拟了一种有限理性代理。解决方案是一对机器,其中每个玩家在游戏的每个阶段选择的机器都是最优的。在重复博弈的进化解释中,Rubinstein 的每次迭代可以被看作是代理的连续世代。这种方法与 Neyman 对重复博弈玩家的研究形成对比,后者只能玩纯策略的混合策略,这些策略可以在有限自动机上进行编程,其中可用的状态数量是一个外生变量,其值由建模者固定。在 Neyman 的模型中,每一代都玩整个游戏,因此与声誉相关的特征可能会出现(Neyman 1985)。更一般地,尽管对于无限次重复的囚徒困境来说合作是不可能的,但对于有限次重复的囚徒困境,对于有限自动机玩家,其状态数量小于游戏轮数的指数级时存在一个合作均衡(Papadimitriou&Yannakakis 1994;Ho 1996)。然而,即使对于由中等规模玩家组成的以牙还牙等简单策略来说,对记忆的要求可能会超过人们的心理能力(Stevens,Volstorf 等,2011)。这些理论模型展示了通往亲社会行为的许多简单途径,但单凭这些模型可能还不足以提供合作的可信过程模型。

在对时间效应(有限迭代与无限迭代)和记忆/认知能力(有限状态自动机与图灵机)的影响进行研究之后,人们很快将注意力转向了环境约束。Nowak 和 May 研究了在二维网格上的“合作者”和“背叛者”的空间分布,在重复囚徒困境中发现,即使没有记忆或战略远见,玩家之间也会出现合作(Nowak&May 1992)。这项工作导致了对_网络拓扑_作为社会行为因素的研究(Jackson 2010),包括社会规范(Bicchieri 2005;J. Alexander 2007),信号传递(Skyrms 2003)和群体智慧效应(Golub&Jackson 2010)。当网络中的社会联系遵循无标度分布时,公共产品游戏的数量和规模的多样性被发现促进了合作,这有助于解释在没有声誉和惩罚机制的社区中合作的出现(F. Santos,M. Santos,&Pacheco 2008)。

但是,也许有限理性最简单的案例是代理人在没有任何思考的情况下实现了一个理想目标。昆虫、花朵,甚至细菌都展示了进化稳定策略(Maynard Smith 1982),有效地在战略正常形式博弈中达到了纳什均衡。如果我们想象两个物种相互作用,比如蜜蜂(Apis mellifera)和一种花朵,每只蜜蜂和花朵之间的互动都对每个物种的适应度有一定影响,其中适应度被定义为预期的后代数量。每次互动后,蜜蜂和花朵可能会获得一定的回报,可能是负面的,并且回报是由每只蜜蜂和花朵的基因赋予决定的。关键在于这些生物体或模型中都没有展示出选择;过程本身选择了特征。代理人没有远见。玩家们自己选择的策略也没有。这个过程完全是机械的。在这种情况下出现的是_进化动态_,一种没有远见的有限理性形式。

当然,任何不当的模型都可能失灵。全世界人们共享的一个经验法则是不让别人占便宜。虽然这个规则大多数时候都有效,但在_最后通牒博弈_(Güth, Schmittberger, & Schwarze 1982)中却失灵了。最后通牒博弈是一个两人博弈,其中一名玩家拥有一笔钱,被要求与另一名玩家分享这笔钱,后者可以选择接受这个提议——在这种情况下,奖金将被平分给两名玩家——或拒绝,这样两名玩家都将得不到任何奖金。当人们收到低于总额 30%的提议时,通常会拒绝这个提议,即使玩家是匿名的,因此不会遭受接受非常低提议所带来的负面声誉信号的后果。在这种情况下,人们可以合理地认为任何提议的分配都比零的现状更糟糕,所以人们应该接受任何他们所得到的。

5.3 少即是多效应

Simon 指出,人们在没有最大化智慧时会满足(Simon 1957a: xxiv),这指向一个常见的假设,即在努力和准确性之间存在权衡(section 2.1)。由于全局理性的规则操作成本高昂(Good 1952: 7(i)),人们会为了认知效率的提升而牺牲准确性(Payne, Bettman, & Johnson 1988)。理性分析的方法论(section 3.3)同样涉及到这种权衡。

Section 5.2 中调查的结果警告我们不要盲目支持准确性和努力之间的权衡是普遍适用的,这一点已经在捍卫启发式作为决策制定合理模型时被强调(Katsikopoulos 2010; Hogarth 2012)。

像_Tallying_这样的简单启发式,它是一种不恰当的线性模型(section 2.3),以及_Take-the-best_(section 7.2),在许多数据集上与线性回归进行测试后,已经发现在样本外预测任务中,尤其是在训练样本量较少时,它们的表现都优于线性回归(Czerlinski 等人 1999; Rieskamp & Dieckmann 2012)。

6. 奥曼的五个论点和一个更多

奥曼提出了有限理性的五个论点,我们在此进行解释(1997)。

  1. 即使在非常简单的决策问题中,大多数经济主体并不是(故意的)最大化者。人们不会扫描选择集,并有意识地从中选择一个最大的元素。

  2. 即使经济主体渴望从选择集中挑选出一个最大元素,进行这样的最大化通常是困难的,大多数人在实践中无法做到。

  3. 实验表明,人们未能满足理性决策理论的基本假设。

  4. 实验表明,理性分析的结论(广义上包括理性决策理论)与观察到的行为不相符。

  5. 有限理性 的一些结论在规范上看起来是不合理的。

在前面的部分,我们涵盖了奥曼的每个论点的起源。在这里,我们简要回顾每一个,突出其他部分中的材料在这个背景下。

第一个论点是,人们不是刻意的最大化者,这是西蒙的一个工作假设,他认为人们倾向于满足而不是最大化(section 2.2)。卡内曼和特沃斯基收集了关于估计选项价值的反思效应的证据,这是前景理论中参考点的原因(section 2.4),以及在依赖排序效用理论中更普遍的类似属性(章节 1.22.4)。吉格伦泽和赫特维格在马克斯·普朗克人类发展研究所的研究小组都研究简单启发式算法结构和解释它们采纳和有效性的适应心理机制;他们的研究计划都从这样一个假设开始,即期望效用理论不是判断和决策的描述性理论的正确基础(章节 35.37.2)。

第二个论点是,即使人们渴望如此,他们通常也无法最大化,这一点是由西蒙和古德等人提出的,后来由卡内曼和特沃斯基提出。西蒙关于在国际象棋的终局中计算 Γ-最小最大推理复杂性的言论是他职业生涯中众多例子之一,早在他在 1950 年代关于有限理性的重要论文之前就开始了。特沃斯基和卡内曼在 1960 年代末和 1970 年代开展的_偏见和启发式_计划推动了系统研究人们的判断何时以及为什么偏离规范标准,即期望效用理论和逻辑一致性。

第三个论点是,实验表明人们未能满足期望效用理论的基本假设,这一点早已为人所知,并且被提出和完善了经济人假设的作者们强调(第 1 节),他们的名字与数学基础联系在一起。我们在 第 1.3 节 中强调了来自萨维奇的延伸引用,但也可以提到德芬奈和萨维奇(1962)对该理论局限性的讨论,甚至更仔细地阅读每个经典专著,即萨维奇 1954 年和德芬奈 1970 年。我们在 第 1.3 节 中讨论的另一个考虑是期望效用理论和几乎所有公理变体对_逻辑全知_的要求。

第四个论点涉及理性分析的预测与观察行为之间的差异,我们在讨论布伦斯维克生态效度观念(第 3.2 节)以及理性分析对这些观察的传统回应(第 3.3 节)时进行了讨论。第五个论点是,一些理性分析的结论与合理的规范标准不符,这一点在 1.2 节1.3 节 以及 第 5 节 中有所涉及。

Aumann 的前四个论点中隐含着这样一个概念,即全局理性是一个合理的规范标准,但对于人类判断和决策的描述性理论来说却存在问题。即使是支持 Aumann 第五个论点的文献,也通常通过对基础数学理论的修改或扩展来解决预期效用理论作为规范标准的问题。这种对优化方法、支配推理和逻辑一致性的广泛承诺是那些将有限理性视为“在约束下的优化”的方法的基础规范原则:

事实上,当考虑到计算成本以及问题本身固有的利益和成本时,有限理性程序实际上是完全最优的程序(Arrow 2004)。

对于跨学科研究人员的大多数来说,有限理性被认为是在约束条件下的某种形式的优化问题。

Gerd Gigerenzer 是最杰出和直言不讳的批评者之一,他批评优化方法和逻辑一致性在人类理性常见规范中所起的作用(Gigerenzer & Brighton 2009),特别是这些标准在 Kahneman 和 Tversky 的偏见和启发式程序中所起的作用(Kahneman & Tversky 1996; Gigerenzer 1996)。我们接下来转向这场辩论,在 第 7 节

7. 有限理性的两种启发式学派

启发式是用于做出判断或决策的简单经验法则。到目前为止,我们已经看到一些例子,包括 Simon 的满意法、Dawes 的不当线性模型、Rapoport 的以牙还牙、模仿,以及 Kahneman 和 Tversky 在我们讨论前景理论时观察到的几种效应。

然而,关于启发式有两种观点,大致对应着与卡内曼和特沃斯基的_偏见和启发式_项目以及吉格伦泽的_快速和简约启发式_项目相关的研究传统。这两个研究项目之间的核心争议是用于评判人类行为的适当规范标准(Vranas 2000)。根据吉格伦泽的观点,偏见和启发式项目错误地将所有偏见都归类为错误(Gigerenzer,Todd 等,1999 年;Gigerenzer&Brighton,2009 年),尽管有证据表明人类心理学中的一些偏见是适应性的。相比之下,在与批评者的一次罕见交流中,卡内曼和特沃斯基认为争议仅仅是术语上的(Kahneman&Tversky,1996 年;Gigerenzer,1996 年)。

在本节中,我们简要概述这两个学派。我们的目标是对每个研究项目进行表征,而不是详尽的概述。

7.1 偏见和启发式

自 1970 年代开始,卡内曼和特沃斯基进行了一系列实验,展示了人类参与者对决策任务的反应方式与据称源自适当规范标准的答案有所偏离(2.4 节和 5.1 节)。这些偏差被命名为_可得性_(特沃斯基和卡内曼 1973 年)、代表性_和_锚定(特沃斯基和卡内曼 1974 年)。认知偏见的集合现在已经达到数百种,尽管其中一些是其他众所周知效应的次要变体,比如“宜家效应”(诺顿、莫肯和阿里利 2012 年)是众所周知的归属效应的一个版本(1.2 节)。然而,认知偏见和启发式程序研究的核心效应,特别是那些支撑前景理论的效应(2.4 节),根深蒂固于认知心理学(卡内曼、斯洛维克和特沃斯基 1982 年)。

概率判断任务的一个例子是卡内曼和特沃斯基的出租车问题,据称显示受试者忽视了基本概率。

一辆出租车在夜间发生了一起肇事逃逸事故。城市中有两家出租车公司,绿色公司和蓝色公司。你获得以下数据:

%%

  • 城市中 85%的出租车是绿色的,15%是蓝色的。

%%

  • 一个证人确定出租车是蓝色的。法庭测试他在适当的能见度条件下辨认出租车的能力。当展示一组出租车样本(一半是蓝色,一半是绿色)时,证人在 80%的情况下做出正确的辨认,在 20%的情况下犯了错误。

问题:在事故中涉及的出租车是蓝色而不是绿色的概率是多少?(Tversky & Kahneman 1977: 3–3)。

继续,卡内曼和特沃斯基报告说,已经给了几百名受试者这个问题的略微变体,对于所有版本,众数和中位数的回答都是 0.8,而不是正确答案的 12/29(≈0.41)。

因此,概率的直觉判断与证人的可信度相一致,并忽略了相关的基础率,即绿色和蓝色出租车的相对频率。(Tversky & Kahneman 1977: 3–3)。

对这类结果的批评性回应可分为三大类。第一种回应类型是认为实验者而非受试者出错(Cohen 1981)。在出租车问题中,可以说贝叶斯站在民间人士一边(Levi 1983),或者,由于实验者的规范标准与受试者的假定规范标准需要一个关于证人证词的理论,而这两者都没有明确规定,因此结论不明确(Birnbaum 1979)。其他认知偏见也被卷入了复制危机,比如_内隐偏见_(Oswald, Mitchell 等人 2013;Forscher, Lai 等人 2017)和_社会启动_(Doyen, Klein 等人 2012;Kahneman 2017 [其他互联网资源])。

第二种回应是认为确定结合概率信息的规范标准并在一系列案例中应用之间存在重要差异(第 8.2 节),而在实践中很难确定决策者是否以实验者意图的方式表达任务(Koehler 1996)。表现出有限理性甚至非理性的观察行为可能是由于问题的预期规范化与受试者实际面临的问题之间存在差异。

例如,考虑卡内曼和特沃斯基早期作品中报道的人们对随机性的系统偏见(Kahneman&Tversky 1972)。对于公平硬币的翻转序列,人们期望在小样本中看到大致相等数量的正反面和正反面之间的交替率略高于长期平均水平(Bar-Hillel&Wagenaar 1991)。这种效应被认为解释了_赌徒谬误_,即错误地认为从公平硬币投掷的独立同分布序列中出现一连串正面将使下一次翻转更有可能出现反面。哈恩和沃伦认为,人们对随机序列的有限经验性质是比将其视为认知缺陷更好的解释。具体来说,人们只会体验到来自随机器的有限输出序列,比如一系列公平硬币投掷,而他们在序列中过去结果的记忆限制将意味着并非所有给定长度的可能序列对他们来说具有相等的概率。因此,对于问题“从公平硬币翻转中更有可能看到_HHHT_还是_HHHH_?”,存在一种心理上合理的解释,正确答案是“Yes”(Hahn&Warren 2009)。如果赌徒谬误归结为未能区分有放回和无放回抽样,哈恩和沃伦的观点是,仅通过经验获得的直觉统计能力无法区分这两种抽样方法。需要进行分析推理。

还要考虑在 section 2.4 中简要提到的风险选择框架效应。一个例子是亚洲疾病例子,

  • 如果采用方案_A_,将拯救 200 人。

  • 如果采用方案_B_,有 1/3 的概率会拯救 600 人,有 2/3 的概率不会拯救任何人(Tversky & Kahneman 1981: 453)。

Tversky 和 Kahneman 报告称,大多数受访者(72%)选择了选项(a),而大多数受访者(78%)在将问题重新表述为死亡人数而非幸存人数时选择了选项(b)。随后实验的元分析显示,表述条件占据了大部分变异性,但也揭示出在前景理论、累积前景理论和马科维茨效用理论中形式化指定的预测因子的线性组合无法捕捉这种表述效应(Kühberger, Schulte-Mecklenbeck, & Perner 1999)。

对于这第二条批评线索的要点并不在于人们的回应与正确的规范标准不符,而在于为什么他们的回应不符将会影响不仅评估人们的理性,还会影响应该采取哪些规范干预来对抗错误。草率地得出结论认为人们犯错,而不是任务的特殊性或我们目前可用的理论工具,是错误的。

最后,第三种响应类型是接受实验结果,但质疑它们是否具有普适性。例如,在对卡内曼和特维斯基的律师-工程师示例进行控制性复制实验时(特维斯基和卡内曼 1977),一个关键假设是个体描述是否是随机抽取的,这通过让受试者从一个瓮中盲目抽取来进行测试(Gigerenzer, Hell, & Blank 1988)。在这些条件下,基本概率忽视现象消失了。对于琳达示例的回应(特维斯基和卡内曼 1983),重新用_哪个选择更频繁_而不是_哪个选择更可能_的术语来表述示例,将受试者中的连接谬误发生率从 77%降低到 27%(Fiedler 1988)。更普遍地说,大多数面对琳达示例的人似乎在对“概率”进行非数学解释时,但在被要求进行频率判断时会转向数学解释(Hertwig & Gigerenzer 1999)。自此之后,拉尔夫·赫特维格(Ralph Hertwig)及其同事指出了涉及概率判断的各种其他效应,在受试者被允许通过抽样学习概率时,这些效应减弱或消失,这表明人们更适应通过对相关概率的_经验决策_而不是通过对其_描述_进行决策(Hertwig, Barron 等人 2004)。

7.2 快速和简便启发式

快速和简便启发式学派与偏见和启发式学派都同意启发式是有偏见的。它们的分歧之处,也是尖锐之处,在于这些偏见是否必然是非理性的表现。对于快速和简便程序来说,问题在于在什么环境条件下,如果有的话,特定的启发式才能有效地发挥作用。如果启发式的结构性偏见适合任务环境,那么该启发式的偏见可能是进行准确判断的优势,而不是一个劣势(section 4)。我们在讨论布伦斯维克的透镜模型时曾看到这种适应性策略(section 3.2),尽管在该模型中的偏见是假设环境和受试者的反应都是线性的。快速和简便程序的目标是将这种布伦斯维克策略适应到各种不当模型中。

这个快速和简约计划的总体目标导致了这两所学派之间的第二个差异。因为快速和简约计划旨在明确启发式在何种条件下会比竞争模型产生更好的结果,所以启发式被视为决策制定的算法模型,而不是错误效应的描述;启发式本身是研究对象。为此,快速和简约传统中的所有启发式都被构想为具有三个组成部分:(i)搜索规则,(ii)停止规则和(iii)决策规则。例如,Take-the-Best(Gigerenzer&Goldstein 1996)是一种应用于二元、强制选择问题的启发式。具体而言,任务是根据外部标准选择正确的选项,例如根据决策者可获得的线索信息正确选择一对城市中哪个人口更多,比如她是否听说过其中一个城市而不是另一个城市,其中一个城市是否已知在职业联赛中有橄榄球分部等。基于数据集,可以计算不同线索的预测有效性,从而推导出它们的权重。然后,Take-the-Best 具有以下结构:搜索规则: 查找具有最高线索有效性的线索;停止规则: 如果对象对的线索值不同,即一个是正的,另一个是负的,则停止搜索。如果线索值相同,则继续按线索顺序向下搜索;决策规则: 预测具有正线索值的替代方案具有更高的目标标准值。如果所有线索都无法区分,即如果所有线索值都相同,则通过抛硬币随机预测替代方案。Take-the-Best 的偏见在于它忽略了相关线索。另一个例子是_tallying_,这是一种不当的线性模型(第 2.3 节)。对于二元、强制选择任务,tallying 具有以下结构:搜索规则: 以随机顺序查找线索;停止规则: 在评估了可用线索中的某些外生确定的_m_(1 < m≤N)之后,停止搜索;决策规则: 预测具有更多正线索值的替代方案具有更高的目标标准值。tallying 的偏见在于它忽略了线索权重。可以看到,通过线索处理方式和性能评估模型之间的比较,以及根据成功的特定标准进行评估,例如正确回答城市人口任务的数量,来评估它们的表现。

因为快速和简便启发式是计算模型,这导致了这两个学派之间的第三个区别。卡尼曼支持认知的系统 I 和系统 II 理论(Stanovich & West 2000)。此外,卡尼曼将启发式分类为快速、直觉和非深思熟虑的系统 I 思维。相比之下,吉格伦泽不支持系统 I 和系统 II 的假设,因此拒绝将启发式分类为必然的非深思熟虑的认知过程。因为启发式是快速和简便计划中的计算模型,原则上每个启发式都可以被决策者深思熟虑地使用,或者被决策建模者用来解释或预测决策者的非深思熟虑行为。棒球运动员直觉地使用的线性光学轨迹(LOT)启发式(McBeath, Shaffer, & Kaiser 1995),用来接住飞行球,一些动物似乎也用它来截取猎物,这也是“哈德逊奇迹”航空飞行员深思熟虑地使用的启发式,推断他们无法到达机场跑道,决定着陆在哈德逊河中。

以下是快速和简便计划中研究的启发式列表(Gigerenzer, Hertwig, & Pachur 2011),以及每个启发式的非正式描述,以及历史和选定的当代参考文献。

  1. 模仿。 人们有强烈的倾向模仿他们社区中成功的成员(Henrich & Gil-White 2001)。

如果一个部落中的某个人发明了一种新的陷阱、武器或其他攻击或防御手段,最明显的自我利益,即使没有太多的推理能力,也会促使其他成员模仿他。(达尔文 1871, 155)

模仿被认为是文化适应速度的基础,包括社会规范的采纳 (section 3.4)。

  1. 优先连接。 当选择与某人建立新联系时,请选择与其他人有最多连接的个体 (尤尔 1925; 巴拉巴西和阿尔伯特 1999; 西蒙 1955b)。

  2. 默认规则。 如果有适用的默认规则,并且没有明显的理由让你做出不同选择,那就遵循这个规则。 (Fisher 1936; Reiter 1980; Thaler & Sustein 2008; Wheeler 2004)。

  3. 满足规则。 搜索可用选项,并选择首个超过你的愿望水平的选项。 (Simon 1955a; Hutchinson et al. 2012)。

  4. 计数。 为了估计一个目标标准,而不是估计可用线索的权重,而是计算正例的数量。 (Dawes 1979; Dana & Dawes 2004)。

  5. 一弹跳规则(Hey’s Rule B)至少搜索两个选项。如果报价高于先前的报价,请停止。 一弹跳规则通过持续搜索来进行“连胜”,当您不断收到越来越低的报价时继续搜索,但一旦运气用完就会停止(Hey 1982;Charness & Kuhn 2011)。

  6. 以牙还牙开始合作,然后以同样的方式回应对手;如果对手合作,则合作;如果对手背叛,则背叛(Axelrod 1984;Rapaport, Seale, & Colman 2015)。

  7. 线性光学轨迹(LOT)为了与另一个移动物体相交,调整您的速度,使您的注视角保持恒定。 (McBeath 等,1995;Gigerenzer 2007)。

  8. 采用最佳策略。 为了决定两个选择在特定标准上哪个价值更高,(i)首先按照它们的预测有效性顺序搜索线索;(ii)接下来,当找到一个能区分两个选择的线索时停止搜索;(iii)然后,选择被区分线索选中的选择。(iv)如果所有线索都无法区分两个选择,则通过随机选择一个选择(Einhorn 1970;Gigerenzer&Goldstein 1996)。

  9. 识别: 为了决定两个选择在特定标准上哪个价值更高,且其中一个选择被识别,选择被识别的选择(Goldstein&Gigerenzer 2002;Davis-Stober,Dana 和 Budescu 2010;Pachur,Todd 等人 2012)。

  10. 流畅性: 为了决定两个选择在特定标准上哪个价值更高,如果两个选择都被识别但一个被更快地识别,选择更快被识别的选择(Schooler&Hertwig 2005;Herzog&Hertwig 2013)。

  11. 1N 规则: 对于 N 个可行选项,均匀投入资源到所有 N 个选项 (Hertwig, Davis, & Sulloway 2002; DeMiguel, Garlappi, & Uppal 2009)。

对于快速和简约程序有三种回应方式。择优法是一个_非补偿性_决策规则的例子,这意味着第一个区分性线索不能被后续的线索“补偿”。当这种情况发生时,认为应该根据第一个区分性线索做出决策,忽略其余线索信息。择优法的计算效率被认为来自于只评估少数线索,平均不超过 3 个,在基准测试中(Czerlinski 等人,1999 年)。然而,决策者需要了解并在开始搜索前对所有线索的有效性进行排序。因此,择优法的设计将一部分执行启发式所需的计算成本视为外生。尽管通过比较对线索进行排序的下限是 O(nlogn),但几乎没有证据表明人类按照这类最有效的排序算法对线索进行排序。相反,这些操作恰恰是定性概率判断所需的操作(1.2 节)。此外,除了排列线索有效性的成本外,还有获取成本以及确定代理的估计是非补偿性的成本。尽管对所需认知努力的确切核算是未知的,并且据称低于批评者所认为的(Katsikopoulos 等人,2010 年),然而这些必要步骤威胁着使择优法在执行中成为非补偿性,但在建立模型执行前所需的内容上并非如此。

第二条批评线涉及对“Take the Best”(Chater, Oaksford, Nakisa, & Redington 2003)认知合理性的质疑。几乎所有关于“Take-the-Best”性能特征的实证数据都是通过计算机模拟得出的,最初的比赛将“Take the Best”与标准统计模型进行了比较(Czerlinski 等人,1999 年),但省略了 Chater、Oaksford 和同事发现的表现与“Take the Best”一样出色的标准机器学习算法。自这些最初的研究以来,焦点已转向机器学习,包括“贪婪提示排列”等“Take-the-Best”的变体,这些变体的表现被证明比原始模型更好,并且在存在时始终能够找到准确的解决方案(Schmitt & Martignon 2006)。撇开针对“Take the Best”作为决策模型的比较性能优势的批评,其他人质疑使用“Take-the-Best”作为认知模型的合理性。例如,“Take-the-Best”假设提示信息是按顺序处理的,但模型的速度优势只有在人类处理提示信息时采用串行架构时才会转化为决策优势。如果人们反而在并行认知架构上处理提示信息,那么“Take-the-Best”的比较速度优势将变得无关紧要(Chater 等人,2003 年)。

第三条批评线涉及“快速和节俭”计划是否真正挑战了优化、支配推理和一致性的规范标准,正如其所宣传的那样。 “Take-the-Best”是一个与期望效用理论的公理不符的决策算法。首先,它的词典结构违反了阿基米德公理(1.1 节,A2)。另外,据推测,它违反了排序公理的传递性条件(A1)。此外,“少即是多”的效应似乎违反了 Good 的原则(Good,1967 年),这是贝叶斯决策理论的一个核心支柱,建议在有机会获取免费信息时推迟做出终端决策。换句话说,根据经典贝叶斯主义,免费建议是无聊的,但没有人应该拒绝免费信息(Pedersen & Wheeler,2014 年)。如果像“Take-the-Best”这样的非补偿性决策规则违反了 Good 的原则,那么也许整个贝叶斯机制都应该被废除(Gigerenzer & Brighton,2009 年)。

但这些观点仅仅告诉我们,试图用一个实值指数对前景进行排序来制定“择优法”是行不通的,并不意味着排序和数值指数都必须被淘汰。正如我们在 1.1 节 中看到的,有关词典概率和非标准分析的文献已经很长并且很丰富,其中包括早期专门讨论非补偿性非线性模型的研究(Einhorn 1970)。其次,吉格伦泽(Gigerenzer)认为,“认知算法...需要满足比内部一致性更重要的约束”(Gigerenzer & Goldstein 1996),其中包括传递性,并且在其他地方主张放弃一致性作为规范标准(Arkes,Gigerenzer,& Hertwig 2016)。然而,“择优法”预设提示按照提示有效性进行排序,这自然包括传递性,否则“择优法”既无法被一致地指定也无法有效执行。更一般地说,快速和简便学派致力于以算法方式制定启发式,并将其实施为计算模型,这使他们致力于优化、支配推理和逻辑一致性的规范标准。

最后,古德(Good)的原则指出,面对单人决策问题的决策者在接收免费信息时不会更差(期望上)。然而,在博弈论中已知有例外情况(Osborne 2003: 283),涉及两个或更多决策者之间的信息不对称。但对于涉及不确定或不精确概率的单人决策问题也有例外情况(Pedersen & Wheeler 2015)。关键在于,古德的原则并不是概率方法的基本原则,而是一个特定结果,适用于具有确定概率的单人决策理论的经典理论。

8. 评估人类的理性

逻辑规则、概率公理、效用理论原则——人类都违背这些规则,并且理所当然地这样做。但我们这样做是否不理性?这取决于理性的定义。对于贝叶斯派来说,任何不遵守概率公理的定性比较判断,从定义上来说,都是不理性的。对于面包师来说,即使是一份盐和面粉等量的面包食谱也是不理性的,即使是连贯的。然而,贝叶斯派并不与面包师作对。为什么?因为面包师满足于“不可食用”这个术语,并且不渴望霸占“不理性”。

启发式的两个学派(第 7 节)对人类的理性达成截然不同的结论。然而,与面包师不同,他们的分歧涉及“理性”的含义以及我们应该如何评价人类的判断和决策。 “理性之争”并非是“修辞华丽”掩盖广泛共识的结果(Samuels, Stich, & Bishop 2002),而是由于使用“理性”这类术语的模糊性而产生的实质性分歧(第 7.2 节)。

在本节中,我们首先区分了七种不同的理性概念,突出了目标、范围、评估标准的差异,以及评估对象的差异。然后,我们转而考虑有限理性中使用的两种重要不同的规范标准,接着以一个例子,感知-认知差距,说明在偏见和启发式文献中对经典实验设计进行轻微变化如何改变结果以及用于评估这些结果的规范标准。

8.1 有限理性

尽管亚里士多德被认为曾说过人类是理性的,但伯特兰·罗素后来承认,他一生都在徒劳地寻找亚里士多德支持的证据。然而,“理性”是马文·明斯基所说的一个手提箱词,这个术语在着手任何事情之前需要被解开。

一个意义,对决策理论至关重要的,是_连贯性_,这仅仅是要求你的承诺不会自相矛盾。主观贝叶斯对选项的理性偏好的表示,作为主观期望效用中的不等式,通过将优势原则应用于(适当结构化的)偏好来提供连贯性。优势推理的一个密切相关的应用是根据适当的损失函数最小化预期损失(或在经济学中最大化预期收益),甚至可能是不对称的(Elliott,Komunjer 和 Timmermann 2005),或者应用于受到严格限制的代理人,如有限自动机(Rubinstein 1986)。连贯性和优势推理也是期望效用理论的基础(section 1.1)。

第二个意义上的理性是指我们采取的一种解释立场或倾向,以理解另一个人的信仰、欲望和行为(Dennett 1971 年),或者理解他们用共同语言可能说的任何事情(Davidson 1974 年)。从这个观点来看,理性是指我们授予另一个人的一系列假设,以便理解他们的行为,包括言论。当我们为另一个人的行为提供理由时,我们就采取了这种立场。如果我说“司机笑了是因为她讲了一个笑话”,如果你不给予我,甚至是这个想象中的司机和女人,很多假设,你就无法理解我。因此,与少数几个凡人能够达到的高尚的一致性规范相比,与解释立场相关的理性标准几乎被每个人满足。

第三个意义上的理性,由休谟(1738 年)提出,适用于评估你的信念,评估它们与你的经验有多好匹配。如果在你的经验中,一件事物的存在总是紧随着另一种经验,那么相信后者随前者而来是理性的。我们甚至可以说,根据你对前者的经验,期待后者是理性的。这种理性观是对一个人承诺的评估,类似于一致性标准;但与一致性不同,休谟对理性的概念试图将信念的理性地位直接与来自世界的证据联系起来。当代大部分认识论都支持这种理性概念,同时试图明确指定我们何时可以正确地将知识归因于某人。

第四个意义上的理性,被韦伯(1905 年)称为_实质性理性_,适用于评估你的探究目标。实质性理性引用了康德对目标的价值的区分,一方面,以及你在实现该目标方面的表现如何,另一方面。试图数清楚你草坪上的草叶可能不是一个值得追求的理性目标,即使你使用理性工具无懈可击地得出正确的计数。

第五种理性的含义,由皮尔斯(1955 年)提出,并被美国实用主义者接受,适用于改变信念的过程,而不是对当前持有的信念进行休谟式评估。在皮尔斯看来,人们受到怀疑的困扰,而不是信念;我们不会花费精力来测试我们信念的坚固性,而是专注于那些受到怀疑的信念。由于探究是为了消除我们拥有的怀疑,而不是证实我们已经拥有的稳定信念,因此,理性原则应该适用于消除怀疑的方法(杜威 1960)。根据这一观点,关于何为实质上理性或非理性的问题将由调查者回答:对于一个对足以压制入侵杂草的草坪感兴趣的农学家来说,获取草坪的草叶计数可能是一个值得追求的实质上理性目标。

第六种理性的含义是指有机体吸收和利用复杂信息、在不再适合任务时对其进行修订或修改的能力。根据这一概念,理性的对象是_有效行为_。乔纳森·贝内特在他对蜜蜂的案例研究中讨论了这种理性的概念:

我们所有_prima facie_的理性或智能案例都基于这样的观察:某些生物的行为在某些可靠的方式上是成功的、适当的或恰当的,相对于其假定的需求或需求。……有适当性的规范,我们可以询问一个蜜蜂的行为是否适合于蜜蜂所特有和现有的东西,而不是适合于过去的特定事物或根本不是特定的事物,而是普遍的事物。(贝内特 1964 年:85)

与休谬的观念类似,贝内特的观点将有限理性与与世界的成功互动联系在一起。此外,与实用主义者一样,贝内特包括对评估的动态过程,而不仅仅是一个人承诺的同步状态或目标的当前优点。但与实用主义者不同,贝内特构想有限理性适用于比思考、探究和信念改变的逻辑更广泛的行为范围。

第七种有限理性的含义类似于通过将有限理性定义为缺陷的缺失来定义一致性的概念。对于贝叶斯派来说,确定的损失是无限理性的典范,而一致性只是其缺失。索伦森提出了这种策略的一种概括,即将有限理性构想为无限理性的缺失,就像清洁是污垢的缺失一样。然而,由于无限理性可能以长期和多样化的方式出现,这种观点的一个结果是,那么就不会有一个统一的有限理性概念来捕捉作为人们应该思考的想法(索伦森 1991)。

这七种有限理性的描述既不是穷尽的也不是完整的。但它们足以说明有限理性概念之间的差异范围,从评估对象和评估标准到有限理性被构想为在推理、规划、思考、解释、预测、信号传递和解释中扮演的角色(如果有的话)。有限理性概念的这种混杂的一个结果是,在归因无限理性方面出现了类似于维多利亚时代诊断蒸气的灵活性。也许是时候完全放弃有限理性的讨论,或者要求对评估对象进行具体说明,使用评估的规范标准,并要求充分关注由这些承诺产生的影响了。

8.2 有限理性中的规范标准

我们的判断和决策应该根据什么标准来评估?像系统偏见这样的特性可能被视为一种缺点或优势,这取决于结果如何评分(section 4)。对决策程序运行成本的全面考量可能会在不考虑成本时倾向于一种次优模型,即使在如何评分结果方面达成一致时也是如此(sections 2.1)。理想化模型内不可能存在的理想行为,比如亲社会规范,在几种不理想化模型中却很常见(section 5.2)。

有限理性的描述通常会引用两种类型的规范标准,即一致性标准或准确性标准。在对有限理性判断和决策的研究中最重要的见解之一是,不仅可能满足一种标准而不满足另一种,而且满足一种标准可能会妨碍满足另一种。

有限理性中的一致性标准通常涉及概率、统计决策理论或命题逻辑。根据爱德华·斯坦(Edward Stein),“理性推理的标准图景”是根据逻辑、概率论等推理原则进行推理。如果理性推理的标准图景是正确的,那么基于这些规则的推理原则就是_推理的规范原则_,换句话说,它们是我们_应该_遵循的原则。(斯坦 1996: 1.2)

逻辑和概率的一致性标准通常在有实验结果声称违反这些标准时被援引,特别是在偏见和启发式文献中(第 7.1 节)。然而,很少有关于我们的推理如何以及何时应符合这些标准,甚至逻辑和概率的适用规范标准究竟是什么的讨论。斯坦讨论了_合取消去_的逻辑规则以及支持它的信念规范原则,其中相信_鸟儿歌唱且蜜蜂摇晃_的连接就会使您理性地相信每个连词。然而,斯坦转而讨论概率,讨论了什么原则应该管理连接两个信念。为什么?

命题逻辑和概率是非常不同的形式主义(Haenni, Romeijn, Wheeler, & Williamson 2011)。首先,逻辑的真值功能语义是组合的,而概率则不是组合的,除非事件在概率上是独立的。那么,为什么逻辑中的消去规则和概率中的引入规则是标准,而不是概率中的消去规则(即边缘化)和逻辑中的引入规则(即附加)?回答这个问题需要对“基于”、“根植于”或其他隐喻关系的积极解释。但是,在对推理原则的呼吁中,通常没有类似于预期效用理论的表示定理(section 1.1)指定定性判断与它们的逻辑或数值表示之间关系的模拟,也没有说明这种关系成立的条件。

第二种规范标准评估判断或决策过程的准确性,重点是得到正确答案。考虑分类判断的准确性,比如预测信用卡交易是否欺诈(Y=1)或合法(Y=0)。分类准确性_是所有预测中正确预测的数量,通常表示为比率。但是分类准确性可能会导致误导性评估。例如,一种总是报告交易为合法的方法,Y=0,实际上会因为欺诈信用卡交易的比率非常低(<3%)而得到非常高的准确性分数(> 97%)。问题在于分类准确性对涉及少数正实例(即 Y=1 的情况)的不平衡类别问题是一个不良指标。更一般地,一个没有预测能力的模型可能具有高准确性,而一个准确性相对较低的模型可能具有更强的预测能力。这一观察被称为_准确性悖论

准确性悖论是引入其他预测性能度量的动机之一。对于我们的欺诈检测问题,你的预测可以有两种正确和两种错误的方式。通过预测 Y=1 时实际上交易是欺诈的(真正例)或者预测 Y=0 时实际上交易是合法的(真负例)可以得到正确的预测。相应地,通过预测 Y=1 时实际上 Y=0(假正例)或者预测 Y=0 时实际上交易是欺诈的(假负例)可以犯错。这四种可能性在以下的二乘二列联表中呈现,有时被称为_混淆矩阵_:

| | 实际类别 |

| --- | --- | --- | --- |

| | Y | 1 | 0 |

| 预测 < br>类别 | 1 | 真 < br>正例 | 假 < br>正例 |

| 0 | 假 < br>负例 | 真 < br>负例 |

对于涉及_N_个示例的二元分类问题,每个预测将落入这四个类别之一。然后可以评估分类器在这些_N_个示例上的性能。一个完全不准确的分类器将在对角线上全部为零;一个完全准确的分类器将在反对角线上全部为零。分类器的_精确率_是真正例与所有正例预测的比率,即_真正例_ / (真正例 + 假正例)。分类器的_召回率_是真正例与所有真实预测的比率,即_真正例_ / (真正例 + 假负例)。

有两点需要注意。第一点是,在实践中通常存在精度和召回率之间的权衡,而每个问题的成本也会有所不同。适合检测信用卡欺诈的精度和召回率的权衡可能不适用于检测癌症,即使正例的频率相同。在已知数据上训练分类器的目的是对样本外实例进行预测。因此,在训练数据中调整分类器以产生适当的精度和召回率之间的权衡并不能保证您会看到这种权衡推广。

结论是,为了评估分类器的性能,有必要指定进行分类的目的,即使在训练数据上表现良好也不一定会推广。所有这些都不与一致性推理相矛盾,因为我们在进行比较判断并通过支配进行推理。但是,将论点表述为一致性会改变评估的_对象_,从第一人称决策者的观点转变为第三人称决策建模者的观点。

8.3 感知-认知差距

人类是否系统地违反概率和统计规范?彼得森和比奇(1967)认为不是。在他们看来,人类是直觉统计学家(5.1),因此概率论和统计学是对人类判断和决策的一个很好的第一近似。然而,正当他们乐观的评论似乎巩固了人类理性的共识观点时,阿莫斯·特沃斯基和丹尼尔·卡尼曼开始了他们的工作来推翻这一观点。启发式和偏见计划(7.1)发现,人们在概率和统计方面特别糟糕,因此概率论、统计学,甚至逻辑都不能很好地近似人类决策。关于这些负面发现的争议之一涉及这些效应的原因——观察到的反应是指出了否则是适应性人类行为中的轻微缺陷,还是指出了我们的习惯和构成方面的不太仁慈的东西。

与认知任务的表现相比,人们普遍认为在执行低层次的运动控制和感知任务时是最优或接近最优的。规划目标导向的运动,比如用手指按电梯按钮或将脚放在湿滑的河石上,需要您的运动控制系统从众多可能的运动策略中选择一个,以实现您的目标同时最大限度地减少生物力学成本(Trommershäuser,Maloney 和 Landy 2003)。我们的运动控制系统似乎使用的损失函数对于小误差增加大约是二次的,但对于大误差增加明显较少,这表明我们的运动控制系统也对异常值具有鲁棒性(Körding 和 Wolpert 2004)。此外,机器学习的进展是通过将人类在一系列感知任务中的表现错误视为贝叶斯错误的代理,得出了一个可观察的、接近完美的规范标准。与认知决策不同,关于我们的运动-感知决策的整体最优性几乎没有争议。这种高级和低级决策之间的差异被称为_感知-认知差距_。

一些人认为感知-认知差距是人们针对每种类型任务使用基本不同策略的证据(7.2)。对最优方法的近似不一定是该方法的最佳近似,而对认知判断和深思熟虑决策的研究却误入歧途,因为假设相反(Mongin 2000)。对感知-认知差距的另一种看法是,它在很大程度上是跨研究的方法差异而不是人类行为的一个稳健特征。我们在这里回顾了支持这一第二论点的证据。

经典的决策研究向受试者提出选择问题,其中描述了概率。例如,您可能会被要求选择以 0.25 的概率赢得 300 欧元的前景,或以 0.2 的概率赢得 400 欧元的前景。在这里,受试者被给予概率的数值描述,通常被要求在没有反馈的情况下做出一次性决策,并发现他们的反应偏离了预期效用假设。然而,在运动控制任务中,受试者必须使用内部的、隐含的概率估计,通常是通过反馈学习的,这些内部估计是接近最优的。感知-运动控制决策是否更好,是因为它们提供反馈,而经典决策任务则没有,还是因为感知-运动控制决策更好,是因为它们是非认知的?

Jarvstad 等人(2013 年)通过设计以下任务探讨了感知-认知差距的稳健性:(a)一个涉及在触摸屏计算机显示器上改变目标大小的指向任务;(b)一个涉及对四个数字求和并接受或拒绝提议答案的算术学习任务,其中目标容差范围因问题而异,类似于运动控制任务中目标的宽度;以及(c)一个涉及计算两个前景的期望值的标准经典概率判断任务。跨任务的概率信息以三种格式呈现:低级、高级和经典。

一旦控制了三种任务类型之间的混淆因素,Jarvstad 等人的研究结果表明:(i)感知-认知差距在很大程度上可以通过对绩效评估方式的差异来解释;(ii)根据经验做出决策与根据描述做出决策的差距(Hertwig,Barron 等人,2004 年)是因为假设外生客观概率与主观概率匹配;(iii)人们做出高级决策的能力比偏见和启发式文献所暗示的要好;以及(iv)主体之间的差异对于预测绩效比选择任务之间的差异更为重要(Jarvstad 等人,2013 年)。

因此,一旦控制了方法论上的差异,感知-认知差距似乎是对任务应用了两种不同规范标准的产物。如果将应用于评估感知-运动任务的标准应用于经典认知决策任务,那么两者似乎表现良好。如果相反,将用于评估经典认知任务的标准应用于感知-运动任务,那么两者都将表现不佳。

Bibliography

  • Alexander, Jason McKenzie, 2007, The Structural Evolution of Morality, New York: Cambridge University Press. doi:10.1017/CBO9780511550997

  • Alexander, Richard D., 1987, The Biology of Moral Systems, London: Routledge.

  • Allais, Maurice, 1953, “Le Comportement de L’homme Rationnel Devant Le Risque: Critique Des Postulats et Axiomes de L’école Américaine”, Econometrica, 21(4): 503–546. doi:10.2307/1907921

  • Anand, Paul, 1987, “Are the Preference Axioms Really Rational?” Theory and Decision, 23(2): 189–214. doi:10.1007/BF00126305

  • Anderson, John R., 1991, “The Adaptive Nature of Human Categorization”, Psychological Review, 98(3): 409–429. doi:10.1037/0033-295X.98.3.409

  • Anderson, John R. and Lael J. Schooler, 1991, “Reflections of the Environment in Memory”, Psychological Science, 2(6): 396–408. doi:10.1111/j.1467-9280.1991.tb00174.x

  • Arkes, Hal R., Gerd Gigerenzer, and Ralph Hertwig, 2016, “How Bad Is Incoherence?”, Decision, 3(1): 20–39. doi:10.1037/dec0000043

  • Arló-Costa, Horacio and Arthur Paul Pedersen, 2011, “Bounded Rationality: Models for Some Fast and Frugal Heuristics”, in A. Gupta, Johan van Benthem, & Eric Pacuit (eds.), Games, Norms and Reasons: Logic at the Crossroads, Dordrecht: Springer Netherlands. doi:10.1007/978-94-007-0714-6*1

  • Arrow, Kenneth, 2004, “Is Bounded Rationality Unboundedly Rational? Some Ruminations”, in M. Augier & J. G. March (eds.), Models of a Man: Essays in Memory of Herbert A. Simon, Cambridge, MA: MIT Press, pp. 47–55.

  • Aumann, Robert J., 1962, “Utility Theory without the Completeness Axiom”, Econometrica, 30(3): 445–462. doi:10.2307/1909888

  • –––, 1997, “Rationality and Bounded Rationality”, Games and Economic Behavior, 21(1–2): 2–17. doi:10.1006/game.1997.0585

  • Axelrod, Robert, 1984, The Evolution of Cooperation, New York: Basic Books.

  • Ballard, Dana H. and Christopher M. Brown, 1982, Computer Vision, Englewood Cliffs, NJ: Prentice Hall.

  • Bar-Hillel, Maya and Avishai Margalit, 1988, “How Vicious Are Cycles of Intransitive Choice?” Theory and Decision, 24(2): 119–145. doi:10.1007/BF00132458

  • Bar-Hillel, Maya and Willem A Wagenaar, 1991, “The Perception of Randomness”, Advances in Applied Mathematics, 12(4): 428–454. doi:10.1016/0196-8858(91)90029-I

  • Barabási, Albert-László and Reka Albert, 1999, “Emergence of Scaling in Random Networks”, Science, 286(5439): 509–512. doi:10.1126/science.286.5439.509

  • Barkow, Jerome, Leda Cosmides, and John Tooby (eds.), 1992, The Adapted Mind: Evolutionary Psychology and the Generation of Culture, New York: Oxford University Press.

  • Baumeister, Roy F., Ellen Bratslavsky, Catrin Finkenauer, and Kathleen D. Vohs, 2001, “Bad Is Stronger than Good.”, Review of General Psychology, 5(4): 323–370. doi:10.1037/1089-2680.5.4.323

  • Bazerman, Max H. and Don A. Moore, 2008, Judgment in Managerial Decision Making seventh edition, New York: Wiley.

  • Bell, David E., 1982, “Regret in Decision Making Under Uncertainty”, Operations Research, 30(5): 961–981. doi:10.1287/opre.30.5.961

  • Bennett, Jonathan, 1964, Rationality: An Essay Towards an Analysis, London: Routledge.

  • Berger, James O., 1980, Statistical Decision Theory and Bayesian Analysis, second edition, New York: Springer. doi:10.1007/978-1-4757-4286-2

  • Bernoulli, Daniel, 1738, “Exposition of a New Theory on the Measurement of Risk”, Econometrica, 22(1): 23–36. doi:10.2307/1909829

  • Bewley, Truman S., 2002, “Knightian Decision Theory: Part I”, Decisions in Economics and Finance, 25(2): 79–110. doi:10.1007/s102030200006

  • Bicchieri, Cristina, 2005, The Grammar of Society: The Nature and Dynamics of Social Norms, Cambridge: Cambridge University Press. doi:10.1017/CBO9780511616037

  • Bicchieri, Cristina and Ryan Muldoon, 2014, “Social Norms”, in The Stanford Encyclopedia of Philosophy, (Spring 2014), Edward N. Zalta (ed.), URL = https://plato.stanford.edu/archives/spr2014/entries/social-norms/

  • Birnbaum, Michael H., 1983, “Base Rates in Bayesian Inference: Signal Detection Analysis of the Cab Problem”, The American Journal of Psychology, 96(1): 85–94. doi:10.2307/1422211

  • Bishop, Christopher M., 2006, Pattern Recognition and Machine Learning, New York: Springer.

  • Blume, Lawrence, Adam Brandenburger, and Eddie Dekel, 1991, “Lexicographic Probabilities and Choice Under Uncertainty”, Econometrica, 58(1): 61–78. doi:10.2307/2938240

  • Bonet, Blai and Héctor Geffner, 2001, “Planning as Heuristic Search”, Artificial Intelligence, 129(1–2): 5–33. doi:10.1016/S0004-3702(01)00108-4

  • Bowles, Samuel and Herbert Gintis, 2011, A Cooperative Species: Human Reciprocity and Its Evolution, Princeton, NJ: Princeton University Press. doi:10.23943/princeton/9780691151250.001.0001

  • Boyd, Robert and Peter J. Richerson, 2005, The Origin and Evolution of Cultures, New York: Oxford University Press.

  • Brown, Scott D. and Andrew Heathcote, 2008, “The Simplest Complete Model of Choice Response Time: Linear Ballistic Accumulation”, Cognitive Psychology, 57(3): 153–178. doi:10.1016/j.cogpsych.2007.12.002

  • Brunswik, Egon, 1943, “Organismic Achievement and Environmental Probability”, Psychological Review, 50(3): 255–272. doi:10.1037/h0060889

  • –––, 1955, “Representative Design and Probabilistic Theory in a Functional Psychology”, Psychological Review, 62(3): 193–217. doi:10.1037/h0047470

  • Charness, Gary and Peter J. Kuhn, 2011, “Lab Labor: What Can Labor Economists Learn from the Lab?” in Handbook of Labor Economics, Vol. 4, pp. 229–330, Elsevier. doi:10.1016/S0169-7218(11)00409-6

  • Chater, Nick, 2014, “Cognitive Science as an Interface Between Rational and Mechanistic Explanation”, Topics in Cognitive Science, 6(2): 331–337. doi:10.1111/tops.12087

  • Chater, Nick, Mike Oaksford, Ramin Nakisa, and Martin Redington, 2003, “Fast, Frugal, and Rational: How Rational Norms Explain Behavior”, Organizational Behavior and Human Decision Processes, 90(1): 63–86. doi:10.1016/S0749-5978(02)00508-3

  • Clark, Andy and David Chalmers, 1998, “The Extended Mind”, Analysis, 58(1): 7–19. doi:10.1093/analys/58.1.7

  • Cohen, L. Jonathan, 1981, “Can Human Irrationality Be Experimentally Demonstrated?” Behavioral and Brain Sciences, 4(3): 317–331. doi:10.1017/S0140525X00009092

  • Coletii, Giulianella and Romano Scozzafava, 2002, Probabilistic Logic in a Coherent Setting, (Trends in Logic, 15), Dordrecht: Springer Netherlands. doi:10.1007/978-94-010-0474-9

  • Czerlinski, Jean, Gerd Gigerenzer, and Daniel G. Goldstein, 1999, “How Good Are Simple Heuristics?” in Gigerenzer et al. 1999: 97–118.

  • Damore, James A. and Jeff Gore, 2012, “Understanding Microbial Cooperation”, Journal of Theoretical Biology, 299: 31–41. doi:10.1016/j.jtbi.2011.03.008

  • Dana, Jason and Robin M. Dawes, 2004, “The Superiority of Simple Alternatives to Regression for Social Science Predictions”, Journal of Educational and Behavioral Statistics, 29(3): 317–331. doi:10.3102/10769986029003317

  • Darwin, Charles, 1871, The Descent of Man, New York: D. Appleton and Company.

  • Davidson, Donald, 1974, “Belief and the Basis of Meaning”, Synthese, 27(3–4): 309–323. doi:10.1007/BF00484597

  • Davis-Stober, Clintin P., Jason Dana, and David V. Budescu, 2010, “Why Recognition Is Rational: Optimality Results on Single-Variable Decision Rules”, Judgment and Decision Making, 5(4): 216–229.

  • Dawes, Robin M., 1979, “The Robust Beauty of Improper Linear Models in Decision Making”, American Psychologist, 34(7): 571–582. doi:10.1037/0003-066X.34.7.571

  • de Finetti, Bruno, 1970 [1974], Teoria Delle Probabilita, Italy: Giulio Einaudi. Translated as Theory of Probability: A Critical Introductory Treatment. Vol. 1 and 2, Antonio Machí and Adrian Smith (trans.), Chichester: Wiley, 1974. doi:10.1002/9781119286387

  • de Finetti, Bruno and Leonard J. Savage, 1962, “Sul Modo Di Scegliere Le Probabilità Iniziali”, Biblioteca Del Metron, Serie C, 1: 81–154.

  • DeMiguel, Victor, Lorenzo Garlappi, and Raman Uppal, 2009, “Optimal Versus Naive Diversification: How Inefficient Is the 1N Portfolio Strategy?”, Review of Financial Studies, 22(5): 1915–1953. doi:10.1093/rfs/hhm075

  • Dennett, Daniel C., 1971, “Intentional Systems”, Journal of Philosophy, 68(4): 87–106. doi:10.2307/2025382

  • Dewey, John, 1960, The Quest for Certainty, New York: Capricorn Books.

  • Dhami, Mandeep K., Ralph Hertwig, and Ulrich Hoffrage, 2004, “The Role of Representative Design in an Ecological Approach to Cognition”, Psychological Bulletin, 130(6): 959–988. doi:10.1037/0033-2909.130.6.959

  • Domingos, Pedro, 2000, “A Unified Bias-Variance Decomposition and Its Applications”, in Proceedings of the 17th International Conference on Machine Learning, Morgan Kaufmann, pp. 231–238.

  • Doyen, Stéphane, Olivier Klein, Cora-Lise Pichton, and Axel Cleeremans, 2012, “Behavioral Priming: It’s All in the Mind, but Whose Mind?” PLoS One, 7(1): e29081. doi:10.1371/journal.pone.0029081

  • Dubins, Lester E., 1975, “Finitely Additive Conditional Probability, Conglomerability, and Disintegrations”, Annals of Probability, 3(1): 89–99. doi:10.1214/aop/1176996451

  • Einhorn, Hillel J., 1970, “The Use of Nonlinear, Noncompensatory Models in Decision Making”, Psychological Bulletin, 73(3): 221–230. doi:10.1037/h0028695

  • Elliott, Graham, Ivana Komunjer, and Allan Timmermann, 2005, “Estimation and Testing of Forecast Rationality under Flexible Loss”, Review of Economic Studies, 72(4): 1107–1125. doi:10.1111/0034-6527.00363

  • Ellsberg, Daniel, 1961, “Risk, Ambiguity and the Savage Axioms”, Quarterly Journal of Economics, 75(4): 643–669. doi:10.2307/1884324

  • Fawcett, Tim W., Benja Fallenstein, Andrew D. Higginson, Alasdair I. Houston, Dave E.W. Mallpress, Pete C. Trimmer, and John M. McNamara, 2014, “The Evolution of Decision Rules in Complex Environments”, Trends in Cognitive Sciences, 18(3): 153–161. doi:10.1016/j.tics.2013.12.012

  • Fennema, Hein and Peter Wakker, 1997, “Original and Cumulative Prospect Theory: A Discussion of Empirical Differences”, Journal of Behavioral Decision Making, 10(1): 53–64. doi:10.1002/(SICI)1099-0771(199703)10:1<53::AID-BDM245>3.0.CO;2-1

  • Fiedler, Klaus, 1988, “The Dependence of the Conjunction Fallacy on Subtle Linguistic Factors”, Psychological Research, 50(2): 123–129. doi:10.1007/BF00309212

  • Fiedler, Klaus and Peter Juslin (eds.), 2006, Information Sampling and Adaptive Cognition, Cambridge: Cambridge University Press. doi:10.1017/CBO9780511614576

  • Fishburn, Peter C., 1982, The Foundations of Expected Utility, Dordrecht: D. Reidel. doi:10.1007/978-94-017-3329-8

  • Fisher, Ronald Aylmer, 1936, “Uncertain Inference”, Proceedings of the American Academy of Arts and Sciences, 71(4): 245–258. doi:10.2307/20023225

  • Friedman, Jerome, 1997, “On Bias, Variance, 0-1 Loss and the Curse of Dimensionality”, Journal of Data Mining and Knowledge Discovery, 1(1): 55–77. doi:10.1023/A:1009778005914

  • Friedman, Milton, 1953, “The Methodology of Positive Economics”, in Essays in Positive Economics, Chicago: University of Chicago Press, pp. 3–43.

  • Friedman, Milton and Leonard J. Savage, 1948, “The Utility Analysis of Choices Involving Risk”, Journal of Political Economy, 56(4): 279–304. doi:10.1086/256692

  • Friston, Karl, 2010, “The Free-Energy Principle: A Unified Brain Theory?”, Nature Reviews Neuroscience, 11(2): 127–138. doi:10.1038/nrn2787

  • Galaabaatar, Tsogbadral and Edi Karni, 2013, “Subjective Expected Utility with Incomplete Preferences”, Econometrica, 81(1): 255–284. doi:10.3982/ECTA9621

  • Gergely, György, Harold Bekkering, and Ildikó Király, 2002, “Developmental Psychology: Rational Imitation in Preverbal Infants”, Nature, 415(6873): 755–755. doi:10.1038/415755a

  • Ghallab, Malik, Dana Nau, and Paolo Traverso, 2016, Automated Planning and Acting, Cambridge: Cambridge University Press. doi:10.1017/CBO9781139583923

  • Gibson, James J., 1979, The Ecological Approach to Visual Perception, Boston: Houghton Mifflin.

  • Gigerenzer, Gerd, 1996, “On Narrow Norms and Vague Heuristics: A Reply to Kahneman and Tversky”, Psychological Review, 103(3): 592–596. doi:10.1037/0033-295X.103.3.592

  • –––, 2007, Gut Feelings: The Intelligence of the Unconscious, New York: Viking Press.

  • Gigerenzer, Gerd and Henry Brighton, 2009, “Homo Heuristicus: Why Biased Minds Make Better Inferences”, Topics in Cognitive Science, 1(1): 107–143. doi:10.1111/j.1756-8765.2008.01006.x

  • Gigerenzer, Gerd and Daniel G. Goldstein, 1996, “Reasoning the Fast and Frugal Way: Models of Bounded Rationality”, Psychological Review, 103(4): 650–669. doi:10.1037/0033-295X.103.4.650

  • Gigerenzer, Gerd, Wolfgang Hell, and Hartmut Blank, 1988, “Presentation and Content: The Use of Base Rates as a Continuous Variable.”, Journal of Experimental Psychology: Human Perception and Performance, 14(3): 513–525. doi:10.1037/0096-1523.14.3.513

  • Gigerenzer, Gerd, Ralph Hertwig, and Thorsten Pachur (eds), 2011, Heuristics: The Foundations of Adaptive Behavior, Oxford University Press. doi:10.1093/acprof:oso/9780199744282.001.0001

  • Gigerenzer, Gerd, Peter M. Todd, and the ABC Group (eds.), 1999, Simple Heuristics That Make Us Smart, Oxford: Oxford University Press.

  • Giles, Robin, 1976, “A Logic for Subjective Belief”, in Foundations of Probability Theory, Statistical Inference, and Statistical Theories of Science, William L. Harper and Clifford Alan Hooker (eds.), Dordrecht: Springer Netherlands, vol. I: 41–72. doi:10.1007/978-94-010-1853-1*4

  • Giron, F. J., and S. Rios, 1980, “Quasi-Bayesian Behavior: A More Realistic Approach to Decision Making?” Trabajos de Estadistica Y de Investigacion Operativa, 31(1): 17–38. doi:10.1007/BF02888345

  • Glymour, Clark, 2001, The Mind’s Arrows, Cambridge, MA: MIT Press.

  • Goldblatt, Robert, 1998, Lectures on the Hyperreals: An Introduction to Nonstandard Analysis, (Graduate Texts in Mathematics 188), New York: Springer New York. doi:10.1007/978-1-4612-0615-6

  • Goldstein, Daniel G. and Gerd Gigerenzer, 2002, “Models of Ecological Rationality: The Recognition Heuristic.”, Psychological Review, 109(1): 75–90. doi:10.1037/0033-295X.109.1.75

  • Golub, Benjamin and Matthew O Jackson, 2010, “Naïve Learning in Social Networks and the Wisdom of Crowds”, American Economic Journal: Microeconomics, 2(1): 112–149. doi:10.1257/mic.2.1.112

  • Good, Irving J., 1952, “Rational Decisions”, Journal of the Royal Statistical Society. Series B, 14(1): 107–114. Reprinted in Good 1983: 3–14

  • –––, 1967, “On the Principle of Total Evidence”, The British Journal for the Philosophy of Science, 17(4): 319–321. Reprinted in Good 1983: 178–180. doi:10.1093/bjps/17.4.319

  • –––, 1971 [1983], “Twenty-Seven Principles of Rationality”, Foundations of Statistical Inference, V. P. Godambe and D. A. Sprott (eds), Toronto: Holt, Rinehart & Winston. Reprinted in Good 1983: 15–20.

  • –––, 1983, Good Thinking: The Foundations of Probability and Its Applications, Minneapolis: University of Minnesota Press.

  • Güth, Werner, Rolf Schmittberger, and Bernd Schwarze, 1982, “An Experimental Analysis of Ultimatum Bargaining”, Journal of Economic Behavior and Organization, 3(4): 367–388. doi:10.1016/0167-2681(82)90011-7

  • Hacking, Ian, 1967, “Slightly More Realistic Personal Probability”, Philosophy of Science, 34(4): 311–325. doi:10.1086/288169

  • Haenni, Rolf, Jan-Willem Romeijn, Gregory Wheeler, and Jon Williamson, 2011, Probabilistic Logics and Probabilistic Networks, Dordrecht: Springer Netherlands. doi:10.1007/978-94-007-0008-6

  • Hahn, Ulrike and Paul A. Warren, 2009, “Perceptions of Randomness: Why Three Heads Are Better Than Four”, Psychological Review, 116(2): 454–461. doi:10.1037/a0015241

  • Halpern, Joseph Y., 2010, “Lexicographic Probability, Conditional Probability, and Nonstandard Probability”, Games and Economic Behavior, 68(1): 155–179. doi:10.1016/j.geb.2009.03.013

  • Hammond, Kenneth R., 1955, “Probabilistic Functioning and the Clinical Method”, Psychological Review, 62(4): 255–262. doi:10.1037/h0046845

  • Hammond, Kenneth R., Carolyn J. Hursch, and Frederick J. Todd, 1964, “Analyzing the Components of Clinical Inference”, Psychological Review, 71(6): 438–456. doi:10.1037/h0040736

  • Hammond, Peter J., 1994, “Elementary Non-Archimedean Representations of Probability for Decision Theory and Games”, in Paul Humphreys (ed.), Patrick Suppes: Scientific Philosopher, Vol. 1: Probability and Probabilistic Causality, Dordrecht, The Netherlands: Kluwer, pp. 25–59. doi:10.1007/978-94-011-0774-7*2

  • Haykin, Simon O., 2013, Adaptive Filter Theory, fifth edition, London: Pearson.

  • Henrich, Joseph and Francisco J Gil-White, 2001, “The Evolution of Prestige: Freely Conferred Deference as a Mechanism for Enhancing the Benefits of Cultural Transmission”, Evolution and Human Behavior, 22(3): 165–196. doi:10.1016/S1090-5138(00)00071-4

  • Hertwig, Ralph and Gerd Gigerenzer, 1999, “The ‘Conjunction Fallacy’ Revisited: How Intelligent Inferences Look Like Reasoning Errors”, Journal of Behavioral Decision Making, 12(4): 275–305. doi:10.1002/(SICI)1099-0771(199912)12:4<275::AID-BDM323>3.0.CO;2-M

  • Hertwig, Ralph and Timothy J. Pleskac, 2008, “The Game of Life: How Small Samples Render Choice Simpler”, in The Probabilistic Mind: Prospects for Bayesian Cognitive Science, Nick Chater and Mike Oaksford (eds.), Oxford: Oxford University Press, 209–236. doi:10.1093/acprof:oso/9780199216093.003.0010

  • Hertwig, Ralph, Greg Barron, Elke U. Weber, and Ido Erev, 2004, “Decisions from Experience and the Effect of Rare Events in Risky Choice”, Psychological Science, 15(8): 534–539. doi:10.1111/j.0956-7976.2004.00715.x

  • Hertwig, Ralph, Jennifer Nerissa Davis, and Frank J. Sulloway, 2002, “Parental Investment: How an Equity Motive Can Produce Inequality”, Psychological Bulletin, 128(5): 728–745. doi:10.1037/0033-2909.128.5.728

  • Herzog, Stefan M. and Ralph Hertwig, 2013, “The Ecological Validity of Fluency”, in Christian Unkelbach & Rainer Greifeneder (eds.), The Experience of Thinking: How Fluency of Mental Processes Influences Cognition and Behavior,, Psychology Press, pp. 190–219.

  • Hey, John D., 1982, “Search for Rules for Search”, Journal of Economic Behavior and Organization, 3(1): 65–81. doi:10.1016/0167-2681(82)90004-X

  • Ho, Teck-Hua, 1996, “Finite Automata Play Repeated Prisoner’s Dilemma with Information Processing Costs”, Journal of Economic Dynamics and Control, 20(1–3): 173–207. doi:10.1016/0165-1889(94)00848-1

  • Hochman, Guy and Eldad Yechiam, 2011, “Loss Aversion in the Eye and in the Heart: The Autonomic Nervous System’s Responses to Losses”, Journal of Behavioral Decision Making, 24(2): 140–156. doi:10.1002/bdm.692

  • Hogarth, Robin M., 2012, “When Simple Is Hard to Accept”, in Todd et al. 2012: 61–79. doi:10.1093/acprof:oso/9780195315448.003.0024

  • Hogarth, Robin M. and Natalia Karelaia, 2007, “Heuristic and Linear Models of Judgment: Matching Rules and Environments”, Psychological Review, 114(3): 733–758. doi:10.1037/0033-295X.114.3.733

  • Howe, Mark L., 2011, “The Adaptive Nature of Memory and Its Illusions”, Current Directions in Psychological Science, 20(5): 312–315. doi:10.1177/0963721411416571

  • Hume, David, 1738 [2008], A Treatise of Human Nature, Jonathan Bennett (ed.), www.earlymoderntexts.com, 2008. [Hume 1738 available online]

  • Hutchinson, John M., Carola Fanselow, and Peter M. Todd, 2012, “Car Parking as a Game Between Simple Heuristics”, in Todd et al. 2012: 454–484. doi:10.1093/acprof:oso/9780195315448.003.0133

  • Jackson, Matthew O., 2010, Social and Economic Networks, Princeton, NJ: Princeton University Press.

  • Jarvstad, Andreas, Ulrike Hahn, Simon K. Rushton, and Paul A. Warren, 2013, “Perceptuo-Motor, Cognitive, and Description-Based Decision-Making Seem Equally Good”, Proceedings of the National Academy of Sciences, 110(40): 16271–16276. doi:10.1073/pnas.1300239110

  • Jevons, William Stanley, 1871, The Theory of Political Economy, London: Macmillian; Company.

  • Juslin, Peter and Henrik Olsson, 2005, “Capacity Limitations and the Detection of Correlations: Comment on Kareev”, Psychological Review, 112(1): 256–267. doi:10.1037/0033-295X.112.1.256

  • Juslin, Peter, Anders Winman, and Patrik Hansson, 2007, “The Naïve Intuitive Statistician: A Naïve Sampling Model of Intuitive Confidence Intervals.”, Psychological Review, 114(3): 678–703. doi:10.1037/0033-295X.114.3.678

  • Kahneman, Daniel and Amos Tversky, 1972, “Subjective Probability: A Judgment of Representativeness”, Cognitive Psychology, 3(3): 430–454. doi:10.1016/0010-0285(72)90016-3

  • –––, 1979, “Prospect Theory: An Analysis of Decision Under Risk”, Econometrica, 47(2): 263–291. doi:10.2307/1914185

  • –––, 1996, “On the Reality of Cognitive Illusions”, Psychological Review, 103(3): 582–591. doi:10.1037/0033-295X.103.3.582

  • Kahneman, Daniel, Baruch Slovic, and Amos Tversky (eds.), 1982, Judgment Under Uncertainty: Heuristics and Biases, Cambridge: Cambridge University Press. doi:10.1017/CBO9780511809477

  • Kareev, Yaakov, 1995, “Through a Narrow Window: Working Memory Capacity and the Detection of Covariation”, Cognition, 56(3): 263–269. doi:10.1016/0010-0277(95)92814-G

  • –––, 2000, “Seven (Indeed, Plus or Minus Two) and the Detection of Correlations”, Psychological Review, 107(2): 397–402. doi:10.1037/0033-295X.107.2.397

  • Karni, Edi, 1985, Decision Making Under Uncertainty: The Case of State-Dependent Preferences, Cambridge, MA: Harvard University.

  • Katsikopoulos, Konstantinos V., 2010, “The Less-Is-More Effect: Predictions and Tests”, Judgment and Decision Making, 5(4): 244–257.

  • Katsikopoulos, Konstantinos V., Lael J. Schooler, and Ralph Hertwig, 2010, “The Robust Beauty of Ordinary Information”, Psychological Review, 117(4): 1259–1266. doi:10.1037/a0020418

  • Kaufmann, Esther and Werner W. Wittmann, 2016, “The Success of Linear Bootstrapping Models: Decision Domain-, Expertise-, and Criterion-Specific Meta-Analysis”, PLoS One, 11(6): e0157914. doi:10.1371/journal.pone.0157914

  • Keeney, Ralph L. and Howard Raiffa, 1976, Decisions with Multiple Objectives: Preferences and Value Trade-Offs, New York: Wiley.

  • Kelly, Kevin T. and Oliver Schulte, 1995, “The Computable Testability of Theories Making Uncomputable Predictions”, Erkenntnis, 43(1): 29–66. doi:10.1007/BF01131839

  • Keynes, John Maynard, 1921, A Treatise on Probability, London: Macmillan.

  • Kidd, Celeste and Benjamin Y. Hayden, 2015, “The Psychology and Neuroscience of Curiosity”, Neuron, 88(3): 449–460. doi:10.1016/j.neuron.2015.09.010

  • Kirsh, David, 1995, “The Intelligent Use of Space”, Artificial Intelligence, 73(1–2): 31–68. doi:10.1016/0004-3702(94)00017-U

  • Klaes, Matthias and Esther-Mirjam Sent, 2005, “A Conceptual History of the Emergence of Bounded Rationality”, History of Political Economy, 37(1):27–59. doi:10.1215/00182702-37-1-27

  • Knight, Frank H., 1921, Risk, Uncertainty and Profit, Boston: Houghton Mifflin.

  • Koehler, Jonathan J., 1996, “The Base Rate Fallacy Reconsidered: Descriptive, Normative, and Methodological Challenges”, Behavioral and Brain Sciences, 19(1): 1–53. doi:10.1017/S0140525X00041157

  • Koopman, Bernard O., 1940, “The Axioms and Algebra of Intuitive Probability”, Annals of Mathematics, 41(2): 269–292. doi:10.2307/1969003

  • Körding, Konrad Paul and Daniel M. Wolpert, 2004, “The Loss Function of Sensorimotor Learning”, Proceedings of the National Academy of Sciences, 101(26): 9839–9842. doi:10.1073/pnas.0308394101

  • Kreps, David M, Paul Milgrom, John Roberts, and Robert Wilson, 1982, “Rational Cooperation in the Finitely Repeated Prisoners’ Dilemma”, Journal of Economic Theory, 27(2): 245–252. doi:10.1016/0022-0531(82)90029-1

  • Kühberger, Anton, Michael Schulte-Mecklenbeck, and Josef Perner, 1999, “The Effects of Framing, Reflection, Probability, and Payoff on Risk Preference in Choice Tasks”, Organizational Behavior and Human Decision Processes, 78(3): 204–231. doi:10.1006/obhd.1999.2830

  • Kyburg, Henry E., Jr., 1978, “Subjective Probability: Criticisms, Reflections, and Problems”, Journal of Philosophical Logic, 7(1): 157–180. doi:10.1007/BF00245926

  • Levi, Isaac, 1977, “Direct Inference”, Journal of Philosophy, 74: 5–29. doi:10.2307/2025732

  • –––, 1983, “Who Commits the Base Rate Fallacy?”, Behavioral and Brain Sciences, 6(3): 502–506. doi:10.1017/S0140525X00017209

  • Lewis, Richard L., Andrew Howes, and Satinder Singh, 2014, “Computational Rationality: Linking Mechanism and Behavior Through Bounded Utility Maximization”, Topics in Cognitive Science, 6(2): 279–311. doi:10.1111/tops.12086

  • Lichtenberg, Jan Malte and Özgür Simsek, 2016, “Simple Regression Models”, Proceedings of Machine Learning Research, 58: 13–25.

  • Loomes, Graham and Robert Sugden, 1982, “Regret Theory: An Alternative Theory of Rational Choice Under Uncertainty”, Economic Journal, 92(368): 805–824. doi:10.2307/2232669

  • Loridan, P., 1984, “ϵ-Solutions in Vector Minimization Problems”, Journal of Optimization Theory and Applications, 43(2): 265–276. doi:10.1007/BF00936165

  • Luce, R. Duncan and Howard Raiffa, 1957, Games and Decisions: Introduction and Critical Suvey, New York: Dover.

  • Marr, D. C., 1982, Vision, New York: Freeman.

  • May, Kenneth O., 1954, “Intransitivity, Utility, and the Aggregation of Preference Patterns”, Econometrica, 22(1): 1–13. doi:10.2307/1909827

  • Maynard Smith, John, 1982, Evolution and the Theory of Games, Cambridge: Cambridge University Press. doi:10.1017/CBO9780511806292

  • McBeath, Michael K., Dennis M. Shaffer, and Mary K. Kaiser, 1995, “How Baseball Outfielders Determine Where to Run to Catch Fly Balls”, Science, 268(5210): 569–573. doi:10.1126/science.7725104

  • McNamara, John M., Pete C. Trimmer, and Alasdair I. Houston, 2014, “Natural Selection Can Favour `Irrational’ Behavior”, Biology Letters, 10(1): 20130935. doi:10.1098/rsbl.2013.0935

  • Meder, Björn, Ralf Mayrhofer, and Michael R. Waldmann, 2014, “Structure Induction in Diagnostic Causal Reasoning”, Psychological Review, 121(3): 277–301. doi:10.1037/a0035944

  • Meehl, Paul, 1954, Clinical Versus Statistical Prediction: A Theoretical Analysis and a Review of the Evidence, Minneapolis: Minnesota Press.

  • Mill, John Stuart, 1844, “On the Definition of Political Economy”, reprinted in John M. Robson (ed.), The Collected Works of John Stuart Mill, Vol. IV, Toronto: University of Toronto Press.

  • Mongin, Philippe, 2000, “Does Optimization Imply Rationality”, Synthese, 124(1–2): 73–111. doi:10.1023/A:1005150001309

  • Nau, Robert, 2006, “The Shape of Incomplete Preferences”, The Annals of Statistics, 34(5): 2430–2448. doi:10.1214/009053606000000740

  • Neumann, John von and Oskar Morgenstern, 1944, Theory of Games and Economic Behavior, Princeton, NJ: Princeton University Press.

  • Newell, Allen and Herbert A. Simon, 1956, The Logic Theory Machine: A Complex Information Processing System (No. P-868), Santa Monica, CA: The Rand Corporation.

  • –––, 1972, Human Problem Solving, Englewood Cliffs, NJ: Prentice-Hall.

  • –––, 1976, “Computer Science as Empirical Inquiry: Symbols and Search”, Communications of the ACM, 19(3): 113–126. doi:10.1145/360018.360022

  • Neyman, Abraham, 1985, “Bounded Complexity Justifies Cooperation in the Finitely Repeated Prisoners’ Dilemma”, Economics Letters, 19(3): 227–229. doi:10.1016/0165-1765(85)90026-6

  • Norton, Michael I., Daniel Mochon, and Dan Ariely, 2012, “The IKEA Effect: When Labor Leads to Love”, Journal of Consumer Psychology, 22(3): 453–460. doi:10.1016/j.jcps.2011.08.002

  • Nowak, Martin A. and Robert M. May, 1992, “Evolutionary Games and Spatial Chaos”, Nature, 359(6398): 826–829. doi:10.1038/359826a0

  • Oaksford, Mike and Nick Chater, 1994, “A Rational Analysis of the Selection Task as Optimal Data Selection”, Psychological Review, 101(4): 608–631. doi:10.1037/0033-295X.101.4.608

  • –––, 2007, Bayesian Rationality, Oxford: Oxford University Press. doi:10.1093/acprof:oso/9780198524496.001.0001

  • Ok, Efe A., 2002, “Utility Representation of an Incomplete Preference Relation”, Journal of Economic Theory, 104(2): 429–449. doi:10.1006/jeth.2001.2814

  • Osborne, Martin J., 2003, An Introduction to Game Theory, Oxford: Oxford University Press.

  • Oswald, Frederick L., Gregory Mitchell, Hart Blanton, James Jaccard, and Philip E. Tetlock, 2013, “Predicting Ethnic and Racial Discrimination: A Meta-Analysis of IAT Criterion Studies.”, Journal of Personality and Social Psychology, 105(2): 171–192. doi:10.1037/a0032734

  • Pachur, Thorsten, Peter M. Todd, Gerd Gigerenzer, Lael J. Schooler, and Daniel Goldstein, 2012, “When Is the Recognition Heuristic an Adaptive Tool?” in Todd et al. 2012: 113–143. doi:10.1093/acprof:oso/9780195315448.003.0035

  • Palmer, Stephen E., 1999, Vision Science, Cambridge, MA: MIT Press.

  • Papadimitriou, Christos H. and Mihalis Yannakakis, 1994, “On Complexity as Bounded Rationality (Extended Abstract)”, in Proceedings of the Twenty-Sixth Annual ACM Symposium on Theory of Computing - STOC ’94, Montreal: ACM Press, 726–733. doi:10.1145/195058.195445

  • Parikh, Rohit, 1971, “Existence and Feasibility in Arithmetic”, Journal of Symbolic Logic, 36(3): 494–508. doi:10.2307/2269958

  • Payne, John W., James R. Bettman, and Eric J. Johnson, 1988, “Adaptive Strategy Selection in Decision Making.”, Journal of Experimental Psychology: Learning, Memory, and Cognition, 14(3): 534–552. doi:10.1037/0278-7393.14.3.534

  • Pedersen, Arthur Paul, 2014, “Comparative Expectations”, Studia Logica, 102(4): 811–848. doi:10.1007/s11225-013-9539-7

  • Pedersen, Arthur Paul and Gregory Wheeler, 2014, “Demystifying Dilation”, Erkenntnis, 79(6): 1305–1342. doi:10.1007/s10670-013-9531-7

  • –––, 2015, “Dilation, Disintegrations, and Delayed Decisions”, in Proceedings of the 9th Symposium on Imprecise Probabilities and Their Applications (Isipta), Pescara, Italy, pp. 227–236.

  • Peirce, Charles S., 1955, Philosophical Writings of Peirce, Justus Buchler (ed.), New York: Dover.

  • Peterson, Cameron R. and Lee Roy Beach, 1967, “Man as an Intuitive Statistician”, Psychological Bulletin, 68(1): 29–46. doi:10.1037/h0024722

  • Popper, Karl R., 1959, The Logic of Scientific Discovery, London: Routledge.

  • Puranam, Phanish, Nils Stieglitz, Magda Osman, and Madan M. Pillutla, 2015, “Modelling Bounded Rationality in Organizations: Progress and Prospects”, The Academy of Management Annals, 9(1): 337–392. doi:10.1080/19416520.2015.1024498

  • Quiggin, John, 1982, “A Theory of Anticipated Utility”, Journal of Economic Behavior and Organization, 3(4): 323–343. doi:10.1016/0167-2681(82)90008-7

  • Rabin, Matthew, 2000, “Risk Aversion and Expected-Utility Theory: A Calibration Theorem”, Econometrica, 68(5): 1281–1292. doi:10.1111/1468-0262.00158

  • Rapoport, Amnon, Darryl A. Seale, and Andrew M. Colman, 2015, “Is Tit-for-Tat the Answer? On the Conclusions Drawn from Axelrod’s Tournaments”, PLoS One, 10(7): e0134128. doi:10.1371/journal.pone.0134128

  • Rapoport, Anatol and A.M. Chammah, 1965, Prisoner’s Dilemma: A Study in Conflict and Cooperation, Ann Arbor: University of Michigan Press.

  • Regenwetter, Michel, Jason Dana, and Clintin P. Davis-Stober, 2011, “Transitivity of Preferences”, Psychological Review, 118(1): 42–56. doi:10.1037/a0021150

  • Reiter, Ray, 1980, “A Logic for Default Reasoning”, Artificial Intelligence, 13(1–2): 81–132. doi:10.1016/0004-3702(80)90014-4

  • Rényi, Alfréd, 1955, “On a New Axiomatic Theory of Probability”, Acta Mathematica Academiae Scientiarum Hungaricae, 6(3–4): 285–335. doi:10.1007/BF02024393

  • Rick, Scott, 2011, “Losses, Gains, and Brains: Neuroeconomics Can Help to Answer Open Questions About Loss Aversion”, Journal of Consumer Psychology, 21(4): 453–463. doi:10.1016/j.jcps.2010.04.004

  • Rieskamp, Jörg and Anja Dieckmann, 2012, “Redundancy: Environment Structure That Simple Heuristics Can Exploit”, in Todd et al. 2012: 187–215. doi:10.1093/acprof:oso/9780195315448.003.0056

  • Rubinstein, Ariel, 1986, “Finite Automata Play the Repeated Prisoner’s Dilemma”, Journal of Economic Theory, 39(1): 83–96. doi:10.1016/0022-0531(86)90021-9

  • Russell, Stuart J., and Subramanian, Devika, 1995, “Provably Bounded-Optimal Agents”, Journal of Artificial Intelligence Research, 2(1): 575–609. doi:10.1613/jair.133

  • Samuels, Richard, Stephen Stich, and Michael Bishop, 2002, “Ending the Rationality Wars: How to Make Disputes About Human Rationality Disappear”, in Common Sense, Reasoning, and Rationality, Renee Elio (ed.), New York: Oxford University Press, 236–268. doi:10.1093/0195147669.003.0011

  • Samuelson, Paul, 1947, Foundations of Economic Analysis, Cambridge, MA: Harvard University Press.

  • Santos, Francisco C., Marta D. Santos, and Jorge M. Pacheco, 2008, “Social Diversity Promotes the Emergence of Cooperation in Public Goods Games”, Nature, 454(7201): 213–216. doi:10.1038/nature06940

  • Savage, Leonard J., 1954, Foundations of Statistics, New York: Wiley.

  • –––, 1967, “Difficulties in the Theory of Personal Probability”, Philosophy of Science, 34(4): 305–310. doi:10.1086/288168

  • Schervish, Mark J., Teddy Seidenfeld, and Joseph B. Kadane, 2012, “Measures of Incoherence: How Not to Gamble If You Must, with Discussion”, in José Bernardo, A. Phlip Dawid, James O. Berger, Mike West, David Heckerman, M.J. Bayarri, & Adrian F. M. Smith (eds.), Bayesian Statistics 7: Proceedings of the 7th Valencia International Meeting, Oxford: Clarendon Press, pp. 385–402.

  • Schick, Frederic, 1986, “Dutch Bookies and Money Pumps”, Journal of Philosophy, 83(2): 112–119. doi:10.2307/2026054

  • Schmitt, Michael, and Laura Martignon, 2006, “On the Complexity of Learning Lexicographic Strategies”, Journal of Machine Learning Research, 7(Jan): 55–83. [Schmitt & Martignon 2006 available online]

  • Schooler, Lael J. and Ralph Hertwig, 2005, “How Forgetting Aids Heuristic Inference”, Psychological Review, 112(3): 610–628. doi:10.1037/0033-295X.112.3.610

  • Seidenfeld, Teddy, Mark J. Schervish, and Joseph B. Kadane, 1995, “A Representation of Partially Ordered Preferences”, The Annals of Statistics, 23(6): 2168–2217. doi:10.1214/aos/1034713653

  • –––, 2012, “What Kind of Uncertainty Is That? Using Personal Probability for Expressing One’s Thinking about Logical and Mathematical Propositions”, Journal of Philosophy, 109(8–9): 516–533. doi:10.5840/jphil20121098/925

  • Selten, Reinhard, 1998, “Aspiration Adaptation Theory”, Journal of Mathematical Psychology, 42(2–3): 191–214. doi:10.1006/jmps.1997.1205

  • Simon, Herbert A., 1947, Administrative Behavior: A Study of Decision-Making Processes in Administrative Organization, first edition, New York: Macmillan.

  • –––, 1955a, “A Behavioral Model of Rational Choice”, Quarterly Journal of Economics, 69(1): 99–118. doi:10.2307/1884852

  • –––, 1955b, “On a Class of Skew Distribution Functions”, Biometrika, 42(3–4): 425–440. doi:10.1093/biomet/42.3-4.425

  • –––, 1957a, Administrative Behavior: A Study of Decision-Making Processes in Administrative Organization, second edition, New York: Macmillan.

  • –––, 1957b, Models of Man, New York: John Wiley.

  • –––, 1976, “From Substantive to Procedural Rationality”, in 25 Years of Economic Theory, T. J. Kastelein, S. K. Kuipers, W. A. Nijenhuis, and G. R. Wagenaar (eds.), Boston, MA: Springer US, 65–86. doi:10.1007/978-1-4613-4367-7*6

  • Skyrms, Brian, 2003, The Stag Hunt and the Evolution of Social Structure, Cambridge: Cambridge University Press. doi:10.1017/CBO9781139165228

  • Sorensen, Roy A., 1991, “Rationality as an Absolute Concept”, Philosophy, 66(258): 473–486. doi:10.1017/S0031819100065128

  • Spirtes, Peter, 2010, “Introduction to Causal Inference”, Journal of Machine Learning Research, 11(May): 1643–1662. [Spirtes 2010 available online]

  • Stalnaker, Robert, 1991, “The Problem of Logical Omniscience, I”, Synthese, 89(3): 425–440. doi:10.1007/BF00413506

  • Stanovich, Keith E. and Richard F. West, 2000, “Individual Differences in Reasoning: Implications for the Rationality Debate?” Behavioral and Brain Sciences, 23(5): 645–65.

  • Stein, Edward, 1996, Without Good Reason: The Rationality Debate in Philosophy and Cognitive Science, Oxford: Clarendon Press. doi:10.1093/acprof:oso/9780198237730.001.0001

  • Stevens, Jeffrey R., Jenny Volstorf, Lael J. Schooler, and Jörg Rieskamp, 2011, “Forgetting Constrains the Emergence of Cooperative Decision Strategies”, Frontiers in Psychology, 1: article 235. doi:10.3389/fpsyg.2010.00235

  • Stigler, George J., 1961, “The Economics of Information”, Journal of Political Economy, 69(3): 213–225. doi:10.1086/258464

  • Tarski, Alfred, Andrzej Mostowski, and Raphael M. Robinson, 1953, Undecidable Theories, Amsterdam: North-Holland Publishing Co.

  • Thaler, Richard H., 1980, “Toward a Positive Theory of Consumer Choice”, Journal of Economic Behavior and Organization, 1(1): 39–60. doi:10.1016/0167-2681(80)90051-7

  • Thaler, Richard H. and Cass R. Sustein, 2008, Nudge: Improving Decisions About Health, Wealth, and Happiness, New Haven: Yale University Press.

  • Todd, Peter M. and Geoffrey F. Miller, 1999, “From Pride and Prejudice to Persuasion: Satisficing in Mate Search”, in Gigerenzer et al. 1999: 287–308.

  • Todd, Peter M., Gerd Gigerenzer, and ABC Research Group (eds.), 2012, Ecological Rationality: Intelligence in the World, New York: Oxford University Press. doi:10.1093/acprof:oso/9780195315448.001.0001

  • Trivers, Robert L., 1971, “The Evolution of Reciprocal Altruism”, The Quarterly Review of Biology, 46(1): 35–57. doi:10.1086/406755

  • Trommershäuser, Julia, Laurence T. Maloney, and Michael S. Landy, 2003, “Statistical Decision Theory and Trade-Offs in the Control of Motor Response”, Spatial Vision, 16(3–4): 255–275. doi:10.1163/156856803322467527

  • Turner, Brandon M., Christian A. Rodriguez, Tony M. Norcia, Samuel M. McClure, and Mark Steyvers, 2016, “Why More Is Better: Simultaneous Modeling of EEG, FMRI, and Behavioral Data”, NeuroImage, 128(March): 96–115. doi:10.1016/j.neuroimage.2015.12.030

  • Tversky, Amos, 1969, “Intransitivity of Preferences”, Psychological Review, 76(1): 31–48. doi:10.1037/h0026750

  • Tversky, Amos and Daniel Kahneman, 1973, “Availability: A Heuristic for Judging Frequency and Probability”, Cognitive Psychology, 5(2): 207–232. doi:10.1016/0010-0285(73)90033-9

  • –––, 1974, “Judgment Under Uncertainty: Heuristics and Biases”, Science, 185(4157): 1124–1131. doi:10.1126/science.185.4157.1124

  • –––, 1977, Causal Schemata in Judgments Under Uncertainty (No. TR-1060-77-10), Defense Advanced Research Projects Agency (DARPA).

  • –––, 1981, “The Framing of Decisions and the Psychology of Choice”, Science, 211(4481): 483–458. doi:10.1126/science.7455683

  • –––, 1983, “Extensional Versus Intuitive Reasoning: The Conjunction Fallacy in Probability Judgment”, Psychological Review, 90(4): 293–315. doi:10.1037/0033-295X.90.4.293

  • –––, 1992, “Advances in Prospect Theory: Cumulative Representation of Uncertainty”, Journal of Risk and Uncertainty, 5(4): 297–323. doi:10.1007/BF00122574

  • Vranas, Peter B.M., 2000, “Gigerenzer’s Normative Critique of Kahneman and Tversky”, Cognition, 76(3): 179–193. doi:10.1016/S0010-0277(99)00084-0

  • Wakker, Peter P., 2010, Prospect Theory: For Risk and Ambiguity, Cambridge: Cambridge University Press. doi:10.1017/CBO9780511779329

  • Waldmann, Michael R., Keith J. Holyoak, and Angela Fratianne, 1995, “Causal Models and the Acquisition of Category Structure.”, Journal of Experimental Psychology: General, 124(2): 181–206. doi:10.1037/0096-3445.124.2.181

  • Walley, Peter, 1991, Statistical Reasoning with Imprecise Probabilities, London: Chapman; Hall.

  • Weber, Max, 1905, The Protestant Ethic and the Spirit of Capitalism, London: Allen; Unwin.

  • Wheeler, Gregory, 2004, “A Resource Bounded Default Logic”, in James Delgrande & Torsten Schaub (eds.), 10th International Workshop on Non-Monotonic Reasoning (Nmr 2004), Whistler, Canada, pp. 416–422.

  • –––, 2017, “Machine Epistemology and Big Data”, in Lee McIntyre & Alex Rosenberg (eds.), The Routledge Companion to Philosophy of Social Science, Routledge, pp. 321–329.

  • White, D. J., 1986, “Epsilon Efficiency”, Journal of Optimization Theory and Applications, 49(2): 319–337. doi:10.1007/BF00940762

  • Yechiam, Eldad and Guy Hochman, 2014, “Loss Attention in a Dual-Task Setting”, Psychological Science, 25(2): 494–502. doi:10.1177/0956797613510725

  • Yule, G. Udny, 1925, “A Mathematical Theory of Evolution, Based on the Conclusions of Dr. J. C. Williss, F.R.S.”, Philosophical Transactions of the Royal Society of London. Series B, Containing Papers of a Biological Character, 213(402–410): 21–87. doi:10.1098/rstb.1925.0002

  • Zaffalon, Marco and Enrique Miranda, 2017, “Axiomatising Incomplete Preferences through Sets of Desirable Gambles”, Journal of Artificial Intelligence Research, 60(December): 1057–1126. doi:10.1613/jair.5230

Academic Tools

Other Internet Resources

decision theory | decision theory: descriptive | economics: philosophy of | game theory: evolutionary | models in science | probabilities, imprecise | rational choice, normative: expected utility | risk | social norms

Acknowledgments

Thanks to Sebastian Ebert, Ulrike Hahn, Ralph Hertwig, Konstantinos Katsikopoulos, Jan Nagler, Christine Tiefensee, Conor Mayo-Wilson, and an anonymous referee for helpful comments on earlier drafts of this article.

Copyright © 2018 by Gregory Wheeler <g.wheeler@fs.de>

最后更新于

Logo

道长哲学研讨会 2024