决策理论 decision theory (Katie Steele and H. Orri Stefánsson)
首次发布于 2015 年 12 月 16 日星期三;实质修订于 2020 年 10 月 9 日星期五
决策理论关注的是决策者选择背后的推理,无论是在乘坐公交车还是打车之间做出平凡的选择,还是在是否追求一个具有挑战性的政治事业方面做出更为深远的选择。(请注意,这里的“决策者”指的是一个实体,通常是一个个体,具备思考和行动能力。)标准观点认为,决策者在任何给定场合选择做什么完全取决于她的信念、欲望或价值观,但这并不是毫无争议的,如下文所述。无论如何,决策理论既是关于信念、欲望和其他相关态度的理论,也是关于选择的理论;重要的是这些不同态度(称之为“偏好态度”)如何相互协调。
本条目的重点是规范决策理论。也就是说,感兴趣的主要问题是在任何一般情况下,决策者的偏好态度应该满足什么标准。这相当于对理性的最低要求,它将更深入的问题,如在特定情况下适当的欲望和合理的信念,放在一边。对于最低要求的关键问题是如何处理不确定性。正统的规范决策理论,即期望效用(EU)理论,基本上认为,在不确定的情况下,应该选择期望价值最大的选项。(请注意,在这个背景下,“价值”应该理解为根据决策者本人的价值观来衡量的价值。)这个简单的准则将是我们讨论的重点。
本条目的结构如下:第 1 节讨论了“对前景的偏好”这一决策理论的核心概念。第 2 节描述了规范决策理论在偏好度量方面的发展,不断提供更强大和灵活的度量方法。第 3 节讨论了最著名的两个 EU 理论版本。第 4 节考虑了 EU 理论对实际行动、推理和价值评估的更广泛意义。第 5 节转向对 EU 理论的突出挑战,而第 6 节则涉及顺序决策,以及这个更丰富的背景如何影响有关理性偏好的辩论。
1. 什么是对前景的偏好?
决策理论中的两个核心概念是偏好和前景(或等价地,选项)。粗略地说,当我们(在本条目中)说一个代理人“偏好”“选项”A 而不是 B 时,我们的意思是代理人认为 A 比 B 更可取或更值得选择。这个粗略的定义清楚地表明,偏好是一种比较的态度。除此之外,关于偏好选项的实际含义,或者换句话说,当我们谈论一个代理人(也许是自己)的偏好选项时,我们关心的是关于代理人的什么方面,这是有争议的。本节考虑了一些解释问题的基本问题,为引入(在下一节中)决策表和期望效用规则做了铺垫,这对于许多人来说是决策理论的熟悉主题。关于偏好和前景的进一步解释性问题将在后面的章节中逐步解决。
尽管如此,让我们首先介绍(理性的)对选项的基本候选属性,然后再转向解释问题。如上所述,偏好涉及对选项的比较;它是选项之间的关系。对于一个选项领域,我们谈论一个代理人的偏好排序,这是由代理人在该领域中任意两个选项之间的偏好所生成的排序。
在接下来的内容中,⪯ 表示一个弱偏好关系。因此 A⪯B 表示我们感兴趣的代理人认为选项 B 至少与选项 A 同样可取。从弱偏好关系中,我们可以定义严格偏好关系 ≺,如下所示:A≺B⇔A⪯B & ¬(B⪯A),其中 ¬X 表示“不是 X 的情况”。无差别关系 ∼ 定义为:A∼B⇔A⪯B & B⪯A。这表示我们感兴趣的代理人认为 A 和 B 同样可取。
我们说当 ⪯ 弱排序一个选项集合 S 时,满足以下两个条件:
公理 1(完备性) 对于任意的 A,B∈S:要么 A⪯B,要么 B⪯A。
公理 2(传递性) 对于任意的 A,B,C∈S:如果 A⪯B 且 B⪯C,则 A⪯C。
上述内容可以被视为对选项的理性偏好的初步描述。然而,即使是这种有限的描述也是有争议的,并且指向了对“对前景/选项的偏好”的不同解释。
从完备性公理开始,它表明一个代理人可以在弱偏好关系的条件下比较 S 中所有选项的所有配对。完备性是否是一个合理的理性约束取决于所考虑的选项类型以及我们对这些选项的偏好如何解释。如果选项集包括各种各样的情况,那么完备性不是立即令人信服的。例如,一个代理人是否应该能够比较使世界上另外两个人识字的选项和使另外两个人达到六十岁的选项是值得怀疑的。另一方面,如果集合中的所有选项彼此非常相似,比如说,所有选项都是投资组合,那么完备性更具说服力。但是,即使我们不限制所考虑的选项类型,完备性是否应该满足的问题取决于对偏好的理解。例如,如果偏好仅仅代表选择行为或选择倾向,正如经济学家们普遍认为的那样(参见 Sen 1973),那么在假设必须做出选择的前提下,完备性自动满足。相反,如果偏好被理解为心理态度,通常被认为是关于一个选项是否比另一个更好或更可取的判断,那么上述关于完备性的疑虑就是相关的(有关进一步讨论,请参见 Mandler 2001)。
大多数哲学家和决策理论家都支持将偏好解释为一种解释性判断,而不是与选择倾向和最终选择行为相同的判断(参见,例如,Hausman 2011a、2011b;Dietrich 和 List,2016a 和 2016b;Bradley 2017;尽管最近有 Thoma 2020b 和 Vredenburgh 2020 为“显性偏好理论”进行辩护,至少在经验经济学的背景下)。此外,许多人认为完备性并不是理性所要求的,因为他们认为理性只对一个代理人实际持有的判断提出要求,而不涉及是否必须首先持有一个判断。然而,根据 Richard Jeffrey(1983)的观点,大多数决策理论家认为理性要求偏好能够在不违反任何理性要求的条件下进行一致扩展。这意味着即使你的偏好不完备,也应该有可能在不违反任何理性要求的情况下将其补充完整,特别是传递性。
这将引出传递性公理,它表明如果选项 B 在弱意义上优于 A,并且 C 在弱意义上优于 B,则 C 在弱意义上优于 A。对传递性的最新挑战涉及到异质选项集合,正如上面关于完备性的讨论所述。但在这里,对选项比较提出了不同的偏好解释。观点是,偏好或可取性的判断可能对显著性条件作出响应。例如,假设在比较汽车 A 和 B 时最显著的特征是它们的行驶速度,而 B 在这方面不比 A 差,然而在比较汽车 B 和 C 时最显著的特征是它们的安全性,而 C 在这方面不比 B 差。此外,在比较 A 和 C 时,最显著的特征是它们的美观程度。在这种情况下,一些人认为(例如,Temkin 2012),对于关于 A、B 和 C 的偏好,没有理由要求传递性得到满足。其他人(例如,Broome 1991a)认为,传递性是更好关系(或客观比较可取性)的含义的一部分;如果理性偏好是更好或可取性的判断,那么传递性是不可商议的。对于汽车的例子,Broome 会认为,一个完全规定的选项的可取性不应该因为与其他选项的比较而变化。无论选择背景如何影响代理人对手头选项的感知,选项的描述都应该反映这一点,或者选择背景不影响选项。无论哪种情况,传递性都应该得到满足。
对于偏好的传递性有一个更直接的辩护,这个辩护依赖于违反该公理可能带来的确定性损失。这就是所谓的“金钱泵”论证(参见 Davidson et. al. 1955,对这种论证的早期论述,但对于最近对这种论证的讨论和修订,请参见 Gustafsson 2010 和 2013)。它基于这样的假设:如果你认为 X 至少和 Y 一样可取,那么你应该愿意用后者来交换前者。假设你违反了传递性;对于你来说:A⪯B,B⪯C,但 C≺A。此外,假设你目前拥有 A。那么你应该愿意用 B 来交换 A。对于 B 和 C 也是一样:你应该愿意用 C 来交换 B。你严格地偏好 A 而不是 C,所以你应该愿意用 C 加上一笔小于 b0 的金额 x 来交换!因此,在几个步骤中,每个步骤都符合你的偏好,你发现自己处于一个明显比你原来的情况更糟糕的境地,根据你自己的标准。如果我们想象这个过程可以重复,将你变成一个“金钱泵”,那么情况将更加戏剧化。因此,论证认为,你的不传递偏好在(工具性上)是不合理的。如果你的偏好是传递的,那么你就不会容易选择一个被支配的选项并成为一个“金钱泵”。因此,你的偏好应该是传递的。
虽然上述争议尚未解决,但在本文的其余部分将做出以下假设:i)偏好的对象可能是异质前景,包含丰富多样的属性领域;ii)选项之间的偏好是对比可取性或选择价值的判断;iii)偏好满足完备性和传递性(尽管前者条件将在第 5 节重新讨论)。现在出现的问题是,对选项的理性偏好是否存在进一步的一般约束。
2. 偏好的效用度量
在我们对前景的理性偏好的持续调查中,偏好排序的数值表示(或度量)将变得重要。所涉及的数值度量被称为效用函数。将发挥作用的两种主要类型的效用函数是序数效用函数和更丰富信息的区间值(或基数)效用函数。
2.1 序数效用
结果表明,只要前景/选项集合 S 是有限的,S 中选项的任何弱序都可以用一个序数效用函数来表示。准确地说,假设 u 是一个定义在 S 上的效用函数。我们说函数 u 表示 S 中选项之间的偏好 ⪯,当且仅当:
(1)对于任意的 A,B∈S:u(A)≤u(B)⇔A⪯B
另一种表述是,当上述条件成立时,偏好关系可以表示为最大化效用,因为它总是偏好具有更高效用的选项。
唯一包含在序数效用表示中的信息是代表偏好的代理如何对选项进行排序,从最不可取到最可取。这意味着如果 u 是表示排序 ⪯ 的序数效用函数,那么任何是 u 的序数变换的效用函数 u'——也就是满足(1)中的双条件的 u 的任何变换——同样能很好地表示 ⪯。因此,我们说序数效用函数只在序数变换上是唯一的。
上述结果可以总结如下:
定理 1(序数表示)。设 S 是一个有限集合,⪯ 是 S 上的弱偏好关系。那么存在一个序数效用函数,它能够很好地表示 ⪯,当且仅当 ⪯ 是完备且传递的。
这个定理应该不会太令人惊讶。如果 ⪯ 在 S 上是完全且传递的,那么可以对 S 中的选项进行排序,从最喜欢到最不喜欢的顺序,其中一些选项可能处于相同的位置(如果它们被认为是同样理想的),但没有循环、循环或间隙。定理 1 只是说我们可以以一种方式给 S 中的选项分配数字,以表示这个顺序。(关于定理 1 的简单证明,除了严格的偏好关系而不是弱偏好关系,请参考 Peterson 2009: 95。)
请注意,序数效用在数学上并不是非常“强大”。例如,比较不同序数效用集合的概率期望是没有意义的。例如,考虑以下两对前景:第一对的元素被分配序数效用为 2 和 4,而第二对的元素被分配序数效用为 0 和 5。让我们在每种情况下指定一个“平坦”的概率分布,使得两对中的每个元素对应于 0.5 的概率。相对于这个概率分配,第一对序数效用的期望值是 3,大于第二对的期望值 2.5。然而,当我们以允许的方式转换序数效用时,例如将第二对中最高效用从 5 增加到 10,期望值的排序就会颠倒;现在比较的是 3 和 5。这一点的重要性将在接下来的内容中变得更加清晰,当我们转向对抽签和风险选择的比较评估时。为了以一致的方式评估抽签/风险前景,需要一个区间值或基数效用函数。同样,为了构建或概念化一个基数效用函数,通常会引用对抽签的偏好。(尽管参见 Alt 1936,其中提供了一个“无风险”的基数效用构建,即不涉及抽签。)
2.2 给效用基数化
为了获得一个基于偏好排序的基数(区间值)效用表示,即一个不仅表示代理人对选项进行排序的方式,还能够表达选项之间“可取性”“距离”的度量,我们需要一个更丰富的设置;选项集和相应的偏好排序需要比顺序效用度量更具结构。约翰·冯·诺伊曼和奥斯卡·摩根斯特恩(1944)提出的一个解释将在下面详细阐述。目前,集中关注对于理解和构建基数效用函数至关重要的选项类型:彩票。[1]
首先考虑对三个常规选项进行排序,例如三个度假目的地阿姆斯特丹、曼谷和加的夫,分别表示为 A、B 和 C。假设您的偏好排序是 A≺B≺C。这些信息足以顺序表示您的判断;请记住,只要 C 的值高于 B 的值,B 的值高于 A 的值,任何效用分配都是可以接受的。但也许我们想要了解更多,而不能从这样的效用函数中推断出来-我们想要知道 C 相对于 B 的优势有多大,相对于 A 的优势有多大。例如,也许曼谷被认为几乎与加的夫一样理想,但相对而言,阿姆斯特丹远远落后于曼谷。或者也许曼谷只比阿姆斯特丹稍微好一点,相对于加的夫优于曼谷的程度。关于选项之间的相对距离的这种信息,以偏好的强度或可取性来衡量,正是区间值效用函数所给出的。问题是如何确定这些信息。
为了解决这个问题,拉姆齐(1926)和后来的冯·诺伊曼和摩根斯特恩(以下简称 vNM)提出了以下建议:我们构建一个新的选项,即彩票 L,它的可能“奖品”是 A 和 C,然后我们计算这个彩票必须给予 C 的机会,使得您对这个彩票和曼谷度假之间无所谓。基本思想是,您对曼谷的判断,相对于加的夫和阿姆斯特丹,可以通过您认为与曼谷一样理想的涉及加的夫和阿姆斯特丹的彩票 L 的风险性来衡量。例如,如果您对曼谷和一个提供非常低中奖机会的彩票无所谓,那么显然您不认为曼谷比阿姆斯特丹好多少,相对于加的夫而言;对您来说,即使是对阿姆斯特丹的微小改进,即一个有小概率中加的夫而不是阿姆斯特丹的彩票,就足以与曼谷匹敌。
上述分析假设彩票的评估是基于其预期的选择价值或可取性。也就是说,彩票的可取性实际上是每个奖品的机会乘以该奖品的可取性的总和。考虑以下例子:假设当彩票导致去曼谷度假的机会为 3/4 时,您对彩票和去曼谷度假之间无所谓。将这个特定的彩票称为 L'。这意味着曼谷在一个可取性尺度上相当于阿姆斯特丹在底部,卡迪夫在顶部的四分之三。如果我们规定 u(A)=0 和 u(C)=1,那么 u(B)=u(L')=3/4。这对应于彩票的预期可取性,即 1/4⋅0+3/4⋅1=3/4=u(L')。也就是说,彩票的可取性是其奖品效用的概率加权和,其中每个奖品的权重由彩票导致该奖品的概率确定。
因此,我们可以通过引入彩票选项来构建一个关于选项的区间值效用度量。正如名称所示,区间值效用度量根据某种可取性尺度传达了选项之间间隔的相对大小的信息。也就是说,在我们固定测量起点和可取性单位刻度之后,效用是唯一确定的。在上面的例子中,我们可以将 A 的效用值设为 1,将 C 的效用值设为 5,这样我们就必须将 B 的效用值设为 4,因为 4 是 1 和 5 之间的四分之三。换句话说,一旦我们为 A 和 C 分配了效用值,L'和因此 B 的效用就确定了。让我们称这个第二个效用函数为 u'。它与我们的原始函数的关系如下:u'=4⋅u+1。这种关系始终存在于两个这样的函数之间:如果 u 是表示偏好排序 ⪯ 的区间值效用函数,而 u'是另一个也表示相同偏好排序的效用函数,则存在常数 a 和 b,其中 a 必须为正,使得 u'=a⋅u+b。这就是说,区间值效用函数只在正线性变换下是唯一的。
在结束对测量效用的讨论之前,应该提到与这些度量所传达的信息相关的两个限制。首先,由于选项的效用(无论是序数还是区间值)只能相对于其他选项的效用确定,因此没有绝对的选项效用,至少在没有进一步假设的情况下是这样的。其次,根据同样的推理,所讨论的区间值和序数效用度量在效用的级别和单位上是不可比较的。举个例子,假设你和我对假期选项的偏好排序如上所述:A≺B≺C。还假设,根据上述情况,我们对于 B 和抽奖 L'是无差别的,该抽奖有 3/4 的机会得到 C 和 1/4 的机会得到 A。那么我们能否说,给予我卡迪夫和给予你曼谷与给予你卡迪夫和给予我曼谷的“总欲望程度”相同?我们没有权利这样说。例如,我们共享的偏好排序是一致的,我可能会觉得在卡迪夫度假是梦想成真,而你只是觉得它是最好的选择。此外,我们甚至不能说,对于你和我来说,曼谷和阿姆斯特丹之间的欲望差异是相同的。根据我的观点,这三个选项的欲望程度可能从地狱般的生活到梦想成真,而根据你的观点,从糟糕到相当糟糕;这两种评估都与上述偏好排序一致。实际上,对于我们对所有可能选项(包括抽奖)的偏好,可能也是如此:即使我们共享相同的总偏好排序,你可能只是持消极态度,找不到那么好的选项,而我可能非常极端,有些选项非常出色,但其他选项则是一种折磨。因此,无论是区间值还是序数的效用函数都不允许有意义的人际比较。(Elster 和 Roemer 1993 年包含了一些讨论这些问题的论文;另请参阅社会选择理论的条目。)
2.3 冯·诺伊曼和莫根斯特恩(vNM)表示定理
上一节在假设抽奖以期望效用为基础进行评估的情况下,提供了一个人对抽奖的偏好的区间值效用表示。有些人可能觉得这有点仓促。为什么我们要假设人们以其期望效用来评估抽奖?vNM 定理通过将注意力转回偏好关系,有效地弥补了推理中的空白。除了传递性和完备性之外,vNM 引入了进一步规定有关抽奖的理性偏好的原则,并且证明了只要一个人的偏好满足这些原则,她的偏好可以被表示为最大化期望效用。
让我们首先用正式的术语来定义彩票的预期效用:设 Li 为来自彩票集合 L 的彩票,Oik 为彩票 Li 的结果或奖品,以概率 pik 出现。彩票 Li 的预期效用定义如下:
vNM 方程。
EU(Li) = ∑ku(Oik)⋅pik
先前所做的假设现在可以正式陈述:
对于任意的 Li,Lj∈L:Li⪯Lj⇔EU(Li)≤EU(Lj)
当上述条件成立时,我们说存在一个代表代理人偏好的期望效用函数;换句话说,代理人可以被表示为最大化期望效用。
vNM 所涉及的问题是:什么样的偏好可以这样表示?为了回答这个问题,我们必须回到选项集上的基础偏好关系 ⪯,在这种情况下涉及到抽签。vNM 定理要求抽签集 L 相当广泛:它在“概率混合”下是封闭的,也就是说,如果 Li,Lj∈L,则具有 Li 和 Lj 作为可能奖品的复合抽签也在 L 中。(另一个不会详细讨论的技术假设是,根据概率法则,复合抽签总是可以简化为只涉及基本奖品的简单抽签。)
对偏好关系的基本合理性约束已经讨论过了,即它对选项进行了弱排序(即满足传递性和完备性)。以下符号将用于引入偏好的两个额外的 vNM 公理:{pA,(1−p)B}表示一个抽签,结果可能是 A,概率为 p,或者是 B,概率为 1−p,其中 A 和 B 可以是最终结果,也可以是抽签。
公理 3(连续性) 假设 A⪯B⪯C。那么存在一个 p∈ [0,1],使得:
{pA,(1−p)C}∼B
公理 4(独立性) 假设 A⪯B。那么对于任意的 C 和任意的 p∈ [0,1]:
{pA,(1−p)C}⪯{pB,(1−p)C}
连续性意味着没有任何结果 A 是如此糟糕,以至于您不愿意进行一些可能导致您最终获得该结果的赌博,但也可能导致您最终获得您认为是对您现状(B)的边际改进的结果(C),前提是 A 的机会足够小。直观地说,连续性保证了代理人对彩票的评估对彩票奖品的概率适当敏感。
独立性意味着当两个备选方案对于某个特定结果具有相同的概率时,我们对这两个备选方案的评估应该与我们对该结果的意见无关。直观地说,这意味着对于彩票之间的偏好应该仅受到彩票之间不同的特征的影响;彩票之间的共同点应该被有效地忽略。
有些人认为连续性公理对理性偏好是一个不合理的限制。是否存在某个概率 p,你愿意接受一次赌博,这次赌博有 p 的概率让你失去生命,有 (1−p) 的概率让你获得 10 亿美元。但这只是进行一次非常小概率被车撞死但更高概率获得 10 美元的赌博!更一般地说,尽管人们很少这样考虑,他们经常进行一些几乎没有可能导致即将死亡的赌博,相应地有非常高的获得一些适度奖励的机会。
在抽象层面上,独立性似乎是理性的一个强制要求。然而,有一些著名的例子表明,人们经常在不违背理性的情况下违反独立性。这些例子涉及可能的彩票结果之间的互补性。一个特别著名的例子是所谓的奥利埃悖论,法国经济学家莫里斯·奥利埃(1953)在 20 世纪 50 年代初首次提出。这个悖论涉及到比较人们对两对类似于表 1 中给出的彩票的偏好。彩票是根据与特定编号的票相关联的奖品来描述的,其中将随机抽取一张票(例如,如果抽取了编号为 2-34 的票之一,则 L1 将获得 2500 美元的奖金)。
表 1. 阿莱悖论
在这种情况下,许多人严格偏好 L2 而不是 L1,但也偏好 L3 而不是 L4(根据他们的选择行为和证词),这对偏好将被称为阿莱悖论。[3] 解释阿莱悖论的一种常见方式是,在第一个选择情况下,无论做出哪种选择,都有可能最终一无所获。因此,在这种情况下,许多人认为稍微多一点的风险(0 美元)是值得的,因为有机会获得更好的奖品。
尽管上述推理似乎很有说服力,阿莱的偏好与独立公理相冲突。以下两种选择情况都是真实的:无论你做出什么选择,如果最后一列中的一张票被抽中,你将获得相同的奖品。因此,独立性意味着你在 L1 和 L2 之间的偏好以及在 L3 和 L4 之间的偏好应该与该列中的奖品无关。但是当你忽略最后一列时,L1 变得与 L3 相同,L2 变得与 L4 相同。因此,如果你更喜欢 L2 而不是 L1,但更喜欢 L3 而不是 L4,那么你的偏好排序似乎存在不一致性。而且,独立性明显被违反了(考虑到选项的描述方式;这是我们在第 5.1 节中要讨论的一个问题)。因此,讨论中的偏好对不能被表示为最大化期望效用。(因此出现了“悖论”:很多人认为独立性是理性的要求,但仍然想要声称阿莱的偏好并不违反理性。)
决策理论家对阿莱悖论有不同的反应。在第 5.1 节中将重新讨论这个问题,讨论对欧几里德理论的挑战。目前的目标只是简单地表明连续性和独立性是对理性偏好的有力约束,尽管也有人对此提出异议。vNM 证明的结果可以总结如下:
定理 2(冯·诺伊曼-莫根斯特恩) 令 O 为有限结果集,L 为相应的彩票集合,该集合在概率混合下封闭,并且 ⪯ 是 L 上的弱偏好关系。当且仅当存在一个函数 u,从 O 到实数集的映射,该函数在正线性变换下是唯一的,并且相对于该函数,⪯ 可以表示为最大化期望效用,⪯ 满足公理 1-4。
David Kreps(1988)对该定理的证明给出了一个易于理解的例子。
3. 进行真实决策
vNM 定理是衡量理性主体对确定性选项偏好强度的非常重要的结果(彩票有效地促进了对确定性选项的基数度量)。但这并不能让我们在现实世界中做出理性决策;我们还没有真正的决策理论。该定理仅限于评估带有结果概率分布的选项——决策理论家和经济学家经常将这种情况描述为“风险选择”(Knight 1921)。
在大多数普通的选择情况下,我们必须或者说必须形成偏好的选择对象并不是这样的。相反,决策者必须参考他们自己关于某个特定选项是否会导致一种结果或另一种结果的概率性信念。在这种情况下做出的决策通常被描述为“不确定选择”(Knight 1921)。例如,考虑一个登山者决定是否尝试攀登危险的山峰,其中对她来说关键因素是天气。如果她幸运的话,她可能可以获得该地区的全面天气统计数据。然而,天气统计数据与彩票设置不同,它们不能确定在特定一天尝试攀登与不尝试攀登山峰的可能结果的概率。至少,登山者在考虑天气情况时必须考虑她对数据收集程序的信心,统计数据是否适用于当天等等。
决策理论中一些最著名的结果在一定程度上解决了这些挑战。它们表明对于“现实世界选项”的偏好存在哪些条件,以便存在一对效用和概率函数,相对于这些函数,主体可以被表示为最大化期望效用。标准解释是,就像效用函数代表主体的欲望一样,概率函数代表她的信念。这些理论被统称为主观期望效用(SEU)理论,因为它们涉及到一个主体对完全以她自己的信念和欲望来描述的前景的偏好(但我们将继续使用更简单的标签 EU 理论)。在本节中,将简要讨论其中的两个结果:Leonard Savage(1954)和 Richard Jeffrey(1965)的结果。
注意,这些欧盟决策理论显然规定了两件事:(a)你应该有一致的偏好态度,以及(b)你应该偏好手段而不是目的,或者至少你应该偏好你评估会平均导致你目的的手段(参见 Buchak 2016)。问题是:这些规定之间的关系是什么?即将简要概述的欧盟表示定理似乎表明,尽管表面上看,这两个规定实际上只是一个:任何具有一致态度的人都更喜欢手段而不是目的,反之亦然。但令人困惑的是,有很多种方式可以拥有一致的偏好态度,而且肯定不是所有这些方式都等同于偏好自己真正的目的手段。在评估欧盟理论的各种形式时,这个谜题值得记在心里;它将在后面再次出现。
3.1 Savage 的理论
Leonard Savage 的决策理论,如他在 1954 年的《统计学基础》中所述,无疑是关于不确定性下选择的最著名的规范理论,特别是在经济学和决策科学领域。在这本书中,Savage 提出了一组对一组选项的偏好进行限制的公理,保证了存在一对概率和效用函数,相对于这对函数,偏好可以被表示为最大化期望效用。在这本书出版的近三十年前,Frank P. Ramsey(1926)实际上提出了一组不同的公理可以产生更多或更少相同的结果。然而,Savage 的理论比 Ramsey 的理论更具影响力,可能是因为 Ramsey 既没有给出完整的证明,也没有提供太多关于如何进行证明的细节(Bradley 2004)。这里不会详细描述 Savage 的结果。然而,将介绍他的定理的要素和结构,突出其优点和缺点。
Savage 理论中的选项或前景与彩票类似,不同之处在于可能的结果不带有概率,而是取决于特定的世界状态是否实际存在。实际上,Savage 理论中的原始元素是结果 [4] 和状态(世界的)。前者是最终影响和关系到代理人的好或坏事态,而后者是代理人无法控制的世界特征,也是她对世界的不确定性的所在。状态集被称为事件。结果和状态之间的区别有助于清晰地区分欲望和信念:前者是 Savage 理论中的欲望目标,而后者是信念目标。
代理人偏好的类似彩票的选项是一组丰富的行为,实际上等同于将结果分配给世界状态的所有可能分配。也就是说,行为是从状态空间到结果空间的函数,而代理人的偏好排序被认为是在所有这些可能函数上定义的。其中一些行为看起来相当合理:考虑将事件“下雨”分配给结果“湿漉漉的散步”,将事件“不下雨”分配给结果“非常舒适的散步”的行为。这显然是不带伞散步的行为。其他 Savage 行为看起来不那么合理,比如将“下雨”和“不下雨”都分配给相同结果“湿漉漉的散步”的恒定行为。(请注意,恒定行为提供了在偏好排序中包含确定结果的方法。)这种行为(以及许多其他行为)的问题在于它不对应于代理人甚至原则上可以选择做或执行的任何事情。[5]
Savage 的行为/状态(事件)/结果的区分可以自然地以表格形式表示,其中行作为行为,为每个状态/事件列产生给定结果。表 2 描述了上述两个行为以及决策者可能关心的第三个行为:i)“不带伞散步”,ii)“带伞散步”,以及 iii)奇怪的恒定行为。当然,Savage 定理所需的行为集还涉及更多行为,以涵盖所有可能的状态和结果的组合。
表 2. 野蛮风格的决策表
在讨论 Savage 的公理之前,让我们先陈述它们所引起的结果。以下符号将被使用:f,g 等是各种行为,即从世界状态集合 S 到结果集合 O 的函数,其中 F 是这些函数的集合。f(si)表示当状态 si∈S 实际时 f 的结果。根据 Savage 的理论,f 的期望效用,表示为 U(f),由以下公式给出:
Savage 的方程式 U(f)=∑iu(f(si))⋅P(si)
Savage 证明的结果可以陈述如下:[6]
定理 3(Savage)。 令 ⪯ 为 F 上的弱偏好关系。如果 ⪯ 满足 Savage 的公理,则以下成立:
代理人对 S 中状态的实际性的信心可以用唯一的(且有限可加)概率函数 P 来表示;
对 O 中最终结果的渴望程度可以用唯一的效用函数 u 来表示,该函数在正线性变换下是唯一的;
并且对于任意 f,g∈F,配对(P,u)会产生一个期望效用函数 U,代表她对 F 中的选择的偏好;即,对于任意 f,g∈F: f⪯g⇔U(f)≤U(g)
上述结果可能看起来很引人注目;特别是,一个人的偏好可以决定一个唯一的概率函数,代表她的信念。然而,仔细观察后,可以明显看出我们的一些信念可以通过检查我们的偏好来确定。假设你被提供了两个彩票的选择,一个是如果硬币正面朝上你将赢得一个不错的奖品,但如果硬币反面朝上则一无所获,另一个是如果硬币反面朝上你将赢得相同的奖品,但如果硬币正面朝上则一无所获。然后假设奖品的可取性(以及同样地,没有奖品的可取性)与硬币的落地方式无关,你在这两个彩票之间的偏好应该完全由你对硬币可能落地方式的比较信念来决定。例如,如果你严格偏好第一个彩票而不是第二个,那就意味着你认为正面朝上的可能性比反面朝上的可能性更大。
上述观察表明,人们可以从个体的偏好中推断出其相对信念,甚至更多。Savage 在这一点上更进一步,将相对信念定义为偏好。为了陈述 Savage 的定义,让 .≾. 为一个弱的相对信念关系,定义在世界状态集合 S 上。(.≺. 和 .∼. 以通常的方式定义,基于 .≾.)
定义 1(相对信念)。 假设 E 和 F 是两个事件(即 S 的子集)。假设 X 和 Y 是两个结果,f 和 g 是两个行为,具有以下属性:
对于所有的 si∈E,f(si)=X,但对于所有的 si∉E,f(si)=Y,
对于所有的 si∈F,g(si)=X,但对于所有的 si∉F,g(si)=Y,
Y⪯X。
然后 E.≾.F⇔f⪯g.
定义 1 基于一个简单的观察,即人们通常更愿意把好的结果押在一个更可能发生的事件上,而不是一个不太可能发生的事件上。但是,这个定义是否能够准确地描述比较信念可能是有问题的。例如,我们可以想象那些仪器上的非理性人,由于这些条件都成立并且他们认为 F 比 E 更有可能发生,但他们仍然不喜欢 g 而更喜欢 f。此外,这个定义引发了如何定义那些对所有结果都漠不关心的人的比较信念的问题(Eriksson 和 Hájek 2007)。也许这样的人并不存在(而且 Savage 的公理 P5 确实明确表示他的结果不适用于这样的人)。然而,似乎一个比较信念的定义不应排除这样的人,如果存在的话,他们可能有严格的比较信念。Savage 认为,根据他的公理 P4,这个比较信念的定义在某种程度上是合理的,下面将会说明。无论如何,事实证明,当一个人的偏好满足 Savage 的公理时,我们可以从她的偏好中推断出一个比较信念关系,这个关系可以用一个(唯一的)概率函数来表示。
毫不拖延,让我们依次陈述 Savage 的公理。这些公理旨在约束一个代理人对一组行为的偏好关系 ⪯,如上所述。Savage 的第一个公理是基本的排序公理。
P1.(排序) 关系 ⪯ 是完备且传递的。
下一个公理与 vNM 的独立性公理相似。我们说在事件 E 中,替代方案 f“与”g 一致,如果对于事件 E 中的任何状态,f 和 g 产生相同的结果。
P2.(确定性原则) 如果 f、g、f'、g'满足以下条件:
f 在事件 ¬E 中与 g 一致,f'在事件 ¬E 中与 g'一致,
如果在事件 E 中 f 与 f' 一致,g 与 g' 一致,
且 f⪯g,
那么 f'⪯g'。
Sure Thing Principle(STP)背后的思想与独立性原则本质上是相同的:由于我们应该能够独立评估每个结果,而不受其他可能结果的影响,因此我们可以安全地忽略两个我们正在比较的行为导致相同结果的世界状态。将该原则以表格形式呈现可能会更加明显。设置涉及以下四个形式的行为:
STP 的直觉是,如果 g 弱优于 f,那么这一定是因为后果 Y 被认为至少和 X 一样可取,同样的推理也意味着 g' 弱优于 f'。
Savage 还要求结果的可取性与其发生的状态无关,因为这对于确定一个代理人的偏好来说是必要的。为了形式化这一要求,Savage 引入了一个空事件的概念,定义如下:
定义 2(空) 当且仅当对于任意的 f,g∈F,f∼g 给定 E 时,事件 E 为空。
直观上讲,空事件是指一个代理人确定不会发生的事件。当且仅当一个代理人确定 E 不会发生时,她对于在 E 下她面前的行为产生的结果是无所谓的。下面的公理规定了知道实际状态不会影响对结果的偏好排序。
P3.(国家中立性) 如果对于所有的 si∈E 且 E 不为空,f(si)=X 且 g(si)=Y,则当 E 给定时,f⪯g 成立,其中 X⪯Y。
下一个公理对于从一个代理人的偏好中确定比较信念关系也是必要的。前面曾经建议通过让您押注一个奖品,来确定您对硬币正面或反面的可能性更大。但是,只有在奖品的大小不会影响您对这两个事件相对可能性的判断时,这个建议才是合理的。这个假设由下一个公理捕捉。由于这个公理相当复杂,将以表格形式陈述:
P4. 考虑以下行为:
现在假设:
X′⪯X,Y′⪯Y,f′⪯f
然后
g′⪯g。
更不正式地说(并以严格偏好的术语表述),这个想法是,如果你更喜欢把奖品 X 押在 f 上而不是 f′,那么你必须认为 E 比 F 更有可能发生。因此,你应该更喜欢把奖品 Y 押在 g 上而不是 g′,因为奖品本身不会影响事件的概率。
下一个公理可以说不是一个合理性要求,而是 Savage 的“结构公理”之一(Suppes 2002)。为了能够从偏好中推断出代理人的比较信念,以及更一般地说,为了能够将代理人表示为最大化期望效用,代理人需要在偏好中具有一定的变化。为此,下一个公理简单地要求代理人在某些选择之间不是无差别的:
P5。 存在一些 f、g∈F,使得 f≺g。
当满足以下五个公理时,代理人的偏好会产生一个比较信念关系,.≾.,该关系具有作为定性概率关系的属性,这是将.≾.表示为概率函数的前提条件。换句话说,.≾.满足以下三个条件,对于任意事件 E、F 和 G:
.≾.是传递的和完备的,
如果 E∩G=∅=F∩G,则 E.≾.F⇔E∪G.≾.F∪G,
开始
作为一种定性概率关系,然而,这并不足以确保概率表示的可能性。为了确保这种可能性,萨维奇添加了以下结构公理:
P6.(非原子性) 假设 f≺g。那么对于任意的 X∈O,存在一个有限的划分 {E1,E2,…Em},使得:
对于任意的 si∈Ej,有 f′(si)=X,但对于任意的 si∉Ej,有 f′(si)=f(si),
对于任意的 si∈Ej,有 g′(si)=X,但对于任意的 si∉Ej,有 g′(si)=g(si),
f′≺g 和 f≺g′。
像 vNM 的连续性公理一样,非原子性意味着无论结果 X 有多糟糕,如果 g 已经优于 f,那么如果我们将 X 作为 f 的可能结果之一,从而构建一个新的替代方案 f′,只要 X 的概率足够小,g 仍然优于修改后的替代方案。实际上,非原子性意味着 S 包含任意小概率的事件。很容易想象如何满足这一点。例如,任何事件 F 都可以根据抛硬币的结果是正面还是反面将其分为两个等概率的子事件。每个子事件可以根据同一枚硬币的第二次抛掷的结果进行类似的分割,依此类推。
Savage 证明了只要满足这六个公理,比较信念关系可以由唯一的概率函数表示。在这样做之后,他可以依靠 vNM 表示定理来证明满足所有六个公理的代理人可以被表示为相对于一个可信地表示代理人对状态的信念和一个可信地表示代理人对最终结果的欲望的基数效用函数最大化(回顾上面 Savage 定理的陈述)。Savage 自己的证明相当复杂,但 Kreps(1988)提供了一个有用的说明。
毫无疑问,萨维奇的期望效用表示定理非常强大。然而,关于萨维奇是否实现了他的目标,有两个重要问题需要问:1)萨维奇是否至少在一般意义上描述了理性偏好?2)萨维奇的定理是否告诉我们如何在现实世界中做出理性决策?萨维奇的理论在满足这两个要求方面存在问题。可以说,该理论的核心弱点是,在构建现实决策模型时,其各种约束和假设在不同方向上产生了不同的影响,而且至少有一个约束(特别是确定性原则)只在决策建模假设下才是合理的,而这些假设应该是理论的输出,而不是输入。
萨维奇理论的一个被广泛认可的决策建模要求是,结果在每个重要方面都要具有最大的具体性,以便进行评估。如果不是这样,例如,状态中立性公理将是一个非常不合理的理性约束。例如,假设我们正在考虑周末是买可可还是柠檬水,并且假设我们对每个选项的好坏取决于天气如何。那么我们需要描述包含天气状态的结果。如果我们不这样做,结果的可取性将取决于实际状态。假设柠檬水在炎热的天气比寒冷的天气更好,那么像“我这个周末喝柠檬水”这样的结果将根据它发生在炎热还是寒冷的状态而更或者更不可取。这将违反状态中立性公理。因此,在这种情况下,适当的结果是“我这个周末在炎热的天气中喝柠檬水”。(当然,如果还有其他会影响手头选择的特征,比如与喜欢柠檬水的朋友分享饮料与与喜欢热可可的朋友分享饮料等,这个结果必须进一步细分为更细粒度的结果。)
上述情况中结果必须足够具体以包含天气状态的事实可能看起来相当无害。然而,这个要求加剧了上述问题,即萨维奇所要求的许多选项/行为在语义上是荒谬的,因为状态/结果对的语义内容是矛盾的。回想一下,萨维奇理论中的偏好排序的定义域等于从状态集合到结果集合的每个函数(Broome 1991a 将其称为矩形场假设)。因此,如果“我这个周末在炎热的天气中喝柠檬水”是我们正在处理的结果之一,并且我们根据天气将状态集合划分为不同的部分,那么必须存在一个行为,在寒冷的状态下具有这个结果!结果越详细(根据状态中立性的合理性要求),矩形场假设就越不合理。这是萨维奇框架内部的紧张关系。确实,很难看出一个理性的代理人如何/为什么能/应该对荒谬的行为形成偏好(尽管参见 Dreier 1996,对于这不是一个如此重要的问题的论证)。然而,如果没有这个假设,代理人的偏好排序将不足以满足萨维奇的理性约束,以产生期望效用表示结果。[9]
Savage 理论中受到最多关注的公理是确定性原则。很容易看出,这个原则与 Allais 的偏好存在冲突,原因与独立性的冲突相同(回顾第 2.3 节)。Allais 的挑战将在稍后再次讨论。目前,我们关注的是确定性原则与 Savage 理论内部逻辑的关系。首先,确定性原则和状态中立性一样,加剧了对矩形场假设的担忧。这是因为只有在结果足够具体以解释世界不同状态下结果之间的任何依赖关系时,确定性原则才是合理的。例如,如果事实上可以选择无风险的替代方案,并因此保证可接受的结果,那么在冒险后什么都没有得到的可取性是否会受到影响(如 Allais 的问题),那么这一点必须在结果的描述中加以考虑。但是,如果我们在结果的描述中考虑这种依赖关系,我们将遇到一个问题,即在偏好排序中会有一些荒谬的行为(例如,参见 Broome 1991a:第 5 章)。
Savage 理论还存在另一个内部问题,与确定性原则有关:只有当决策模型构建得使得决策者正在考虑的行为与决定这些行为结果的世界状态之间存在概率独立性时,该原则才是合理的。回想一下,该原则规定,如果我们有以下形式的四个选项:
然后,如果 g 弱优于 f,则 g' 必须弱优于 f'。然而,假设世界状态和我们考虑的备选方案之间存在概率依赖,并且我们发现 Z 比 X 和 Y 都要好,我们还发现 W 比 X 和 Y 都要好。此外,假设 g 使 ¬E 比 f 更有可能发生,而 f' 使 ¬E 比 g' 更有可能发生。那么,理所当然地,我们会更喜欢 g 而不是 f,但会更喜欢 f' 而不是 g'。
为什么概率独立性的要求是有问题的?首先,在许多现实世界的决策情况下,很难以一种方式构建决策模型,使得状态在直观上与行为概率独立。例如,假设一个代理喜欢吸烟,并且正在决定是否戒烟。她的寿命是影响吸烟可取性的一种情况。根据代理的寿命长短将状态集合进行划分是很自然的。但是很明显,她正在考虑的选项可能(并且可以说应该)影响她对世界上每个状态的可能性的看法,因为众所周知,吸烟会缩短寿命。因此,萨维奇需要对决策问题进行替代性表示——状态不直接参考寿命,而是参考代理对吸烟作出某种反应的生理倾向。
或许总有一种方法可以构建决策模型,使得行为在直观上与状态概率独立。但是其中存在更严重的问题。回想一下,萨维奇试图从代理对行为的偏好中确定一个理性代理的信念的方式,以便这些信念最终可以用概率函数表示。如果我们对现实世界的决策感兴趣,那么所讨论的行为应该是代理可以识别的选项(这是值得怀疑的)。此外,现在我们看到,萨维奇对偏好的理性约束之一——确定性原则——只有在建模的行为与状态概率独立时才是合理的。换句话说,如果决策模型要促进适当的信念和欲望度量,那么这种独立性必须内置于其中。但这就假设我们已经对我们试图表示态度的代理的信念有重要信息;即她认为哪些状态划分与她的行为概率独立。
上述问题表明需要一种关于不确定性下选择的替代理论。理查德·杰弗里的理论将在接下来讨论,它避免了到目前为止讨论的所有问题。但正如我们将看到的,杰弗里的理论也有其自身的众所周知的问题,尽管这些问题并非不可克服。
3.2 Jeffrey 的理论
Richard Jeffrey 的期望效用理论与 Savage 的理论在考虑的前景(即选项)和对这些前景的偏好的合理性约束方面存在差异。Jeffrey 理论的独特优势在于可以将现实世界的决策问题建模为代理人所感知的方式;对偏好的合理性约束的可信度不依赖于以特定方式建模决策问题。我们首先描述决策前景或设置以及相应的期望效用规则,然后转向与偏好相关的合理性约束和相应的定理。
与 Savage 不同,Jeffrey 不区分工具性欲望的对象(行为和结果)和信念的对象(世界状态)。相反,Jeffrey 假设描述事态的命题既是欲望的对象,也是信念的对象。乍一看,这似乎是无可非议的:就像我们可以对是否会下雨有观点一样,我们也可以对那是否是可取的有观点。这种设置的令人不舒服之处在于,行为也只是命题——它们是代理人既有信念又有欲望的普通事态。就像代理人对可能的周末天气情景有偏好排序一样,她对可能的行为也有偏好排序,而在这两种情况下,最受偏好的事态不一定是最有可能成为真实的。换句话说,唯一将行为视为特殊的是它们的实质内容——这些是代理人在给定情况下有能力选择/使之成为真实的命题。就像代理人从第三人称的角度评估自己的行动选择。如果一个人认为决策模型应该有说服力地代表所讨论的代理人的主观视角,那么这可能是 Jeffrey 理论的一个弱点,尽管它可能是一个没有后果的弱点。[10]
在继续之前,对于命题可能会有所帮助:它们是可以为真或为假的抽象对象,并且通常与可能世界的集合相对应。可能世界可以被看作是关于事物如何或可能如何的抽象表示(Stalnaker 1987; 另请参阅可能世界的条目)。例如,关于在时间 t 下下雨的命题只是所有下雨的可能世界的集合。而且只有当实际世界恰好是下雨的可能世界集合的成员时,这个特定的命题才为真。
Jeffrey 理论的基本结论是,一个命题的可取性,包括代表行为的命题,取决于命题在不同的方式下的可取性以及它在这些不同方式下的相对概率。为了更准确地陈述这一点,p、q 等将表示命题变量。让{p1,p2,…,pn}是命题 p 的众多有限分割之一;也就是说,是命题 p 可以实现的相互矛盾但共同穷尽的方式的集合。例如,如果 p 是下雨的命题,那么我们可以根据是否去海滩来粗略地对这个命题进行分割,但我们也可以更细致地对 p 进行分割,例如根据每小时的毫米降雨量。根据 Jeffrey 的观点,p 的可取性,表示为 Des(p),由以下公式给出:
Jeffrey 的方程式。 Des(p)=∑iDes(pi)⋅P(pi∣p)
这实际上是一个用于评估 p 的条件期望效用公式。如前所述,一个特殊情况是当 p 的内容是可以被代理人选择使其成为真实的可识别的东西,即一个行为。
Jeffrey 的可取性公式和 Savage 的期望效用公式之间的一个重要区别是,不像 Savage 的理论中必须做的那样,在可取性和“期望”可取性之间没有区别。在 Savage 的理论中,有一个明确的区别,即效用用于衡量代理人对最终结果的基本欲望,而期望效用用于衡量代理人对不确定前景或行为的偏好。这种不相似性是因为没有一种方式可以将 p 评估为需要成为最终结果的东西;它们本身可以被看作是根据其不同可能的实现来评估的不确定前景。
关于杰弗里计算可取性的方式,还有一件重要的事情需要注意,那就是它不假设被评估的替代方案 p 和可能的实现方式 pis 之间存在概率独立性。实际上,每个 pi 的概率都明确地取决于所讨论的 p。当涉及到评估行为时,这意味着(用萨维奇的术语来说),对于行为的可能状态-结果对的概率是条件于所讨论的行为的。因此,我们可以看到为什么代理人可以根据自己的视角描述她的决策问题;没有要求她识别一组状态(在杰弗里的情况下,这将是与行为分区正交的命题空间的一个分区),使得这些状态适当细粒度且与行为概率独立。
此外,鉴于第 3.1 节中对确定性原则(STP)的讨论,可以明显地看出杰弗里的理论没有这个公理。由于状态可能在概率上依赖于行为,一个代理人可以被表示为在违反 STP 的情况下最大化杰弗里的可取性函数的值。此外,与萨维奇的表示定理不同,杰弗里的表示定理不依赖于类似于矩形场假设的任何东西。代理人不需要对人为构造的行为或命题具有偏好,这些行为或命题在给定特定状态和结果的解释下是无意义的。实际上,根据杰弗里的理论,只有代理人认为可能的命题(即她为它们分配了大于零的概率)才包括在她的偏好排序中。
当然,为了证明杰弗里理论的表示定理,我们仍然需要一些结构性假设。特别是,偏好排序 ⪯ 所定义的集合 Ω 必须是一个无原子的布尔代数,其中已经移除了不可能的命题,表示为 ⊥。布尔代数只是一组例如命题或句子,它在经典逻辑运算符和否定下是封闭的。代数是无原子的,只要它的所有元素都可以被细分为更细的元素。假设 Ω 是无原子的,因此类似于萨维奇的 P6,并且可以给出类似的理由:如果投掷一枚硬币,根据硬币的落地方式,可以将 p 为真的任何方式 pi 分成两个更细的命题。
那么,在什么条件下,集合 Ω 上的偏好关系 ⪯ 可以表示为最大化的可取性?一些对偏好的要求条件现在应该已经很熟悉了,不再讨论。特别是,⪯ 必须是传递的、完备的和连续的(回想一下我们在 vNM 的连续性偏好公理第 2.3 节中的讨论)。
然而,下面两个条件并不是迄今为止考虑的两个表示定理的显式部分:
平均化 如果 p, q∈Ω 是互斥的,则
p⪯q⇔p⪯p∪q⪯q
公正性 假设 p,q∈Ω 是互斥的,并且 p∼q。那么如果存在一个与 p 和 q 都互斥且满足 ¬(r∼p)的 r,使得 p∪r∼q∪r,那么对于每个这样的 r,都有 p∪r∼q∪r。
平均化是杰弗里理论中的区分合理性条件。实际上,它可以看作是独立性和确定性原则的一个弱版本,并且在杰弗里理论中起着类似的作用。但它与阿莱斯偏好并不直接矛盾,并且它的合理性不依赖于确定性原则所暗示的概率独立性类型。该假设要求没有命题比其所有可能实现都严格更好或更差,这似乎是一个合理的要求。当 p 和 q 互斥时,p∪q 意味着 p 或 q 中的一个为真,但不能同时为真。因此,p∪q 既不应该比 p 和 q 都更可取,也不应该比它们都更不可取。假设 p 和 q 中有一个比另一个更可取。那么由于 p∪q 与两者中更可取的一个的真实性相容,p∪q 的可取性应该严格介于 p 和 q 之间。然而,如果 p 和 q 同样可取,那么 p∪q 应该与这两个命题一样可取。
公正性的直观吸引力在杰弗里理论中的作用与萨维奇理论中的 P4 相似,但不如平均化那么大。杰弗里本人在评论中也承认了这一点。
公理存在是因为我们需要它,并且它是由我们对所要推导的结果的合理性的先验信念所证明的。(1965 年:147)
然而,似乎可以提出一个论证,即任何合理的人都会满足这个公理。假设你对两个不能同时成立的命题 p 和 q 都持中立态度。现在假设我们找到一个命题 r,它与 p 和 q 都不相容,并且你发现它比 p 和 q 都更可取。那么如果你发现 p 与 r 的结合和 q 与 r 的结合之间没有区别,那一定是因为你认为 p 和 q 的概率相等。否则,你会更喜欢包含你认为概率较低的 p 或 q 的结合,因为这样可以增加更可取的命题 r 的机会。由此可得,对于满足上述条件的任何其他命题 s,你也应该对 p∪s 和 q∪s 持中立态度,因为这两个并集同样有可能得到 s。
第一个证明一个偏好关系能够表示为最大化 Jeffrey 可取性函数值的充分条件的定理的人实际上不是 Jeffrey 本人,而是数学家 Ethan Bolker(1966 年,1967 年)。他证明了以下结果(回顾上面给出的“可取性度量”的定义):[11]
定理 4(Bolker) 令 Ω 为一个完备且无原子的命题布尔代数,⪯ 为 Ω∖⊥ 上的连续、传递和完备关系,满足平均性和公正性。那么在 Ω∖⊥ 上存在一个欲望度量和一个概率度量,使得 ⪯ 可以表示为最大化欲望度量。
不幸的是,Bolker 的表示定理并不能像 Savage 的定理那样得到唯一的结果。即使一个人的偏好满足 Bolker 定理中的所有条件,也不能保证只有一个概率函数可以表示她的信念,也不能保证表示她欲望的欲望度量是唯一的(除非她的偏好是无界的)。更糟糕的是,同样满足所有这些公理的偏好排序可以被表示为相对于两个甚至在如何根据概率对命题进行排序上都不一致的概率函数最大化欲望度量。[12]
对于那些认为确定一个人的相对信念的唯一方法是看她的偏好的人来说,杰弗里理论中的缺乏独特性是一个大问题。事实上,这可能是经济学家们主要忽视杰弗里理论的主要原因之一。经济学家传统上对超出可以通过检查一个人的偏好来确定的一个人的欲望和信念的任何讨论持怀疑态度,他们认为这是一个人行为直接揭示的唯一态度。对于这些经济学家来说,如果我们甚至不能原则上通过观察一个人的偏好来确定一个理性人的相对信念,那么这是一个令人不悦的消息。
然而,那些不太倾向于行为主义的人可能不认为 Bolker 的定理中的缺乏独特性是一个问题。例如,詹姆斯·乔伊斯(1999)认为,杰弗里的理论在这方面完全正确,因为人们不应该期望合理的条件对一个人的偏好进行限制就足以确定一个代表该人信念的唯一概率函数。只有通过施加过于强大的条件,如萨维奇所做的那样,我们才能实现这一点。然而,如果我们追求的是独特性,那么我们可以像乔伊斯指出的那样,将 Bolker-Jeffrey 公理与代理人的相对信念关系上的某些条件(例如 Villegas 1964 提出的条件)结合起来,这些条件与 Bolker-Jeffrey 公理一起确保代理人的偏好可以由一个唯一的概率函数和一个唯一的可取性函数表示,该可取性函数在正线性变换下是唯一的。
与乔伊斯建议的向杰弗里的理论中添加特定的信念假设不同,我们可以通过丰富前景集合来获得相同的独特性结果。例如,理查德·布拉德利(1998)已经表明,如果将杰弗里的理论中的布尔代数扩展到指示条件,那么在扩展域上满足 Bolker-Jeffrey 公理(以及一些特定适用于条件的公理)的偏好关系将可以表示为最大化可取性,其中概率函数是唯一的,可取性函数在正线性变换下是唯一的。
4. 预期效用(EU)理论的更广泛影响
从一开始就注意到,EU 理论既是一种关于理性选择的理论,也是一种关于行为之间整体偏好的理论,同时也是一种关于理性信念和欲望的理论。本节依次扩展了 EU 理论的认识论和评价承诺。
4.1 关于理性信念
有些人将欧盟理论称为贝叶斯决策理论。这个标签突出了对概率主义的承诺,即信念可以以数值形式表示为概率,否则就是非理性的。因此,欧盟理论与概率主义之间存在着密切的联系,或者更一般地说,存在着理性偏好和理性信念之间的联系。(这里不关注理性偏好和相关理性信念的细节;对欧盟理论在这方面的挑战将在下面的第 5 节中讨论。)
有些人认为理性偏好和理性信念之间的联系非常深入。在这个谱系的尽头是这样的观点,即信念的含义本身就涉及偏好。事实上,回想一下 Savage 理论中的这个策略,在前面的第 3.1 节中已经讨论过。然而,许多人对将比较信念与特别设计的前景偏好等同起来的合理性表示怀疑。一个更温和的立场是将这些偏好视为相关比较信念的必然结果,但并非与之完全相同。无论信念是否仅仅是偏好的基础或者是以偏好的术语来定义的,还有一个进一步的问题,即对于理性信念具有某种结构(比如符合概率计算)的唯一合理性依据是否是一种实用主义的依据,即一个建立在代理人的偏好在其他方面不一致或自我矛盾的论证。这种实用主义的最新辩护者(尽管以更一般的术语来表述)是 Rinard(例如,2017 年)。其他人则认为,对于理性信念的解释可以和应该最终以认识论的理由来证明;例如,Joyce(1998)提供了一个非实用主义的概率主义的理由,该理由基于对自己的信念的整体“离真实性的距离”的概念。(有关这一立场的进一步发展,请参见关于概率主义的认识论效用论的条目。)
尽管存在这些细微的争议,贝叶斯派一致认为实用考虑在管理信念方面起着重要作用。至少有一种重要的方式,即代理人可以通过反思其信念程度的实用影响来询问自己。此外,是否寻求更多证据是一个实用问题;它取决于预期能够获得与手头决策相关的“信息价值”。这个想法是,寻求更多证据是一个值得选择的行动,前提是在做出决策之前寻求进一步证据的预期效用大于基于现有证据做出决策的预期效用。这种推理在 Good(1967)的一篇论文中得到了突出,他证明了人们应该始终寻求可能与手头决策有关的“免费证据”。(这个定理的前身可以在 Ramsey 1990(死后出版)和 Savage 1954 中找到。)请注意,该定理假设了被称为“条件化”的标准贝叶斯学习规则,该规则要求当一个人的学习经验形式上是确切地了解某个命题(对于这个命题,人们已经给予了正概率)时,人们的新信念程度应该等于在这个命题上的条件概率为一时的旧信念程度。实际上,条件化在 Good 关于免费证据非负价值的结果中起着关键作用,被一些人视为对这一学习规则提供某种合理性依据的证明。
因此,欧盟理论或贝叶斯决策理论构成了一套强大的认识规范。它被视为科学推理的适当解释,引发了统计推理和实验设计的学派,并对“证据”、“证据支持”、“归纳”与“演绎”等关键概念进行了形式化解释,以及“一致性”和“解释力”对真理的影响(请参阅相关条目)。作为贝叶斯主义在科学推理方面的主要竞争对手,可以说是被称为经典或误差统计学的一系列方法,它们否认证据对假设的“支持程度”(无论是概率还是其他方式)。这些方法更关注假设是否经受住了各种“严格测试”,并且推理是根据测试的长期性质进行的,而不是根据它们在任何单个案例中的表现,这将需要决策理论的推理(请参阅统计学哲学条目)。
4.2 关于理性欲望
欧盟理论对理性欲望的结构持有一种立场。在这方面,该理论受到了两方面的批评。首先,有人批评欧盟理论对于可能影响一个行动者欲望的因素过于宽容。然后,我们转向相反的批评:在欲望方面,欧盟理论不够宽容。
担心欧盟理论对欲望过于宽容与担心该理论不可证伪是相关的。担心的是,根据欧盟理论,表面上看起来不合理的偏好总是可以被解释为在适当的选项描述下是合理的。如上文第 1 节所讨论的,似乎违反传递性的偏好可以被解释为与该公理一致,只要被比较的选项在其描述上有所不同,这取决于其他因素,包括其他被考虑的选项。对于似乎违反可分离性或独立性(每个结果对选项整体价值的贡献)的偏好,如下文第 5.1 节进一步讨论。有人可能会争辩说,这是描述这类代理人偏好的正确方式。毕竟,偏好的恰当模型应该捕捉到对代理人重要的一切,包括最终结果和选项的描述。然而,在这种情况下,欧盟理论实际上是空洞的或无能为力的,作为代理人可以追求的理性标准。此外,它扩展了什么是能够合理地赋予价值或对代理人有吸引力的结果的概念。
对于代理人的偏好必然与欧盟理论一致,并具有上述所述的对代理人可能欲望的影响,有两种反应方式:
一种方式是反对这种说法,声称对代理人的偏好内容存在额外的约束。一方面,可能存在经验约束,即偏好内容由代理人更大的“网络”偏好态度的适应性和简洁性之间的权衡决定。另一方面,可能存在关于代理人可以合理区分哪种结果的规范约束(有关讨论,请参见 Tversky 1975;Broome 1991a 和 1993;Pettit 1993;Dreier 1996;Guala 2006;Vredenburgh 2020)。
一个人可以选择接受这种观点,将欧盟理论解释为不是一个代理人可以通过或失败的标准,而是作为一种组织原则,使得可以将代理人的欲望以及她的信念进行描述(参见特别是 Guala 2008)。
无论如何,可以争论的是,欧盟理论在构建代理人的偏好态度方面还不够深入,以便我们可以理解这些偏好态度的原因。Dietrich 和 List(2013 和 2016a)提出了一个更一般的框架来填补这个空白。在他们的框架中,满足一些最小约束的偏好可以表示为依赖于代理人在给定上下文中感知每个选项的属性束。属性可以进一步分类为选项属性(与结果本身有关)、关系属性(与特定上下文中的结果有关)或上下文属性(与选择上下文本身有关)。这种表示允许更详细地分析代理人偏好的原因,并捕捉代理人选择中不同类型的上下文依赖性。此外,它允许对偏好的合理原因进行明确限制,或者换句话说,哪些属性可以合理地出现在结果描述中;这些限制可以帮助澄清欧盟理论的规范承诺。
还有一些较为特殊的模型,可以提供理解偏好背后原因的模板。例如,多准则决策框架(参见 Keeney 和 Raiffa 1993)将代理人对选项的整体偏好排序视为与所有相关价值维度对应的偏好排序集合的聚合。在某些假设下,整体或聚合的偏好排序与欧盟理论是兼容的。另一种方法是试图理解时间或商品的时间位置对偏好的影响。为此,可以用时间索引的商品束或消费流来描述结果(关于这种模型的早期模型,请参见 Ramsey 1928;后来有影响力的处理是 Koopmans 1960)。代理人对这些消费流的偏好可能存在系统性结构,超出了欧盟偏好公理所强加的结构。例如,前述作者考虑并描述了呈指数时间贴现的偏好。
现在让我们转向相反的批评类型:即欧盟理论对理性偏好和欲望的有限约束是否过于严格。这里的重点将放在欧盟理论与关于行为选择价值性的突出伦理立场以及关于价值的本质及其与信念的关系的元伦理立场的兼容性上。
人们可能会想知道欧盟理论,事实上是决策理论更普遍地是否与规范伦理学无关,或者是否仅与伦理后果主义相容,因为行为的排名完全由其可能结果的效用决定。这样的模型似乎与非后果主义伦理理论相矛盾,因为行为的选择价值性据称不仅取决于其后果的道德价值。该模型似乎无法容纳基本的义务论观念,如主体相对性、绝对禁止或可允许但次优的行为。
然而,最初的回应是,不应过分解读决策理论的形式概念。行为和结果的效用度量只是一种表示排序的便捷方式,并且在识别和评估结果的不同方式方面有很大的空间。正如一个代理人的效用函数不一定对伦理考虑不敏感一样(这是由于经济模型中自私偏好的普遍存在而导致的一种常见误解;例如,参见 Sen 1977),它也不一定对特定的非后果主义或义务论伦理考虑不敏感。这完全取决于如何区分和评估行为及其结果。首先,行为的性质可能是其所有可能结果的属性。此外,某个事件是否发生或由决策代理人或其他人实施可能是相关的。例如,一个行为涉及撒谎,可以在该行为的所有可能结果中引用,并且决策代理人的撒谎可以与他人的撒谎区分开来。总的来说,行为及其结果可以根据在道德上重要的任何事情进行区分,无论是与行为的选择方式、选择者、以及/或某种状态如何从行为中产生有关的复杂关系属性。有关如何在行为和结果的描述中容纳各种伦理属性的早期讨论,请参见 Sen(1982)、Vallentyne(1988)、Broome(1991b)和 Dreier(1993)。这个想法后来被与所谓的“后果化”计划有关的其他人接受,包括 Louise(2004)和 Portmore(2007)。这个想法是,据称非后果主义伦理理论的规范建议可以用与一些价值函数相对应的行为/结果排名来表示,就像后果主义伦理理论一样(参见 Colyvan 等人 2010 年的研究)。
调和决策理论与所有形式的非后果主义之间的一个难点是难以容纳绝对禁止或边界约束(参见 Oddie 和 Milne 1999; Jackson 和 Smith 2006)。例如,假设存在一种道德禁止杀害无辜者的约束,无论其他利益如何。也许这样的约束最好以词汇排序和相应的价值函数来建模,其中行为/结果的杀害无辜者的状态在确定其相对排序/价值时具有优先权。但是,在面对风险时,这会产生反直觉的影响,因为很多行为都有一些机会,无论多么小,杀害无辜者。这里的教训可能只是这些理论需要发展;任何成熟的伦理理论都应该向我们解释如何在风险或不确定性下行动。对于决策理论和非后果主义的调和来说,更具有说服力的挑战是容纳“以代理人为中心的选择”和相关的“超额履行”。Portmore(例如,2007 年)和 Lazar(例如,2017 年)提出了这方面的建议,这些建议以不同的方式吸引了行为/结果的道德排序,而不同于代理人追求这些行为/结果的个人成本。
在决策理论与全面的伦理理论之间可以调和的程度上,我们是否应该说这些理论之间没有意义上的区别?Brown(2011 年)和 Dietrich 和 List(2017 年)证明了事实上伦理理论的选择理论表示更好地促进了它们之间的区别;像“(非)后果主义”这样的术语可以被精确定义,尽管有争议。更一般地,我们可以根据区分行为/结果的性质(无论是内在的还是某种意义上的关系)以及它们产生的行为/结果的排序的性质(是否传递、完全、连续等)来分类理论。这也揭示了与欧盟理论的偏离。
实际上,一些最有说服力的反例来自于伦理考虑对欧盟偏好公理的挑战。回想一下我们在第 1 节中对基本排序公理的讨论。传递性公理已经通过对伦理动机的偏好循环的例子的呼吁而受到质疑(参见 Temkin 2012)。非连续词汇排序的概念在上面提到了与伦理边界约束有关。完备性公理的可有可无性也常常是通过对涉及难以权衡的竞争伦理价值观的例子的呼吁来证明的,比如平均福利与总福利之间的竞争。其他针对完备性的暗示性例子涉及个人福利的竞争概念(参见,例如,Levi 1986; Chang 2002)。一个理性的代理人是否必须对两个职业选择之间有一个明确的偏好,这两个选择在创造性自我表达机会与社区服务方面拉扯不同方向(也许是一个作为舞者的职业与一个在偏远地区作为医生的职业)?请注意,关于欧盟理论的一些挑战在下面的第 5 节中会更深入地讨论。
最后,我们转向欧盟理论的潜在元伦理承诺。大卫·刘易斯(1988 年,1996 年)以欧盟理论来反驳反休谟主义,即我们有时完全受到我们对什么是好的信念的驱使,而不是我们的欲望,正如休谟主义所主张的那样。他将反休谟理论形式化为在一方面,一个行动者对任何命题 A 的欲望,以及另一方面,她对关于 A 的好处的命题的信念之间存在必然联系;并声称证明当这种联系以欧盟理论的术语来形式化时,所讨论的行动者将是动态不一致的。有几个人批评了刘易斯的论证。例如,布鲁姆(1991c),伯恩和哈杰克(1997)以及哈杰克和佩蒂特(2004)提出了对抗休谟主义的形式化,这些形式化对刘易斯的批评是免疫的,而斯特凡松(2014)和布拉德利和斯特凡松(2016)则认为刘易斯的证明依赖于一个错误的假设。然而,刘易斯的论证无疑引发了关于欧盟理论允许的信念和欲望之间的联系类型的有趣辩论。此外,还有一些关于欧盟理论中欲望的作用和结构的元伦理相关问题可以进行研究。例如,杰弗里(1974 年)和森(1977 年)对理论是否能够容纳高阶欲望/偏好进行了一些初步调查,以及如果能够容纳,这些欲望/偏好如何与一阶欲望/偏好相关联。
5. 对欧盟理论的挑战
到目前为止,重点一直放在标准理性选择理论的突出版本上:欧盟理论。本节将介绍一些对欧盟理论的关键批评,这些批评已经发展成为对理性选择的替代解释。对标准理论的提出的创新是独特的,因此将分别讨论,但它们不一定是互斥的。请注意,我们没有涉及所有批评欧盟理论的批评,这些批评激发了对理性选择的替代解释。这种类型的两个主要遗漏(因为篇幅不足,而且已经在本百科全书的其他条目中得到了充分解决)是 i)因果异常问题和因果决策理论的发展(请参阅因果决策理论的条目),以及 ii)无限状态空间问题和“相对期望理论”等替代方案的发展(请参阅理性选择的规范理论:期望效用理论和圣彼得堡悖论的条目)。
5.1 关于风险和后悔态度
预期效用理论因不允许不同、互相排斥的世界状态下结果之间的价值互动而受到批评。例如,回想一下,在决定两个风险选项时,根据萨维奇版本的理论,你应该忽略两个选项导致相同结果的世界状态。如果我们可以假设不同世界状态下的结果之间是可分离的,即一个结果对于一个选项的整体价值的贡献与该选项可能导致的其他结果无关,那么这似乎是非常合理的。因此,在比较两个选项时,相同结果(具有相等概率)应该在比较中互相抵消,这意味着如果两个选项在某个世界状态下共享一个结果,那么在比较这两个选项时,共享结果是无关紧要的。
阿莱悖论是上文第 2.3 节讨论的一个经典例子,其中上述的可分离性似乎失败了。为了方便参考,产生悖论的选项如表 3 所示。回顾第 2.3 节,人们倾向于更喜欢 L2 而不是 L1,以及更喜欢 L3 而不是 L4——这种态度被称为阿莱悖论的偏好,违反了预期效用理论。违反之处正是因为某些结果对于一个选项的整体价值的贡献与该选项可能具有的其他结果是不独立的。比较 L3 相对于 L4 多出的 0 结果的额外机会。许多人认为,在第一个比较中,这种额外机会比后者更重要,即相对于 L2 选择 L1 并且第一张票被抽中时,额外的 0.01 机会 2400 肯定更大,而不是因为拒绝的选项也有很高的机会导致 0 结果而产生的后悔,这违反了可分离性的假设。(有关这一假设的最新广泛讨论,请参见 Thoma 2020a。)
表 3. 艾利斯悖论
已经尝试过多种方法使艾利斯的偏好与某种期望效用理论相兼容。一个常见的回应是暗示选择问题的描述是错误的。如果真的是理性的,那么应该评估 L1 可能导致的 0 结果,以表示与其他彩票的$0 结果相比,该结果所带来的额外遗憾或风险(如表 4 所示)。如果我们这样做,艾利斯的偏好就不再与欧拉理论相矛盾。最简单的方法是注意到,当我们忽略被比较的选项在具有相同结果的世界状态下(即忽略表 4 中的最后一列)时,L1 不再与 L3 相同,这意味着冯·诺伊曼和莫根斯特恩的独立公理(以及萨维奇的确定性原则)不再要求只有在喜欢 L4 胜过 L3 时才喜欢 L2 胜过 L1。
表 4. Allais 悖论重新描述
上述的“重新描述策略”可以在结果的价值和/或贡献取决于其他可能结果时使用:只需以考虑到这种依赖关系的方式描述结果。但更令人担忧的是,无论何时遇到违反预期效用理论或其他理性理论的情况(如第 4.2 节所讨论的),都可以使用这种策略。
Lara Buchak(2013)最近发展了一种决策理论,可以容纳 Allais 的偏好,而无需重新描述结果。根据 Buchak 的解释,Allais 偏好的解释不是结果 0 对选项整体价值的不同贡献,而是部分取决于其他可能的结果,她认为这反映了选项可能导致的其他结果对可能性为$0 的选项风险的影响。为了容纳 Allais 的偏好(以及违反 EU 理论的其他直观合理的风险态度),Buchak 引入了一个风险函数,代表人们愿意用某种坏事的风险来交换某种好事的机会。她还表明,如果一个代理满足一组特定的公理,这些公理基本上是 Savage 的公理,只是确定性原则被一个严格较弱的原则所取代,那么代理的偏好可以表示为最大化风险加权期望效用;这本质上是 Savage 风格的期望效用,加上一个风险函数的加权。
Bradley 和 Stefánsson(2017)也开发了一种新的决策理论,部分是为了回应 Allais 悖论。但与 Buchak 不同,他们认为解释 Allais 的偏好的原因是从选择的抽奖中赢得零的价值部分取决于如果选择不同会发生什么。为了容纳这一点,他们将 Jeffrey 的决策理论中的布尔代数扩展到反事实命题,并且表明 Jeffrey 的扩展理论可以表示反事实和实际结果之间经常发现的价值依赖关系。特别是,他们的理论可以捕捉到(不)希望赢得零的(不)可取性部分取决于是否保证在选择不同的情况下赢得某些东西。因此,他们的理论可以将 Allais 的偏好表示为最大化扩展的 Jeffrey 可取性函数的价值。
Stefánsson 和 Bradley(2019)在 Jeffrey 的决策理论的扩展中提出了另一种解释 Allais 偏好的方法;这次扩展到机会命题,即描述客观概率分布的命题。总体思想是某个结果的机会增加或减少的可取性(例如,在 Allais 案例中,$0 结果的机会增加 0.01)可能取决于增加或减少之前的机会。Stefánsson 和 Bradley 将 Jeffrey 的理论扩展到机会命题也是受到标准决策理论不区分对某种好事的风险规避和对该好事数量的态度的影响(例如,Hansson 1988,Rabin 2000 和 Buchak 2013)的启发。
5.2 关于完整性:模糊的信念和欲望
如第 4 节所述,对于欧盟要求完整的偏好排序的批评既有认识论的考虑,也有欲望/价值的考虑。在价值方面,许多人认为,一个理性的行动者可能会因为无法比较它们的不可比较的特质而简单地发现两个选项是不可比较的。(在这里,将遵循这些术语的一个突出用法,即特定的选项可以被描述为在价值上不可比较,而价值的一般属性或维度可以被描述为不可比较。)就像是,行动者对确定选项的可取性的评估可能无法通过任何精确的效用函数来表示。同样,在信念方面,一些人认为(特别是 Joyce 2010 和 Bradley 2017),证据可能是这样的,以至于它不会使一个理性的行动者对可由唯一概率函数测量的精确信念程度做出承诺。
有各种各样的替代性、更模糊的欲望和信念表示方法可能被认为更合适。例如,Halpern(2003)研究了在我们离开概率的情况下概念化和表示认识论不确定性的不同方式。很可能也有各种各样的方式来表示不确定的欲望。这里的重点将仅仅集中在哲学家中流行的一个提议上:使用概率和效用函数的集合来分别表示信念和欲望中的不确定性。这是标准欧盟模型的最小推广,因为概率和效用度量仍然起着作用。粗略地说,认识论不确定性越严重,就需要更多的概率度量来共同表示行动者的信念。这种理性信念的概念被称为不精确概率论(参见不精确概率的条目)。同样,评估不确定性越严重,就需要更多的效用度量来共同表示行动者的欲望。严格来说,我们不应该单独处理信念和欲望,而应该谈论由一组概率和效用对表示的行动者的不完整偏好。请回顾对不完整偏好的一致可扩展性的要求(参见第 1 节);在这种表示中,所有的概率-效用对都是不完整偏好的候选扩展。
那么问题就出现了:是否存在一个保守的欧盟决策规则的概括,可以处理概率和效用对的集合?竞争者决策规则通常以选择函数的形式提出,该函数以一些可行选项的集合作为输入,并返回作为输出的一组非空的可接受选择,该选择是可行选项的子集。对这些选择函数的基本约束是,它们在选项实际上是可比较的情况下尊重代理人的偏好。也就是说,如果代理人态度的所有概率和效用函数对两个选项的排序达成一致,那么这些特定选项应该相应地排序。对选择函数的相关约束是“EU 主导选项”不是可接受的选择,即,如果一个选项的预期效用低于另一个选项,根据所有概率和效用函数的对,那么前者主导的选项不是可接受的选择。请注意,Levi(1986)对可接受性有一个稍微更严格的条件:如果一个选项在至少一个概率和效用函数对中没有最大的 EU,则它是不可接受的。然而,在概率和效用函数的集合是闭凸集的普通情况下,Levi 的条件等价于排除 EU 主导选项的前述条件(Schervish 等人,2003)。
对于真正不可比较的选项(通过上述可接受性测试幸存下来,但并不是代理人无所谓的选项),真正的争议就开始了。参见 Bradley(2017)对各种处理方法的广泛讨论。常常用来区分不可比较选项的一个考虑因素是谨慎。例如,Maxmin-EU 规则建议选择具有最大最小预期效用的行动(参见 Gilboa 和 Schmeidler,1989;Walley,1991)。这个规则使用起来很简单,但可以说过于谨慎,完全不考虑预期效用的全面分布。相比之下,α-Maxmin 规则建议选择具有最大 α 加权的最小和最大预期效用之和的行动。最小和最大预期效用的相对权重可以被看作是反映决策者在面对不确定性时的悲观或谨慎程度(参见 Binmore,2009)。
还有更复杂的选择规则,这些规则依赖于对不确定性的更丰富的表示,涉及到置信度的概念。例如,Klibanoff 等人(2005)提出了一种规则,根据置信度加权的预期效用来在否则不可比较的选项之间进行选择。它假设可以为与行为相关的各种预期效用分配权重,反映代理人对相应的概率和效用对的置信度。还有其他规则,即使在没有精确的基数权重的情况下,也可以利用置信度。例如,Gärdenfors 和 Sahlin(1982)建议简单地排除任何低于置信度阈值的概率(和效用)函数,然后基于剩余部分应用基于 Maxmin-EU 规则。Hill(2013)的选择理论有些类似,尽管概率和效用对的置信度阈值可以根据选择问题而变化(并且术语“置信度”本身的使用方式也不同)。还有其他提议,根据它们能够容忍的不确定性程度(这又取决于置信度水平),来比较行动,并且仍然是一个令人满意的选项(参见,例如,Ben-Haim,2001)。这些规则很有说服力,但它们确实引发了一系列关于如何解释和衡量起到作用的额外主观态度的困难问题,比如“对信念/欲望的置信度的程度”和“令人满意的欲望水平”。
5.3 无意识
最近对预期效用理论提出了一个新的挑战,即无意识的挑战。事实上,无意识对所有现存的选择规范理论都构成了挑战。为了简化问题,我们将重点讨论萨维奇的预期效用理论,以说明无意识所带来的挑战。
正如读者所知,萨维奇默认存在一组可能的结果 O,以及另一组可能的世界状态 S,并将行为的集合 F 定义为从 S 到 O 的所有函数的集合。此外,他的表示定理被解释为证明了一个合理的人总是执行 F 中最大化预期效用的行为,相对于 S 上的概率度量和 O 上的效用度量。
现在,萨维奇的理论对于如何解释 S 中的状态和 O 中的结果是中立的。例如,该理论可以将 S 和 O 分别解释为所有逻辑上可能的状态和结果的集合,但也可以将 S 和 O 分别解释为某些建模者认可的状态和结果的集合,或者决策者本人认可的状态和结果的集合。
如果该理论旨在描述决策者的推理过程,前两种解释似乎不如第三种。前两种解释的问题在于决策者可能不知道一些逻辑上可能的状态和结果,以及建模者知道的一些状态和结果。(话虽如此,我们可以通过参考建模者知道的状态和结果来确定代理人不知道的状态和结果。)
当涉及(部分)不知情的决策者时,可以在“不知情的不知情”和“知情的不知情”之间进行重要区分。前者指的是决策者没有意识到可能存在一些他们不知道的结果或状态的情况,而后者指的是决策者至少怀疑存在一些他们不知道的结果或状态的情况。
从决策的角度来看,对于不知道自己不知道的事情并不是很感兴趣。毕竟,如果一个人甚至没有意识到自己可能对某种状态或结果不知情,那么这种无知就无法在他对该做什么的推理中起到任何作用。然而,决策理论模型已经提出了一个关于理性人如何应对意识增长的理论(这个理论适用于以前对自己的无知不知情的人)。特别是,经济学家卡尼和维罗(2013 年,2015 年)最近将标准的贝叶斯条件化扩展到了这种学习事件中。他们的理论,逆向贝叶斯主义,非正式地说,意识增长不应该影响代理人在增长之前意识到的状态/结果的概率比例。理查德·布拉德利(2017 年)在更一般的杰弗里风格框架下为类似原则辩护,鲁索斯(2020 年)也是如此;但这个观点受到了斯蒂尔和斯特凡松(即将出版-a,即将出版-b)以及马赫塔尼(即将出版)的批评。
相反,从决策的角度来看,意识到自己的无知似乎非常有趣。如果你怀疑有一些可能的状态,比如你还没有考虑过的状态,以及一些相应的结果,你对其内容一无所知,那么在做出决策之前,你可能至少想对你预期这种状态的可能性有一些看法,以及对应的结果是好还是坏。
有许多人提出了代表意识到自己无知的代理人的模型(例如,沃克和迪茨 2013 年,皮尔蒙特 2017 年,卡尼和维罗 2017 年)。斯蒂尔和斯特凡松(即将出版-b)认为,在决策者对自己知道自己不知道的状态/结果进行推理时,她的判断的自信程度和风险管理方式可能没有什么特别之处。尽管如此,她得出这些概率和期望值判断的方式值得进一步探索。例如,格兰特和奎金(2013a,2013b)认为,这些判断是基于过去经历了意识增长的情况的归纳得出的。
总体而言,对于无意识的文献研究正在迅速增长。Bradley(2017)和 Steele 和 Stefánsson(即将出版)是哲学领域对这一主题的新的深入研究。Schipper 在经济学和计算机科学领域维护了一个关于无意识的参考文献,网址为\url{http://faculty.econ.ucdavis.edu/faculty/schipper/unaw.htm}。
6. 顺序决策
Savage 和 Jeffrey 的决策理论以及他们的批评者显然只涉及单个或“一次性”决策;问题是一个代理人在特定时间点的偏好排序,最终选择的行为。可以将此称为静态决策问题。问题是,这个框架是否足以处理更复杂的情景,特别是涉及一系列或一系列决策的情况;这些被称为顺序决策问题。
在纸上,至少从外观上看,静态和顺序决策模型看起来非常不同。静态模型具有熟悉的表格或正常形式,每一行代表一个可用的行动/选项,列代表不同可能的世界状态,每个行动对应一个给定结果。另一方面,顺序决策模型具有树状或广义形式(如图 1 所示)。它描述了一系列预期的选择点,选择点延伸出的分支代表该选择点的选项。其中一些分支在解决一些由新证据引起的不确定性后,导致进一步的选择点。
这些静态和顺序决策模型之间的基本差异引发了关于它们如何相互关联的问题:
静态和顺序决策模型是否描绘了相同类型的决策问题?如果是这样,顺序决策模型的静态对应物是什么?
顺序决策环境是否揭示了欧盟理论的进一步(不)优势?更一般地说,这个环境是否为选择的规范理论提供了启示?
这些问题事实上是相当有争议的。在介绍一个关于尤利西斯的旧故事之后,它们将依次被解答。
6.1 尤利西斯是否理性?
一个众所周知的顺序决策问题是乌利西斯在他回到伊萨卡的旅途中所面临的问题,这是荷马古代伟大故事中的一个情节。乌利西斯必须在航行经过一个由甜美歌声的塞壬居住的岛屿时做出选择。他可以选择自由航行,也可以选择被绑在桅杆上。在前一种情况下,乌利西斯在听到塞壬的歌声后,可以选择继续航行回到伊萨卡,或者永远留在岛上。在后一种情况下,他将无法自由做出进一步的选择,船只将继续航行到伊萨卡,经过那些甜美的塞壬。最终的结果取决于乌利西斯所做的选择序列。乌利西斯的决策问题在图 1 中以树形(或广义)形式表示(其中两个方框代表乌利西斯的选择点)。
图 1. 乌利西斯的决策问题
我们被告知,在出发之前,乌利西斯最希望自由地听到塞壬的歌声并返回伊萨卡。问题是乌利西斯预测他未来的自己不会遵守:如果他自由航行,他将被塞壬诱惑,实际上不会继续回家,而是永远留在岛上。因此,乌利西斯推理认为被绑在桅杆上会更好,因为他宁愿忍受被绑在桅杆上的羞耻和不适,也愿意回到家中,而不是永远留在塞壬的岛上。
很难否认尤利西斯在被绑在桅杆上做出了明智的选择。然而,有人认为尤利西斯并不是一个典范的行动者,因为他的现在的自我必须与将来会被塞壬诱惑的自我相对抗。虽然从静态决策标准来看,尤利西斯在第一个选择节点上是理性的,但从顺序决策标准来看,我们可能认为他整体上是非理性的,这是从选择序列的相对价值来理解的。尤利西斯不可避免地追求的选择序列毕竟是次优的。如果他能够无拘无束地航行并继续回到伊萨卡岛,那将更好。如果尤利西斯在延长的时间段内持续理性,比如说,如果他始终以欧盟最大化者的身份行动,并且只按照贝叶斯规范(标准条件化的变体)改变他的信念和欲望,那么这个序列就可以实现。从这个解读来看,顺序决策模型引入了关于随时间变化的理性的考虑。
虽然随时间变化的理性可能在评估一个行动者的偏好和改变这些偏好的规范方面具有重要意义(可以将下面第 6.2 节的讨论理解为这种方式),但仍然存在一个重要问题,即在任何给定时间点上,一个行动者应该如何行动。为此,顺序决策模型可以被有益地视为帮助确定特定时间点上的理性选择的工具,就像静态决策模型一样。顺序决策树实际上是一种可视化代理人相信自己将来可能面临的一系列选择和学习事件的时间序列的方式,这取决于她将发现自己处于决策树的哪个部分。关键问题是:在她的预测决策树中的初始选项中,一个行动者应该如何选择?这个问题引发了相当多的争议。文献中出现了三种主要的处理顺序决策树的方法。这些方法将依次进行讨论;将提出这些争议可能并不实质性,而是指示对顺序决策模型解释的微妙差异。
所谓的天真方法在处理顺序决策时与其他两种方法形成了有益的对比。天真的行动者假设决策树上的任何路径都是可能的,因此会选择最优的路径,根据他/她现在的态度。例如,一个天真的尤利西斯只会假设他有三种整体策略可供选择:要么命令船员将他绑在桅杆上,要么不发出这样的命令,然后在塞壬的岛上停下来,要么不发出这样的命令,然后坚持他的航线。尤利西斯更喜欢与后一种组合相关的结果,因此他通过不命令船员约束他来启动这个策略。表 5 呈现了天真尤利西斯决策问题的静态对应物。实际上,这个决策模型没有考虑到尤利西斯对他未来偏好的现有知识,因此建议他追求一个被预测为不可能的选项。
表 5. 天真的尤利西斯决策问题
毋庸置疑,天真的顺序选择方法确实名副其实。相比之下,复杂方法的特点是强调向后规划:复杂的选择者并不假设决策树上的所有路径,或者换句话说,各个选择节点上的所有可能选择组合都是可行的。相反,代理人考虑的是当他/她到达所讨论的时间位置时,他/她将倾向于在后续选择节点上选择什么。复杂的尤利西斯会注意到这样一个事实,即如果他不受限制地到达塞壬岛,由于塞壬之歌对他的偏好产生了转变效应,他将希望无限期停留在那里。这在决策问题的静态表示中得到了体现,如表 6 所示。这里的状态涉及尤利西斯到达岛屿后的未来偏好。由于第二个状态的概率(根据假设)为零,行为是基于第一个状态来决定的,因此尤利西斯明智地选择被绑在桅杆上。
第 6 张桌子。复杂的尤利西斯决策问题
坚决的选择只在某些特定条件下偏离复杂的选择,这些条件并不适用于尤利西斯,因为他的态度变化是无法解释的。坚决选择的辩护者通常辩护违反独立公理/肯定事实原则的决策理论和相关偏好(特别是 McClennen 1990 和 Machina 1989;另请参阅 Rabinowicz 1995 和 Buchak 2013 进行讨论),并诉诸于坚决选择以使这些偏好在顺序决策环境中更容易接受(将在下面的第 6.2 节进一步讨论)。根据坚决选择,在适当的情境中,代理人应该在所有选择点上坚持最初被认为是最好的策略。问题是,这个建议是否有意义,考虑到顺序决策模型的标准解释。一个代理人选择违背自己的偏好以履行先前选择的计划,这意味着什么?这似乎违背了偏好的概念。当然,一个代理人可能非常重视遵守先前的承诺。然而,任何这种诚信问题都应该在结果的规定中反映出来,因此应该反映在当时的代理人偏好中。这与在某个时间点上与自己的全面考虑偏好不一致的选择是完全不同的。
坚决选择的辩护者可能对顺序决策模型有不同的解释,即未来的“选择点”实际上并不是代理人可以根据当时的偏好自由选择的点。如果是这样,那么这将对问题或兴趣产生微妙的转变。在接下来的内容中,将假设顺序决策模型的标准解释,并相应地假设理性代理人追求复杂的选择方法(如 Levi 1991、Maher 1992、Seidenfeld 1994 等人所述)。
6.2 EU 公理再审视
我们已经看到,顺序决策树可以帮助像尤利西斯这样的代理人评估其当前选择的后果,以便他能更好地思考现在该做什么。然而,关于顺序选择的文献主要关注更有雄心的问题。顺序决策环境有效地提供了“测试”理性偏好理论和偏好(或信念和欲望)变化规范的新方法。问题是,一个代理人的决策理论在这个广义上是否被证明是动态不一致或自我破坏的。
Skyrms(1993)关于条件化的“历时荷兰书”论证可以这样理解。假设代理人具有欧盟偏好,并对顺序决策问题采取复杂的(向后推理)方法。Skyrms 表明,任何计划以与条件化相悖的方式学习的代理人在某些特殊设计的顺序决策情境中会做出自我破坏的选择。相比之下,进行条件化的代理人永远不会做出这种自我破坏的选择。这里所讨论的“自我破坏的选择”是指产生确定损失的选择。也就是说,代理人选择了一种策略,这种策略在她自己看来肯定比另一种策略更糟糕,只要她的学习规则使她在一个或多个未来的决策节点上做出不同的选择。
同样的“动态一致性”论证可以用来支持欧盟偏好以及与条件化相一致的学习(参见 Hammond 1976, 1977, 1988b,c)。与之前一样,假设代理人对顺序决策问题采取复杂的方法。Hammond 表明,只有完全贝叶斯的代理人才能计划追求在初始选择节点上被认为是最优的任何路径。这使得贝叶斯代理人独特,因为她永远不会根据自己的偏好和偏好变化规范做出“自我破坏的选择”。她永远不会选择一种在她自己看来比另一种策略更糟糕的策略,只要她的偏好使她在一个或多个未来的决策节点上做出不同的选择。
Hammond 对欧盟理论的论证以及它所引用的动态一致性概念受到了不同领域的批评,既有那些捍卫违反独立公理但保留完备性和传递性(即排序)公理的欧盟理论的理论的人,也有那些捍卫违反后者的理论的人(有关讨论,请参见 Steele 2010)。一些捍卫违反独立公理的理论的人(特别是 Machina 1989 和 McClennen 1990)已经提到过:他们拒绝了支持动态一致性论证的复杂选择假设。Seidenfeld(1988a,b,1994,2000a,b)则拒绝了 Hammond 关于动态一致性的概念,而更倾向于一种更微妙的概念,区分了违反排序和仅违反独立性的理论;前者与后者不同,通过 Seidenfeld 的测试,该测试依赖于代理人在最佳选项之间对未来决策节点的冷漠。这个论点也不是没有批评者(见 McClennen 1988,Hammond 1988a,Rabinowicz 2000)。
注意,任何违背欧盟理论的代价都被 Al-Najjar 和 Weinstein(2009)所强调,特别是对自由信息的厌恶和对未来更多选择机会的厌恶。Kadane 等人(2008)和 Bradley 和 Steele(2016)关注与支付以避免免费证据相关的确定性损失。但是,请参见 Buchak(2010,2013)对这个问题与认识论与工具理性的关系进行细致讨论。
7. 结论性的评论
让我们总结一下为什么决策理论在哲学上具有兴趣的主要原因。首先,规范决策理论显然是一种实践理性的(最低限度的)理论。其目的是描述实践上理性的代理人的态度,并且通常会提出各种(静态和顺序)论证来表明不满足标准决策理论约束的代理人会遭受某些实践上的灾难。其次,许多这些约束涉及代理人的信念。特别是,规范决策理论要求代理人的信念程度满足概率公理,并且他们会根据新信息进行条件化。因此,决策理论对认识论和科学哲学的辩论具有重大影响;也就是说,对于认识论的理论。
最后,决策理论对于心灵和心理学的哲学家以及对于如何理解他人行为和意图以及更一般地解释他人心灵活动的人来说应该具有极大的兴趣。决策理论家通常假设一个人的行为可以完全用她的信念和欲望来解释。但更有趣的是,决策理论的一些最重要的结果——各种表示定理,其中一些已经在上面讨论过——表明如果一个人满足某些合理性要求,那么我们可以从她的选择倾向(或偏好)中读出她的信念和欲望,以及这些信念和欲望的强度。这些定理真正告诉我们多少是一个有争议的问题,正如上面所讨论的。但在对这些结果的乐观解读中,它们向我们保证,我们可以在没有太多关于他们选择倾向以外的证据的情况下,有意义地谈论其他人心灵活动的内容。
Bibliography
Al-Najjar, Nabil I. and Jonathan Weinstein, 2009, “The Ambiguity Aversion Literature: A Critical Assessment”, Economics and Philosophy, 25: 249–284. [al-Najjar and Weinstein 2009 available online (pdf)]
Allais, Maurice, 1953, “Le Comportement de l’Homme Rationnel devant le Risque: Critique des Postulats et Axiomes de l’Ecole Américaine”, Econometrica, 21: 503–546.
Alt, Franz, 1936, “Über die Meßbarkeit des Nutzens”, Zeitschrift für Nationalökonomie, 7: 161–169.
Ben-Haim, Yakov, 2001, Information-Gap Theory: Decisions Under Severe Uncertainty, London: Academic Press.
Bermúdez, José Luis, 2009, Challenges to Decision Theory, Oxford: Oxford University Press.
Binmore, Ken, 2009, Rational Decisions, Princeton: Princeton University Press.
Bolker, Ethan D., 1966, “Functions Resembling Quotients of Measures”, Transactions of the American Mathematical Society, 124: 292–312.
–––, 1967, “A Simultaneous Axiomatisation of Utility and Subjective Probability”, Philosophy of Science, 34: 333–340.
Bradley, Richard, 1998, “A Representation Theorem for a Decision Theory with Conditionals”, Synthese, 116: 187–222
–––, 2004, “Ramsey’s Representation Theorem”, Dialectica, 4: 484–497.
–––, 2007, “A Unified Bayesian Decision Theory”, Theory and Decision, 63: 233–263.
–––, 2017, Decision Theory with a Human Face, Cambridge: Cambridge University Press.
Bradley, Richard and H. Orri Stefánsson, 2017, “Counterfactual Desirability”, British Journal for the Philosophy of Science, 68: 485–533.
–––, 2016, “Desire, Expectation and Invariance”, Mind, 125: 691–725.
Bradley, Seamus and Katie Steele, 2016, “Can Free Evidence be Bad? Value of Information for the Imprecise Probabilist”, Philosophy of Science, 83: 1–28.
Broome, John, 1991a, Weighing Goods: Equality, Uncertainty and Time, Oxford: Blackwell.
–––, 1991b, “The Structure of Good: Decision Theory and Ethics”, in Foundations of Decision Theory, Michael Bacharach and Susan Hurley (eds.), Oxford: Blackwell, pp. 123–146.
–––, 1991c, “Desire, Belief and Expectation”, Mind, 100: 265–267.
–––, 1993, “Can a Humean be moderate?”, in Value, Welfare and Morality, G.R. Frey and Christopher W. Morris (eds.), Cambridge: Cambridge University Press. pp. 51–73.
Brown, Campbell, 2011, “Consequentialize This”, Ethics, 121: 749–771.
Buchak, Lara, 2010, “Instrumental rationality, epistemic rationality, and evidence-gathering”, Philosophical Perspectives, 24: 85–120.
–––, 2013, Risk and Rationality, Oxford: Oxford University Press.
–––, 2016, “Decision Theory”, in Oxford Handbook of Probability and Philosophy, Christopher Hitchcock and Alan Hájek (eds.), Oxford: Oxford University Press, pp. 789–814.
Byrne, Alex and Alan Hájek, 1997, “David Hume, David Lewis, and Decision Theory”, Mind, 106: 411–728.
Chang, Ruth, 2002, “The Possibility of Parity”, Ethics, 112: 659–688.
Colyvan, Mark, Damian Cox, and Katie Steele, 2010, “Modelling the Moral Dimension of Decisions”, Noûs, 44: 503–529.
Davidson, Donald, J. C. C. McKinsey and Patrick Suppes, 1955, “Outlines of a Formal Theory of Value, I”, Philosophy of Science, 22: 140–160.
Dietrich, Franz and Christian List, 2013, “A Reason-Based Theory of Rational Choice”, Noûs, 47: 104–134.
–––, 2016a, “Reason-Based Choice and Context Dependence: An Explanatory Framework”, Economics and Philosophy, 32: 175–229.
–––, 2016b, “Mentalism Versus Behaviourism in Economics: a Philosophy-of-Science Perspective”, Economics and Philosophy, 32: 249–281.
–––, 2017, “What Matters and How it Matters: A Choice-Theoretic Representation of Moral Theories”, The Philosophical Review, 126: 421–479.
Dreier, James, 1996, “Rational Preference: Decision Theory as a Theory of Practical Rationality”, Theory and Decision, 40: 249–276.
–––, 1993, “Structures of Normative Theories”, The Monist, 76: 22–40.
Elster, Jon and John E. Roemer (eds.), 1993, Interpersonal Comparisons of Well-Being, Cambridge: Cambridge University Press.
Eriksson, Lina and Alan Hájek, 2007, “What are Degrees of Belief”, Studia Logica, 86: 183–213.
Gärdenfors, Peter and Nils-Eric Sahlin, 1982, “Unreliability Probabilities, Risk Taking, and Decision Making”, reprinted in P. Gärdenfors and N.-E. Sahlin (eds.), 1988, Decision, Probability and Utility, Cambridge: Cambridge University Press, pp. 313–334.
Gaifman, Haim and Yang Liu, 2018, “A Simpler and more Realistic Subjective Decision Theory”, Synthese, 195: 4205–4241.
Gilboa, Itzhak and David Schmeidler, 1989, “Maxmin Expected Utility With Non-Unique Prior”, Journal of Mathematical Economics, 18: 141–153.
Good, I.J., 1967, “On the Principle of Total Evidence”, British Journal for the Philosophy of Science, 17: 319–321.
Grant, Simon and John Quiggin, 2013a, “Bounded Awareness, Heuristics and the Precautionary Principle”, Journal of Economic Behavior & Organization, 93: 17–31.
–––, 2013b, “Inductive Reasoning about Unawareness”, Economic Theory, 54: 717–755.
Guala, Francesco, 2006, “Has Game Theory Been Refuted?”, Journal of Philosophy, 103: 239–263.
Gustafsson, Johan E., 2010, “A Money-Pump for Acyclic Intransitive Preferences”, Dialectica, 64: 251–257.
–––, 2013, “The Irrelevance of the Diachronic Money-Pump Argument for Acyclicity”, The Journal of Philosophy, 110: 460–464.
Hájek, Alan and Philip Pettit, 2004, “Desire Beyond Belief”, Australasian Journal of Philosophy, 82: 77–92.
Halpern, Joseph Y., 2003, Reasoning About Uncertainty, Cambridge, MA: MIT Press.
Hammond, Peter J., 1976, “Changing Tastes and Coherent Dynamic Choice”, The Review of Economic Studies, 43: 159–173.
–––, 1977, “Dynamic Restrictions on Metastatic Choice”, Economica, 44: 337–350.
–––, 1988a, “Orderly Decision Theory: A Comment on Professor Seidenfeld”, Economics and Philosophy, 4: 292–297.
–––, 1988b, “Consequentialism and the Independence Axiom”, in Risk, Decision and Rationality, B. R. Munier (ed.), Dordrecht: D. Reidel, pp. 503–516.
–––, 1988c, “Consequentialist Foundations for Expected Utility Theory”, Theory and Decision, 25: 25–78.
Hansson, Bengt, 1988, “Risk Aversion as a Problem of Conjoint Measurement”, in Decision, Probability and Utility, P. Gärdenfors and N.-E. Sahlin (ed.), Cambridge: Cambridge University Press, pp. 136–158.
Hausman, Daniel M., 2011a, “Mistakes about Preferences in the Social Sciences”, Philosophy of the Social Sciences, 41: 3–25.
–––, 2011b, Preference, Value, Choice, and Welfare, Cambridge: Cambridge University Press.
Heap, Shaun Hargreaves, Martin Hollis, Bruce Lyons, Robert Sugden, and Albert Weale, 1992, The Theory of Choice: A Critical Introduction, Oxford: Blackwell Publishers.
Hill, Brian, 2013, “Confidence and Decision”, Games and Economic Behaviour, 82: 675–692.
Jackson, Frank and Michael Smith, 2006, “Absolutist Moral Theories and Uncertainty”, The Journal of Philosophy, 103: 267–283.
Jeffrey, Richard C., 1965, The Logic of Decision, New York: McGraw-Hill.
–––, 1974, “Preferences Among Preferences”, The Journal of Philosophy, 71: 377–391.
–––, 1983, “Bayesianism With a Human Face”, in Testing Scientific Theories, John Earman (ed.), Minneapolis: University of Minnesota Press, pp. 133–156.
Joyce, James M., 1998, “A Non-Pragmatic Vindication of Probabilism”, Philosophy of Science, 65: 575–603.
–––, 1999, The Foundations of Causal Decision Theory, New York: Cambridge University Press.
–––, 2002, “Levi on Causal Decision Theory and the Possibility of Predicting one’s Own Actions”, Philosophical Studies, 110: 69–102.
–––, 2010, “A Defense of Imprecise Credences in Inference and Decision Making”, Philosophical Perspectives, 24: 281–323.
Kadane, Joseph B., Mark J. Schervish, and Teddy Seidenfeld, 2008, “Is Ignorance Bliss?”, The Journal of Philosophy, 105: 5–36.
Karni, Edi and Marie-Louise Vierø, 2013, “‘Reverse Bayesianism’: A Choice-Based Theory of Growing Awareness”, American Economic Review, 103: 2790–2810.
–––, 2015, “Probabilistic Sophistication and Reverse Bayesianism”, Journal of Risk and Uncertainty, 50: 189–208.
–––, 2017, “Awareness of Unawareness: A Theory of Decision Making in the Face of Ignorance”, Journal of Economic Theory, 168: 301–325.
Keeney, Ralph L. and Howard Raiffa, 1993, Decisions with Multiple Objectives: Preferences and Value Tradeoffs, Cambridge: Cambridge University Press.
Klibanoff, Peter, Massimo Marinacci, and Sujoy Mukerji, 2005, “A Smooth Model of Decision Making Under Ambiguity”, Econometrica, 73: 1849–1892.
Knight, Frank, 1921, Risk, Uncertainty, and Profit, Boston: Houghton Mifflin Company.
Koopmans, Tjalling C., 1960, “Stationary Ordinal Utility and Impatience”, Econometrica, 28: 287–309.
Kreps, David M., 1988, Notes on the Theory of Choice, Boulder: Westview Press.
Lazar, Seth, 2017, “Deontological Decision Theory and Agent-Centred Options”, Ethics, 127: 579–609.
Levi, Isaac, 1986, Hard Choices: Decision Making Under Unresolved Conflict, Cambridge: Cambridge University Press.
–––, 1991, “Consequentialism and Sequential Choice”, in Foundations of Decision Theory, M. Bacharach and S. Hurley (eds.), Oxford: Basil Blackwell, pp. 70–101.
Lewis, David, 1988, “Desire as Belief”, Mind, 97: 323–332.
–––, 1996, “Desire as Belief II”, Mind, 105: 303–313.
Loomes, Graham and Robert Sugden, 1982, “Regret Theory: An Alternative Theory of Rational Choice Under Uncertainty”, The Economic Journal, 92: 805–824.
Louise, Jennie, 2004, “Relativity of Value and the Consequentialist Umbrella”, Philosophical Quarterly, 4: 518–536.
Machina, Mark J., 1989, “Dynamic Consistency and Non-Expected Utility Models of Choice Under Uncertainty”, Journal of Economic Literature, 27: 1622–1668.
Maher, Patrick, 1992, “Diachronic Rationality”, Philosophy of Science, 59: 120–141.
Mahtani, Anna, forthcoming, “Awareness Growth and Dispositional Attitudes”, Synthese.
Mandler, Michael, 2001, “A Difficult Choice in Preference Theory: Rationality Implies Completeness or Transitivity but Not Both”, in Varieties of Practical Reasoning, Elijah Millgram (ed.), Cambridge, MA: MIT Press, pp. 373–402.
McClennen, Edward F., 1988, “Ordering and Independence: A Comment on Professor Seidenfeld”, Economics and Philosophy, 4: 298–308.
–––, 1990, Rationality and Dynamic Choice: Foundational Explorations. Cambridge: Cambridge University Press.
Meacham, Patrick, Christopher J. G. and Jonathan Weisberg, 2011, “Representation Theorems and the Foundations of Decision Theory”, Australasian Journal of Philosophy, 89: 641–663.
Peterson, Martin, 2009, An Introduction to Decision Theory, Cambridge: Cambridge University Press.
Pettit, Philip, 1993, “Decision Theory and Folk Psychology”, in Foundations of Decision Theory: Issues and Advances, Michael Bacharach and Susan Hurley (eds.), Oxford: Blackwell, pp. 147–175.
Piermont, Evan, 2017, “Introspective Unawareness and Observable Choice”, Games and Economic Behavior, 106: 134–152.
Portmore, Douglas W., 2007, “Consequentializing Moral Theories”, Pacific Philosophical Quarterly, 88: 39–73.
Rabin, Matthew, 2000, “Risk Aversion and Expected-Utility Theory: A Calibration Theorem”, Econometrica, 68: 1281–1292.
Rabinowicz, Wlodek, 1995, “To Have one’s Cake and Eat it, Too: Sequential Choice and Expected-Utility Violations”, Journal of Philosophy, 92: 586–620.
–––, 2000, “Preference Stability and Substitution of Indifferents: A rejoinder to Seidenfeld”, Theory and Decision, 48: 311–318.
–––, 2002, “Does Practical Deliberation Crowd out Self-Prediction?”, Erkenntnis, 57: 91–122.
Ramsey, Frank P., 1926 [1931], “Truth and Probability”, in The Foundations of Mathematics and other Logical Essays, R.B. Braithwaite (ed.), London: Kegan, Paul, Trench, Trubner & Co., pp. 156–198.
–––, 1928, “A Mathematical Theory of Saving”, The Economic Journal, 38: 543–559.
–––, 1990, “Weight of the Value of Knowledge”, British Journal for the Philosophy of Science, 41: 1–4.
Resnik, Michael D., 1987, Choices: An Introduction to Decision Theory, Minneapolis: University of Minnesota Press.
Rinard, Susanna, 2017, “No Exception for Belief”, Philosophy and Phenomenological Research, 94: 121–143.
Roussos, Joe, 2020, Policymaking Under Scientific Uncertainty, Ph.D. thesis, London School of Economics and Political Science.
Savage, Leonard J., 1954, The Foundations of Statistics, New York: John Wiley and Sons.
Schervish, Mark J., Teddy Seidenfeld, Joseph B. Kadane, and Isaac Levi, 2003, “Extensions of Expected Utility Theory and Some Limitations of Pairwise Comparisons”, Proceedings of the Third ISIPTA (JM): 496–510.
Seidenfeld, Teddy, 1988a, “Decision Theory Without ‘Independence’ or Without ‘Ordering’”, Economics and Philosophy, 4: 309–315.
–––, 1988b, “Rejoinder [to Hammond and McClennen]”, Economics and Philosophy, 4: 309–315.
–––, 1994, “When Normal and Extensive Form Decisions Differ”, Logic, Methodology and Philosophy of Science, IX: 451–463.
–––, 2000a, “Substitution of Indifferent Options at Choice Nodes and Admissibility: A Reply to Rabinowicz”, Theory and Decision, 48: 305–310.
–––, 2000b, “The Independence Postulate, Hypothetical and Called-off Acts: A Further Reply to Rabinowicz”, Theory and Decision, 48: 319–322.
Sen, Amartya, 1973, “Behaviour and the Concept of Preference”, Economica, 40: 241–259.
–––, 1977, “Rational Fools: A Critique of the Behavioural Foundations of Economic Theory”, Philosophy and Public Affairs, 6: 317–344.
–––, 1982, “Rights and Agency”, Philosophy and Public Affairs, 11: 3–39.
Skyrms, Brian, 1993, “A Mistake in Dynamic Coherence Arguments?”, Philosophy of Science, 60: 320–328.
Stalnaker, Robert C., 1987, Inquiry, Cambridge, MA: MIT Press.
Steele, Katie S., 2010, “What are the Minimal Requirements of Rational Choice?: Arguments from the Sequential-Decision Setting”, Theory and Decision, 68: 463–487.
Steele, Katie S. and H. Orri Stefánsson, forthcoming-a, “Belief Revision for Growing Awareness”, Mind.
–––, forthcoming-b, Beyond Uncertainty: Reasoning with Unknown Possibilities, Martin Peterson (ed.), Cambridge University Press.
Stefánsson, H. Orri, 2014, “Desires, Beliefs and Conditional Desirability”, Synthese, 191: 4019–4035.
Stefánsson, H. Orri and Richard Bradley, 2019, “What is Risk Aversion?”, British Journal for the Philosophy of Science, 70: 77–102.
Suppes, Patrick, 2002, Representation and Invariance of Scientific Structures, Stanford: CSLI Publications.
Temkin, Larry, 2012, Rethinking the Good: Moral Ideals and the Nature of Practical Reasoning, Oxford: Oxford University Press.
Thoma, Johanna, 2020a, “Instrumental Rationality Without Separability”, Erkenntnis, 85: 1219–1240. doi:10.1007/s10670-018-0074-9
–––, 2020b, “In Defense of Revealed Preference Theory”, Economics and Philosophy, 1-25. doi:10.1017/S0266267120000073
Tversky, Amos, 1975, “A Critique of Expected Utility Theory: Descriptive and Normative Considerations”, Erkenntnis, 9: 163–173.
Villegas, C., 1964, “On Qualitative Probability σ-Algebras”, Annals of Mathematical Statistics, 35: 1787–1796.
Vallentyne, Peter, 1988, “Gimmicky Representations of Moral Theories”, Metaphilosophy, 19: 253–263.
Vredenburgh, Kate, 2020, “A Unificationist Defence of Revealed Preferences”, Economics and Philosophy, 36(1): 149–169. doi:10.1017/S0266267118000524
von Neumann, John and Oskar Morgenstern, 1944, Theory of Games and Economic Behavior, Princeton: Princeton University Press.
Walley, Peter, 1991, Statistical Reasoning with Imprecise Probabilities, New York: Chapman and Hall.
Walker, Oliver and Simon Dietz, 2011, “A Representation Result for Choice Under Conscious Unawareness”, Grantham Research Institute on Climate Change and the Environment, Working Paper No. 59.
Zynda, Lyle, 2000, “Representation Theorems and Realism about Degrees of Belief”, Philosophy of Science, 67: 45–69.
Academic Tools
Other Internet Resources
Bradley, Richard, 2014, Decision Theory: A Formal Philosophical Introduction.
Hansson, Sven Ove, 1994, Decision Theory: A Brief Introduction.
Related Entries
decision theory: causal | epistemic utility arguments for epistemic norms | possible worlds | probabilities, imprecise | probability, interpretations of | rational choice, normative: expected utility | social choice theory | statistics, philosophy of
Copyright © 2020 by Katie Steele <katie.steele@anu.edu.au> H. Orri Stefánsson <orri.stefansson@philosophy.su.se>
最后更新于