归纳逻辑 inductive (James Hawthorne)

首次发表于 2004 年 9 月 6 日;实质性修订于 2018 年 3 月 19 日

归纳逻辑是一种证据支持的逻辑。在演绎逻辑中,有效演绎论证的前提在逻辑上蕴含结论,其中逻辑蕴含意味着使前提为真的逻辑可能状态必须使结论为真。因此,有效演绎论证的前提为结论提供了全面的支持。归纳逻辑将这个思想扩展到较弱的论证上。在一个好的归纳论证中,前提的真实性为结论的真实性提供了一定程度的支持,其中这种支持程度可以通过某种数值尺度来衡量。类比于演绎蕴涵的概念,归纳支持程度的概念可能意味着以下内容:在使前提为真的逻辑可能状态中,结论必须在其中(至少)比例为 r 的状态中为真——其中 r 是支持强度的某种数值度量。

如果一个好的归纳论证的逻辑要有任何真正的价值,它所表达的支持度量应该能够胜任任务。可以假设,逻辑至少应满足以下条件:

充分性准则(CoA): 逻辑学应该使得(作为逻辑学的问题)随着证据的累积,真实证据的总体将最终通过逻辑学的支持度来表明,虚假假设很可能是虚假的,而真实假设很可能是真实的。

这里所述的 CoA 可能会让一些读者感到意外地强大。在给定特定的证据支持逻辑的情况下,如何证明它满足这样的条件?第 4 节将准确地展示这个条件是如何由本文第 1 至 3 节中阐述的证据支持逻辑满足的。

本文将重点讨论近年来认识论学家和逻辑学家广泛研究的归纳逻辑方法。这种方法使用条件概率函数来表示证据陈述支持假设的程度。假设应该根据它们对证据陈述可能是真实的程度来进行经验评估。概率论的一个直接定理,称为贝叶斯定理,阐明了假设对证据陈述的可能性的说法如何影响假设受到这些证据陈述支持的程度。因此,这种对证据支持逻辑的方法通常被称为贝叶斯归纳逻辑或贝叶斯证实理论。本文首先详细阐述了贝叶斯归纳逻辑的概念。然后,它将检查这种逻辑在作为假设的证据支持逻辑方面是否能够通过检验。特别是,我们将看到这样的逻辑如何能够满足上述的充分性标准。

第 1 至第 3 节介绍了所有概率逻辑的主要思想,这些思想是关于证据支持的(贝叶斯)概率逻辑的基础。这三节应足以提供对该主题的充分理解。第 5 节将这一解释扩展到关于证据主张(称为似然性)的假设模糊或不精确的情况。阅读第 1 至第 3 节后,读者可以直接跳到第 5 节,跳过第 4 节中关于如何满足 CoA 的相当技术性的解释。

第 4 节是给更高级读者的,他们想要了解这种逻辑如何在证据累积时导致对真实假设的收敛。这个结果表明,充分性准则确实得到满足——随着证据的累积,虚假假设很可能会具有接近 0 的证据支持值(由其后验概率测量);而随着这种情况发生,真实假设很可能会获得接近 1 的证据支持值(由其后验概率测量)。


1. 归纳论证

让我们从考虑一些归纳论证的常见例子开始。考虑以下两个论证:

例子 1. 在一个随机样本中的 3200 只乌鸦中,每只乌鸦都是黑色的。这强烈支持以下结论:所有乌鸦都是黑色的。

例子 2. 在一个随机样本中的 400 名注册选民中,62%的选民(在 2004 年 2 月 20 日进行的民意调查中)表示他们支持约翰·克里而不是乔治·W·布什成为 2004 年总统选举的总统候选人。这支持以下结论的概率至少为 0.95:在民意调查进行时,57%至 67%的所有注册选民支持克里而不是布什成为总统。

这种类型的论证通常被称为归纳法。它与统计估计技术密切相关。我们可以将这种论证的逻辑形式半正式地表示如下:

前提:在由 n 个人口 B 的成员组成的随机样本 S 中,具有属性 A 的成员的比例为 r。

因此,具有支持程度 p,

结论:B 的所有成员中具有属性 A 的比例在 r-q 和 r+q 之间(即,在误差 q 的边界内)。

让我们更正式地阐述这个论证。前提可以分解为三个独立的陈述:[1]

半正式化

Formalization

Premise 1

在 S 的成员中,具有属性 A 的成员的频率(或比例)为 r。

F [A,S]=r

Premise 2

S 是关于其成员是否具有属性 A 的 B 的随机样本。

Rnd [S,B,A]

Premise 3

样本 S 恰好有 n 个成员。

Size [S]=n

Therefore

具有支持度 p 的程度

==== ===={p}

Conclusion

B 成员中具有属性 A 的比例位于 r-q 和 r+q 之间(即,在误差范围 q 内)

F [A,B]=r±q

任何处理此类论证的归纳逻辑都应解决两个挑战。(1)它应该告诉我们哪些列举归纳论证应该被视为好的归纳论证。特别是,它应该告诉我们如何确定适当的支持度 p,以使这些前提对于给定的误差范围 q 在归纳上支持结论。(2)它应该可证明满足监督随附原则。也就是说,作为元定理,如果一个表达了人口中某属性的近似比例的结论是真实的,那么足够数量的人口随机样本将很有可能为好的归纳论证提供真实的前提,从而为该真实结论提供接近 1 的支持度 p。为了避免琐碎性,这些足够数量的样本只是大人口的一小部分。关于列举归纳:贝叶斯估计和收敛的补充部分,详细介绍了贝叶斯解释如何满足这两个挑战。

然而,归纳法在范围上相当有限。这种归纳形式仅适用于支持涉及简单的普遍条件句(即形式为“所有的 B 都是 A”)和关于人群中某属性比例的主张(即形式为“B 中 A 的频率为 r”)的主张。但是,许多重要的经验假设不能简化为这种简单形式,而且对于这些假设的证据并不是由这些实例的枚举组成。例如,考虑牛顿力学理论:

所有物体保持静止或匀速运动,除非受到外力的作用。物体的加速度(即其运动从静止或匀速运动转变的速率)与作用于它的力具有相同的方向;物体由于力而加速的速率等于力的大小除以物体的质量。如果一个物体对另一个物体施加力,第二个物体将以与第一个物体施加的力相反的方向施加相同数量的力。

对于这个理论的证据(以及反对这个理论的证据)并不是通过检查随机选择的一部分物体及其所受的力来获得的。相反,该理论是通过计算这个理论对各种具体情况下可观察现象的说法(或暗示)并检查这些现象是否按照理论所说的方式发生来进行测试的,这些情况可以从小物体之间的简单碰撞到行星和彗星的轨迹等各种情况。这种测试假设和理论的方法是无处不在的,并且应该由一个合适的归纳逻辑来捕捉。

更一般地说,在归纳推理至关重要的广泛情况下,枚举归纳是不足够的。相反,根据它们对证据的陈述(或暗示)来判断假设的可能真实性的证据推理更为合适。考虑陪审团成员应该根据在谋杀审判中提出的证据做出的推理。对于有罪或无罪的推断是基于各种证据的拼凑。它几乎从不涉及考虑过去类似被告犯下类似谋杀案的随机选择的情况序列。或者,考虑一下医生如何根据患者的症状来诊断。尽管在类似症状出现时各种疾病的发生频率可能起到一定作用,但这显然不是全部。诊断学家通常采用一种假设评估的形式——例如,患者是否患有脑肿瘤的假设能解释他的症状?;或者这些症状更可能是轻微中风的结果?;或者其他一些假设是否更能解释患者的症状?因此,对归纳逻辑的充分解释应该通过假设评估的逻辑来测试假设或理论,即根据它对可观察现象的陈述(或“预测”)来测试。在第 3 节中,我们将看到一种称为“贝叶斯推理”或“贝叶斯证实理论”的概率归纳逻辑如何捕捉这种推理。这些论证的完整逻辑结构将在该部分详细说明。

2. 归纳逻辑与归纳概率

或许最古老且最为人所理解的表示部分信念、不确定推理和归纳支持的方式是使用概率和等价概念赔率。数学家们已经研究概率 350 多年了,但这个概念显然要古老得多。近年来,出现了许多其他相关的部分信念和不确定推理的表示方法。其中一些方法在基于计算机的人工智能系统中找到了有用的应用,这些系统在专家领域(如医学诊断)进行归纳推理。然而,在这些应用领域中,概率表示方法占据主导地位。因此,在本文中,我们将专门关注概率表示的归纳支持。关于一些突出的不确定推理和支持强度的替代表示方法的简要比较描述可以在《不确定推理表示的一些突出方法》的补充材料中找到。

2.1 概率逻辑的历史起源

概率的数学研究始于 17 世纪中叶的布莱斯·帕斯卡和皮埃尔·德·费尔马。从那时起到 19 世纪初,随着数学理论的不断发展,概率论主要应用于评估游戏中的风险,并对大规模人口的特征进行简单的统计推断,例如根据死亡率计算适当的人寿保险费率。19 世纪初,皮埃尔·西蒙·拉普拉斯进一步推进了理论,并展示了如何将概率推理应用于更广泛的科学和实际问题。从那时起,概率已经成为科学、商业和现代生活中许多其他领域中不可或缺的工具。

在概率论的发展过程中,各种研究者似乎将其视为一种逻辑。但是,概率首次作为逻辑的一个明确部分进行详细处理的是乔治·布尔的《思维的法则》(1854 年)。二十年后,约翰·文恩在《机会的逻辑》(1876 年)中提出了一种替代的经验频率学解释概率的方法。不久之后,整个逻辑学学科在演绎逻辑的新发展下发生了转变。

在 19 世纪末 20 世纪初,弗雷格、罗素和怀特海德展示了如何用我们现在称之为量化谓词逻辑的严格形式系统来表示演绎逻辑。这是逻辑学家首次拥有了一个完全形式化的演绎逻辑,足以表示数学和科学中出现的所有有效演绎论证。在这种逻辑中,演绎论证的有效性仅取决于所涉及的句子的逻辑结构。这种演绎逻辑的发展促使一些逻辑学家尝试将类似的方法应用于归纳推理。其想法是将演绎蕴涵关系扩展到概率蕴涵的概念,用于那些前提对结论提供不确定支持的情况。这些部分蕴涵是用条件概率来表示的,即形式为 P [C∣B]=r 的概率(读作“给定 B 的情况下 C 的概率为 r”),其中 P 是概率函数,C 是结论句子,B 是前提句子的合取,r 是前提 B 对结论 C 提供的概率支持程度。试图发展这样一种逻辑的尝试在模仿形式演绎逻辑的范式方面有所不同。

一些归纳逻辑学家试图通过仅仅基于前提和结论句子的句法结构来指定归纳支持概率,以追随演绎范式。在演绎逻辑中,所涉及的句子的句法结构完全决定了前提是否逻辑上蕴含结论。因此,这些归纳逻辑学家试图效仿。在这样的系统中,每个句子都对语言中的其他句子赋予了一个句法指定的支持程度。因此,这种系统中的归纳概率在逻辑上是合理的,因为它们仅依赖于句法结构。这种观念在约翰·梅纳德·凯恩斯的《概率论》(1921)中在一定程度上得到了阐述。鲁道夫·卡尔纳普在他的《概率的逻辑基础》(1950)和其他几部作品中更加严谨地追求了这个想法(例如,卡尔纳普 1952 年)。 (有关卡尔纳普方法的详细信息,请参见本百科全书中关于概率计算解释的逻辑概率部分。)

在凯恩斯和卡尔纳普的归纳逻辑中,贝叶斯定理是概率论的一个直接定理,在表达证据对假设的影响方面起着核心作用。贝叶斯定理表达了假设 h 在证据 e 上的概率 P [h∣e] 如何取决于如果 h 为真,e 发生的概率 P [e∣h],以及在考虑证据之前假设 h 的概率 P [h](称为先验概率)。 (稍后我们将详细研究贝叶斯定理。)因此,这样的方法可以称为贝叶斯逻辑主义归纳逻辑。其他著名的贝叶斯逻辑主义发展概率归纳逻辑的尝试包括杰弗里斯(1939)、杰恩斯(1968)和罗森克兰茨(1981)的作品。

现在广泛认为,这种对贝叶斯逻辑主义的句法方法的核心思想是有致命缺陷的——句法逻辑结构不能是归纳支持前提与结论程度的唯一决定因素。句法贝叶斯逻辑主义面临的问题的一个关键方面涉及逻辑在科学背景下的应用,其中结论句是某个科学假设或理论,而前提是证据主张。困难在于,在任何满足概率的常规公理的概率逻辑中,对假设的归纳支持必须部分依赖于其先验概率。这个先验概率代表(可以说)假设在除了观察和实验证据之外的考虑基础上被认为是多么合理(例如,可能是由于各种合理性论证)。句法贝叶斯逻辑主义者必须告诉我们如何以仅依赖于假设的句法逻辑结构的方式来为这些先证据的假设的先验概率分配值,可能是基于某种句法简单性的度量。这个想法在实践中存在严重问题。各种类型的例子似乎表明,这种方法在特定情况下必须为假设分配直观上相当不合理的先验概率(有关详细信息,请参见第 3.2 节末尾引用的脚注)。此外,为了使这个想法适用于对真实科学理论的证据支持,科学家们必须以一种使其相关句法结构显现的方式形式化理论,然后仅基于该句法基础(以及它们与证据陈述的句法关系)来评估理论。我们要用这种方式评估引力的替代理论和量子的替代理论吗?这似乎是对真实科学假设和理论评估的一种极其可疑的方法。 因此,仅仅逻辑结构似乎不足以对科学假设进行归纳评估。(在第 3 节中,我们将更详细地讨论这个问题,首先看看概率逻辑如何使用贝叶斯定理来表示先验概率和证据似然函数之间的证据支持。))

在符号贝叶斯逻辑主义思想发展的同时,一种另类的概率归纳推理观念也在兴起。这种方法现在通常被称为贝叶斯主观主义或个人主义方法(参见,例如,Ramsey 1926; De Finetti 1937; Savage 1954; Edwards, Lindman, & Savage 1963; Jeffrey 1983, 1992; Howson & Urbach 1993; Joyce 1999)。这种方法将归纳概率视为一个代理人在证据为真的情况下,对假设为真的信念程度的度量。这种方法最初是作为贝叶斯决策理论的一部分而发展的,它是一个更大的信念和行动规范理论。其主要思想是,一个代理人对各种可能结果的渴望程度应该与她对世界上关于这些结果的主张的信念强度相结合,以产生最优理性决策。贝叶斯主观主义者提供了一个捕捉这个思想的决策逻辑,并试图通过展示原则上它导致对应追求哪种风险选择的最优决策来证明这个逻辑的合理性。在贝叶斯主观主义或个人主义关于归纳概率的解释中,归纳概率函数代表着理性代理人的主观(或个人)信念强度,这种信念强度是理性决策中起作用的信念强度。(请参阅本百科全书中关于概率计算解释的主观概率部分。)

归纳逻辑学的逻辑主义观念的要素今天仍然存在,作为被称为贝叶斯归纳逻辑的一般方法的一部分。然而,在哲学家和统计学家中,“贝叶斯”一词现在与主观主义或个人主义的信念和决策解释最为密切相关。而“贝叶斯归纳逻辑”一词则已经带有纯主观概率涉及的逻辑的含义。这种用法是误导性的,因为对于归纳逻辑来说,贝叶斯/非贝叶斯的区别实际上应该取决于逻辑是否赋予贝叶斯定理一个重要角色,或者该方法在归纳推理中基本上避免使用贝叶斯定理,就像 R.A.费舍尔(1922 年)和尼曼与皮尔逊(1967 年)发展的经典统计推断方法所做的那样。事实上,任何一个使用相同的概率函数来表示假设引起的证据主张的概率和由这些证据主张引起的假设的概率的归纳逻辑,在更广义上都必须是一个贝叶斯归纳逻辑;因为贝叶斯定理直接从每个概率函数必须满足的公理中得出,并且贝叶斯定理表达了证据主张的概率和由这些证据主张引起的假设的概率之间的必然联系。

在本文中,我们将研究的概率归纳逻辑是一种更广义上的贝叶斯概率归纳逻辑。这种逻辑不会预设主观贝叶斯信念和决策理论,并且避免了句法版本的贝叶斯逻辑主义的不可取之处。我们将看到,有充分的理由区分归纳概率、信念概率和纯句法逻辑概率。因此,本文中阐述的概率逻辑将以一种不依赖于这些概率函数概念的方式呈现。然而,这个逻辑的版本将足够通用,以适应贝叶斯主观主义或贝叶斯句法逻辑主义的计划,如果有人希望这样做的话。

2.2 概率逻辑:公理和特征

所有逻辑都源于句子中术语的含义。我们现在所认识的形式演绎逻辑是建立在标准逻辑术语(即真值功能属性)的含义基础上的。这些逻辑术语以及我们将用来表示它们的符号如下:

  • '非', '∼';

  • '且', '⋅';

  • '包括或', '∨';

  • 真值函数的“如果-那么”,“⊃”;

  • “当且仅当”,“≡”;

  • 量词

    • '所有', '∀',和

    • '一些', '∃';和

  • 相等关系,'='.

所有其他术语的含义,非逻辑术语,如名称、谓词和关系表达式,被允许“自由浮动”。也就是说,演绎论证的逻辑有效性既不依赖于名称、谓词和关系术语的含义,也不依赖于包含它们的句子的真值。它仅仅假设这些非逻辑术语是有意义的,并且包含它们的句子具有真值。演绎逻辑告诉我们,一些句子的逻辑结构,即它们的逻辑术语的句法排列,使它们无法同时对任何可能的事态真实。这就是逻辑不一致的概念。逻辑蕴涵的概念与之相互定义。一组前提句逻辑蕴涵一个结论句,当且仅当该结论的否定与这些前提逻辑不一致。

归纳逻辑似乎必须在几个重要方面偏离演绎逻辑提供的范例。首先,逻辑蕴涵是句子之间的绝对、全无关系,而归纳支持是以强度程度来衡量的。其次,虽然归纳支持的概念类似于演绎蕴涵的概念,并且可以说是其扩展,但似乎没有归纳逻辑扩展逻辑不一致概念——至少没有与归纳支持相互定义的方式,就像逻辑不一致与逻辑蕴涵相互定义一样。实际上,事实证明,当(B⋅∼A)的无条件概率接近于 0 时(即(B⋅∼A)“几乎不一致”),B 对 A 的归纳支持程度 P [A∣B] 可以在 0 和 1 之间的任何地方。

另一个显著的区别是,当 B 在逻辑上蕴含 A 时,添加前提 C 不能削弱逻辑蕴含关系——即(C⋅B)也必须在逻辑上蕴含 A。这种逻辑蕴含的特性被称为单调性。但归纳支持是非单调的。一般来说,根据 A、B 和 C 的含义,将前提 C 添加到 B 中可能会大大提高对 A 的支持程度,也可能大大降低对 A 的支持程度,或者可能完全不变——即 P [A∣(C⋅B)] 的值可能比 P [A∣B] 大得多,也可能比 P [A∣B] 小得多,或者它可能与 P [A∣B] 的值相同,或者几乎相同。

在概率归纳逻辑的形式化处理中,归纳支持由定义在形式语言 L 的句子上的条件概率函数表示。这些条件概率函数受到某些规则或公理的约束,这些规则或公理对逻辑术语的含义敏感(即“非”、“与”、“或”等逻辑词,量词“所有”和“某些”,以及身份关系)。这些公理适用于语言的其他术语可能的含义。实质上,这些公理指定了一组可能的支持函数{Pβ,Pγ,…,Pδ,…},适用于给定的语言 L。尽管每个支持函数都满足这些相同的公理,但哪一个支持函数提供了适当的归纳支持度的问题不能仅仅通过这些公理来解决。这可能取决于其他因素,例如语言的非逻辑术语(即名称和谓词表达式)的含义。

一种指定归纳支持函数逻辑公理的好方法如下。这些公理显然比条件概率的常规公理要弱。例如,常规公理假设条件概率值限制在 0 和 1 之间的实数。以下公理不假设这一点,只假设支持函数将一些实数作为支持强度的值。然而,事实证明以下公理足以推导出所有常规条件概率的常规公理(包括对值限制在 0 和 1 之间的常规限制)。我们只引用这些较弱的公理来防止一些关于支持函数公理可能假设过多或过于限制的担忧。

设 L 为带有身份的谓词逻辑语言,设‘⊨’为标准的逻辑蕴涵关系,即表达式‘B⊨A’表示“B 在逻辑上蕴涵 A”,表达式‘⊨A’表示“A 是一个重言式”。支持函数是一个从 L 的句子对到实数的函数 Pα,满足以下公理:

  • (1)对于至少一些句子 E、F、G 和 H,Pα [E∣F] ≠Pα [G∣H]。

对于所有的句子 A、B、C 和 D:

  • (2)如果 B⊨A,则 Pα [A∣B] ≥Pα [C∣D];

  • (3)Pα [A∣(B⋅C)]=Pα [A∣(C⋅B)];

  • (4)如果 C⊨∼(B⋅A),那么要么 Pα [(A∨B)∣C]=Pα [A∣C]+Pα [B∣C],要么对于每个句子 E,Pα [E∣C]=Pα [C∣C];

  • (5)Pα [(A⋅B)∣C]=Pα [A∣(B⋅C)] ×Pα [B∣C]。

这个公理化将条件概率视为基本,这似乎适用于证据支持函数。(这些函数在定义时与更常见的无条件概率函数一致,只需让 Pα [A]=Pα [A∣(D∨∼D)]。然而,这些公理允许条件概率 Pα [A∣C] 保持定义,即使条件语句 C 的概率为 0,即使 Pα [C∣(D∨∼D)]=0。)

注意,条件概率函数仅适用于一对句子,即结论句和前提句。因此,在概率归纳逻辑中,我们通过将有限的前提句连接成一个句子来表示前提的有限集合。而不是说,

A 由前提集合{B1,B2,B3,...,Bn}支持到程度 r,

我们改为说

A 由连词前提(((B1⋅B2)⋅B3)⋅…⋅Bn)以 r 程度支持,

并将其写作

P [A∣(((B1⋅B2)⋅B3)⋅…⋅Bn)]=r。

上述公理相当薄弱。例如,它们并未说明逻辑上等价的句子以相同程度支持其他句子;相反,这个结果可以从这些公理中推导出来(见下面的结果 6)。这些公理也没有说明逻辑上等价的句子以相同程度支持所有其他句子;相反,这个结果也是可以推导出来的(见下面的结果 8)。事实上,从这些公理中可以推导出概率论的所有常规定理。以下结果在概率逻辑中特别有用。它们从这些公理中的推导在注释 2 中提供。

  1. 如果 B⊨A,则 Pα [A∣B]=1。

  2. 如果 C⊨∼(B⋅A),则 Pα [(A∨B)∣C]=Pα [A∣C]+Pα [B∣C],否则对于每个句子 E,Pα [E∣C]=1。

  3. Pα [∼A∣B]=1−Pα [A∣B] 或者 Pα [C∣B]=1 对于每个句子 C。

  4. 1≥Pα [A∣B] ≥0。

  5. 如果 B⊨A,则 Pα [A∣C] ≥Pα [B∣C]。

  6. 如果 B⊨A 且 A⊨B,则 Pα [A∣C]=Pα [B∣C]。

  7. 如果 C⊨B,则 Pα [(A⋅B)∣C]=Pα [(B⋅A)∣C]=Pα [A∣C]。

  8. 如果 C⊨B 且 B⊨C,则 Pα [A∣B]=Pα [A∣C]。

  9. 如果 Pα [B∣C]>0,那么 Pα [A∣(B⋅C)]=Pα [B∣(A⋅C)] ×Pα [A∣C] Pα [B∣C](这是贝叶斯定理的简单形式)。

  10. Pα [(A∨B)∣C]=Pα [A∣C]+Pα [B∣C] −Pα [(A⋅B)∣C]。

  11. 如果{B1,…,Bn}是任意有限的句子集合,对于每一对 Bi 和 Bj,C⊨∼(Bi⋅Bj)(即,给定 C,集合中的成员是互斥的),那么要么对于每个句子 D,Pα [D∣C]=1,要么 Pα [((B1∨B2)∨…∨Bn)∣C]=n∑i=1Pα [Bi∣C]。

  12. 如果{B1,…,Bn,…}是任何一个可数无穷句子集,对于每一对 Bi 和 Bj,C⊨∼(Bi⋅Bj),那么要么对于每个句子 D,Pα [D∣C]=1,要么 [3] limnPα [((B1∨B2)∨…∨Bn)∣C]=∞∑i=1Pα [Bi∣C]。

现在让我们简要地考虑每个公理,看看它作为归纳支持的定量度量的约束有多合理,以及它如何扩展了演绎蕴涵的概念。首先注意,L 上的每个支持度函数 Pα 都用一些实数值来衡量支持强度,但这些公理并没有明确限制这些值必须在 0 和 1 之间。事实上,所有的支持值必须在 0 和 1 之间,但这是由公理推导出来的,而不是假设的。通过实数对归纳支持进行缩放无疑是一个合理的方法。

公理 1 是一个非平凡性要求。它表明支持值不能对所有句子对都相同。这个公理仅仅排除了将相同数量的支持分配给每个句子的平凡支持函数。可以用以下规则替换这个公理:

Pα [(A∨∼A)∣(A∨∼A)] ≠Pα [(A⋅∼A)∣(A∨∼A)].

但是这个替代规则事实上可以从公理 1 和其他公理推导出来。

公理 2 断言,当 B 在逻辑上蕴含 A 时,B 对 A 的支持与可能的支持一样强。这符合归纳支持函数是演绎蕴涵关系的一般化的观点,其中演绎蕴涵的前提对其结论提供了可能的最强支持。

公理 3 仅仅是说(B⋅C)以与(C⋅B)完全相同的程度支持句子。这是一个特别弱的公理。但是与其他公理一起,它足以推导出逻辑上等价的句子以完全相同的程度支持所有句子。

公理 4 说归纳支持以一种合理的方式累加。当 C 在逻辑上蕴含 A 和 B 的不相容性时,即没有可能的情况可以使 A 和 B 同时为真,C 对它们各自提供的支持程度必须等于它对它们的析取式提供的支持。唯一的例外是在 C 像一个逻辑矛盾一样,并以最大可能程度支持所有句子的情况下(在演绎逻辑中,逻辑矛盾逻辑上蕴含每个句子)。

要理解公理 5 的含义,将支持函数 Pα 视为描述可能情况的度量。将形式为‘Pα [D∣E]=r’的每个支持程度表达解读为在 E 为真的所有情况中 D 为真的比例为 r。按照这种方式解读,公理 5 则表示以下内容。假设 B 在所有 C 为真的情况中占比为 q,假设 A 在 B 和 C 同时为真的情况中占比为 r。那么在所有 C 为真的情况中,A 和 B 应该同时为真的比例是多少?在所有 C 为真的情况中,比例为 q(B 部分)的比例为 r((A⋅B)部分)的情况。

句子 B 支持句子 A 的程度很大程度上取决于这些句子的意义。特别是,它通常取决于我们与非逻辑术语(除了逻辑术语 not、and、or 等、量词和恒等符号之外的术语)相关联的意义,即语言中的名称、谓词和关系术语的意义。例如,我们应该希望

Pα [乔治未婚 ∣ 乔治是单身]=1,

根据“单身汉都是未婚”的通常意义,因为这是分析上的真实——即不需要经验证据来建立这种联系。(在谓词逻辑的形式语言中,如果我们将“已婚”与谓词术语‘M’相关联,将“单身”与谓词术语‘B’相关联,并将名称术语‘g’指代乔治,则我们应该希望 Pα [∼Mg∣Bg]=1,因为在这种对非逻辑术语的意义赋值下,∀x(Bx⊃∼Mx)是分析上的真实。)因此,让我们将每个个体支持函数 Pα 与语言的所有非逻辑术语的意义(主要内涵)的特定赋值相关联。(然而,证据支持函数不应该预设所谓次要内涵的意义赋值——例如,与可能的事态下的刚性指示符相关联的意义赋值。因为,我们不希望确认函数 Pα 使得)

Pα [这个玻璃装满了 H2O∣ 这个玻璃装满了水]=1,

因为我们推测归纳逻辑学要依赖明确的经验证据来支持水是由 H2O 组成的这一主张。因此,我们与支持函数相关联的术语的意义应该只是它们的主要内涵,而不是次要内涵。)

在归纳逻辑学的背景下,补充上述公理还是有意义的,可以加入两个额外的公理。这是第一个额外的公理:

  • (6)如果 A 是集合论或科学中使用的任何其他纯数学公理,或者如果 A 是分析真理(即,如果 A 的真实性仅取决于其包含的词语的含义,其中名称和谓词的具体含义是与特定支持函数 Pα 相关联的),那么对于所有的句子 C,Pα [A∣C]=Pα [C∣C](即,Pα [A∣C]=1)。

这里是公理 6 如何应用于上述例子,当与支持函数 Pα 相关联的非逻辑术语的含义赋值使得 ∀x(Bx⊃∼Mx)成为分析真理时,得到 Pα [∼Mg∣Bg]=1。根据公理 6(随后是结果 7、5 和 4),我们有

1=Pα [∀x(Bx⊃∼Mx)∣Bg]=Pα [(Bg⋅∀x(Bx⊃∼Mx))∣Bg] ≤Pα [∼Mg∣Bg] ≤1;

因此,Pα [∼Mg∣Bg]=1。公理 6 背后的思想是,归纳逻辑是关于对偶然性主张的证据支持。对于非偶然性真理,没有任何东西可以作为经验证据支持或反对。特别是,分析真理应该由所有前提 C 最大程度地支持。

归纳逻辑应该遵循演绎范式的一个重要方面是,逻辑不应该预设偶然性陈述的真实性。如果陈述 C 是偶然性的,那么其他一些陈述应该能够作为反对 C 的证据。否则,支持函数 Pα 将会将 C 及其所有逻辑推论在所有可能的证据主张下的支持度都设为 1。这对于归纳逻辑来说是不合适的。归纳逻辑的整个思想是提供一种度量前提陈述指示偶然性结论陈述可能真值程度的方法。如果某些偶然性陈述的真值被预设为在每个可能的前提上都具有支持值 1,这个思想就无法正常工作。这样的概率分配会通过隐藏归纳支持关系中的重要前提使归纳逻辑成为附带前提的推理。这类似于允许在明确陈述的前提不足以逻辑蕴涵结论的情况下,将演绎论证视为有效,但论证的有效性可以依赖于额外的未明示前提。这不是严谨的演绎逻辑方法应该工作的方式,也不应该是严谨的归纳逻辑方法的常见做法。

尽管如此,概率逻辑学家通常会将临时接受的偶然性主张暂时搁置,将它们的概率设为 1(无论是否提供了明确的证据)。这种做法可以避免重复将给定的偶然性句子 B 作为前提写入,因为只要 Pγ [B∣C]=1,那么 Pγ [A∣B⋅C] 将等于 Pγ [A∣C]。尽管这种惯例很有用,但这样的概率函数应被视为适当的、逻辑明确的、非附带推理的归纳支持关系的简写。因此,准确地说,归纳支持函数 Pα 不应在每个可能的前提上将概率 1 分配给一个句子,除非该句子要么是(i)逻辑真理,要么是(ii)集合论公理或科学中使用的其他纯数学概念,要么是(iii)根据 Pα 所假设的语言解释,该句子是分析性的(因此不属于证据支持的范畴)。因此,我们采用以下所谓的“规则性公理”的版本。

  • (7)如果对于所有的 C,Pα [A∣C]=Pα [C∣C](即 Pα [A∣C]=1),那么 A 必须是逻辑真理或集合论公理或科学中使用的其他纯数学概念,或者 A 必须是根据与支持函数 Pα 相关的 L 的术语的含义而言是分析性真理。

公理 6 和 7 共同表明,支持函数 Pα 将那些被每个前提分配概率 1 的句子视为非偶然真理,因此不受经验支持的限制。

一些贝叶斯逻辑学家提出,归纳逻辑可以仅依赖于句子的逻辑形式,就像演绎逻辑一样。其思想是,有效地通过补充公理 1-7 以仅依赖于句子的逻辑结构的附加公理,并引入足够多的这样的公理,将可能的支持函数数量减少到一个唯一最佳的支持函数。现在广泛认为这个项目无法以合理的方式实施。也许支持函数除了公理 1-7 之外还应遵守一些规则。但是,任何合理的附加规则的集合是否足以确定一个单一、唯一合格的支持函数是值得怀疑的。稍后,在第 3 节中,我们将简要回顾这个问题,在我们详细阐述归纳概率如何捕捉假设与证据之间关系之后。

2.3 归纳概率的两种观念

条件概率函数的公理 1-7 仅仅对什么可以适当地被视为支持度函数的程度施加了形式上的限制。每个满足这些公理的函数 Pα 可以被看作是将归纳支持的概念应用于尊重逻辑术语含义的语言 L 的一种可能方式,就像每个语言的可能真值赋值代表了一种可能的方式来赋予其句子真值,以一种尊重逻辑术语含义的方式。关于哪种可能的真值赋值代表了语言句子的实际真实性或虚假性的问题取决于更多因素。它取决于非逻辑术语的含义和实际世界的状态。同样,一个完全有意义的语言中一些句子实际上支持其他句子的程度必须依赖于比仅仅满足支持函数公理更多的东西。至少,它必须依赖于语言句子的含义,也许还要依赖于更多其他因素。但是,还有什么呢?也许对归纳概率是什么的更好理解可以通过填充我们对归纳支持概念的理解来提供一些帮助。让我们暂停一下讨论两种著名观点——对归纳概率概念的两种解释。

一种非句法逻辑学的归纳概率解释将每个支持函数 Pα 视为可能事态的度量。其思想是,给定一个完全有意义的语言(与支持函数 Pα 相关联),'Pα [A∣B]=r'表示在 B 为真的那些事态中,A 为真的比例为 r。通常不会有一种单一特权的方式来定义这种可能事态的度量。相反,满足公理 1-7 所施加的约束的一系列函数 Pα,Pβ,Pγ 等等,可能代表了语言中所表达的命题的推理重要性的可行度量。当然,这个想法还需要更多的具体阐述。下一节将提供一些关于如何进行阐述的指示。

主观贝叶斯主义者提供了对支持函数的另一种解释。首先,他们通常将无条件概率视为基本概念,并将条件概率定义为无条件概率的比率:条件概率'Pα [A∣B]'定义为无条件概率的比率:

Pα [A∣B]=Pα [A⋅B] Pα [B]。

主观贝叶斯主义者认为每个无条件概率函数 Pα 代表了一个理想理性主体 α 的信念强度或置信强度。在这种理解下,'Pα [A]=r'表示“α 对 A 为真的信念(或置信)强度为 r”。主观贝叶斯主义者通常将这种信念强度与主体愿意在 A 被证明为真时下注的金额(或效用单位)联系起来。大致上,思想是这样的。假设一个理想理性主体 α 愿意接受一项赌注,如果 A 被证明为假,将获得(不少于)1 个单位的收益。然后,在对主体对金钱的欲望做出合理假设的情况下,可以证明主体对 A 为真的信念强度应为

Pα [A]=1(u+1)。

并且可以进一步证明,任何表达了主体 α 语言中所有陈述的这种与下注相关的信念强度的函数 Pα 必须满足类似于无条件概率公理 1-5 的公理。此外,可以证明,任何满足这些公理的函数 Pβ 都是某个理想理性主体 β 的可能理性信念函数。信念强度与结果的可取性(例如,在赌注中获得金钱或商品)之间的这些关系是主观贝叶斯决策理论的核心。主观贝叶斯主义者通常将归纳概率仅仅视为这种概率信念强度的概念。

毫无疑问,真实的行动者确实比其他人更强烈地相信某些主张。而且可以说,真实行动者的信念强度可以在 0 到 1 之间的概率尺度上进行测量,至少近似如此。显然,证据对假设的归纳支持应该影响行动者对该假设真实性的信念强度——这就是进行归纳推理的目的,不是吗?然而,对于将归纳支持函数视为贝叶斯信念强度函数,我们有充分的理由要谨慎,稍后我们将会看到。因此,也许一个行动者的支持函数并不完全等同于他的信念函数,也许归纳支持和信念强度之间的关系更加复杂一些。

无论如何,显然需要对支持函数所代表的内容进行解释。信念函数解释和逻辑学解释(以可能的事态为度量)是提供这种解释的两种尝试。但是,让我们暂时搁置这个解释问题。在看到归纳逻辑的工作原理之后,或许能更好地理解归纳支持函数的真正含义。

3. 将归纳概率应用于科学假设的评估

归纳逻辑学最重要的应用之一是对科学假设的证据评估的处理。逻辑学应该捕捉到对各种科学假设的证据支持结构,从简单的诊断性声明(例如,“患者被 HIV 感染”)到关于世界基本性质的复杂科学理论,如量子力学或相对论。本节将展示证据支持函数(又称贝叶斯确认函数)如何表示科学假设和理论的证据评估。这种逻辑本质上是比较性的。对假设的评估取决于证据相对于替代假设的支持程度。

考虑一些关于共同主题的互斥的替代假设(或理论)的集合{h1,h2,...}。替代集合可能非常简单,例如{“患者患有 HIV”,“患者没有 HIV”}。或者,当医生试图确定哪种疾病导致患者的症状时,替代集合可能包含一长串可能的疾病假设。对于宇宙学家来说,替代集合可能包含几个不同的引力理论,或者“相同”理论的几个经验上不同的变体。每当两个假设(或理论)的变体在经验上有所不同时,它们被视为不同的假设。(这不应与相反的实证主义断言混淆,即具有相同经验内容的理论实际上是相同的理论。归纳逻辑不一定支持这种观点。)

逻辑学所评估的竞争性假设(或理论)的集合可以是有限的,也可以是可数无限的。现实语言中包含的表达式数量不会超过可数的数量;因此,逻辑学适用于可数无限数量的句子就足够了。从纯粹的逻辑学角度来看,竞争性替代集合可以包括关于给定主题的每个竞争性假设(或理论),这些假设(或理论)可以在给定语言中表达——例如,所有可能的关于宇宙起源和演化的理论,这些理论可以用英语和当代数学来表达。在实践中,替代假设(或理论)通常会在很长一段时间内被构建和证据评估。无论是将所有替代假设一起考虑,还是一次只有少数替代假设可用,证据支持的逻辑都可以以类似的方式工作。

科学假设的证据包括特定实验或观察的结果。对于给定的实验或观察,让‘c’表示其进行的相关条件的描述,让‘e’表示实验或观察的结果,即条件 c 的证据结果。

科学假设与证据之间的逻辑联系通常需要通过背景信息和辅助假设的介入来实现。让“b”代表将竞争假设集合{h1,h2,...}中的每个假设 hi 与证据相连接所需的背景和辅助假设。虽然 b 中的辅助假设所表达的主张本身可能会受到经验评估的影响,但它们应该是在评估集合{h1,h2,...}中的备选假设时不争议的主张类型。相反,考虑中的每个备选假设都依赖于相同的背景和辅助假设来逻辑地与证据事件相连接。(如果竞争假设 hi 和 hj 在与证据主张建立逻辑联系时分别依赖于不同的辅助假设 ai 和 aj,则应对相应的合取假设(hi⋅ai)和(hj⋅aj)进行以下处理,因为这些备选合取假设将构成争议的经验上不同的备选方案。)

在假设与观察或实验条件 c(通过背景和辅助条件 b)的结果 e 之间具有演绎关系的情况下,我们将有 hi⋅b⋅c⊨e 或 hi⋅b⋅c⊨∼e。例如,hi 可能是牛顿的万有引力理论。对该理论的测试可能涉及一个条件语句 c,描述了对木星位置的一些早期测量结果,并描述了下一次位置测量的方法;结果描述 e 说明了这次额外位置测量的结果;背景信息(和辅助假设)b 可能说明了用于进行位置测量的设备的工作原理和准确性的一些已经得到确认的理论。然后,从 hi⋅b⋅c 我们可以计算出我们预期找到的具体结果 e;因此,以下逻辑蕴涵成立:hi⋅b⋅c⊨e。然后,只要 c 所述的实验和观察条件实际上是真实的,如果 e 所描述的证据结果实际发生,那么由此产生的联合证据主张(c⋅e)可以被认为是对 hi 的有力证据,鉴于 b。(这种理论评估方法被称为假设演绎方法的证据支持。)另一方面,当我们从 hi⋅b⋅c 计算出与观察到的证据结果 e 不相容的某个结果时,以下逻辑蕴涵成立:hi⋅b⋅c⊨∼e。在这种情况下,仅从演绎逻辑出发,我们还必须有 b⋅c⋅e⊨∼hi;因此,hi 被称为被 b⋅c⋅e 证伪。我们将在下面描述的证据支持的贝叶斯解释扩展了这种演绎主义方法,包括假设 hi(及其替代假设)可能与证据没有演绎关系,而是可能暗示着证据结果在某种程度上可能或不可能发生。 也就是说,贝叶斯方法适用于我们既没有 hi⋅b⋅c⊨e 也没有 hi⋅b⋅c⊨∼e 的情况,而只有 P [e∣hi⋅b⋅c]=r,其中 r 是介于 0 和 1 之间的“蕴涵强度”。

在更详细地描述证据支持逻辑之前,也许有必要对背景知识和辅助假设(用‘b’表示)进行更多的说明。杜埃姆(1906)和奎因(1953)通常被认为是引起归纳逻辑学家对辅助假设在将科学假设和理论与经验证据联系起来的重要性的警觉。他们指出,科学假设通常本身与证据主张几乎没有联系。相反,在大多数情况下,科学假设只相对于背景信息和将它们与证据联系起来的辅助假设进行可测试的预测。(在下一小节中将提供一些具体的辅助假设示例。)通常,辅助假设是来自其他科学领域的高度确认的假设。它们通常描述用于观察或进行实验的各种设备(例如测量仪器)的操作特性。在对假设 hi 与其竞争者进行测试时,它们的可信度通常不是问题,因为 hi 及其替代品通常依赖于相同的辅助假设将它们与证据联系起来。但即使辅助假设已经得到很好的确认,我们也不能简单地假设它是没有问题的,或者只是已知为真的。相反,对假设 hi 的证据支持或反驳是相对于在确认上下文中假定的任何辅助假设和背景信息(在 b 中)而言的。在其他情境中,用于测试 hi 的辅助假设本身可能是一组受到证据支持或反驳的备选假设之一。 此外,就竞争性假设在解释证据时采用不同的辅助假设而言,证据仅仅测试每个假设与其独特的辅助假设相结合对抗替代假设的情况,如前所述。因此,被视为待测试假设 hi 的内容以及被视为辅助假设和背景信息 b 的内容可能取决于认识论背景,即一组实验或观察所测试的替代假设类别以及在该背景中预设的主张。没有哪个陈述本质上是一个测试假设,或者本质上是一个辅助假设或背景条件。相反,这些类别是陈述在特定认识论背景中可能扮演的角色。

在概率归纳逻辑中,证据(c⋅e)对假设 hi 相对于背景和辅助假设 b 的支持程度由后验概率 Pα [hi∣b⋅c⋅e] 表示,根据证据支持函数 Pα。事实证明,假设的后验概率仅取决于两种因素:(1) 其先验概率 Pα [hi∣b] 以及其竞争对手的先验概率 Pα [hj∣b]、Pα [hk∣b] 等;以及(2) 证据结果 e 在 hi 与 b 和 c 相结合的情况下的可能性 P [e∣hi⋅b⋅c],以及根据竞争假设的这些相同证据结果的可能性 P [e∣hj⋅b⋅c]、P [e∣hk⋅b⋅c] 等。我们现在将详细研究每个因素。在此之后,我们将准确地看到后验概率的值如何取决于可能性和先验概率的值。

3.1 可能性

在概率归纳逻辑中,可能性承载了假设的经验意义。可能性是一个形式为 P [e∣hi⋅b⋅c] 的支持函数概率。它表达了根据假设 hi、背景和辅助条件 b 以及实验(或观察)条件 c,结果 e 发生的可能性有多大。[5] 如果一个假设连同辅助条件和实验/观察条件在逻辑上蕴含了一个证据主张,概率的公理使得相应的可能性在客观上成立,即每个支持函数都必须对其值达成一致:如果 hi⋅b⋅c⊨e,则 P [e∣hi⋅b⋅c]=1;如果 hi⋅b⋅c⊨∼e,则 P [e∣hi⋅b⋅c]=0。然而,在许多情况下,假设 hi 与证据之间并没有逻辑上的推导关系,而只是概率上的暗示。这可能以几种方式发生:(1)假设 hi 本身可能是一个明确的概率或统计假设;(2)作为背景 b 的一部分,辅助统计假设可能将假设 hi 与证据联系起来;(3)假设与证据之间的联系可能有些松散或不精确,没有通过明确的统计主张进行中介,但对于证据评估的目的来说足够客观。让我们简要考虑一下前两种情况的例子。我们将在第 5 节中讨论第三种情况,即模糊和不精确可能性的问题。

正在测试的假设本身可能是统计性质的。统计假设及其在可能性中的作用的最简单的例子之一是关于抛硬币的机会特征的假设。设 h [r] 是一个假设,它表示一个特定硬币在正常抛掷中正面朝上的倾向(或客观机会)为 r,设 b 表示这样的抛掷在概率上彼此独立。设 c 表示硬币以正常方式抛掷 n 次;设 e 表示在这些抛掷中硬币正面朝上 m 次。在这种情况下,假设 h [r] 对于条件 c 的结果 e 的可能性值由众所周知的二项式公式给出:

P [e∣h[r] ⋅b⋅c]=n!m!×(n−m)!×rm(1−r)n−m.

当然,还有更复杂的涉及统计假设的可能性情况。例如,考虑钚 233 核的半衰期为 20 分钟的假设,即钚 233 核在 20 分钟内衰变的倾向(或客观机会)为 1/2。这样一个系统的完整统计模型表明,该系统在任何时间段 x 内保持完整(即不衰变)的倾向(或客观机会)由公式 1/2x/τ 控制,其中 τ 是这样一个系统的半衰期。设 h 是一个假设,它表示这个统计模型适用于半衰期为 20 分钟的钚 233 核;设 c 表示某个具体的钚 233 核在初始时间 t0 内在一个衰变探测器(某种特定类型)中保持完整;设 e 表示到后来的时间 t 时没有检测到这个相同的钚 233 核的衰变;设 b 表示探测器完全准确(它总是注册真实的衰变,从不注册误报的检测)。那么,给定 h 和 c 的 e 的相关可能性是这样的:P [e∣h⋅b⋅c]=1/2(t−t0)/τ,其中 τ 的值为 20 分钟。

作为背景 b 的一部分,辅助统计假设可能需要连接假设 hi 与证据。例如,HIV 的血液检测具有已知的假阳性率和真阳性率。假设假阳性率为 0.05,即在所有 HIV 不存在的情况下,该测试倾向于错误地显示血液样本为 HIV 阳性的情况占所有情况的 5%。假设真阳性率为 0.99,即在所有 HIV 确实存在的情况下,该测试倾向于正确地显示血液样本为 HIV 阳性的情况占所有情况的 99%。在对特定患者的血液进行测试时,所考虑的假设是该患者被 HIV 感染,h,和该患者未被 HIV 感染,∼h。在这种情况下,已知的测试特性作为背景信息 b。实验条件 c 仅说明该特定患者接受了这种特定类型的 HIV 血液检测,并且实验室使用了适当的程序进行处理。假设结果 e 说明结果是 HIV 的阳性测试结果。因此,相关的似然概率为 P [e∣h⋅b⋅c]=0.99 和 P [e∣∼h⋅b⋅c]=0.05。

在这个例子中,似然概率的值完全是由测试准确性的统计特性决定的,这些特性由背景/辅助信息 b 提供。由证据测试的假设 h 本身并不是统计的。

当然,这种情况可能发生在更复杂的假设上。感兴趣的备选假设可能是确定性的物理理论,比如牛顿引力理论和一些具体的备选理论。一些测试这个理论的实验依赖于具有已知统计误差特征的相对不精确的测量,这些特征作为背景或辅助假设 b 的一部分来表达。例如,辅助假设 b 可能描述了测量扭矩对石英纤维施加的误差特征,其中测量扭矩用于评估测试质量之间的引力强度。在这种情况下,b 可能会说对于这种设备,测量误差通常服从给定引力理论预测的某个值,具有某个特定的标准偏差,这是该设备的特征。这导致被测试的各种引力理论 hi 的似然值 ri 具有具体的值,即 P [e∣hi⋅b⋅c]=ri。

由明确的统计主张产生的似然值,无论是在被测试的假设中还是从将假设与证据联系起来的明确的统计背景主张中产生的,通常被称为直接推理似然值。这样的似然值应该是完全客观的。因此,所有的证据支持函数在其值上应该达成一致,就像在逻辑蕴涵的证据上所有的支持函数在似然值上达成一致一样。直接推理似然值在扩展的、非演绎的意义上是逻辑的。事实上,一些逻辑学家试图通过涉及的句子的逻辑形式来详细说明直接推理的逻辑 [6]。但无论这个项目是否成功,将这种类型的似然值视为具有高度客观或主观间达成一致的值似乎是合理的。

在确认性背景下,不是所有感兴趣的可能性都是通过演绎或明确陈述的统计要求来保证的。在这种情况下,可能性可能具有模糊、不精确的值,但这些值足够确定,仍然可以支持对证据上的假设进行客观评估。在第 5 节中,我们将考虑这种情况,其中没有涉及基础统计理论,但可能性足够确定,可以在科学假设的证据评估中发挥其标准作用。然而,在我们首次了解可能性确切已知的逻辑如何工作之后,更容易理解如何正确处理这种情况(例如,可能性值由明确的统计假设和/或明确的统计辅助所认可的情况)。无论如何,在许多科学背景下,将假设与证据主张相关联的可能性将具有这样的客观值。因此,尽管科学界的各个成员可能需要多种不同的支持函数 Pα、Pβ、…、Pγ 等来表示其不同的“归纳倾向”,但我们现在将考虑所有证据支持函数在可能性值上达成一致的情况。因为可能性代表了科学假设的经验内容,即假设(连同实验条件 c、背景和辅助条件 b)对证据的陈述或概率暗示。因此,科学的经验客观性依赖于科学家在可能性数值上的高度客观性或主观间的一致性。

为了更生动地理解这一观点,想象一下,如果科学家们对可能性的价值存在广泛分歧,那么科学将会是什么样子。每个从业者对一种理论的解释都会得出关于各种可能的证据陈述是否为真的不同结论。科学家 α 认为理论 h1 在概率上意味着事件 e 非常可能发生,而他的同事 β 则认为理论 h1 的经验意义是 e 非常不可能发生。相反地,α 认为竞争理论 h2 在概率上意味着 e 非常不可能发生,而 β 则认为 h2 表示 e 极有可能发生。因此,对于 α 来说,证据结果 e 对 h1 相对于 h2 提供了强有力的支持,因为

Pα [e∣h1⋅b⋅c] ≫Pα [e∣h2⋅b⋅c]。

但他的同事 β 认为结果 e 恰恰相反,即 h2 相对于 h1 得到了强有力的支持,因为

Pβ [e∣h2⋅b⋅c] ≫Pβ [e∣h1⋅b⋅c].

如果这种情况经常发生,或者在科学领域中有重要的证据要求,那么它将破坏该科学的经验客观性。它将完全削弱该科学领域内这些假设和理论的经验可测试性。在这种情况下,尽管每个科学家都使用相同的句子来表达给定的理论 hi,但每个人对这些句子的经验含义的理解是如此不同,以至于 α 所理解的 hi 与 β 所理解的 hi 是不同的经验理论。(实际上,可以说,α 必须至少采用 h1 或 h2 中的一个句子来表达与 β 不同的命题。)因此,科学的经验客观性要求专家在可能性的值上应该达成一致。[7]

现在我们假设可能性具有客观或主观间协商的值,这些值对于科学界的所有代理人都是共同的。我们通过从表示可能性的表达式中去掉下标“α”、“β”等来标记这种协议,因为所有考虑的支持函数都应该对可能性的值达成一致。有人可能担心这种假设过于强大。在某些合理的科学背景下,尽管科学家应该对假设的经验意义有足够的共同理解,可以给可能性分配相似的值,但对其数值的精确一致可能是不现实的。在某些重要的情况下,这一点是正确的。因此,稍后在第 5 节中,我们将看到如何放松精确可能性值可用的假设,并看到逻辑在这种情况下的工作原理。但是现在,如果我们专注于那些具有客观或主观间协商的可能性的背景,概率归纳逻辑的主要思想将更容易解释。稍后我们将看到,在可能性的值可能有些模糊的情况下,或者在科学界的成员在其值上有一定程度的分歧的情况下,同样的逻辑仍然适用。

对可能性的充分处理需要引入一个额外的符号设备。科学假设通常通过一系列实验或观察来进行测试,这些实验或观察在一段时间内进行。为了明确表示证据的累积,让一系列句子 c1,c2,…,cn 描述进行一系列实验或观察的条件。让这些观察的相应结果由句子 e1,e2,…,en 表示。我们将用'cn'缩写表示前 n 个实验或观察条件的连接,并用'en'缩写表示它们结果的连接。然后,对于一系列 n 个观察或实验及其结果,可能性采取形式 P [en∣hi⋅b⋅cn]=r,其中 r 取适当的值。在许多情况下,证据流的可能性将等于各个结果的可能性的乘积:

P [en∣hi⋅b⋅cn]=P [e1∣hi⋅b⋅c1] ×⋯×P [en∣hi⋅b⋅cn]。

当这个等式成立时,可以说证据的各个部分在假设(以及辅助条件)上是概率上独立的。在下面对证据支持逻辑的解释中,除非明确引用,否则不假设这种概率上的独立性。

3.2 后验概率和先验概率

证据支持的概率逻辑通过后验概率 Pα [hi∣b⋅cn⋅en] 来表示假设的净支持。后验概率表示来自证据 cn⋅en 以及与评估 hi 相关的任何合理性考虑的假设的净支持。尽管似然度是证据对假设的后验概率做出贡献的方式,但所有其他相关的合理性考虑都由一个单独的因素表示,称为假设的先验概率:Pα [hi∣b]。先验概率表示未被证据似然度捕捉到的任何重要考虑的权重。超越证据本身的任何相关考虑都可以在表达式 b 中明确陈述(除了 b 可能包含的支持似然度的辅助假设)。因此,hi 的先验概率可能明确取决于 b 的内容。事实证明,后验概率仅取决于证据似然度的值以及先验概率的值。

作为先验概率的一个例子,考虑前一节中描述的 HIV 测试示例。医生和患者想要知道的是后验概率的值,即患者在有了阳性测试结果 c⋅e 和测试的错误率 b 的情况下,患有 HIV 的概率 Pα [h∣b⋅c⋅e]。这个后验概率的值取决于患者获得真阳性结果的可能性(由于错误率)P [e∣h⋅b⋅c]=0.99,以及获得假阳性结果的可能性 P [e∣∼h⋅b⋅c]=0.05。此外,后验概率的值还取决于在考虑测试结果之前,患者患有 HIV 的可能性有多大,即 Pα [h∣b]。在医学诊断的背景下,这个先验概率通常是根据患者所处风险群体中 HIV 的基础发病率来评估的(例如,患者是否是静脉注射毒品者,是否与多个伴侣发生不安全性行为等)。在逻辑学的严格方法中,这样的信息及其与风险相关性应该在背景信息 b 中明确说明。为了看到这些信息的重要性,考虑以下数值结果(可以使用下一节介绍的贝叶斯定理计算)。如果患者所处风险群体的基础发病率相对较高,比如 Pα [h∣b]=0.10,那么阳性测试结果将使他患有 HIV 的后验概率值为 Pα [h∣b⋅c⋅e]=0.69。然而,如果患者所处风险群体非常低,比如 Pα [h∣b]=0.001,那么阳性测试结果只会将他患有 HIV 感染的后验概率提高到 Pα [h∣b⋅c⋅e]=0.02。这个后验概率比先验概率 0.001 要高得多,但不应该让患者过于担心。这个阳性测试结果很可能是由于测试的相对较高的假阳性率,而不是由于 HIV 的存在。 这种测试,其误报率高达 0.05,最好用作筛查测试;阳性结果需要进行第二次更严格、更少误差的测试。

更一般地说,在科学假设和理论的证据评估中,先验概率代表了假设之间的非证据可信度权重评估。然而,由于这种可信度评估的强度可能在科学界的成员之间有所不同,批评者经常将这种评估视为纯主观的,并认为它们在贝叶斯推理中的作用非常有问题。贝叶斯归纳主义者反驳说,可信度评估在科学中发挥着重要而合法的作用,特别是当证据无法区分一些替代假设时。而且,他们认为,“纯主观”这个词是不合理的。这种可信度评估通常得到了广泛的论证支持,这些论证可能依赖于有力的概念考虑。

科学家经常在评估竞争观点时提出可信度论证。尽管这种论证很少是决定性的,但它们可能使科学界达成广泛的共识,特别是关于一些逻辑上可能的替代方案的不可信度。这似乎是思想实验的主要认识论作用。例如,考虑到已经用于量子理论各种解释的可信度论证(例如与测量问题相关的论证)。这些论证涉及到最初发展该理论时的核心概念问题。其中许多问题最初是由那些对量子理论的发展做出最大贡献的科学家提出的,他们试图对该理论及其影响进行概念上的把握。

鉴于任何证据体系,很容易构造出一系列逻辑上可能的替代假设,使得证据的概率与所需相等。特别是,很容易构造出逻辑上蕴含任何给定证据的假设,为所有可用证据提供概率值为 1。尽管这些构造出的假设大多是荒谬的,但证据的概率无法排除它们。然而,除了概率之外,影响假设后验概率值的因素只有它们的先验概率值;因此,只有先验概率评估才能为贝叶斯逻辑提供重要的合理性考虑。因此,贝叶斯逻辑只能通过先验概率评估给予不合理的假设应有的重视。

结果表明,贝叶斯推理的数学结构使得先验概率特别适合表示竞争假设之间的合理性评估。在对假设的证据支持的完整解释中(如下所述),只有竞争假设的先验概率比值 Pα [hj∣b]/Pα [hi∣b] 以及似然比值 Pα [e∣hj⋅b⋅c]/Pα [e∣h2⋅b⋅c] 起着关键作用。先验概率比值很适合表示假设 hj 相对于竞争假设 hi 的合理性程度。此外,这种比较评估所依据的合理性论证可以在 b 中明确陈述。因此,鉴于归纳逻辑需要纳入经过深思熟虑的合理性评估(例如为了排除荒谬的替代假设),贝叶斯先验概率的比较评估似乎非常适合完成这项工作。

因此,尽管先验概率可能是主观的,即代理人可能在合理性论证的相对强度上存在分歧,但在科学背景下使用的先验概率不必仅代表主观的心血来潮。相反,关于一个假设比另一个假设更有可能性的论证应该支持假设的先验相对强度。合理性评估的重要作用可以通过一些科学智慧的共识来捕捉,如众所周知的科学格言,非凡的主张需要非凡的证据。也就是说,需要特别强的证据,即(比值的)似然性的极高值,才能克服一些假设在证据出现之前的极低合理性值。在下一节中,我们将看到这个想法是如何运作的,并在第 3.4 节中再次回到它。

当足够强的证据出现时,事实证明先验合理性评估对后验概率值的贡献可能会被大大“冲淡”,被证据所覆盖。也就是说,只要真实假设的先验概率评估不被认为接近零,先验概率值的影响很可能会随着证据的积累而逐渐消失。在第 4 节中,我们将看到这种贝叶斯收敛到真实假设的方式是如何运作的。因此,事实证明,当由似然性所代表的区分性证据仍然较弱时,先验合理性评估发挥其最重要的作用。

在进入贝叶斯定理的逻辑之前,还有一个要点。一些贝叶斯逻辑学家坚持认为,假设的后验概率应该仅由句法逻辑形式决定。这个想法是,可能可以合理地用句法逻辑形式来指定似然度;因此,如果句法形式也可以决定先验概率的值,那么归纳逻辑将完全像演绎逻辑一样“形式化”。凯恩斯和卡纳普试图通过句法版本的无差别原则来实现这个想法——即句法上相似的假设应该被赋予相同的先验概率值。卡纳普详细展示了如何实施这个项目,但只适用于非常简单的形式语言。大多数逻辑学家现在认为这个项目失败了,因为合理的先验概率可以仅依赖于逻辑形式的整个想法存在致命缺陷。语义内容应该是重要的。古德曼的青-绿谓词提供了一种说明这一点的方式。此外,正如之前提到的,要使这个想法适用于对真实科学理论的证据支持,科学家必须仅基于其句法结构评估每个替代理论的先验概率。这似乎是一种不合理的做法。我们难道要仅通过探索其句法结构来评估引力的替代理论或量子理论的替代理论的先验概率,而完全不考虑它们的内容——不考虑它们对世界的陈述吗?这似乎是对评估真实科学理论的一种极为可疑的方法。仅仅逻辑结构是不能且不应该足以确定真实科学理论的合理先验概率值的。此外,真实科学假设和理论不可避免地受到基于它们对世界的陈述的合理性考虑的影响。 先验概率非常适合表示对于备选假设的可信性考虑的比较权重。但是,对于比较可信性的合理评估不能仅仅从假设的逻辑形式中推导出来。

我们稍后将回到先验概率的讨论。现在让我们看看贝叶斯逻辑如何将似然性与先验概率结合起来,得出假设的后验概率。

3.3 贝叶斯定理

任何概率归纳逻辑,它借鉴了概率论的常规规则来表示证据支持假设的方式,必须是广义上的贝叶斯归纳逻辑。因为,贝叶斯定理直接遵循概率论的常规公理。它的重要性源于它表达了假设和证据之间的关系。它展示了如何通过似然度将证据与先验概率结合起来,为假设产生后验概率。我们现在研究几种形式的贝叶斯定理,每种形式都可以从公理 1-5 推导出来。

贝叶斯定理最简单的版本适用于对假设的证据,如下所示:

贝叶斯定理:简单形式

Pα [hi∣e]=Pα [e∣hi] ×Pα [hi] Pα [e]

这个方程表达了根据证据 e 对假设 hi 的后验概率 Pα [hi∣e],与证据在该假设上的似然 Pα [e∣hi]、假设的先验概率 Pα [hi] 和证据的简单概率 Pα [e] 之间的关系。因素 Pα [e] 通常被称为证据的预期性。以这种方式书写,该定理忽略了实验(或观察)条件 c,以及所有的背景信息和辅助假设 b。正如前面讨论的,这两个术语在逻辑上连接所讨论的假设 hi 与证据 e 之间起着重要作用。在科学背景下,似然的客观性 Pα [e∣hi⋅b⋅c] 几乎总是依赖于这些术语。因此,尽管在贝叶斯推理的解释中,忽略实验(或观察)条件和辅助假设是一种常见做法,但下面的处理以及本文剩余部分将明确这些术语的作用。

证据支持函数 Pα 上的下标 α 提醒我们存在不止一个这样的函数。许多不同的概率函数满足公理 1-5,因此每个函数都满足贝叶斯定理。其中一些概率函数可能更符合我们对假设的证据支持应该如何工作的直观概念。然而,关于假设 hi 的初始可信度,贝叶斯代理之间肯定存在合理的差异。这种初始可信度评估的多样性通过对假设的先验概率的不同值来表示:Pα [hi],Pβ [hi],Pγ [hi] 等。这通常导致后验概率的不同值:Pα [hi∣e],Pβ [hi∣e],Pγ [hi∣e] 等。因此,牢记证据支持函数之间的多样性是很重要的。

这是贝叶斯定理的简单形式,当实验(或观察)条件 c 以及背景信息和辅助假设 b 明确时,它的表达如下:

贝叶斯定理:简单形式,明确实验条件、背景信息和辅助假设

Pα [hi∣b⋅c⋅e]=P [e∣hi⋅b⋅c] ×Pα [hi∣b] Pα [e∣b⋅c] ×Pα [c∣hi⋅b] Pα [c∣b]=P [e∣hi⋅b⋅c] ×Pα [hi∣b] Pα [e∣b⋅c] 当 Pα [c∣hj⋅b]=Pα [c∣b] 时。

这个定理的这个版本从根据该假设的证据的似然值(连同背景和辅助条件以及实验条件)P [e∣hi⋅b⋅c],该假设的先验概率值(在背景和辅助条件下)Pα [hi∣b],以及证据的预期性值(在背景和辅助条件以及实验条件下)Pα [e∣b⋅c],确定了假设的后验概率 Pα [hi∣b⋅c]。请注意,在似然值的因子 P [e∣hi⋅b⋅c] 中,下标 α 已被省略。这标志着在科学背景下,关于假设在实验条件 hi⋅b⋅c 下的证据结果 e 的似然值通常是客观确定的。该因子表示假设(连同背景和辅助条件)对实验条件可能的证据结果的似然值的客观陈述。因此,所有合理的支持函数应该对似然值的值达成一致意见。(第 5 节将讨论似然值可能缺乏这种客观性的情况。)

贝叶斯定理的这个版本包括一个项,表示实验条件在假设和背景信息(以及辅助条件)上的似然值与仅在背景(和辅助条件)上的实验条件的“似然值”的比值:Pα [c∣hi⋅b]/Pα [c∣b]。可以说,这个项的值应该是 1,或者非常接近 1,因为所讨论的假设的真实性不应显著影响实验条件是否满足的可能性。如果各种替代假设对实验条件本身分配了显著不同的似然值,那么这样的条件更应该适当地作为证据结果 e 的一部分被包括进来。

在科学界的同一群体中,假设的先验概率和预期性往往是相对主观的因素,不同的代理人可能在这些因素应该取什么值上有合理的分歧。贝叶斯逻辑学家通常接受假设的先验概率的明显主观性,但发现预期性的主观性更令人困扰。这至少部分是因为在证据支持的贝叶斯逻辑中,预期性的值不能独立于假设的似然度和先验概率来确定。也就是说,当对于一组备选假设的每个成员,似然度 P [e∣hj⋅b⋅c] 具有客观(或经过共识)的值时,预期性受以下方程式的限制(求和范围为互斥且穷尽的备选假设集合{h1,h2,…,hm,…},可以是有限的或可数无限的):

Pα [e∣b⋅c]=∑jP [e∣hj⋅b⋅c] ×Pα [hj∣b⋅c].

这个方程式表明,先验概率的值和似然度的值共同决定了证据的预期性的值。此外,它暗示了预期性的值必须位于备选假设所暗示的各种似然度值的最大值和最小值之间。然而,在计算预期性的确切值时,只有当对假设 hj 的每个备选方案都进行了具体说明时,才能以这种方式计算。在某些备选假设未指定(或未发现)的情况下,预期性的值原则上受到可能的备选假设的总体限制,但没有办法准确确定其值应该是多少。

通过诉诸贝叶斯定理的另一种形式,即比率形式,可以避免确定证据的预期值的数值困难,该形式逐对比较假设:

贝叶斯定理:比率形式

Pα [hj∣b⋅c⋅e] Pα [hi∣b⋅c⋅e]=P [e∣hj⋅b⋅c] P [e∣hi⋅b⋅c] ×Pα [hj∣b] Pα [hi∣b] ×Pα [c∣hj⋅b] Pα [c∣hi⋅b]=P [e∣hj⋅b⋅c] P [e∣hi⋅b⋅c] ×Pα [hj∣b] Pα [hi∣b] 当 Pα [c∣hj⋅b]=Pα [c∣hi⋅b] 时。

Pα [c∣hj⋅b]=Pα [c∣hi⋅b] 这个条款表明,由 c 描述的实验(或观察)条件在(hi⋅b)和(hj⋅b)上的可能性相等——即,根据一个假设,实验或观察条件不比另一个假设更可能发生。[9]

贝叶斯定理的这种比率形式表达了一个假设在证据上比另一个假设更有可能。请注意,似然比承载了证据的全部重要性。证据只以这种方式影响假设的评估。影响后验概率比值的唯一因素是先验概率的比值。当似然性完全客观时,影响后验概率比值的任何主观性只能通过先验概率比值的主观性产生。

贝叶斯定理的这个版本显示,为了评估假设的后验概率比值,不需要绝对评估假设的先验概率;只需要它们的比值。也就是说,关于先验概率,贝叶斯评估假设只依赖于一个假设比另一个假设更有可能的程度(由 b 中的考虑所表达)。这种贝叶斯评估假设本质上是比较性的,因为科学假设的评估只需要似然比和先验概率的比值。此外,我们很快将看到,假设的后验概率的绝对值完全源自贝叶斯定理的比率形式提供的后验概率比值。

当证据由 n 个不同的实验或观察组成时,我们可以通过将术语'c'替换为实验或观察条件的合取(c1⋅c2⋅…⋅cn),并将术语'e'替换为它们各自结果的合取(e1⋅e2⋅…⋅en)来明确表示这一事实。为了方便表示,让我们用术语'cn'来缩写 n 个实验条件的合取,并用术语'en'来缩写相应的 n 个结果的合取。相对于任何给定的假设 h,不同实验或观察的证据结果通常在概率上彼此独立,也与彼此的实验条件独立。在这种情况下,我们有:

P [en∣h⋅b⋅cn]=P [e1∣h⋅b⋅c1] ×⋯×P [en∣h⋅b⋅cn]。

当贝叶斯定理的比率形式扩展为明确表示证据由 n 个不同的实验(或观察)及其各自结果组成时,它采用以下形式。

贝叶斯定理:n 个不同证据主张的比率形式

Pα [hj∣b⋅cn⋅en] Pα [hi∣b⋅cn⋅en]=P [en∣hj⋅b⋅cn] P [en∣hi⋅b⋅cn] ×Pα [hj∣b] Pα [hi∣b] ×Pα [cn∣hj⋅b] Pα [cn∣hi⋅b]=P [en∣hj⋅b⋅cn] P [en∣hi⋅b⋅cn] ×Pα [hj∣b] Pα [hi∣b] 当 Pα [cn∣hj⋅b]=Pα [cn∣hi⋅b] 时。

此外,当证据主张在概率上彼此独立时,我们有

Pα [hj∣b⋅cn⋅en] Pα [hi∣b⋅cn⋅en]=P [e1∣hj⋅b⋅c1] P [e1∣hi⋅b⋅c1] ×⋯×P [en∣hj⋅b⋅cn] P [en∣hi⋅b⋅cn] ×Pα [hj∣b] Pα [hi∣b].

让我们考虑一个简单的例子,说明贝叶斯定理的比率形式如何适用于一系列独立的证据事件。假设我们拥有一个有问题的硬币,并且想要确定它在通常的投掷方式下出现正面的倾向性。考虑两个假设,h [p] 和 h [q],它们表示硬币在通常的投掷中出现正面的倾向性分别为 p 和 q。让 cn 报告硬币以正常方式投掷 n 次,让 en 报告正好出现 m 次正面。假设这些投掷的结果是概率上独立的(由 b 断言),则相应的似然函数采用二项式形式

P [en∣h[r] ⋅b⋅cn]=n!m!×(n−m)!×rm(1−r)n−m,

用 r 代表 p 和 q,分别。然后,方程 9**得出以下公式,其中似然比是各自二项式项的比率:

Pα [h[p] ∣b⋅cn⋅en]Pα [h[q] ∣b⋅cn⋅en]=pm(1−p)n−mqm(1−q)n−m×Pα [h[p] ∣b]Pα [h[q] ∣b]

例如,当硬币被投掷 n=100 次并且出现正面 m=72 次时,与假设 h [3/4] 相比,对假设 h [1/2] 的证据由似然比给出

P [en∣h[1/2] ⋅b⋅cn]P [en∣h[3/4] ⋅b⋅cn]=[(1/2)72(1/2)28][(3/4)72(1/4)28]=.000056269.

在这种情况下,即使先验的合理性考虑(在 b 中表达)使得硬币是公平的可能性比倾向于正面朝上、倾向为 3/4 的硬币的可能性高 100 倍,即 Pα [h[1/2] ∣b]/Pα [h[3/4] ∣b]=100,这些抛掷提供的证据使得硬币是公平的后验合理性只有倾向于正面朝上、倾向为 3/4 的假设的大约 6/1000 的可能性:

Pα [h[1/2] ∣b⋅cn⋅en]Pα [h[3/4] ∣b⋅cn⋅en]=.0056269.

因此,这样的证据强烈反驳了相对于“3/4-正面假设”而言的“公平假设”,前提是对先前的合理性进行评估不会使后者的假设过于不可信。然而,请注意,强烈的反驳并不意味着绝对的反驳。额外的证据可能扭转对公平假设的反驳趋势。

这个例子使用了相同类型实验的重复——反复抛硬币。但这个观点更普遍适用。随着证据的增加,可能性比例

P [en∣hj⋅b⋅cn] P [en∣hi⋅b⋅cn]

方法 0,然后贝叶斯定理的比率形式,方程式 9∗)和 9∗∗)表明,由于 Pα [hj∣b⋅cn⋅en] ≤Pα [hj∣b⋅cn⋅en] Pα [hi∣b⋅cn⋅en],hj 的后验概率也必须趋近于 0。

这样的证据强烈地反驳了 hj,对其先验可信度几乎没有考虑。事实上,贝叶斯归纳被证明是一种排除性归纳的版本,方程式 9∗ 和 9∗∗ 开始说明了这一点。假设 hi 是真实的假设,考虑一下发生在每个错误竞争者 hj 身上的情况。如果有足够的证据来驱使每个可能性比率

Such evidence comes to strongly refute hj, with little regard for its prior plausibility value. Indeed, Bayesian induction turns out to be a version of eliminative induction, and Equation 9∗ and 9∗∗ begin to illustrate this. For, suppose that hi is the true hypothesis, and consider what happens to each of its false competitors, hj. If enough evidence becomes available to drive each of the likelihood ratios

P [en∣hj⋅b⋅cn] P [en∣hi⋅b⋅cn]

当 n 增加时,如果 hj 趋近于 0,那么方程 9∗ 表明每个错误的 hj 将被有效地反驳,它们的后验概率将趋近于 0(当 n 增加时)。因此,hi 的后验概率必须趋近于 1。下面的两个方程精确地展示了这个过程。

如果我们将方程 9∗ 中的贝叶斯定理的比率版本对 hi 的所有替代假设求和(包括适当的总括性替代假设 hK),我们得到贝叶斯定理的赔率形式。根据定义,给定 B 的情况下,对于陈述 A 的赔率与给定 B 的情况下 A 的概率相关如下:

Ωα [∼A∣B]=Pα [∼A∣B] Pα [A∣B]=1−Pα [A∣B] Pα [A∣B].

这种赔率概念导致了贝叶斯定理的以下版本:

贝叶斯定理:赔率形式

Ωα [∼hi∣b⋅cn⋅en]=∑j≠iPα [hj∣b⋅cn⋅en] Pα [hi∣b⋅cn⋅en]+Pα [hK∣b⋅cn⋅en] Pα [hi∣b⋅cn⋅en]=∑j≠iP [en∣hj⋅b⋅cn] P [en∣hi⋅b⋅cn] ×Pα [hj∣b] Pα [hi∣b]+Pα [en∣hK⋅b⋅cn] P [en∣hi⋅b⋅cn] ×Pα [hK∣b] Pα [hi∣b]

在需要一个全面的备择假设 hK 的情况下,‘+’符号后面的因子才是必需的。

请记住,当我们有一组有限的具体备择假设可用时,{h1,h2,…,hm},但这组备择假设并不是穷尽的(可能存在其他未明确、未发现的备择假设),全面备择假设 hK 只是否定每个具体备择假设的结果,(∼h1⋅∼h2⋅…⋅∼hm)。一般来说,相对于全面备择假设的证据声明的可能性不会享有与具体备择假设相同类型的客观性。因此,我们在全面备择假设的可能性上附加下标 α,以表示这种缺乏客观性。

虽然全能假设可能缺乏客观的可能性,但随着额外的具体假设被阐明,贝叶斯定理中全能术语的影响力会减弱。也就是说,当发现新的假设时,它们会从全能假设中“剥离”出来。因此,当新的假设 hm+1 被制定并明确时,旧的全能假设 hK 将被新的全能假设 hK∗ 所取代,其形式为(∼h1⋅⋅∼h2⋅…⋅∼hm⋅∼hm+1);而新全能假设的先验概率是通过减少旧全能假设的先验概率得到的:Pα [hK∗∣b]=Pα [hK∣b] −Pα [hm+1∣b]。因此,随着新的备选假设被明确,全能术语的影响力应该逐渐减弱至 0。[10]

如果增加的证据使得将每个竞争者 hj 与假设 hi 进行比较的似然比趋近于 0,那么反对假设 hi 的几率 Ωα [∼hi∣b⋅cn⋅en] 将趋近于 0(前提是如果需要的话,全能术语的先验概率也会趋近于 0,因为新的备选假设被明确并剥离)。当 Ωα [∼hi∣b⋅cn⋅en] 趋近于 0 时,假设 hi 的后验概率将趋近于 1。这是因为反对假设 hi 的几率与其后验概率之间存在以下公式的关系:

贝叶斯定理:一般概率形式

Pα [hi∣b⋅cn⋅en]=11+Ωα [∼hi∣b⋅cn⋅en].

对一个假设的反对几率仅取决于后验概率比值的值,这些值完全来自贝叶斯定理的比值形式。因此,我们可以看到一个假设的后验概率的个体值仅取决于后验概率的比值,这些比值来自贝叶斯定理的比值形式。因此,贝叶斯定理的比值形式捕捉到了贝叶斯评估假设的所有关键特征。它展示了证据的影响(以似然比的形式)如何与假设的比较可信度评估(以先验概率比值的形式)相结合,从而提供了对假设在与竞争对手的竞争中被推翻或支持的程度的净评估。

有一个结果,一种贝叶斯收敛定理,它表明如果 hi(连同 b⋅cn)为真,则似然比

P [en∣hj⋅b⋅cn] P [en∣hi⋅b⋅cn]

将归纳逻辑学中的可证明区分的备择假设 hj 与 hi 进行比较,随着证据的累积(即 n 的增加),其结果很可能接近于 0。让我们称这个结果为似然比收敛定理。当这个定理适用时,方程 9∗ 表明,无论其先验概率 Pα [hj∣b] 的值如何,错误竞争者 hj 的后验概率很可能接近于 0,随着证据的累积。当这种情况发生在 hi 的每个错误竞争者身上时,方程 10 和 11 表明,真实假设 hi 的后验概率将随着证据的增加而接近于 1。因此,贝叶斯归纳实质上是一种通过排除来进行归纳的版本,其中通过似然比接近于 0 来排除备择假设。因此,当似然比收敛定理适用时,本文开头描述的归纳逻辑的充分性标准将得到满足:随着证据的累积,真实证据陈述的集合支持一个假设的程度,根据逻辑的测量,很可能表明错误假设很可能是错误的,而真实假设很可能是真实的。我们将在第 4 节中研究这个似然比收敛定理。

一种称为似然主义的观点以与上述贝叶斯逻辑类似的方式使用似然比。然而,似然主义试图避免使用先验概率。有关这种替代观点的解释,请参阅补充材料《似然比、似然主义和似然法则》。有关贝叶斯定理及其应用的更多讨论,请参阅本百科全书中关于贝叶斯定理和贝叶斯认识论的条目。

3.4 关于先验概率和模糊多样的合理性评估的表述

鉴于科学界应该在似然值上基本达成一致,任何在假设的后验概率值上存在显著分歧的情况都应该源于对这些假设的先验概率值的评估存在分歧。我们在第 3.3 节中看到,贝叶斯证据支持的逻辑只需要依赖于先验概率比值的评估——即一个假设比另一个假设更有可能性的程度。因此,证据支持的逻辑只要求科学家能够评估各种假设的相对合理性。在科学背景下,假设的相对合理性值应该依赖于明确的合理性论证,而不仅仅是私人观点。(从形式上讲,逻辑可以通过在 b 中明确陈述的方式来表示相对合理性论证。)对于科学界的成员来说,如果其他成员认为某个假设是一个合理的提议,而只是简单地说“别问我为什么,这只是我的观点”,那将是非常不科学的。即便如此,代理人可能无法准确指定可用的合理性论证对一个假设的支持程度比另一个假设更强烈多少;因此,假设的先验概率比值可能是模糊的。此外,科学界的代理人可能对可用的合理性论证对一个假设相对于对手假设的支持程度存在分歧;因此,先验概率比值也可能有一定的多样性。

个体代理人对比可能性评估的模糊性以及代理人社群中这种评估的多样性可以通过一组支持函数{Pα,Pβ,...}来形式化表示,这些函数在可能性的值上达成一致,但在(假设的)先验概率的(比率)值上涵盖了一系列的值。模糊性和多样性是不同的问题,但可以以非常相似的方式表示。让我们依次简要考虑每个问题。

对假设的先验可能性的评估通常是模糊的,不受贝叶斯概率归纳逻辑的精确定量处理的限制,这可能需要先验概率的评估似乎无法在实践中完成。为了了解贝叶斯归纳主义者如何解决这个问题,首先回顾一下贝叶斯定理的比率形式,即方程 9*。

Pα [hj∣b⋅cn⋅en] Pα [hi∣b⋅cn⋅en]=P [en∣hj⋅b⋅cn] P [en∣hi⋅b⋅cn] ×Pα [hj∣b] Pα [hi∣b]

回想一下,这个定理的比率形式捕捉到了证据支持逻辑的基本特征,尽管它只提供了后验概率比率的值。请注意,定理的比率形式很容易适应我们没有先验概率的精确数值的情况。它只依赖于我们评估备选假设 hj 相对于假设 hi 更或更不可信的能力——只需要评估比值 Pα [hj∣b]/Pα [hi∣b] 的值;不需要个别先验概率的值。这种比较可信度比评估比个别假设的先验概率的具体数值要容易得多。当与似然比的比率结合时,这些先验比率足以产生后验可信度的评估,

Pα [hj∣b⋅cn⋅en] Pα [hi∣b⋅cn⋅en]。

尽管这种后验比率不能提供个别假设的后验概率的值,但它们对假设 hj 的后验支持提供了关键的限制,因为

Pα [hj∣b⋅cn⋅en]<Pα [hj∣b⋅cn⋅en] Pα [hi∣b⋅cn⋅en]=P [en∣hj⋅b⋅cn] P [en∣hi⋅b⋅cn] ×Pα [hj∣b] Pα [hi∣b]

Bayes'定理的这种比率形式容忍了对先验概率比率的评估中的很多模糊或不精确。实际上,只需要评估这些先验可信度比率的界限就可以得到有意义的结果。给定一个特定区间内的先验比率,

q≤Pα [hj∣b] Pα [hi∣b] ≤r

一个似然比

P [en∣hj⋅b⋅cn] P [en∣hi⋅b⋅cn]=LRn

在区间内导致一个后验支持比率

(LRn×q)≤Pα [hj∣b⋅cn⋅en] Pα [hi∣b⋅cn⋅en] ≤(LRn×r).

(从技术上讲,每个概率支持函数为每对句子分配一个特定的数值;因此,当我们写出像 q≤Pα [hj∣b] Pα [hi∣b] ≤r 这样的不等式时,

q≤Pα [hj∣b] Pα [hi∣b] ≤r

当我们谈论一组概率函数 Pα 时,我们实际上是在谈论一个模糊集合,该集合满足不等式。因此,从技术上讲,贝叶斯逻辑使用一组概率支持函数来表示假设的比较合理性值的模糊性。

注意,如果似然比值 LRn 随着证据量 en 的增加趋近于 0,那么后验概率比值的取值范围必须随着上界(LRn×r)趋近于 0 而变得更加紧密。此外,对于 hj 的绝对支持程度 Pα [hj∣b⋅cn⋅en] 也必须趋近于 0。

这个观察非常有用。因为可以证明,当 hi⋅b⋅cn 为真且 hj 与 hi 在经验上有所不同时,持续寻找证据很可能导致证据结果 en 的似然比值 P [en∣hj⋅b⋅cn]/P [en∣hi⋅b⋅cn] 随着证据量的增加趋近于 0。这个结果被称为似然比收敛定理,将在第 4 节中详细研究。当似然比值趋近于 0 时,后验概率比值的上界也趋近于 0,从而使得 hj 的后验概率也趋近于 0,有效地推翻了假设 hj。因此,真实假设的虚假竞争者将会被增加的证据有效地排除。随着这种情况发生,方程式 9*到 11 表明真实假设 hi 的后验概率 Pα [hi∣b⋅cn⋅en] 趋近于 1。

因此,贝叶斯归纳逻辑对假设的归纳支持是一种排除性归纳的形式,其中证据有效地驳斥了真假假设的错误替代品。由于其排除性的性质,贝叶斯证据支持逻辑不需要先验概率的精确值。它只需要依赖于比较合理性比值的界限,而这些界限只在证据仍然相对薄弱时起到重要作用。如果真假设被评估为相对合理(由 b 中包含的合理性论证所致),那么合理性评估将使其在替代品中占据优势。如果真假设被评估为相对不合理,合理性评估只会减缓其在竞争对手中占主导地位的速度,反映了非凡假设需要非凡证据(或非凡证据的积累)来克服其最初的不合理性的观点。因此,随着证据的积累,代理人的模糊初始合理性评估转变为明确的后验概率,表明它们受到证据的强烈驳斥或支持。

当社区中的各个代理人对假设的非证据合理性存在广泛分歧时,贝叶斯证据支持逻辑可以将这种多样性表示为代理人群体的一组模糊支持函数的集合。让我们将这样的支持函数集合称为多样性集合。也就是说,多样性集合只是一组支持函数 Pα,它们涵盖了竞争假设对比合理性评估值的范围。

q≤Pα [hj∣b] Pα [hi∣b] ≤r

根据科学界的评估。但是,再次强调,如果累积的证据将各种替代假设与真实假设之间的似然比推向 0,多样性集合中的支持函数范围将在后验概率的值上接近一致,接近 0,以证明真实假设的错误竞争者。因此,这些证据不仅巩固了每个代理人的模糊初步合理性评估,还使整个社区在对真实假设的经验性不同竞争者的近似反驳上达成一致。随着这种情况的发生,真实假设的后验概率可能接近 1。似然比收敛定理暗示着,只要真实假设与其竞争对手在经验上足够不同,这种趋向真理的收敛应该非常可能发生。

在进入第 4 节之前,还应该提到有关先验概率和贝叶斯收敛的一个问题。一些主观主义版本的贝叶斯归纳似乎暗示着一个代理人对假设的先验合理性评估应该一劳永逸地保持不变,并且所有的合理性更新都应该通过符合贝叶斯定理的似然性来实现。批评者认为这是不合理的。科学界的成员可能会在重新思考合理性论证并引入新的考虑因素时,从时间到时间合理地修订他们对假设的(相对)先验合理性评估。这似乎是科学概念发展的自然部分。事实证明,这种对假设的相对合理性的重新评估对于这里讨论的概率归纳逻辑没有任何困难。这种重新评估可以通过添加或修改修改背景信息 b 的明确陈述来表示。这种重新评估可能导致个体代理人的新模糊集和社区的新多样性集(非贝叶斯)转换。贝叶斯归纳逻辑(如此处所述)对于假设的先验合理性评估应该具有什么值没有任何要求;它也不限制它们如何随时间变化。只要(相对)先验合理性的重新评估系列不会使真实假设的(相对)先验合理性值趋近于零(或者至少不会太快地这样做),似然比收敛定理暗示着证据很可能通过递减的似然比将真实假设的经验上的不同竞争对手的后验概率趋近于 0;随着这种情况的发生,真实假设的后验概率将趋近于 1。

(对于对归纳的概率论解释和在总体中属性相对频率的估计感兴趣的人应该参阅附录《归纳推理:贝叶斯估计和收敛》。)

4. 似然比收敛定理

在本节中,我们将研究似然比收敛定理。该定理表明,在某些合理条件下,当假设 hi(与辅助条件 b 一起)为真,并且备择假设 hj 在由条件 ck 描述的实验或观察的某些可能结果上与 hi 在经验上有所不同时,当足够长的一系列这样的实验和观察 cn 产生一系列结果 en 时,这些结果将产生似然比 P [en∣hj⋅b⋅cn]/P [en∣hi⋅b⋅cn] 逐渐趋近于 0,支持 hi 而不是 hj,随着证据的累积(即 n 的增加)。该定理对这些似然比向 0 的“可能收敛速率”设定了明确的下界。也就是说,它对于 hi 为真时,如果出现一系列结果,其似然比值相对于 hi 而言低于任何指定的小距离的可能性有一个下界。

定理本身并不需要贝叶斯概率函数的完整装置。它只依赖于似然性。定理的陈述和证明都不使用任何先验概率。因此,即使是拒绝使用贝叶斯先验概率的似然主义者也可以接受这个结果。根据前一节中的贝叶斯定理的形式(9 -11),似然比收敛定理进一步暗示了虚假竞争假设的后验概率可能收敛于 0。也就是说,当比值 P [en∣hj⋅b⋅cn]/P [en∣hi⋅b⋅cn] 随着 n 的增加趋近于 0 时,贝叶斯定理的比值形式(方程 9)表明,hj 的后验概率在证据累积时也必须趋近于 0,而不管其先验概率的值如何。因此,代表个体代理的模糊先验可信度的支持函数(即模糊集合)和代表代理群体的各种先验的多样性集合将在经验上不同的虚假竞争对手的后验概率上达成一致,接近 0。随着虚假竞争对手的后验概率下降,真实假设的后验概率趋近于 1。因此,该定理证明了概率支持函数的归纳逻辑满足本文开头提出的充分性准则(CoA)。

归纳比率收敛定理仅提供了一些可能收敛的充分条件。但是,即使定理的前提条件不满足,比率可能会收敛于 0(如定理所描述的方式)。这个定理克服了贝叶斯收敛结果的批评者提出的许多异议。首先,该定理不使用二阶概率;它对概率的概率没有任何说法。它只涉及表达实验或观察结果各种可能序列的析取句的概率。该定理不要求证据由根据假设具有相同分布的事件序列组成(如重复掷骰子)。该结果在个别实验或观察结果在每个假设下给定时具有概率独立的情况下最容易表达。因此,本节将介绍这个版本。然而,当证据流的个别结果在给定假设下不具有概率独立性时,该定理的一个版本也成立。(这个定理的更一般版本将在下面的概率反驳定理补充中介绍,其中提供了两个版本的证明。)此外,这个结果不依赖于假设所涉及的概率函数是可数可加的。此外,该结果提供的收敛速率的明确下界意味着在收敛发生之前没有必要等待无限长的运行(正如一些批评者所认为的那样)。

有时候有人声称,贝叶斯收敛结果只在代理人一次性确定了先验概率的值,并且仅通过贝叶斯定理根据证据来更新后验概率时才有效。然而,似然比收敛定理即使在代理人随时间修正其先验概率评估的情况下也适用。从一个支持函数(或模糊集)转移到另一个支持函数可能是由于新的合理性论证或对旧论证强度的重新评估引起的。似然比收敛定理本身仅涉及似然值。因此,只要这种重新评估不会过快地将真假设的先验概率推向 0,该定理就意味着每个经验上不同的错误竞争者的后验概率在证据增加时很可能接近 0。[13]

4.1 实验和观察的可能结果空间

为了说明似然比收敛定理的细节,我们需要一些额外的符号约定和定义。以下是它们。

对于给定的 n 个实验或观察 cn 的序列,考虑那些可能导致 hj 相对于 hi 的似然比小于某个选择的小数 ε>0 的结果序列的集合。这个集合由以下表达式表示,

{en:P [en∣hj⋅b⋅cn] P [en∣hi⋅b⋅cn]<ε}。

在这个表达式前面放置析取符号‘∨’得到一个表达式,

∨{zh:归纳 [zh∣hj⋅b⋅cn] 归纳 [zh∣hi⋅b⋅cn]<ε},

这是我们用来表示该集合中所有结果序列 en 的析取的符号。因此,

∨{zh:归纳 [zh∣hj⋅b⋅cn] 归纳 [zh∣hi⋅b⋅cn]<ε}

仅仅是一个特定的句子,实际上是在说:“在前 n 次实验或观察的结果序列中,将会出现一种使得 hj 相对于 hi 的似然比小于 ε 的情况。”

似然比收敛定理表明,在某些条件下(在下面详细介绍),在“hi⋅b⋅cn”为真的情况下,这种类型的析取句的似然概率为

P [∨{en:P[en∣hj⋅b⋅cn] P [en∣hi⋅b⋅cn]<ε}∣hi⋅b⋅cn],

必须至少为 1−(ψ/n),对于某个明确可计算的术语 ψ。因此,真实的假设 hi 在概率上意味着随着证据量 n 的增加,产生一个使得似然比 P [en∣hj⋅b⋅cn]/P [en∣hi⋅b⋅cn] 小于 ε 的结果序列 en 的可能性变得非常高(接近于 1),而且对于您选择的任何特定值 ε 都成立。随着这种情况发生,hi 的错误竞争者 hj 的后验概率必须趋近于 0,这是贝叶斯定理的比率形式所要求的,即方程式 9*。

这个概率的下界中的术语 ψ 取决于假设 hj 和 hi 对于所提出的实验和观察序列 cn 的经验差异的度量。为了指定这个度量,我们需要考虑每个实验或观察的可能结果的集合。因此,考虑由句子 c1,c2,…,cn 描述的一些实验或观察条件的序列。对于每个条件 ck,将会有一些可能的替代结果范围。让 Ok={ok1,ok2,…,okw}是描述条件 ck 的替代可能结果的一组陈述。 (在序列 c1,…,cn 中,不同实验之间的替代结果数量通常会有所不同;因此,w 的值可能取决于 ck。)对于每个假设 hj,在 Ok 中,ck 的替代结果是互斥且完备的,因此我们有:

P [oku⋅okv∣hj⋅b⋅ck]=0 且 w∑u=1P [oku∣hj⋅b⋅ck]=1。

现在,我们让形式为'ek'的表达式作为变量,其范围是条件 ck 的可能结果,即 ek 的范围是 Ok 的成员。与之前一样,'cn'表示前 n 个测试条件的合取(c1⋅c2⋅…⋅cn),'en'表示相应结果的可能序列(e1⋅e2⋅…⋅en)。让我们使用表达式'En'来表示可能从条件 cn 的序列中产生的所有可能结果序列的集合。因此,对于每个假设 hj(包括 hi),∑en∈EnP [en∣hj⋅b⋅cn]=1。

这一小节中引入的一切都只是符号约定,除了概率论公理之外,没有引入任何实质性的假设。我将在下面介绍的似然比收敛定理版本,确实依赖于一个实质性的假设,尽管这个假设相当弱。下一小节将详细讨论该假设。

4.2 概率独立性

在大多数科学背景下,相对于考虑的每个假设,一系列实验或观察的结果在概率上是彼此独立的,或者至少可以被分解为概率上独立的部分。对于我们的目的来说,证据结果在假设上的概率独立可以清晰地分为两种类型。

定义:独立证据条件:

  1. 对于一个额外的实验或观察 ck+1,如果在给定 h⋅b 及其自身条件 ck 的情况下,一系列结果 ek 在条件上对于条件是独立的,当且仅当 P [ek∣h⋅b⋅ck⋅ck+1]=P [ek∣h⋅b⋅ck]。

  2. 一个个体结果 ek 是与其他观察和它们的结果序列(ck−1⋅ek−1)无关的,只要给定 h⋅b 和它自己的条件 ck,当且仅当 P [ek∣h⋅b⋅ck⋅(ck−1⋅ek−1)]=P [ek∣h⋅b⋅ck]。

当这两个条件成立时,证据序列的可能性可以分解为各个实验或观察的可能性的乘积。为了看到这两个独立条件如何影响分解,首先考虑以下公式,即使没有满足任何独立条件,该公式仍然成立:

P [en∣hj⋅b⋅cn]=n∏k=1P [ek∣hj⋅b⋅cn⋅ek−1]。

当条件独立成立时,整个证据流的可能性可以解释为仅依赖于过去观察条件及其结果的概率乘积。它们不依赖于其他实验条件的结果尚未确定的条件。以下是公式:

P [en∣hj⋅b⋅cn]=n∏k=1P [ek∣hj⋅b⋅ck⋅(ck−1⋅ek−1)].

最后,只要两个独立条件都满足,我们就可以得到证据流的可能性与单个实验或观察的可能性之间的以下关系:

P [en∣hj⋅b⋅cn]=n∏k=1P [ek∣hj⋅b⋅ck].

(关于方程式 12-14 的证明,请参见《独立证据条件的直接结果》的补充材料。)

在科学背景下,证据几乎总是可以分为满足每个备选假设的独立证据条件的部分。为了理解原因,让我们更仔细地考虑每个独立条件。

条件独立性表明,仅仅添加一个新的观察条件 ck+1,而不指定其结果之一,不会改变其他实验 ck 的结果 ek 的可能性。为了理解这个条件的重要性,想象一下如果它被违反会怎样。假设假设 hj 是某个统计理论,比如说,一个关于超导性的量子理论。ck 中表达的条件描述了一系列实验设置,可能在世界各地的许多实验室中进行,测试理论的各个方面(例如,在不同材料和温度下测试电导率的实验)。ek 是这些实验的结果序列。条件独立性的违反意味着仅仅在 hj⋅b⋅ck 中添加一个描述如何设置额外实验的陈述 ck+1,但没有提及其结果,会改变对证据序列 ek 的可能性的理解。通过可能性,(hj⋅b)关于实验 ck 的结果 ek 所表达的内容会因仅仅提供另一个实验安排 ck+1 的描述而有所不同。条件独立性在成立时排除了这种奇怪的影响。

结果独立性表明,先前测试条件的描述以及它们的结果与额外实验的结果概率无关。如果这个条件被广泛违反,那么为了确定给定假设的最可靠结果概率,就需要包括过去观察的数量和结果的信息。假设对未来情况的描述将取决于过去情况的发展。这种依赖最好不要大规模发生。否则,假设将相当无用,因为它在每个具体情况中的经验意义将取决于考虑到过去观察和实验结果的数量。然而,即使存在这种依赖关系,只要它们不是太普遍,结果独立性可以通过将每个结果依赖数据集合打包在一起,将其视为单个扩展实验或观察来轻松满足。然后,通过以这种方式将结果依赖数据打包在一起,结果独立性条件将由独立结果块的(连词)陈述来满足。[14]

我们将研究的似然比收敛定理的版本仅取决于独立证据条件(连同概率论的公理)。它不依赖于其他假设。实际上,我们还可以建立一个更一般的定理版本,该版本不依赖于独立证据条件中的任何一个。然而,在几乎所有科学背景下,独立证据条件都将得到满足,因此假设它们不会有太大损失。(而且,如果我们回避解释更一般结果所需的额外复杂性,演示将更加顺利。)

从这一点开始,让我们假设以下版本的独立证据条件成立。

假设:独立证据假设。对于考虑的每个假设 h 和背景 b,我们假设实验和观察可以被打包成条件语句 c1,…,ck,ck+1,…,以及可能的结果,以满足以下条件:

  1. 一个条件序列 ck 的可能结果 ek 的每个序列都与附加条件 ck+1 无关,即 P [ek∣h⋅b⋅ck⋅ck+1]=P [ek∣h⋅b⋅ck]。

  2. 条件 ck 的可能结果 ek 与其他观察和可能结果序列(ck−1⋅ek−1)无关,即 P [ek∣h⋅b⋅ck⋅(ck−1⋅ek−1)]=P [ek∣h⋅b⋅ck]。

现在我们已经具备了开始陈述似然比收敛定理所需的一切。

4.3 当存在可证伪结果时的似然比收敛

似然比收敛定理分为两部分。第一部分仅适用于总证据流 cn 中的实验或观察 ck,其中根据假设 hj,某些可能的结果具有 0 的发生概率,但根据假设 hi,它们具有非零的发生概率。这些结果是非常理想的。如果它们发生,将会出现将 hj 与 hi 进行比较的似然比为 0 的情况,从而证伪了 hj。所谓的关键实验是这种情况的特例,其中至少对于一个可能的结果 oku,P [oku∣hi⋅b⋅ck]=1 且 P [oku∣hj⋅b⋅ck]=0。在更一般的情况下,假设 hi 与 b 表示 ck 的结果之一至少是最小可能的,而假设 hj 表示这个结果是不可能的-即,P [oku∣hi⋅b⋅ck]>0 且 P [oku∣hj⋅b⋅ck]=0。为了方便起见,我们定义了一个术语来描述这种情况。

定义:完全结果兼容性。我们称假设 hj 在实验或观察 ck 上与假设 hi 完全结果兼容,当且仅当对于它的每个可能结果 ek,如果 P [ek∣hi⋅b⋅ck]>0,则 P [ek∣hj⋅b⋅ck]>0。等价地,如果至少对于它的一个可能结果 ek,P [ek∣hi⋅b⋅ck]>0 但 P [ek∣hj⋅b⋅ck]=0,则 hj 在实验或观察 ck 上不完全结果兼容。

似然比收敛定理的第一部分适用于证据总流的那部分(即总证据流的子序列),其中假设 hj 与假设 hi 不完全兼容;定理的第二部分适用于证据总流的剩余部分,即总证据流的子序列,其中 hj 与 hi 完全兼容。事实证明,这两种情况必须以不同的方式处理。(这是由于在实验和观察中,用于经验上区分两个假设的预期信息内容的测量对于完全兼容的实验和观察来说会变得无限大;对于不完全兼容的实验和观察,这种信息内容的测量会爆炸(变为无穷大))。因此,收敛定理的以下部分仅适用于由实验和观察组成的证据总流的那部分,这些实验和观察与所涉及的假设不完全兼容。因此,以下是收敛定理的第一部分。

似然比收敛定理 1-伪证定理: 假设证据总流 cn 恰好包含 m 个实验或观察,其中 hj 与 hi 不完全兼容。假设独立证据条件对于证据流 cn 与这两个假设分别成立。此外,假设存在一个下界 δ>0,使得对于每个 ck,其中 hj 与 hi 不完全兼容,

P [∨{oku:P[oku∣hj⋅b⋅ck]=0}∣hi⋅b⋅ck]≥δ

—即,hi 与 b⋅ck 一起表明,至少有 δ 的可能性会发生 hj 认为不可能发生的结果。那么,

P [∨{en:P[en∣hj⋅b⋅cn] P [en∣hi⋅b⋅cn]=0}∣hi⋅b⋅cn]=P [∨{en:P[en∣hj⋅b⋅cn]=0}∣hi⋅b⋅cn]≥1−(1−δ)m,

对于大的 m,逼近 1。(证明见伪证定理的证明。)

换句话说,我们只假设对于每个观察 ck,hi 说观察 ck 至少有一个小概率 δ 产生 hj 认为不可能的结果 oku。如果这样的实验或观察的数量 m 足够大(或者如果得到这样的结果的概率的下界 δ 足够大),并且如果 hi(连同 b⋅cn)为真,则 hj 认为不可能的结果之一很可能会发生。如果其中一个结果发生,那么 hj 相对于 hi 的似然比将变为 0。根据贝叶斯定理,当这种情况发生时,根据证据,hj 被完全推翻,其后验概率变为 0。

伪证定理非常符合常识。首先,注意如果证据流中存在一个关键实验,那么该定理是完全明显的。也就是说,假设对于特定实验 ck(在证据流 cn 中),存在两个不兼容的可能结果 okv 和 oku,使得 P [okv∣hj⋅b⋅ck]=1 和 P [oku∣hi⋅b⋅ck]=1。那么,显然,P [∨{oku:P[oku∣hj⋅b⋅ck]=0}∣hi⋅b⋅ck]=1,因为 oku 是其中一个满足 P [oku∣hj⋅b⋅ck]=0 的结果。因此,在有关键实验的情况下,该定理适用于 m=1 和 δ=1。

对于没有关键实验可用的情况,该定理同样具有常识性。为了了解在这种情况下它的含义,考虑一个例子。假设 hi 是一个暗示了质子衰变特定速率的理论,但是这个速率非常低,以至于在给定的一年内,任何一个特定的质子衰变的概率都非常小。考虑一个暗示质子永不衰变的替代理论 hj。如果 hi 是真实的,那么对于足够持续的观测序列(即如果适当的探测器能够长时间观测数万亿个质子),最终几乎肯定会检测到一个质子的衰变。当这种情况发生时,似然比变为 0。因此,hj 的后验概率变为 0。

将一些具体值代入伪证定理给出的公式中,可以看出收敛速度可能是什么样子。例如,该定理告诉我们,如果我们在一个包含至少 m=19 个观测或实验的证据流 cn 上比较任意一对假设 hi 和 hj,其中每个观测或实验都有一个概率 δ≥.10 产生一个证伪结果,那么在 hi⋅b⋅cn 上获得一个产生似然比的结果序列 en 的似然概率为

P [en∣hj⋅b⋅cn] P [en∣hi⋅b⋅cn]=0,

将至少与(1−(1−.1)19)=.865 一样大。(读者可以尝试其他 δ 和 m 的值。)

现在我们已经看到了一个,可以对这种收敛定理的需要和有用性进行评论。给定一些特定的科学假设 hi 和 hj,我们可以直接计算在给定(hi⋅b⋅cn)的情况下,一个提议的实验或观察序列 cn 将导致产生低似然比的结果序列之一的可能性。因此,对于给定的假设对和一个提议的实验序列,我们不需要一个一般的收敛定理来告诉我们获得反驳证据的可能性。具体的假设 hi 和 hj 自己告诉我们这一点。它们告诉我们获得每个具体结果序列的可能性,包括那些要么反驳竞争者,要么为其产生非常小的似然比的结果序列。此外,当我们实际进行了实验并记录了其结果后,唯一重要的是该结果的实际似然比。收敛定理变得无关紧要。

似然比收敛定理(包括伪证定理和尚未出现的部分)的目的是在考虑任何特定的假设对之前,提前向我们保证,如果测试假设的可能证据序列具有反映两个假设的经验差异性的某些特征,那么很有可能会出现产生非常小的似然比的结果序列之一。这些定理为这种收敛的速度提供了有限的下界。因此,它们显示了在我们使用逻辑学来测试具体的假设对之前,CoA 已经得到满足。

4.4 可能没有证伪结果时的似然比收敛

当证据流包括可能证伪备选假设的结果时,证伪定理适用。然而,它完全忽视了证据流中的任何实验或观察对于假设 hj 与假设 hi 完全兼容的影响。现在我们转向一个定理,适用于那些仅由实验和观察组成的证据流(或证据流的一部分),在这些实验和观察中,假设 hj 与假设 hi 完全兼容。这种类型的证据流不包含可能的证伪结果。在这种情况下,实验或观察 ck 的唯一可能指定 0 似然的结果是假设 hi 也指定 0 似然的结果。

与证据完全统计性质相关的假设通常在整个证据流上是完全兼容的。因此,这种类型的证据流在实践中无疑比包含可能证伪结果的证据流更常见。此外,每当整个证据流包含一些实验和观察,其中假设在某些实验和观察上不完全兼容,而在其他实验和观察上完全兼容时,我们可以将完全兼容的实验和观察视为整个证据流的一个独立子序列,以了解该部分证据对于产生似然比值的可能影响。

为了涵盖完全由实验或观察组成的证据流(或证据流的子序列),其中 hj 与假设 hi 完全兼容,我们首先需要找到一种有用的方法来衡量假设在这些证据上彼此之间的经验区别程度。考虑一些由观察 cn 导致的结果序列 en。似然比 P [en∣hj⋅b⋅cn]/P [en∣hi⋅b⋅cn] 本身衡量了结果序列区分 hi 和 hj 的程度。但作为衡量证据区分假设能力的指标,原始似然比提供了一个相当不平衡的尺度,一个范围从 0 到无穷大的尺度,其中 en 在 hi 和 hj 之间根本没有区分的中点为 1。因此,与其使用原始似然比来衡量 en 区分假设的能力,使用对数似然比更为有用。对数似然比提供了这样的度量。

定义:QI-信息的质量。 对于每个实验或观察 ck,定义在给定 b 的情况下,由可能的结果 oku 提供的区分 hj 和 hi 的信息质量如下(从现在开始,我们将“logs”视为以 2 为底):

QI [oku∣hi/hj∣b⋅ck]=log [P[oku∣hi⋅b⋅ck] P [oku∣hj⋅b⋅ck]].

同样地,对于实验或观察序列 cn,定义给定 b 时可能结果 en 用于区分 hj 和 hi 所提供的信息质量如下:

QI [en∣hi/hj∣b⋅cn]=log [P[en∣hi⋅b⋅cn] P [en∣hj⋅b⋅cn]].

也就是说,QI 是 hi 相对于 hj 的似然比的以 2 为底的对数。

因此,我们将衡量一个结果在区分两个假设之间所提供的信息质量,作为似然比的以 2 为底的对数。这显然是一个对结果在区分两个假设方面的证据强度的对称度量。根据这个度量,当 QI [oku∣hi/hj∣b⋅ck]=0 时,假设 hi 和 hj 对于给定的结果 oku 赋予相同的似然值。因此,QI 以对数刻度测量信息,该刻度关于自然的无信息中点 0 对称。这个度量被设置为正信息支持 hi 而不是 hj,负信息支持 hj 而不是 hi。

鉴于对每个假设的独立证据假设,很容易证明一系列结果的 QI 只是该序列中各个结果的 QI 的总和:

QI [en∣hi/hj∣b⋅cn]=n∑k=1QI [ek∣hi/hj∣b⋅ck].

概率论者通过首先将可能的值乘以它们发生的概率,然后将这些乘积相加,来衡量一个量的期望值。因此,QI 的期望值由以下公式给出:

定义:EQI——信息的期望质量。 我们采用的约定是,如果 P [oku∣hi⋅b⋅ck]=0,那么术语 QI [oku∣hi/hj∣b⋅ck] ×P [oku∣hi⋅b⋅ck]=0。在以下定义的背景下,这个约定是有意义的,因为只要根据 hi(以及 b⋅ck)来看,结果 oku 发生的概率为 0,那么它对于证据区分 hj 和 hi 的能力没有影响是有意义的。还要注意,hj 在 ck 上与 hi 的完全结果兼容意味着,只要 P [ek∣hj⋅b⋅ck]=0,我们也必须有 P [ek∣hi⋅b⋅ck]=0;所以无论何时在术语中分母为 0,

QI [oku∣hi/hj∣b⋅ck]=log [P[oku∣hi⋅b⋅ck] P [oku∣hj⋅b⋅ck]],

刚才描述的约定使术语

QI [oku∣hi/hj∣b⋅ck] ×P [oku∣hi⋅b⋅ck]=0.

因此,以下概念是明确定义的:

对于在实验或观察 ck 上与 hi 完全兼容的 hj,定义

EQI [ck∣hi/hj∣b]=∑uQI [oku∣hi/hj∣b⋅ck] ×P [oku∣hi⋅b⋅ck].

此外,对于在序列 cn 中的每个实验和观察,hj 与 hi 完全兼容的情况,定义

EQI [cn∣hi/hj∣b]=∑en∈EnQI [en∣hi/hj∣b⋅cn] ×P [en∣hi⋅b⋅cn].

一个实验或观察的 EQI 是其信息的预期质量,用于在 hi 为真时区分 hi 和 hj。它是实验或观察的可能结果在 hi(连同 b⋅c)为真时区分假设的预期证据强度的度量。而 QI 衡量了每个特定结果或结果序列在经验上区分假设的能力,EQI 衡量了实验或观察产生区分结果的倾向。可以证明 EQI 以非常精确的方式跟踪经验上的差异性。我们稍后会回到这个问题。

很容易看出,一系列观察 cn 的 EQI 只是序列中各个观察 ck 的 EQI 的总和:

EQI [cn∣hi/hj∣b]=n∑k=1EQI [ck∣hi/hj∣b]。

(有关证明,请参见《证明 EQI 对于 cn 来说是个体 ck 的 EQI 之和的补充》。)

这表明,对于由实验和观察组成的证据流 cn,将 EQI [ck∣hi/hj∣b] 的值平均化为观察次数 n 可能是有用的,以获得信息的平均预期质量的度量。

定义:信息的平均预期质量 对于在证据流 cn 中的每个实验和观察,使得 hj 与 hi 在每个实验和观察上完全兼容,定义从 cn 中区分 hj 和 hi 的平均预期信息质量 ¯EQI,给定 hi⋅b,如下所示:

¯EQI [cn∣hi/hj∣b]=EQI [cn∣hi/hj∣b] n=(1/n)×n∑k=1EQI [ck∣hi/hj∣b]。

结果表明,EQI [ck∣hi/hj∣b] 的值不能小于 0;当且仅当 hi 在至少一个结果 oku 上与 hj 在经验上有所不同时,它必须大于 0——即当且仅当在至少一个结果 oku 上满足 P [oku∣hi⋅b⋅ck] ≠P [oku∣hj⋅b⋅ck] 时,它在经验上有所不同。¯EQI [cn∣hi/hj∣b] 的情况也是如此。

定理:EQI 的非负性。

EQI [ck∣hi/hj∣b] ≥0;且当且仅当对于其可能的结果 oku 中至少存在一个结果时,EQI [ck∣hi/hj∣b]>0。

P [oku∣hi⋅b⋅ck] ≠P [oku∣hj⋅b⋅ck]。

因此,¯EQI [cn∣hi/hj∣b] ≥0;且当且仅当至少有一个实验或观察 ck 具有至少一个可能的结果 oku,使得 ¯EQI [cn∣hi/hj∣b]>0。

P [oku∣hi⋅b⋅ck] ≠P [oku∣hj⋅b⋅ck]。

(证明见附录《将结果空间细分对 EQI 的影响——包括 EQI 非负性的证明》。)

实际上,将结果空间 Ok={ok1,…,okv,…,okw}细分为在可能性比值上有所不同的不同结果,EQI 就会变得更大。[15] 这表明 EQI 以精确的方式跟踪经验上的差异。EQI 的非负性结果对于可能性比值收敛定理的重要性将很快变得清楚。

现在我们可以陈述可能性比值收敛定理的第二部分。它适用于所有不包含可能的反驳结果 hj 的证据流,当 hi 成立时-即,它适用于所有证据流,其中 hj 在流中的每个 ck 上与 hi 完全兼容。

可能性比值收敛定理 2-概率反驳定理。

假设证据流 cn 仅包含与 hi 完全兼容的实验或观察结果,即假设对于序列 cn 中的每个条件 ck,对于其可能的结果 oku,要么 P [oku∣hi⋅b⋅ck]=0,要么 P [oku∣hj⋅b⋅ck]>0。此外(作为对前述假设的轻微加强),假设对于 cn 中每个观察条件 ck 的每个可能结果 oku,要么 P [oku∣hi⋅b⋅ck]=0,要么

P [oku∣hj⋅b⋅ck] P [oku∣hi⋅b⋅ck] ≥γ,其中 γ>0 且小于 1/e2(≈.135;其中 e'是自然对数的底)。并且假设独立证据条件对于证据流 cn 与这些假设的每一个都成立。现在,选择任意小于 1 的正数 ε,尽可能小,但足够大(对于所考虑的观察次数 n),使得

And suppose that the Independent Evidence Conditions hold for evidence stream cn with respect to each of these hypotheses. Now, choose any positive ε<1, as small as you like, but large enough (for the number of observations n being contemplated) that the value of

¯EQI [cn∣hi/hj∣b]>−(logε)n.

然后:

P [∨{en:P[en∣hj⋅b⋅cn] P [en∣hi⋅b⋅cn] <ε}∣hi⋅b⋅cn]> 1−1n×(logγ)2(¯EQI [cn∣hi/hj∣b]+(logε)/n)2

对于 ε=1/2m 和 γ=1/2q,这个公式变为,

P [∨{en:P[en∣hj⋅b⋅cn] P [en∣hi⋅b⋅cn] <1/2m}∣hi⋅b⋅cn]> 1−1n×q2(¯EQI [cn∣hi/hj∣b] −(m/n))2

(证明见附录概率反驳定理的证明。)

这个定理提供了通过超小的可能性比率来推翻错误选择的充分条件。满足这些条件的情况表明所涉及的假设在经验上彼此之间有多大的差异。定理表明,当满足这些条件时,根据假设 hi(与 b⋅cn 一起考虑),很可能发生一个使得可能性比率小于 ε 的结果序列 en。获得这样的证据结果 en 的可能性非常接近于 1,即不超过某个数量

1n×(logγ)2(¯EQI [cn∣hi/hj∣b]+(logε)n)2

小于 1。(注意,这个小于 1 的数量随着 n 的增加而趋近于 0。)

结果表明,在几乎每种情况下(对于几乎任何一对假设),获得这样的证据的实际可能性(即,具有小于 ε 的似然比值的证据)将比这个因子所示的更接近于 1。[16] 因此,该定理对于获得小似然比的可能性提供了过于谨慎的下界。它表明,对于证据流的 ¯EQI 值越大,该流产生一系列产生非常小的似然比值的结果序列的可能性就越大。但是,即使 ¯EQI 仍然非常小,足够长的证据流 n,即使是这种低质量的证据,几乎肯定也会产生一个非常小的似然比值的结果序列。[17]

注意定理的前提条件,“要么

P [oku∣hi⋅b⋅ck]=0

或者

P [oku∣hj⋅b⋅ck] P [oku∣hi⋅b⋅ck] ≥γ,

对于某个 γ>0 但小于 1/e2(≈.135)",在任何情况下都不支持假设 hi 优于 hj。这个条件只是排除了一些可能性,即某些结果可能相对于 hi 对 hj 提供极强的证据,通过使 P [oku∣hi⋅b⋅ck]=0 或通过使

P [oku∣hj⋅b⋅ck] P [oku∣hi⋅b⋅ck]

小于某个相当小的 γ。这个条件只是因为我们的证据可区分度测量 QI 在比率

P [oku∣hj⋅b⋅ck] P [oku∣hi⋅b⋅ck]

是非常小的。此外,这个条件对可能的实验或观察实际上没有任何限制。如果 ck 有一些可能的结果句 oku,这将使得

P [oku∣hj⋅b⋅ck] P [oku∣hi⋅b⋅ck]<γ

(对于给定的小 γ 感兴趣),可以将 oku 与 ck 的其他结果句 okv 一起进行析取合并。然后,定理的前提条件将得到满足,但将句子“(oku∨okv)”视为单个结果。可以证明,这种“析取合并”的唯一效果是使 ¯EQI 比它本来应该更小(而较大的 ¯EQI 值更可取)。如果在进行实验或观察 ck 时实际上发生了过于强烈的反驳析取 oku,那就更好了,因为这会导致一个似然比。

P [oku∣hj⋅b⋅ck] P [oku∣hi⋅b⋅ck]

在特定的证据结果上小于 γ。我们只是在计算通过似然比进行反驳的可能性的下限时,未能考虑到这种更强烈的反驳可能性。

在本节中探讨的两个收敛定理的要点是,在考虑任何特定的假设对时,如果测试它们的可能证据流具有反映它们的证据可区分性的某些特征,那么很可能会产生产生小似然比的结果。这些定理为收敛的速度提供了有限的下限。因此,没有必要等待无限长的运行时间才能实现收敛。实际上,对于任何概率分布行为良好的证据序列,产生产生小似然比值的结果的实际可能性将不可避免地比定理 1 和定理 2 给出的下限要高得多。

总之,根据定理 1 和定理 2,每个假设 hi 通过可能性来说,通过足够的观察,它很可能在可能性比赛中主导其经验上不同的竞争对手。真实的假设对此说真话,而它的竞争对手则撒谎。即使是具有极低平均预期信息质量的观察序列,如果证据序列足够长,也很可能完成任务。因此(根据方程 9*),随着证据的累积,对错误假设的支持程度很可能接近 0,表明它们很可能是错误的;而随着这种情况发生(根据方程 10 和 11),对真实假设的支持程度将接近 1,表明它很可能是真实的。因此,充分性准则(CoA)得到满足。

5. 当可能性模糊或多样时

到目前为止,我们一直假设可能性具有客观或一致的数值。尽管这种假设在科学背景下经常得到满足,但在某些重要情境中,这种假设是不现实的,即假设只支持模糊的可能性值,并且在假设对证据主张的可能性值上存在足够的歧义,科学界无法就可能性的精确值达成一致。让我们现在看看如何以合理的方式放宽对精确、一致可能性值的假设。

回想一下为什么在科学实践中,对于可能性的精确值的一致性或接近一致性是如此重要。只要科学界的成员在可能性上存在分歧,他们就在对于他们的假设的经验内容上存在分歧,即关于每个假设对于世界可能性的描述。这可能导致对于哪些假设被一定证据推翻或支持存在分歧。同样,只要可能性的值仅仅是由个体代理理解的假设模糊地暗示出来,该代理可能无法确定哪个假设被一定证据推翻或支持。

然而,我们已经看到,个体可能性的具体值并不是证据对假设影响的关键。正如方程式 9-11 所示,可能性的比值才是起到重要作用的。因此,即使两个支持函数 Pα 和 Pβ 在个体可能性的值上存在分歧,只要满足以下条件,它们仍然可以在对于各种竞争假设的推翻或支持上基本达成一致:

方向一致条件: 如果一对支持函数 Pα 和 Pβ 的似然比在方向上一致(与与一对假设相关的实验或观察的可能结果相比),则被认为是一致的。

  • 只要可能的结果序列 en 使得 Pα [en∣hj⋅b⋅cn] Pα [en∣hi⋅b⋅cn]<1, 它也使得 Pβ [en∣hj⋅b⋅cn] Pβ [en∣hi⋅b⋅cn]<1;

  • 每当可能的结果序列 en 使得 Pα [en∣hj⋅b⋅cn] Pα [en∣hi⋅b⋅cn]>1, 它也使得 Pβ [en∣hj⋅b⋅cn] Pβ [en∣hi⋅b⋅cn]>1;

  • 这些似然比中的每一个对于这两个支持函数都要么接近于 1,要么与它们都相差很远。[19]

当这个条件成立时,根据 Pα,证据将支持 hi 而不是 hj,只有在 Pβ 的情况下也是如此,尽管支持的强度可能不同。此外,虽然两个支持函数在证据流中可能以不同的速率增加或减少似然比,但累积证据的影响应该最终以类似的方式影响它们的反驳或支持。

当似然性模糊或多样时,我们可以采取类似于我们对模糊和多样的先验可信度评估所采用的方法。我们可以将个体代理的模糊集扩展到包括一系列归纳支持函数,这些函数涵盖了证据主张的似然比值的范围(以及由先验概率比率表示的假设的比较支持强度的范围,这些比率是由 b 内的可信度论证引起的)。同样,我们可以将代理群体的多样性集扩展到包括支持函数,这些函数涵盖了科学界成员的模糊集中出现的似然比值的范围。

这种对模糊性和多样性的扩展旨在容纳模糊和多样的可能性值,对于假设的真实收敛结果没有任何困扰。因为只要在考虑的扩展模糊或多样性集合中,所有支持函数都满足方向一致条件,那么似然比收敛定理就适用于该集合中的每个支持函数。因为该收敛定理的证明并不依赖于似然性是客观的或具有主观一致的值的假设。相反,它适用于每个单独的支持函数 Pα。在应用这个结果到一系列支持函数时唯一可能的问题是,当它们的似然值不同时,函数 Pα 可能与 Pβ 在给定的证据序列中支持哪个假设存在分歧。这可能是因为不同的支持函数可能以不同的似然值来表示假设的证据重要性,即对于相同的证据主张指定不同的似然值。因此,根据 Pα,一个支持 hi 的证据流可能根据 Pβ 而言支持 hj。然而,当给定的一组支持函数满足方向一致条件时,这个问题就不会出现。方向一致意味着 Pα 和 Pβ 对于假设的证据重要性足够相似,以至于一个序列的结果只有在 Pβ 也是如此的情况下,才能支持一个假设。

因此,当定向协议条件对于包含模糊或多样性可能性的所有支持函数在一个被扩展的模糊或多样性集合中成立,并且只要足够的证据区分实验或观察可以进行,被扩展的模糊或多样性集合中的所有支持函数很可能会一致认为真实假设的经验上不同的错误竞争者的可能性比极小。随着这种情况的发生,社区将一致同意驳斥这些竞争者,并且真实假设将升至榜首。[20]

如果真实假设有证据上等价的竞争者呢?它们的后验概率也必须上升。在这种情况下,我们只能确保真实假设与其证据上等价的竞争者的析取将被推向 1,因为证据使其证据上不同的竞争者降低。只有当真实假设没有证据上等价的竞争者,或者无论它有什么等价竞争者,都可以通过不依赖于证据可能性的合理性论证来降低,真实假设本身才会接近 1,而这种合理性论证只通过先验概率的比率所代表的比较合理性评估显示出来。

补充清单

Bibliography

  • Boole, George, 1854, The Laws of Thought, London: MacMillan. Republished in 1958 by Dover: New York.

  • Bovens, Luc and Stephan Hartmann, 2003, Bayesian Epistemology, Oxford: Oxford University Press. doi:10.1093/0199269750.001.0001

  • Carnap, Rudolf, 1950, Logical Foundations of Probability, Chicago: University of Chicago Press.

  • –––, 1952, The Continuum of Inductive Methods, Chicago: University of Chicago Press.

  • –––, 1963, “Replies and Systematic Expositions”, in The Philosophy of Rudolf Carnap, Paul Arthur Schilpp (ed.),La Salle, IL: Open Court.

  • Chihara, Charles S., 1987, “Some Problems for Bayesian Confirmation Theory”, British Journal for the Philosophy of Science, 38(4): 551–560. doi:10.1093/bjps/38.4.551

  • Christensen, David, 1999, “Measuring Confirmation”, Journal of Philosophy, 96(9): 437–61. doi:10.2307/2564707

  • –––, 2004, Putting Logic in its Place: Formal Constraints on Rational Belief, Oxford: Oxford University Press. doi:10.1093/0199263256.001.0001

  • De Finetti, Bruno, 1937, “La Prévision: Ses Lois Logiques, Ses Sources Subjectives”, Annales de l’Institut Henri Poincaré, 7: 1–68; translated by Henry E. Kyburg, Jr. as “Foresight. Its Logical Laws, Its Subjective Sources”, in Studies in Subjective Probability, Henry E. Kyburg, Jr. and H.E. Smokler (eds.), Robert E. Krieger Publishing Company, 1980.

  • Dowe, David L., Steve Gardner, and Graham Oppy, 2007, “Bayes, Not Bust! Why Simplicity is No Problem for Bayesians”, British Journal for the Philosophy of Science, 58(4): 709–754. doi:10.1093/bjps/axm033

  • Dubois, Didier J. and Henri Prade, 1980, Fuzzy Sets and Systems, (Mathematics in Science and Engineering, 144), New York: Academic Press.

  • –––, 1990, “An Introduction to Possibilistic and Fuzzy Logics”, in Glenn Shafer and Judea Pearl (eds.), Readings in Uncertain Reasoning, San Mateo, CA: Morgan Kaufmann, 742–761..

  • Duhem, P., 1906, La theorie physique. Son objet et sa structure, Paris: Chevalier et Riviere; translated by P.P. Wiener, The Aim and Structure of Physical Theory, Princeton, NJ: Princeton University Press, 1954.

  • Earman, John, 1992, Bayes or Bust? A Critical Examination of Bayesian Confirmation Theory, Cambridge, MA: MIT Press.

  • Edwards, A.W.F., 1972, Likelihood: an account of the statistical concept of likelihood and its application to scientific inference, Cambridge: Cambridge University Press.

  • Edwards, Ward, Harold Lindman, and Leonard J. Savage, 1963, “Bayesian Statistical Inference for Psychological Research”, Psychological Review, 70(3): 193–242. doi:10.1037/h0044139

  • Eells, Ellery, 1985, “Problems of Old Evidence”, Pacific Philosophical Quarterly, 66(3–4): 283–302. doi:10.1111/j.1468-0114.1985.tb00254.x

  • –––, 2006, “Confirmation Theory”, Sarkar and Pfeifer 2006..

  • Eells, Ellery and Branden Fitelson, 2000, “Measuring Confirmation and Evidence”, Journal of Philosophy, 97(12): 663–672. doi:10.2307/2678462

  • Field, Hartry H., 1977, “Logic, Meaning, and Conceptual Role”, Journal of Philosophy, 74(7): 379–409. doi:10.2307/2025580

  • Fisher, R.A., 1922, “On the Mathematical Foundations of Theoretical Statistics”, Philosophical Transactions of the Royal Society, series A , 222(594–604): 309–368. doi:10.1098/rsta.1922.0009

  • Fitelson, Branden, 1999, “The Plurality of Bayesian Measures of Confirmation and the Problem of Measure Sensitivity”, Philosophy of Science, 66: S362–S378. doi:10.1086/392738

  • –––, 2001, “A Bayesian Account of Independent Evidence with Applications”, Philosophy of Science, 68(S3): S123–S140. doi:10.1086/392903

  • –––, 2002, “Putting the Irrelevance Back Into the Problem of Irrelevant Conjunction”, Philosophy of Science, 69(4): 611–622. doi:10.1086/344624

  • –––, 2006, “Inductive Logic”, Sarkar and Pfeifer 2006..

  • –––, 2006, “Logical Foundations of Evidential Support”, Philosophy of Science, 73(5): 500–512. doi:10.1086/518320

  • –––, 2007, “Likelihoodism, Bayesianism, and Relational Confirmation”, Synthese, 156(3): 473–489. doi:10.1007/s11229-006-9134-9

  • Fitelson, Branden and James Hawthorne, 2010, “How Bayesian Confirmation Theory Handles the Paradox of the Ravens”, in Eells and Fetzer (eds.), The Place of Probability in Science, Open Court. [Fitelson & Hawthorne 2010 preprint available from the author (PDF)]

  • Forster, Malcolm and Elliott Sober, 2004, “Why Likelihood”, in Mark L. Taper and Subhash R. Lele (eds.), The Nature of Scientific Evidence, Chicago: University of Chicago Press.

  • Friedman, Nir and Joseph Y. Halpern, 1995, “Plausibility Measures: A User’s Guide”, in UAI 95: Proceedings of the Eleventh Conference on Uncertainty in Artificial Intelligence, 175–184.

  • Gaifman, Haim and Marc Snir, 1982, “Probabilities Over Rich Languages, Testing and Randomness”, Journal of Symbolic Logic, 47(3): 495–548. doi:10.2307/2273587

  • Gillies, Donald, 2000, Philosophical Theories of Probability, London: Routledge.

  • Glymour, Clark N., 1980, Theory and Evidence, Princeton, NJ: Princeton University Press.

  • Goodman, Nelson, 1983, Fact, Fiction, and Forecast, 4th edition, Cambridge, MA: Harvard University Press.

  • Hacking, Ian, 1965, Logic of Statistical Inference, Cambridge: Cambridge University Press.

  • –––, 1975, The Emergence of Probability: a Philosophical Study of Early Ideas about Probability, Induction and Statistical Inference, Cambridge: Cambridge University Press. doi:10.1017/CBO9780511817557

  • –––, 2001, An Introduction to Probability and Inductive Logic, Cambridge: Cambridge University Press. doi:10.1017/CBO9780511801297

  • Hájek, Alan, 2003a, “What Conditional Probability Could Not Be”, Synthese, 137(3):, 273–323. doi:10.1023/B:SYNT.0000004904.91112.16

  • –––, 2003b, “Interpretations of the Probability Calculus”, in the Stanford Encyclopedia of Philosophy, (Summer 2003 Edition), Edward N. Zalta (ed.), URL = <Interpretations of Probability (Stanford Encyclopedia of Philosophy/Summer 2003 Edition)>

  • –––, 2005, “Scotching Dutch Books?” Philosophical Perspectives, 19 (Epistemology): 139–151. doi:10.1111/j.1520-8583.2005.00057.x

  • –––, 2007, “The Reference Class Problem is Your Problem Too”, Synthese, 156(3): 563–585. doi:10.1007/s11229-006-9138-5

  • Halpern, Joseph Y., 2003, Reasoning About Uncertainty, Cambridge, MA: MIT Press.

  • Harper, William L., 1976, “Rational Belief Change, Popper Functions and Counterfactuals”, in Harper and Hooker 1976: 73–115. doi:10.1007/978-94-010-1853-1_5

  • Harper, William L. and Clifford Alan Hooker (eds.), 1976, Foundations of Probability Theory, Statistical Inference, and Statistical Theories of Science, volume I Foundations and Philosophy of Epistemic Applications of Probability Theory, (The Western Ontario Series in Philosophy of Science, 6a), Dordrecht: Reidel. doi:10.1007/978-94-010-1853-1

  • Hawthorne, James, 1993, “Bayesian Induction is Eliminative Induction”, Philosophical Topics, 21(1): 99–138. doi:10.5840/philtopics19932117

  • –––, 1994,“On the Nature of Bayesian Convergence”, PSA: Proceedings of the Biennial Meeting of the Philosophy of Science Association 1994, 1: 241–249. doi:10.1086/psaprocbienmeetp.1994.1.193029

  • –––, 2005, “Degree-of-Belief and Degree-of-Support: Why Bayesians Need Both Notions”, Mind, 114(454): 277–320. doi:10.1093/mind/fzi277

  • –––, 2009, “The Lockean Thesis and the Logic of Belief”, in Franz Huber and Christoph Schmidt-Petri (eds.), Degrees of Belief, (Synthese Library, 342), Dordrecht: Springer, pp. 49–74. doi:10.1007/978-1-4020-9198-8_3

  • Hawthorne, James and Luc Bovens, 1999, “The Preface, the Lottery, and the Logic of Belief”, Mind, 108(430): 241–264. doi:10.1093/mind/108.430.241

  • Hawthorne, James and Branden Fitelson, 2004, “Discussion: Re-solving Irrelevant Conjunction With Probabilistic Independence”, Philosophy of Science, 71(4): 505–514. doi:10.1086/423626

  • Hellman, Geoffrey, 1997, “Bayes and Beyond”, Philosophy of Science, 64(2): 191–221. doi:10.1086/392548

  • Hempel, Carl G., 1945, “Studies in the Logic of Confirmation”, Mind, 54(213): 1–26, 54(214):97–121. doi:10.1093/mind/LIV.213.1 doi:10.1093/mind/LIV.214.97

  • Horwich, Paul, 1982, Probability and Evidence, Cambridge: Cambridge University Press. doi:10.1017/CBO9781316494219

  • Howson, Colin, 1997, “A Logic of Induction”, Philosophy of Science, 64(2): 268–290. doi:10.1086/392551

  • –––, 2000, Hume’s Problem: Induction and the Justification of Belief, Oxford: Oxford University Press. doi:10.1093/0198250371.001.0001

  • –––, 2002, “Bayesianism in Statistics“, in Swinburne 2002: 39–71. doi:10.5871/bacad/9780197263419.003.0003

  • –––, 2007, “Logic With Numbers”, Synthese, 156(3): 491–512. doi:10.1007/s11229-006-9135-8

  • Howson, Colin and Peter Urbach, 1993, Scientific Reasoning: The Bayesian Approach, La Salle, IL: Open Court. [3rd edition, 2005.]

  • Huber, Franz, 2005a, “Subjective Probabilities as Basis for Scientific Reasoning?” British Journal for the Philosophy of Science, 56(1): 101–116. doi:10.1093/phisci/axi105

  • –––, 2005b, “What Is the Point of Confirmation?” Philosophy of Science, 72(5): 1146–1159. doi:10.1086/508961

  • Jaynes, Edwin T., 1968, “Prior Probabilities”, IEEE Transactions on Systems Science and Cybernetics, SSC–4(3): 227–241. doi:10.1109/TSSC.1968.300117

  • Jeffrey, Richard C., 1983, The Logic of Decision, 2nd edition, Chicago: University of Chicago Press.

  • –––, 1987, “Alias Smith and Jones: The Testimony of the Senses”, Erkenntnis, 26(3): 391–399. doi:10.1007/BF00167725

  • –––, 1992, Probability and the Art of Judgment, New York: Cambridge University Press. doi:10.1017/CBO9781139172394

  • –––, 2004, Subjective Probability: The Real Thing, Cambridge: Cambridge University Press. doi:10.1017/CBO9780511816161

  • Jeffreys, Harold, 1939, Theory of Probability, Oxford: Oxford University Press.

  • Joyce, James M., 1998, “A Nonpragmatic Vindication of Probabilism”, Philosophy of Science, 65(4): 575–603. doi:10.1086/392661

  • –––, 1999, The Foundations of Causal Decision Theory, New York: Cambridge University Press. doi:10.1017/CBO9780511498497

  • –––, 2003, “Bayes’ Theorem”, in the Stanford Encyclopedia of Philosophy, (Summer 2003 Edition), Edward N. Zalta (ed.), URL = <Bayes' Theorem (Stanford Encyclopedia of Philosophy/Winter 2003 Edition)>

  • –––, 2004, “Bayesianism”, in Alfred R. Mele and Piers Rawling (eds.), The Oxford Handbook of Rationality, Oxford: Oxford University Press, pp. 132–153. doi:10.1093/0195145399.003.0008

  • –––, 2005, “How Probabilities Reflect Evidence”, Philosophical Perspectives, 19: 153–179. doi:10.1111/j.1520-8583.2005.00058.x

  • Kaplan, Mark, 1996, Decision Theory as Philosophy, Cambridge: Cambridge University Press.

  • Kelly, Kevin T., Oliver Schulte, and Cory Juhl, 1997, “Learning Theory and the Philosophy of Science”, Philosophy of Science, 64(2): 245–267. doi:10.1086/392550

  • Keynes, John Maynard, 1921, A Treatise on Probability, London: Macmillan and Co.

  • Kolmogorov, A.N., 1956, Foundations of the Theory of Probability (Grundbegriffe der Wahrscheinlichkeitsrechnung, 2nd edition, New York: Chelsea Publishing Company.

  • Koopman, B.O., 1940, “The Bases of Probability”, Bulletin of the American Mathematical Society, 46(10): 763–774. Reprinted in H. Kyburg and H. Smokler (eds.), 1980, Studies in Subjective Probability, 2nd edition, Huntington, NY: Krieger Publ. Co. [Koopman 1940 available online]

  • Kyburg, Henry E., Jr., 1974, The Logical Foundations of Statistical Inference, Dordrecht: Reidel. doi:10.1007/978-94-010-2175-3

  • –––, 1977, “Randomness and the Right Reference Class”, Journal of Philosophy, 74(9): 501–520. doi:10.2307/2025794

  • –––, 1978, “An Interpolation Theorem for Inductive Relations”, Journal of Philosophy, 75:93–98.

  • –––, 2006, “Belief, Evidence, and Conditioning”, Philosophy of Science, 73(1): 42–65. doi:10.1086/510174

  • Lange, Marc, 1999, “Calibration and the Epistemological Role of Bayesian Conditionalization”, Journal of Philosophy, 96(6): 294–324. doi:10.2307/2564680

  • –––, 2002, “Okasha on Inductive Scepticism”, The Philosophical Quarterly, 52(207): 226–232. doi:10.1111/1467-9213.00264

  • Laudan, Larry, 1997, “How About Bust? Factoring Explanatory Power Back into Theory Evaluation”, Philosophy of Science, 64(2): 206–216. doi:10.1086/392553

  • Lenhard Johannes, 2006, “Models and Statistical Inference: The Controversy Between Fisher and Neyman-Pearson”, British Journal for the Philosophy of Science, 57(1): 69–91. doi:10.1093/bjps/axi152

  • Levi, Isaac, 1967, Gambling with Truth: An Essay on Induction and the Aims of Science, New York: Knopf.

  • –––, 1977, “Direct Inference”, Journal of Philosophy, 74(1): 5–29. doi:10.2307/2025732

  • –––, 1978, “Confirmational Conditionalization”, Journal of Philosophy, 75(12): 730–737. doi:10.2307/2025516

  • –––, 1980, The Enterprise of Knowledge: An Essay on Knowledge, Credal Probability, and Chance, Cambridge, MA: MIT Press.

  • Lewis, David, 1980, “A Subjectivist’s Guide to Objective Chance”, in Richard C. Jeffrey, (ed.), Studies in Inductive Logic and Probability, vol. 2, Berkeley: University of California Press, 263–293.

  • Maher, Patrick, 1993, Betting on Theories, Cambridge: Cambridge University Press.

  • –––, 1996, “Subjective and Objective Confirmation”, Philosophy of Science, 63(2): 149–174. doi:10.1086/289906

  • –––, 1997, “Depragmatized Dutch Book Arguments”, Philosophy of Science, 64(2): 291–305. doi:10.1086/392552

  • –––, 1999, “Inductive Logic and the Ravens Paradox”, Philosophy of Science, 66(1): 50–70. doi:10.1086/392676

  • –––, 2004, “Probability Captures the Logic of Scientific Confirmation”, in Christopher Hitchcock (ed.), Contemporary Debates in Philosophy of Science, Oxford: Blackwell, 69–93.

  • –––, 2005, “Confirmation Theory”, The Encyclopedia of Philosophy, 2nd edition, Donald M. Borchert (ed.), Detroit: Macmillan.

  • –––, 2006a, “The Concept of Inductive Probability”, Erkenntnis, 65(2): 185–206. doi:10.1007/s10670-005-5087-5

  • –––, 2006b, “A Conception of Inductive Logic”, Philosophy of Science, 73(5): 513–523. doi:10.1086/518321

  • –––, 2010, “Bayesian Probability”, Synthese, 172(1): 119–127. doi:10.1007/s11229-009-9471-6

  • Mayo, Deborah G., 1996, Error and the Growth of Experimental Knowledge, Chicago: University of Chicago Press.

  • –––, 1997, “Duhem’s Problem, the Bayesian Way, and Error Statistics, or ‘What’s Belief Got to do with It?’”, Philosophy of Science, 64(2): 222–244. doi:10.1086/392549

  • Mayo Deborah and Aris Spanos, 2006, “Severe Testing as a Basic Concept in a Neyman-Pearson Philosophy of Induction“, British Journal for the Philosophy of Science, 57(2): 323–357. doi:10.1093/bjps/axl003

  • McGee, Vann, 1994, “Learning the Impossible”, in E. Eells and B. Skyrms (eds.), Probability and Conditionals: Belief Revision and Rational Decision, New York: Cambridge University Press, 179–200.

  • McGrew, Timothy J., 2003, “Confirmation, Heuristics, and Explanatory Reasoning”, British Journal for the Philosophy of Science, 54: 553–567.

  • McGrew, Lydia and Timothy McGrew, 2008, “Foundationalism, Probability, and Mutual Support”, Erkenntnis, 68(1): 55–77. doi:10.1007/s10670-007-9062-1

  • Neyman, Jerzy and E.S. Pearson, 1967, Joint Statistical Papers, Cambridge: Cambridge University Press.

  • Norton, John D., 2003, “A Material Theory of Induction”, Philosophy of Science, 70(4): 647–670. doi:10.1086/378858

  • –––, 2007, “Probability Disassembled”, British Journal for the Philosophy of Science, 58(2): 141–171. doi:10.1093/bjps/axm009

  • Okasha, Samir, 2001, “What Did Hume Really Show About Induction?”, The Philosophical Quarterly, 51(204): 307–327. doi:10.1111/1467-9213.00231

  • Popper, Karl, 1968, The Logic of Scientific Discovery, 3rd edition, London: Hutchinson.

  • Quine, W.V., 1953, “Two Dogmas of Empiricism”, in From a Logical Point of View, New York: Harper Torchbooks. Routledge Encyclopedia of Philosophy, Version 1.0, London: Routledge

  • Ramsey, F.P., 1926, “Truth and Probability”, in Foundations of Mathematics and other Essays, R.B. Braithwaite (ed.), Routledge & P. Kegan,1931, 156–198. Reprinted in Studies in Subjective Probability, H. Kyburg and H. Smokler (eds.), 2nd ed., R.E. Krieger Publishing Company, 1980, 23–52. Reprinted in Philosophical Papers, D.H. Mellor (ed.), Cambridge: University Press, Cambridge, 1990,

  • Reichenbach, Hans, 1938, Experience and Prediction: An Analysis of the Foundations and the Structure of Knowledge, Chicago: University of Chicago Press.

  • Rényi, Alfred, 1970, Foundations of Probability, San Francisco, CA: Holden-Day.

  • Rosenkrantz, R.D., 1981, Foundations and Applications of Inductive Probability, Atascadero, CA: Ridgeview Publishing.

  • Roush, Sherrilyn , 2004, “Discussion Note: Positive Relevance Defended”, Philosophy of Science, 71(1): 110–116. doi:10.1086/381416

  • –––, 2006, “Induction, Problem of”, Sarkar and Pfeifer 2006..

  • –––, 2006, Tracking Truth: Knowledge, Evidence, and Science, Oxford: Oxford University Press.

  • Royall, Richard M., 1997, Statistical Evidence: A Likelihood Paradigm, New York: Chapman & Hall/CRC.

  • Salmon, Wesley C., 1966, The Foundations of Scientific Inference, Pittsburgh, PA: University of Pittsburgh Press.

  • –––, 1975, “Confirmation and Relevance”, in H. Feigl and G. Maxwell (eds.), Induction, Probability, and Confirmation, (Minnesota Studies in the Philosophy of Science, 6), Minneapolis: University of Minnesota Press, 3–36.

  • Sarkar, Sahotra and Jessica Pfeifer (eds.), 2006, The Philosophy of Science: An Encyclopedia, 2 volumes, New York: Routledge.

  • Savage, Leonard J., 1954, The Foundations of Statistics, John Wiley (2nd ed., New York: Dover 1972).

  • Savage, Leonard J., et al., 1962, The Foundations of Statistical Inference, London: Methuen.

  • Schlesinger, George N., 1991, The Sweep of Probability, Notre Dame, IN: Notre Dame University Press.

  • Seidenfeld, Teddy, 1978, “Direct Inference and Inverse Inference”, Journal of Philosophy, 75(12): 709–730. doi:10.2307/2025515

  • –––, 1992, “R.A. Fisher’s Fiducial Argument and Bayes’ Theorem”, Statistical Science, 7(3): 358–368. doi:10.1214/ss/1177011232

  • Shafer, Glenn, 1976, A Mathematical Theory of Evidence, Princeton, NJ: Princeton University Press.

  • –––, 1990, “Perspectives on the Theory and Practice of Belief Functions”, International Journal of Approximate Reasoning, 4(5–6): 323–362. doi:10.1016/0888-613X(90)90012-Q

  • Skyrms, Brian, 1984, Pragmatics and Empiricism, New Haven, CT: Yale University Press.

  • –––, 1990, The Dynamics of Rational Deliberation, Cambridge, MA: Harvard University Press.

  • –––, 2000, Choice and Chance: An Introduction to Inductive Logic, 4th edition, Belmont, CA: Wadsworth, Inc.

  • Sober, Elliott, 2002, “Bayesianism—Its Scope and Limits”, in Swinburne 2002: 21–38. doi:10.5871/bacad/9780197263419.003.0002

  • Spohn, Wolfgang, 1988, “Ordinal Conditional Functions: A Dynamic Theory of Epistemic States”, in William L. Harper and Brian Skyrms (eds.), Causation in Decision, Belief Change, and Statistics, vol. 2, Dordrecht: Reidel, 105–134. doi:10.1007/978-94-009-2865-7_6

  • Strevens, Michael, 2004, “Bayesian Confirmation Theory: Inductive Logic, or Mere Inductive Framework?” Synthese, 141(3): 365–379. doi:10.1023/B:SYNT.0000044991.73791.f7

  • Suppes, Patrick, 2007, “Where do Bayesian Priors Come From?” Synthese, 156(3): 441–471. doi:10.1007/s11229-006-9133-x

  • Swinburne, Richard, 2002, Bayes’ Theorem, Oxford: Oxford University Press. doi:10.5871/bacad/9780197263419.001.0001

  • Talbot, W., 2001, “Bayesian Epistemology”, in the Stanford Encyclopedia of Philosophy, (Fall 2001 Edition), Edward N. Zalta (ed.), URL = <Bayesian Epistemology (Stanford Encyclopedia of Philosophy/Fall 2001 Edition)>

  • Teller, Paul, 1976, “Conditionalization, Observation, and Change of Preference”, in Harper and Hooker 1976: 205–259. doi:10.1007/978-94-010-1853-1_9

  • Van Fraassen, Bas C., 1983, “Calibration: A Frequency Justification for Personal Probability ”, in R.S. Cohen and L. Laudan (eds.), Physics, Philosophy, and Psychoanalysis: Essays in Honor of Adolf Grunbaum, Dordrecht: Reidel. doi:10.1007/978-94-009-7055-7_15

  • Venn, John, 1876, The Logic of Chance, 2nd ed., Macmillan and co; reprinted, New York, 1962.

  • Vineberg, Susan, 2006, “Dutch Book Argument”, Sarkar and Pfeifer 2006..

  • Vranas, Peter B.M., 2004, “Hempel’s Raven Paradox: A Lacuna in the Standard Bayesian Solution”, British Journal for the Philosophy of Science, 55(3): 545–560. doi:10.1093/bjps/55.3.545

  • Weatherson, Brian, 1999, “Begging the Question and Bayesianism”, Studies in History and Philosophy of Science [Part A], 30(4): 687–697. doi:10.1016/S0039-3681(99)00020-5

  • Williamson, Jon, 2007, “Inductive Influence”, British Journal for Philosophy of Science, 58(4): 689–708. doi:10.1093/bjps/axm032

  • Zadeh, Lotfi A., 1965, “Fuzzy Sets”, Information and Control, 8(3): 338–353. doi:10.1016/S0019-9958(65)90241-X

  • –––, 1978, “Fuzzy Sets as a Basis for a Theory of Possibility”, Fuzzy Sets and Systems, vol. 1, 3–28.

Academic Tools

Other Internet Resources

  • Confirmation and Induction. Really nice overview by Franz Huber in the Internet Encyclopedia of Philosophy.

  • Inductive Logic, (in PDF), by Branden Fitelson, Philosophy of Science: An Encyclopedia, (J. Pfeifer and S. Sarkar, eds.), Routledge. An extensive encyclopedia article on inductive logic.

  • Teaching Theory of Knowledge: Probability and Induction. A very extensive outline of issues in Probability and Induction, each topic accompanied by a list of relevant books and articles (without links), compiled by Brad Armendt and Martin Curd.

  • Bayesian Networks Without Tears, (in PDF), by Eugene Charniak (Computer Science and Cognitive Science, Brown University). An introductory article on Bayesian inference.

  • Miscellany of Works on Probabilistic Thinking. A collection of on-line articles on Subjective Probability and probabilistic reasoning by Richard Jeffrey and by several other philosophers writing on related issues.

  • Fitelson’s course on Confirmation Theory. Main page of Branden Fitelson’s course on Confirmation Theory. The Syllabus provides an extensive list of links to readings. The Notes, Handouts, & Links page has Fitelson’s weekly course notes and some links to useful internet resources on confirmation theory.

  • Fitelson’s course on Probability and Induction. Main page of Branden Fitelson’s course on Probability and Induction. The Syllabus provides an extensive list of links to readings on the subject. The Notes & Handouts page has Fitelson’s powerpoint slides for each of his lectures and some links to handouts for the course. The Links page contains links to some useful internet resources.

Bayes’ Theorem | epistemology: Bayesian | probability, interpretations of

Acknowledgments

Thanks to Alan Hájek, Jim Joyce, and Edward Zalta for many valuable comments and suggestions. The editors and author also thank Greg Stokley and Philippe van Basshuysen for carefully reading an earlier version of the entry and identifying a number of typographical errors.

Copyright © 2018 by James Hawthorne <hawthorne@ou.edu>

最后更新于

Logo

道长哲学研讨会 2024