归纳问题 problem of (Leah Henderson)

首次发表于 2018 年 3 月 21 日星期三;实质性修订于 2022 年 11 月 22 日星期二

我们通常认为我们所做的观察能够证明我们尚未进行的观察的某些期望或预测,以及超越观察的一般性主张。例如,对某种外观的面包迄今为止具有滋养作用的观察似乎证明了我吃下一块类似的面包也会有滋养作用的期望,以及这种类型的面包通常具有滋养作用的主张。从观察到未观察到的,或者到一般规律的这种推理被称为“归纳推理”。

所谓“归纳问题”的最初来源是大卫·休谟于 1739 年出版的《人性论》第一卷第三部分第 6 节(Hume 1739)。1748 年,休谟在《人类理解研究》第四节中给出了该论证的较短版本(Hume 1748)。在本文中,我们将把《人性论》引用为“T”,将《人类理解研究》引用为“E”。

休谟问我们基于归纳推理的根据如何形成对未观察到的事物的信念。他以一种二难的形式提出了一个论证,似乎排除了从前提到归纳推理的结论的任何推理可能性。他说,有两种可能的论证类型,“演绎”和“可能性”,但都不适用。演绎论证得出了错误的结论,而可能性论证将是循环论证。因此,对于休谟来说,问题仍然是如何解释为什么我们形成超越我们经历过的过去实例的任何结论(T. 1.3.6.10)。休谟强调,他并不争论我们确实进行这种推理。正如他所看到的那样,挑战在于理解推理的“基础”——它所依据的“逻辑”或“论证过程”(E. 4.2.21)。在回避休谟对解决这个挑战的可能性的论证的同时,如何解决这个挑战的问题被称为“归纳问题”。

休谟的论证是哲学中最著名的之一。许多哲学家试图解决这个问题,但有相当一部分人接受了他的结论,即这个问题是无法解决的。对于这个问题的重要性,意见也存在广泛的谱系。有人认为休谟的论证并没有得出任何深远的怀疑性结论,要么是因为从未打算如此,要么是因为论证在某种程度上被错误地构建了。然而,许多人认为这是一个最深刻的哲学挑战,因为它似乎质疑了我们形成知识的最基本方式之一的合理性。例如,伯特兰·罗素(Bertrand Russell)认为,如果休谟的问题无法解决,“理智和疯狂之间就没有智力上的区别”(Russell 1946: 699)。

在本文中,我们首先将研究休谟自己的论证,对其进行重建,然后调查对其提出的问题的不同回应。


1. 休谟的归纳问题

休谟将归纳问题作为对因果关系概念进行分析的一部分引入。休谟在早期现代时期广泛流行的观念中,心灵被称为“观念”的心理实体所填充。休谟认为,最终我们所有的观念都可以追溯到感官经验的“印象”。在最简单的情况下,一个观念通过从相应的印象中“复制”进入心灵(T. 1.1.1.7/4)。更复杂的观念则是由简单观念的组合而产生的(E. 2.5/19)。休谟认为观念之间存在一些关系,包括因果关系(E. 3.2)。 (有关休谟的哲学的更多信息,请参见 Morris&Brown 2014)。

对于休谟来说,因果关系是唯一一种“我们可以超越记忆和感官证据的证据”(E. 4.1.4,T. 1.3.2.3/74)的关系。假设我们的感官中有一个物体存在:比如火药。然后我们可以推断出该物体的一个效果:比如爆炸。因果关系将我们的过去和现在的经验与我们对未来的期望联系起来(E. 4.1.4/26)。

休谟认为,我们不能仅凭先验手段进行因果推断(E. 4.1.7)。相反,他声称,它是基于经验,特别是经验的恒常联结。我们推断火药将会爆炸,是基于过去经验中火药和爆炸之间的关联。

休谟想要更多地了解这种推理的基础。如果这样的推理是通过“推理链”(E. 4.2.16)进行的,他说,他想知道这种推理是什么。总的来说,他声称这些推理依赖于以下形式的转变:

我发现这样一个对象总是伴随着这样一个效果,我预见到其他外观相似的对象也会伴随着类似的效果。(E. 4.2.16)

在《论人类理解》中,休谟说道

如果理由决定了我们,那么它将基于这样一个原则:我们没有经验的实例必须类似于我们有经验的实例,并且自然的过程始终保持一致。(T. 1.3.6.4)

为了方便起见,我们将把观察到的和未观察到的规律之间的相似性或相似性的主张称为“统一性原则(UP)”。有时它也被称为“相似性原则”或“自然统一原则”。

休谟随后提出了他著名的论证,得出结论:这个原则背后没有推理。这个论证采取了二难的形式。休谟区分了思想关系和事实问题。思想关系包括几何、代数和算术命题,“总之,每个肯定的陈述都是直观或证明确凿的”。另一方面,“事实问题”是经验性命题,可以很容易地被构想成与它们不同。休谟说

所有的推理可以分为两种,即演绎推理,即涉及观念关系的推理,和道德推理,即涉及事实和存在的推理。(E. 4.2.18)

休谟依次考虑了这两种推理的可能性,并在每种情况下都认为它们无法为统一原则提供论证。

首先,休谟认为这种推理不能是演绎的,因为演绎推理只能得出不可能被认为是错误的结论。而且,他说,

它暗示着自然的进程可能会改变,并且一个看似与我们经历过的相似的对象可能会产生不同或相反的效果。(E. 4.2.18)

他说,我们可以清楚地、明确地构想出一种情况,即未观察到的情况不遵循迄今为止观察到的规律。(E. 4.2.18,T. 1.3.6.5/89)

其次,休谟认为这种推理也不能是“涉及事实和真实存在的推理”。他还称之为“可能性”推理。他声称,所有这样的推理“都是基于未来将与过去一致的假设”,换句话说,是基于统一性原则。(E. 4.2.19)

因此,如果推理的链条是基于这种论证的话,它将再次依赖于这个假设,“并且将那个问题的核心视为理所当然”。(E. 4.2.19,另见 T. 1.3.6.7/90)。然后,第二种类型的推理无法提供一个不循环的推理链条。

在《论人性》版本中,休谟得出结论

因此,不仅我们的理性在发现原因和效果的最终联系时失败,而且即使经验告诉我们它们的不断结合,我们也无法通过理性来满足自己,为什么我们应该将那种经验扩展到我们观察到的那些特定情况之外。(T. 1.3.6.11/91–2)

归纳问题的结论是,我们将过去的规律投射到未来的倾向并没有理性的支持。尽管休谟提出了他的论证,归纳问题是要找到一种避免这个结论的方法。

在提出问题之后,休谟确实提出了他自己对他所提出的疑问的“解决方案”(E. 5, T. 1.3.7–16)。这包括对归纳推理的解释,即如果不是理性驱动,那么是由什么驱动的。在《论人类理解》中,休谟以明确对比的方式提出了归纳问题。他问这种推理中涉及的转变是通过理解还是想象产生的;我们是被理性决定进行转变,还是通过某种感知的关联和关系决定的?(T. 1.3.6.4)

by means of the understanding or imagination; whether we are determin’d by reason to make the transition, or by a certain association and relation of perceptions? (T. 1.3.6.4)

他继续总结这个结论,说

因此,当思维从一个对象的观念或印象转移到另一个对象的观念或信念时,它并不是由理性决定的,而是由某些原则决定的,这些原则将这些对象的观念联系在一起,并在想象中将它们统一起来。(T. 1.3.6.12)

因此,被认为是想象力支撑归纳推理的基础,而不是理性。

在《询问》中,休谟提出了心灵所采取的一步,

这一步没有任何论证或理解过程的支持...必须由其他同等重要和权威的原则归纳出来。(E. 5.1.2)

这个原则就是“习惯”或“习性”。其观点是,如果一个人不断地看到类似的物体或事件相互关联,那么心灵就倾向于期望未来也会保持类似的规律性。这种推断的倾向或“倾向性”是习惯的结果:

…在许多情况下发现,任何两种物体,如火焰和热、雪和寒冷,总是相互结合在一起;如果火焰或雪重新呈现在感官中,习惯会使心灵期待热或冷,并相信这样的品质确实存在,并会在更近的接触中显现出来。这种信念是将心灵置于这种情况下的必然结果。当我们处于这种境地时,这是灵魂的一种运作,就像当我们受益时感受到爱情,或者当我们遭受伤害时感受到仇恨一样。所有这些运作都是一种自然本能的一种形式,无论是推理还是思考和理解的过程都无法产生或阻止。(E. 5.1.8)

休谟认为,这些推论确实遵循自然的规律是一种“预先设定的和谐”(E. 5.2.21)。这是一种自然的本能,实际上可能比依靠理性进行这些推论更能使我们在世界上取得成功。

2. 重建

Hume 的论证已经以许多不同的版本呈现和形成。对于 Hume 本人对这个论证的历史解释,也存在着持续而活跃的讨论。因此,很难提供一个明确而无争议的 Hume 论证重建。尽管如此,为了组织本文中将讨论的对 Hume 问题的不同回应,以下重建将作为一个有用的起点。

Hume 的论证涉及特定的归纳推理,例如:

所有观察到的 A 的实例都是 B。

A 的下一个实例将是 B。

让我们称之为“推理 I”。属于这种模式的推理现在通常被称为“简单的枚举归纳”的案例。

休谟自己的例子是:

所有观察到的面包实例(具有特定外观)都是有营养的。

下一个具有该外观的面包实例将是有营养的。

休谟的论证如下(前提标记为 P,子结论和结论标记为 C):

P1.

有两种类型的论证:指示性和概率性(休谟的叉子)。

P2.

推理 I 假设了统一性原则(UP)。

  • 第一种观点:*

P3.

一个示范性的论证建立了一个其否定是一个矛盾的结论。

P4.

归纳问题的否定不是一个矛盾。

C1.

对于 UP(通过 P3 和 P4)没有证明性的论证。

  • 第二个问题:归纳问题。*

P5.

任何对归纳问题的可能论证都预设了归纳问题。

P6.

一个原则的论证不能预设相同的原则(非循环性)。

C2.

通过 P5 和 P6,没有对 UP 的可能性论证。

  • 归纳问题:*

C3.

没有关于 UP 的论证(根据 P1,C1 和 C2)。

P7.

如果没有对 UP 的论证,那么就没有从前提到任何假设 UP 的推理的结论的推理链。

C4.

从前提到推理 I 的结论中没有推理链(根据 P2,C3 和 P7)。

P8。

如果从前提到推理 I 的结论中没有推理链,那么推理是不合理的。

C5.

推理 I 没有被证明是合理的(通过 C4 和 P8)。

对于休谟所说的“演绎”和“概率”论证有不同的解释。有时,“演绎”被等同于“推理”,而“概率”被等同于“归纳”(例如,Salmon 1966)。然后,休谟的两难困境的第一个角会排除演绎论证的可能性,而第二个角会排除归纳论证的可能性。然而,在这种解释下,前提 P3 将不成立,因为演绎论证的结论可以是一个非必要命题。前提 P3 可以修改为演绎(推理)论证建立的结论如果前提为真则不能为假。但是,这样一来,未来类似于过去的假设(这不是一个必要命题)可以通过一些前提的演绎论证来建立,尽管不能通过先验前提来建立(与结论 C1 相矛盾)。

另一种常见的解读是将“演绎有效的先验前提”等同于“指示性”,将“具有经验前提的”等同于“可能性”(例如,Okasha 2001)。如果一个人认为,可以先验地知道的前提不能是错误的,因此是必然的,那么这种解读可能更接近真相,就像休谟似乎认为的那样。如果推理是演绎有效的,那么从先验前提推理得出的结论也必然是必然的。那么,这个两难困境的第一个角度排除了具有先验前提的演绎有效的论证的可能性,而第二个角度排除了任何依赖于经验前提的论证(无论是演绎的还是非演绎的)的可能性。

然而,最近的评论者认为,在休谟所处的历史背景下,他所区分的指示性和可能性的论证与论证是否具有演绎形式无关(Owen 1999;Garrett 2002)。此外,建立出其否定是矛盾的结论的推理类别可能不仅包括从先验前提中演绎有效的推理,还包括使用先验推理(即,在从前提到结论的过程中不依赖于我们从观察中学到的东西的推理)得出的任何推理。似乎休谟确实意味着第一个角度的论证排除了任何先验推理,因为他说自然规律的变化不能被“任何演绎论证或先验的抽象推理”所排除(E. 5.2.18)。根据这种理解,先验论证将被休谟的两难困境的第一个角度排除,经验论证将被第二个角度排除。这是我在本文中采用的解释。

在休谟的论证中,归纳问题起着核心作用。正如我们将在第 4.2 节中看到的那样,各种作者对这个原则表示怀疑。休谟的论证也可以不引用归纳原则而直接回答一个问题,即在特定归纳推理 I 的前提和结论之间可以给出什么样的论证。例如,有什么样的论证可以让我们从迄今为止对有营养的面包的观察中推断出下一块面包也会有营养?对于论证的第一个角,休谟的论证可以直接应用。一个演绎论证建立了一个其否定是矛盾的结论。归纳推理的结论的否定并不是矛盾的。下一块面包没有营养并不是矛盾的。因此,对于归纳推理的结论没有演绎论证。在论证的第二个角,休谟提出的问题是循环性。即使休谟错误地认为所有归纳推理都依赖于归纳原则,仍然可能存在循环性问题,但正如我们将在第 4.1 节中看到的那样,循环性的确切性质需要仔细考虑。但目前的主要观点是,休谟的论证通常在不引用归纳原则的情况下进行。

由于休谟的论证是一个两难问题,有两种主要的抵抗方式。第一种是解决第一个角,并辩称实际上存在一个演绎论证(在这里指基于先验推理的论证),可以证明归纳推理的合理性。第二种是解决第二个角,并辩称实际上存在一个可能的(或经验的)论证,可以证明归纳推理的合理性。我们在第 3 节和第 4 节中讨论了这两种方法的不同变体。

也有人对这个困境的后果提出质疑。例如,一些学者否认休谟应该被解读为根本没有引用前提 P8。他们声称的原因是,他并不追求一个明确的关于合理化的结论,比如 C5。休谟确实是在寻求从归纳推理的前提到结论的“推理链”,他认为为了完成这个链条,需要对 UP 进行论证。然而,人们可以认为关于合理化没有进一步的前提,所以他的论证的结论只是 C4:从前提到归纳推理的结论没有推理链。休谟可能是在推进一个“认知心理学的论题”,而不是对合理化的规范性主张(Owen 1999;Garrett 2002)。这个论题是关于推理背后的认知过程的本质。根据 Garrett 的观点,休谟论证的主要结论是,没有推理过程能够建立 UP。对于 Owen 来说,这个论题的意思是,推理不是通过由中介链接连接的思想链条来进行的,这是理性能力的特征。

也有解释者认为,休谟只是试图排除一种特定的归纳合理化,这种合理化基于他那个时代理性主义者主导的理性观念,而不是一般的合理化(Beauchamp & Rosenberg 1981;Baier 2009)。特别是,有人声称这是“试图驳斥理性主义者的信念,即至少有些归纳论证是证明性的”(Beauchamp & Rosenberg 1981: xviii)。根据这种解释,前提 P8 应该修改为类似以下的内容:

  • 如果没有基于证明性论证的推理链从前提到推理 I 的结论,那么推理 I 就没有合理化。

然而,这样的解释确实面临一个问题,即休谟的论证明确是一个双管齐下的攻击,涉及的不仅仅是证明性论证,还有可能性论证。

如何将规范性结论归因于休谟是一个复杂的问题。这在一定程度上取决于对休谟自己解决问题的解释。正如我们在第 1 节中看到的,休谟将归纳推理的基础归因于《论人类理解》中的想象力原则,以及《询问人类理解的原则》中的“习惯”,被认为是一种自然本能。问题是,即使不是基于理性,这种替代方案是否为推理提供了任何形式的理由。乍一看,似乎休谟在暗示归纳推理完全是基于非理性的基础上进行的。他显然并不认为它们不能产生良好的结果。事实上,休谟甚至暗示这种心智操作甚至可能比“我们的理性的谬误推论,其操作缓慢”更少“容易出错和错误”(E. 5.2.22)。而且,他并不认为想象力的运作完全没有理性。首先,休谟谈到想象力受原则的支配。在《论人类理解》的后面,他甚至给出了描述什么样的好的因果推理应该是“规则”和“逻辑”(T. 1.3.15)。他还明确认为可以区分出更好的这种“推理”形式。因此,有理由认为休谟并不是试图主张归纳推理没有任何理性基础,而只是它们没有以理性的形式为根基。

这一切表明,关于休谟自己结论的预期范围存在争议的空间。因此,关于连接他的论证的其余部分与规范性结论之间的前提(如前提 P8)应该采取什么形式也存在争议。然而,无论谁在这方面是正确的,事实仍然是,休谟在历史上一直被主要解读为提出归纳怀疑论的论证。

有一些方法有效地(即使不是明确地)对前提 P8 提出异议,并认为从前提到结论的推理链并不是归纳推理合理化的必要条件。根据这种方法,我们可以承认休谟已经表明归纳推理在我们有理由认为其结论为真的意义上并不合理,但仍然认为归纳推理的较弱形式的合理化是可能的(第 5 节)。最后,有一些哲学家接受怀疑主义结论 C5 并试图容纳它。例如,有人试图论证归纳推理并不像人们通常认为的那样对科学探究至关重要(第 6 节)。

3. 解决休谟困境的第一种方法

休谟的论证的第一个角度,如上所述,旨在证明没有对 UP 的证明性论证。人们试图通过几种方式来表明第一个角度并不能完全排除归纳推理的证明性或先验性论证。从第一个角度逃脱的一种可能途径是否认前提 P3,这相当于承认合成先验命题的可能性(第 3.1 节)。另一种可能性是试图提供一个先验性论证,即推理的结论是可能的,尽管不确定。休谟的困境的第一个角度暗示着不能有一个证明性的论证来证明归纳推理的结论,因为可以构想出结论的否定。例如,很可能想象到我吃下一块面包会毒害我而不是滋养我。然而,这并不排除只能证明面包很可能滋养而不是肯定滋养的证明性论证的可能性。然后,可以质疑前提 P8,即认为证明归纳推理的合理性并不需要从前提到结论的推理链。如果我们从前提到结论是可能或很可能的主张有一个论证,那就足够了。然后,归纳推理的先验性证明就已经提供了。已经试图基于最佳解释推理提供归纳推理的先验性证明(第 3.2 节)。还有试图基于概率形式的归纳推理找到先验性解决方案的尝试,尽管现在许多人认为纯粹的先验性论证是找不到的,因为涉及到经验假设(第 3.3 - 3.5 节)。

3.1 合成先验性

正如我们在第 1 节中所看到的,休谟认为演绎论证的结论是“思想关系”,而“可能的”或“道德的”论证的结论是“事实问题”。休谟对“思想关系”和“事实问题”的区分预示了康德对“分析”和“综合”命题的区分(康德 1781 年)。一个经典的分析命题的例子是“单身汉是未婚男子”,而一个综合命题是“我的自行车轮胎是扁的”。对于休谟来说,基于先验推理的演绎论证只能建立思想关系或分析命题。先验性与分析性之间的关联支持了前提 P3,即演绎论证建立了一个否定就是矛盾的结论。

对休谟问题的一个可能的回应是否认前提 P3,允许先验推理可能导致综合命题的可能性。康德在回应休谟时著名地认为这种综合先验知识是可能的(康德 1781 年,1783 年)。他通过一种逆转休谟所倡导的经验主义计划的方式来做到这一点。休谟试图理解因果或必然联系的概念如何基于经验,而康德则认为经验只是通过理解的概念或“范畴”而产生的。在他的观点中,人们可以通过关于经验必要前提的横渡论证来获得这些概念的先验知识,包括因果关系的概念。关于康德对休谟的回应的更详细说明可以在 de Pierris 和 Friedman 2013 年的著作中找到。

3.2 归纳-解释解决方案

“归纳问题”是指由阿姆斯特朗、邦乔和福斯特(Armstrong 1983;BonJour 1998;Foster 2004)提出的“法则解释”解决方案,该方案依赖于“推理到最佳解释”原则(IBE)。根据 IBE,我们应该推断出提供了最佳解释的假设很可能是真实的。支持“法则解释”方法的人认为,“推理到最佳解释”是一种与休谟试图证明的“外推”归纳推理不同的推理方式。他们还认为,尽管非演绎,但它是一种先验合理的推理方式。例如,阿姆斯特朗说:“推断到最佳解释是理性的一部分。如果这不是理性的,那什么是?”(Armstrong 1983:59)。

先验合理性被认为是分为两个步骤进行的。首先,我们应该认识到某些观察到的规律需要用某种基础法则来解释。例如,如果一个硬币在重复投掷中持续地正面朝上,那么这种情况仅仅因为“偶然”而发生的可能性就越来越不可信。相反,我们应该推断出更好的解释,即这个硬币有一定的偏向。仅仅说这个硬币不仅在观察到的情况下正面朝上,在未观察到的情况下也是如此,并不能解释观察到的规律。因此,单纯的休谟常规联结是不够的。解释所需的是一种“非休谟的、形而上学上强大的客观规律概念”(BonJour 1998),这被认为涉及实际的自然必然性(Armstrong 1983;Foster 2004)。

一旦确定了观察到的规律必须有一种形而上学上强大的解释,第二步就是论证在所有可能的形而上学上强大的解释中,“直接”的归纳解释是最好的解释,其中直接解释将观察到的频率推广到更广泛的人群。例如,假设硬币有一定的正面朝上的机会,到目前为止观察到的 m/n 次正面朝上的事实的最好解释是硬币正面朝上的机会是 m/n。而这种机会不仅决定了观察到的情况,也决定了未观察到的情况。

根据法则解释的解决方案依赖于将 IBE 视为一种理性的、先验的推理形式,它与诸如推理 I 的归纳推理不同。然而,人们也可以将归纳推理视为 IBE 的一种特殊情况(Harman 1968),或者将 IBE 视为表征归纳推理的另一种方式(Henderson 2014)。如果这些观点中的任何一个是正确的,IBE 就没有与归纳推理必要的独立性,无法为其提供非循环的证明。

人们还可以基于这样的理由反对法则解释方法,即规律性不一定需要用必然联系或强大的形而上学定律来解释。该方法的可行性还取决于非休谟法则观念的可持续性。已经有几次严肃的尝试来发展这样的解释(Armstrong 1983;Tooley 1977;Dretske 1977),但也受到了很多批评(参见 J. Carroll 2016)。

另一个关键的反对意见是,即使在归纳的证明中使用 IBE 是合法的,归纳问题的归纳-解释解决方案仍然是在回避问题。在论证的第一步中,我们推断出一个超越迄今为止观察到的时空区域的法则或规律,以预测未来会发生什么。但是,为什么仅适用于观察到的时空区域的法则不能是同样好的解释呢?主要的回答似乎是我们可以从先验上看出,具有时间或空间限制的法则会是较差的解释。福斯特认为,原因是这会引入更多的谜团:

因为在我看来,一个范围仅限于某个特定时期的法则比一个时间上普遍的法则更神秘,本质上更令人困惑。(福斯特 2004)

3.3 贝叶斯解决方案

另一种尝试构建先验论证的方法是利用概率论的形式化。在休谟写作的时候,概率被用来分析游戏的机会。而且一般来说,它们被用来解决一个问题,即在已知某个原因起作用的情况下,我们期望看到什么。这就是所谓的“直接推理”问题。然而,归纳问题涉及到“反向”问题,即根据特定的观察来确定原因或一般假设。

使用概率解决“反向”问题的最早和最重要的方法之一是由托马斯·贝叶斯开发的。贝叶斯的论文包含了主要结果,于 1764 年在他去世后发表(贝叶斯 1764)。然而,这项工作可能在此之前就已经完成,并且实际上是对 1748 年休谟《探究》出版的直接回应(有关历史的已知情况的讨论,请参见 Zabell 1989: 290–93)。

我们将使用从一个瓮中取球的问题来说明贝叶斯方法。假设我们有一个瓮,其中包含未知比例的白球和黑球。我们通过从瓮中取出一个球,记录其颜色,然后再放回去再次取球来从瓮中取样。

首先考虑直接推理的问题。给定瓮中白球的比例,对于给定大小的样本观察,各种结果的概率是多少?假设瓮中白球的比例为 θ=0.6。在一个样本中抽取到一个白球的概率为 p(W; θ=0.6)=0.6。我们还可以使用概率计算规则(参见 Hájek 2011 的第 1 节)计算其他结果的概率,例如在一个样本中抽取到两个白球的概率。一般来说,在大小为 N 的样本中抽取到 nw 个白球的概率由二项分布给出:

p(nw; θ=x)=(Nnw)xnw(1−x)(N−nw)

这是一个“抽样分布”p(E∣H)的具体示例,它给出了在假设某个假设 H 为真的情况下,样本中出现某些证据 E 的概率。根据概率计算规则,可以事先计算出抽样分布。

然而,归纳问题是一个相反的问题。我们想要推断的不是在已知假设下样本会是什么样子,而是基于有限样本的观察来推断关于总体情况或人口的假设。候选假设的概率可以用来预测进一步的观察。例如,在乌龟问题中,我们想要知道特定样本频率的观察结果 nwN 对于乌龟中白球比例 θ 的影响。

贝叶斯方法的思想是不仅为构成证据的事件分配概率,还为假设分配概率。我们从对相关假设的“先验概率”分布 p(H)开始。在获得一些证据 E 后,贝叶斯将先验概率 p(H)更新为条件概率 p(H∣E)。这个更新规则被称为“条件化规则”。条件概率 p(H∣E)被称为“后验概率”,并且可以使用贝叶斯定理计算:

p(H∣E)=p(E∣H)p(H)p(E)

在这里,抽样分布可以被视为条件概率 p(E∣H),这被称为证据 E 上假设 H 的“似然性”。

然后可以计算贝叶斯方法中对尚未观察到的数据 E'的预测分布,给定观察到的数据 E。贝叶斯方法中的预测分布由以下公式给出:

p(E'∣E)=∑Hp(E'∣H)p(H∣E)

在 H 是连续变量的情况下,总和变成了积分的问题。

对于瓮的例子,我们可以使用贝叶斯定理计算后验概率 p(θ∣nw),以及由上述二项分布给出的似然。为了这样做,我们还需要为参数 θ 分配一个先验概率分布。一个自然的选择,早期由贝叶斯本人和拉普拉斯提出的选择,是在参数 θ 上放置一个均匀先验。贝叶斯本人对这个选择的理由是,在观察到任何数据之前,仅基于先验计算样本中白球数量的每个值的概率,所有这些概率都是相等的。拉普拉斯有一个不同的理由,基于无差异原则。这个原则指出,如果你没有任何理由支持一个假设胜过另一个,你应该给它们分配相等的概率。

在选择均匀先验的情况下,可以计算后验概率和预测分布。结果表明,给定 N 次抽取中 nw 个白球的情况下,下一个球是白球的概率为

p(w∣nw)=nw+1N+2

这是拉普拉斯著名的“继承规则”(1814 年)。假设基于观察到 100 个中的 90 个白球,我们通过继承规则计算出下一个球是白色的概率为 91/102=0.89。可以想象下一个球可能是黑色的。即使在所有 100 个球都是白色的情况下,下一个球是白色的概率为 0.99,仍然存在一个很小的概率下一个球不是白色的。因此,概率推理提供的不是下一个球将是某种颜色的论证,而是根据过去观察到的内容,对某些未来观察结果非常可能的论证。

总的来说,瓮中之鳖案例中的贝叶斯-拉普拉斯论证提供了一个例子,说明概率推理如何从过去观察到的证据推导出对未来观察结果的可能性预测。问题是,这种计算方法对归纳问题提供了什么样的解决方案,如果有的话。乍一看,由于这只是一个数学计算,似乎确实从归纳推理的前提到一个命题的概率上提供了一种先验的论证。

然而,为了明确地建立这一点,人们需要争论论证的所有组成部分和假设都是先验的,这需要进一步研究至少三个重要问题。

首先,贝叶斯-拉普拉斯论证依赖于概率计算的规则。这些规则的地位是什么?遵循它们是否等同于先验推理?这个问题的答案在一定程度上取决于概率本身的解释。广义上讲,根据某些著名的概率解释,这些规则可能具有先验的地位,并且可以构成一个演示性论证的基础。这些解释包括拉普拉斯(1814 年)最初发展的经典解释,逻辑解释(Keynes(1921 年),Johnson(1921 年),Jeffreys(1939 年),Carnap(1950 年),Cox(1946 年,1961 年)),以及 Ramsey(1926 年),Savage(1954 年)和 de Finetti(1964 年)的主观解释。试图为归纳问题提出概率先验解决方案的努力主要与这些解释相关。

其次,在乌尔恩的情况下,贝叶斯-拉普拉斯论证是基于一个特定的概率模型——二项模型。这涉及到一个假设,即存在一个描述乌尔恩中未知比例 θ 的参数,并且数据是从该参数的分布中独立抽取的。这些假设的基础是什么?它们是否适用于除了实际乌尔恩情况之外的其他情况——也就是说,我们是否可以将一般的观察看作是从“自然之乌尔恩”中抽取的?人们一直担心这些类型的假设,在从乌尔恩中抽取球的情况下是合理的,但在其他归纳推理的情况下可能不成立。因此,归纳问题的概率解决方案可能具有相对有限的适用范围。至少,在这里选择模型时需要明确一些假设。可以说,模型的选择引入了经验假设,这意味着概率解决方案不是一种先验解。

第三,贝叶斯-拉普拉斯论证依赖于特定的先验概率分布选择。这个选择的状态如何,它是否可以基于先验原则?从历史上看,贝叶斯-拉普拉斯选择均匀先验以及整个经典概率的概念都依赖于无差别原则。许多人认为这个原则是一种先验原则。然而,它也受到了很多批评,因为它可能导致不一致的概率分配(Bertrand 1888; Borel 1909; Keynes 1921)。这种不一致是由于有多种方式来划分替代空间,不同的选择会导致冲突的概率分配。拯救无差别原则的一种尝试是诉诸解释主义,并主张该原则只应用于在“最具解释性基本水平”上划分空间,而这个水平是根据先验的解释优先性概念来确定的(Huemer 2009)。

对于先验分配的先验论证的追求已经基本放弃。对于许多人来说,由 Ramsey、de Finetti 和 Savage 发展起来的主观主义基础提供了更令人满意的理解概率的基础。从这个观点来看,试图在概率规则本身所规定的概率之外引入任何进一步的先验约束是错误的。相反,先验的分配可能反映个人观点或背景知识,没有先验是先验性的不合理选择。

到目前为止,我们已经考虑了在假设空间中对假设和观测进行概率论论证的问题。还有一种传统的尝试,即从所有可观测变量的联合概率分布出发,确定我们应该具有哪些概率分布,给定某些观测。然后可以对这个可观测变量的分布直接假设公理,并检查对预测分布的影响。归纳逻辑的许多发展,包括 Carnap 的有影响力的计划,都是以这种方式进行的(Carnap 1950, 1952)。

这种方法有助于澄清概率模型背后的假设的作用。关于观测的一个假设是它们是“可交换的”。这意味着随机变量的联合分布在排列变换下是不变的。非正式地说,这意味着观测的顺序不会影响概率。例如,在乌尔恩的情况下,这意味着先抽取一个白球然后抽取一个黑球与先抽取一个黑球然后抽取一个白球的概率是相同的。De Finetti 证明了一个广义表示定理,即如果假设一个无限序列的随机变量的联合概率分布是可交换的,那么它可以被写成从每个分布函数的混合中,数据的行为就像它们是独立随机抽取的(de Finetti 1964)。在乌尔恩的例子中,该定理表明,数据就像是从一个参数为 θ 的二项分布中独立随机抽取的,而 θ 本身具有先验概率分布。

可交换性的假设可以被看作是对休谟假设“过去类似于未来”的一种自然形式化。这是直观的,因为假设可交换性意味着认为观测的顺序,无论是过去还是未来,对概率分配没有影响。

但是,归纳逻辑的发展揭示了许多概括是可能的。例如,约翰逊提出假设一个他称之为“充分性假设”的公理。这个公理表明,结果可以是多种不同类型的,下一个结果是第 i 类型的条件概率仅取决于先前试验的次数和先前第 i 类型结果的次数(约翰逊 1932 年)。假设对于三种或更多类型的充分性假设会产生一个对应于卡纳普的“归纳方法连续体”的一般预测分布(卡纳普 1952 年)。这个预测分布的形式为:

p(i∣N1,N2,…Nt)=Ni+kN1+N2+⋯+Nt+kt

其中 k 是一个正数。当 t=2 且 k=1 时,这就变成了拉普拉斯的继承法则。

归纳问题的一种解决方法是推广可交换性的概念,例如“部分可交换性”和“马尔可夫可交换性”,并对此进行了探索,这些可以被视为对称性假设的形式(Zabell 1988; Skyrms 2012)。由于对可观测量的概率做出了较少限制的公理,结果是对于预测的概率不再有唯一的结果,而是由上述的一般继承规则所映射出的一整类可能的概率。因此,在这个传统中,就像贝叶斯-拉普拉斯方法一样,我们已经摆脱了产生唯一的先验概率答案的论证。

那么,人们可能会认为,先验分配或相关的可观测概率分布的假设正是经验假设进入归纳推理的地方。概率计算是经验论证,而不是先验论证。如果这是正确的,那么概率框架最终没有提供归纳问题的先验解决方案,而是让我们澄清了什么是休谟主张的归纳推理依赖于均匀性原则。

3.4 部分解决方案

有人认为,尽管归纳问题尚未解决,但在某种意义上存在部分解决方案,被称为“逻辑解决方案”。例如,豪森(Howson)认为,“归纳推理在给定适当前提的情况下是合理的”(Howson 2000: 239,他的强调)。根据这种观点,归纳推理无法摆脱经验前提,但我们仍然可以将贝叶斯条件作为一种类似逻辑或“一致性约束”的功能,它“从假设和观察中生成预测”(Romeijn 2004: 360)。一旦我们有了经验假设,在先验概率中实例化,并且有了观察结果,贝叶斯条件告诉我们应该是什么样的预测概率分布。

部分解决方案的概念也出现在支撑当代机器学习的学习理论中。机器学习是计算机科学领域关注从经验中学习的算法。例如,可以训练识别或分类数据中模式的算法。学习理论关注找到数学定理,保证实际使用的算法的性能。在这个领域中,有一个众所周知的发现,即学习算法只有在具有“归纳偏差”时才有效,也就是说,它们对所应用的领域做出了一些先验假设(Mitchell 1997)。

这个想法在所谓的“无免费午餐定理”(Wolpert 1992, 1996, 1997)中也得到了形式化的表达。这些定理可以解释为休谟第一叉中的论证版本,因为它们证明了算法在表现不佳时不会产生矛盾,因为存在一些先验可能的情况它不会表现好(Sterkenburg 和 Grünwald 2021:9992)。根据休谟的前提 P3,这排除了对其良好性能的证明性论证。

前提 P3 可能会受到质疑,因为可以为偶然命题提供先验的证明。即使归纳推理在某些可能的情况下可能失败,如果我们将信任均匀地分布在所有可能性上,并且有理由认为(或至少没有理由怀疑)归纳推理不可靠的情况需要“非常特定的事物安排”,从而只占据了所有可能性的一小部分空间(White 2015),那么形成可靠性期望仍然是合理的。然而,无免费午餐定理对这种方法提出了困难,因为它们表明,如果我们对未来事件的所有逻辑可能序列进行均匀分布,任何学习算法都预计具有 1/2 的泛化误差,因此不会比随机猜测更好(Schurz 2021b)。

No-Free-Lunch 定理可以被视为对学习算法进行合理化时的基本限制,当这些算法被视为从可能的数据到结论的映射时。然而,学习算法也可以被看作是不仅仅依赖于输入数据,还依赖于特定模型的函数(Sterkenburg 和 Grünwald 2021)。例如,贝叶斯“算法”提供了一个通用的方法,用于根据数据对特定模型和先验进行更新。学习理论中的一些定理为这种方法的性能提供了一般性的保证。例如,有一些定理保证了贝叶斯算法的收敛性(Ghosal,Ghosh 和 van der Vaart 2000,Ghosal,Lember 和 van der Vaart 2008)。在每个实例化中,这种收敛性是相对于特定的先验而言的。因此,尽管首先由休谟提出,并在 No-Free-Lunch 定理中具体实现的考虑因素排除了对学习算法的任何通用模型无关的合理化,但它并不排除以此类一般性的先验“模型相关”学习保证的形式进行部分合理化(Sterkenburg 和 Grünwald 2021)。

3.5 组合方法

利用概率推理产生归纳推理的一种替代尝试是所谓的“组合”解决方案。这最初是由 Donald C. Williams(1947)提出的,后来由 David Stove(1986)发展起来。

像贝叶斯-拉普拉斯论证一样,解决方案在很大程度上依赖于直接从总体到样本的“直接推理”中可以进行直接的先验计算的想法。正如我们所见,给定一定的总体频率,可以基于概率计算规则直接计算出样本中不同频率的概率。贝叶斯-拉普拉斯论证依赖于使用贝叶斯规则将概率分布反转,从抽样分布得到后验分布。相反,威廉姆斯提出逆推理可以基于某种逻辑推论:比例(或统计)推论。

比例推论,或统计推论,如下所示:

  1. 所有 M 中的事物中,m/n 是 P。

  2. a 是一个 M

因此,a 是 P,概率为 m/n。

例如,如果一个兔群中有 90%的兔子是白色的,而我们观察到了一只兔子 a,那么比例三段论说我们可以推断出 a 是白色的,概率为 90%。威廉姆斯认为比例三段论是一种非演绎逻辑三段论,它在蕴涵三段论和归纳问题之间有效地插值。

  1. 所有的 M 都是 P

  2. a 是一个 M

因此,a 是 P。

归纳问题和矛盾的三段论

  1. 没有 M 是 P

  2. a 是 M

因此,a 不是 P。

这种三段论可以与关于越来越大样本行为的观察相结合。通过对抽样分布的计算,可以证明随着样本大小的增加,样本频率在接近总体频率的范围内的概率也增加。事实上,伯努利大数定律指出,随着样本大小趋于无穷大,样本频率接近总体频率的概率趋于 1。威廉姆斯认为,这样的结果支持一个“普遍的总前提,适用于所有归纳,即样本‘匹配’其总体”(威廉姆斯 1947 年:78)。

然后,我们可以将比例三段论应用于从总体中抽取的样本,得到以下论证:

  1. 大多数样本与其总体相匹配

  2. S 是一个样本。

因此,S 与其总体相匹配的概率很高。

这是比例三段论的一个实例,并且它使用关于样本与总体匹配的一般结果作为第一个主要前提。

下一步是论证,如果我们观察到样本包含 m/n 个 F 的比例,那么我们可以得出结论,由于这个样本很可能与其总体匹配,总体很可能具有接近样本频率 m/n 的总体频率。威廉姆斯和斯托夫都声称这等于归纳问题的一个逻辑先验解决方案。

一些作者认为,只有在样本 S 是从可能样本总体中随机抽取的情况下,威廉姆斯-斯托夫的论证才是有效的(布朗 1987 年;威尔 1948 年;吉亚金托 1987 年)。有时这被提出作为对比例三段论应用的反对意见。主张是,只有在从 Ms 总体中随机抽取 a 的情况下,比例三段论才是有效的。然而,对此的回应是,为了应用三段论,没有必要知道样本是随机抽取的(马赫 1996 年;坎贝尔 2001 年;坎贝尔和富兰克林 2004 年)。当然,如果你有理由认为你的抽样过程更有可能选择某些个体而不是其他个体,例如,如果你知道你在某个地方有更多某种类型的个体,那么你不应该应用比例三段论。但是,辩护者声称,如果没有这样的理由,应用比例三段论是相当合理的。当然,你总是有可能抽取一个不具有代表性的样本,也就是说,样本频率与总体频率不匹配的少数样本之一,但这就是为什么结论只是可能而不是确定的原因。

论证中更有问题的一步是最后一步,它将我们从样本与其总体高概率匹配的主张转化为从观察到特定样本频率时,样本抽取自的总体具有高概率接近样本频率的主张。问题在于对“高概率”含义的微妙转变,这已经成为对伯努利定理的常见误读的基础。Hacking(1975: 156–59)用以下方式表达了这一观点。伯努利定理授权主张,很多时候,样本频率周围的一个小区间将包含真实的总体频率。换句话说,从“通常正确”的意义上来说,可以高概率地说样本与其总体匹配。但这并不意味着在每次使用时,“样本周围的一个小区间将包含真实的总体频率”的命题在“可信的”意义上高概率成立。这意味着对于任何给定的样本,高度可信的是样本与其总体匹配。样本与其总体匹配“通常正确”的主张与存在一些样本完全不匹配其总体的主张是相容的。因此,不能从伯努利定理推断出对于任何给定的样本频率,我们应该对“样本周围的一个小区间将包含真实的总体频率”的命题赋予高概率。但这正是威廉姆斯在他的论证的最后一步中所做的推论。马赫(1996)以类似的方式论证了威廉姆斯-斯托夫论证的最后一步是谬误的。实际上,如果我们想要得出关于样本频率给定的总体频率的概率的结论,正确的方法是使用前一节中描述的贝叶斯方法。 但是,正如我们在那里看到的那样,这需要分配先验概率,这就解释了为什么许多人认为组合解决方案在某种程度上非法地预设了像等可能性原则这样的假设。威廉姆斯-斯托夫论证实际上并没有给我们提供一种替代的方法来颠倒概率,这种方法绕过了贝叶斯派所面临的所有问题。

4. 解决休谟两难困境的第二个问题

到目前为止,我们已经考虑了解决休谟两难困境的第一个问题的方法。但当然也有可能选择解决第二个问题。

有人可能会争辩说,尽管休谟说的不同,一个可能的论证在问题上并不是循环的(我们在 4.1 节中考虑了这种回应)。或者,有人可能试图争辩说,可能的论证根本不是循环的(第 4.2 节)。

4.1 归纳归纳的证明

解决休谟困境的第二个问题的一种方法是拒绝前提 P6,即排除循环论证。有人认为,某些类型的循环论证可以为归纳推理提供可接受的证明。由于这种证明本身也是归纳的,因此这种方法通常被称为“归纳归纳的证明”。

首先,我们应该研究休谟循环性是如何产生的。以枚举归纳推理的简单情况为例,遵循以下模式(X):

大多数观察到的 F 都是 G 的

因此:大多数 F 都是 G 的。

休谟声称这样的论证假设了统一性原则(UP)。根据前提 P7 和 P8,这种假设也需要通过一个论证来支持,以使归纳推理得到合理化。一个自然的想法是,我们可以通过“它有效”的理由来为统一性原则辩护。我们知道它有效,因为过去依赖于它的论证实例被发现是成功的。然而,仅凭这一点是不够的,除非我们有理由认为这样的论证在未来也会成功。这个主张本身必须通过归纳论证(S)来支持:

大多数依赖于 UP 的 X 形式的论证在过去是成功的。

因此,大多数依赖于 UP 的 X 形式的论证是成功的。

但是这个论证本身依赖于归纳前提,而这正是我们试图证明的前提。

正如我们在第 2 节中所看到的,一些人反对休谟的观点,即所有归纳推理都预设了归纳前提。然而,基于概率论证来证明归纳推理的合理性会导致循环论证的论点并不依赖于这一观点。循环论证的担忧可以更一般地表述。如果论证 S 依赖于推理 X 中已经预设的某些东西,那么论证 S 就不能用来证明推理 X。问题是这个东西究竟是什么。

一些作者认为,实际上 S 并不依赖于任何前提,甚至不依赖于我们已经知道 X 的结论的预设。他们声称,S 是“规则循环”的论证,它依赖于推理规则,以便得出这个规则本身是可靠的结论。假设我们采用规则 R,该规则认为当观察到大多数 F 是 G 时,我们应该推断大多数 F 是 G。那么推理 X 就依赖于规则 R。我们想要证明规则 R 是可靠的。我们可以援引规则 R 过去的工作情况,因此,通过归纳论证,它在将来也将起作用。将这个论证称为 S*。

大多数遵循规则 R 的推理都是成功的

因此,大多数遵循 R 的推理都是成功的。

由于这个论证本身使用了规则 R,使用它来证明 R 是可靠的是循环论证的。

一些作者随后争论说,尽管前提循环是恶性的,但规则循环不是(Cleve 1984; Papineau 1992)。认为规则循环不是恶性的一个原因是,即使不需要知道或者仅仅有理由相信规则 R 是可靠的,也可以通过使用该规则得出一个有理由的结论。这是外在主义者关于合理性的主张(Cleve 1984)他们说,只要 R 实际上是可靠的,一个人就可以形成对依赖 R 的论证的结论的有理由的信念,只要一个人对前提有有理由的信念。

如果一个人不被外在主义者的主张所说服,他可能会试图以不同的方式主张规则循环是良性的。例如,要求在没有任何规则循环的情况下证明一个规则是可靠的可能看起来是不合理的,当这个规则是非常基本的性质时。正如 Lange 所说:

可以提出这样的建议,即尽管一个循环论证通常无法证明其结论的合理性,在证明一种基本形式的推理时,循环论证是可以接受的。毕竟,没有比这更基本的地方可以转向,因此我们对一种基本形式的推理合理要求的只是它自身的认可。(Lange 2011: 56)

支持这一观点的人指出,即使是演绎推理也无法通过演绎的方式来证明。考虑刘易斯·卡罗尔(Lewis Carroll)的阿基里斯和乌龟的对话(Carroll 1895)。阿基里斯正在与一只拒绝执行假言演绎的乌龟争论。乌龟接受了前提 p 和前提 p 蕴含 q,但他不接受 q。阿基里斯如何说服他呢?他设法说服他接受另一个前提,即“如果 p 和 p 蕴含 q,则 q”。但乌龟仍然不准备推导出 q。阿基里斯继续添加同类的前提,但毫无效果。看起来,对于不准备使用该规则的人来说,假言演绎无法得到证明。

如果前提的循环性是恶性的,而规则的循环性不是,似乎有些奇怪,因为规则和前提之间似乎可以很容易地互换。毕竟,规则总是可以像在刘易斯·卡罗尔的故事中那样被添加为论证的前提。但是,刘易斯·卡罗尔的故事似乎也表明,准备接受陈述规则的前提(乌龟乐意这样做)与准备使用该规则(乌龟拒绝这样做)之间确实存在根本的区别。

假设我们承认归纳论证(如 S 或 S*)可以在没有恶性循环的情况下支持归纳推理 X。然而,可能的反对意见是,该论证仅仅不能对 X 提供充分的证明。毕竟,像反归纳这样不太合理的推理规则也可以以类似的方式支持自身。反归纳规则是 CI:

大多数观察到的 A 都是 B。

因此,大多数 A 都不是 B 的情况并非如此。

然后考虑以下 CI*的论证:

大多数归纳论证都没有成功

因此,大多数归纳论证不是没有成功,即许多归纳论证是成功的。

因此,这个论证以循环规则的方式确立了归纳论证的可靠性(参见 Salmon 1963 年)。

归纳问题是指 S 论证可以用来支持 X 推理,但只适用于那些已经准备好通过使用 S 进行归纳推理的人。它无法说服那些不准备首先依赖该规则的怀疑论者。因此,有人可能认为这个论证并没有取得太大的成就。

对于这些担忧的回应是,正如帕皮诺所说,这个论证“本来就不打算做太多事情”(帕皮诺 1992 年:18)。虽然存在一个反归纳论者的对应论证,但这是无关紧要的。承认这个论证无法说服反归纳论者或怀疑论者。尽管如此,归纳合理化的支持者仍然坚持认为,展示归纳推理的可靠性仍然具有一定的附加价值,即使我们已经接受归纳推理本身没有问题。归纳合理化为归纳提供了一种重要的一致性检查。

4.2 没有规则

甚至可以进一步尝试解构休谟的循环性问题。也许归纳推理甚至没有共同的规则。如果每个归纳推理本质上都是独特的,那该怎么办?这可以被视为拒绝休谟的前提 P5。例如,奥卡沙认为,如果归纳背后没有“规则”,那么可以回避休谟的循环性问题(奥卡沙 2005a,b)。诺顿提出了类似的观点,即所有归纳推理都是实质性的,没有共同的形式(诺顿 2003,2010,2021)。

这些观点的支持者攻击了休谟的主张,即所有归纳推理都基于一个统一原则。对于统一原则的模糊性长期以来一直存在抱怨(萨尔蒙 1953)。未来只在某些方面类似于过去,而在其他方面则不同。假设到目前为止,在我所有的生日上,我都不到 40 岁。这并不能让我期望我下一个生日时还不到 40 岁。休谟的论述中似乎存在一个重大的空白。他本可以解释或描述我们如何进行归纳推理,假设我们可以进行这样的推理。但他没有触及我们如何区分我们合理地推断出一个规律并将其视为一条法则的情况和我们不这样做的情况。

尼尔森·古德曼(Nelson Goodman)常被认为以其“归纳新谜题”(Goodman 1955: 59–83)特别生动的形式提出了这一观点。假设我们以以下方式定义一个谓词“grue”。当一个物体在时间 t 之前被观察时是绿色的,否则是蓝色的。古德曼考虑了一个思想实验,在这个实验中我们观察了一堆绿色的翡翠在时间 t 之前。我们可以通过说所有观察到的翡翠都是绿色来描述我们的结果。使用简单的枚举归纳模式,我们可以从结果推断出所有观察到的翡翠都是绿色的,即所有翡翠都是绿色的。但同样地,我们也可以通过说所有观察到的翡翠都是 grue 来描述相同的结果。然后使用相同的模式,我们可以从结果推断出所有观察到的翡翠都是 grue 的,即所有翡翠都是 grue 的。在第一种情况下,我们预期在时间 t 之后观察到的翡翠是绿色的,而在第二种情况下,我们预期它是蓝色的。因此,这两个预测是不兼容的。古德曼声称休谟忽略的是为什么我们会投射像“绿色”这样的谓词,而不是像“grue”这样的谓词的任何解释。这就是“新谜题”,通常被认为是休谟没有解决的进一步归纳问题。

从古德曼那里可以得出的一个道德是,并没有一个所有可能的论证都依赖于的普遍统一原则(Sober 1988; Norton 2003; Okasha 2001, 2005a,b, Jackson 2019)。相反,每个归纳推理都假设了一些更具体的经验前提。特定的归纳推理取决于未来与过去相似的某种具体方式。然后,它可以通过另一个依赖于完全不同经验主张的归纳推理来证明。这又需要通过另一个归纳推理来证明。因此,休谟问题的本质在第二个角上发生了转变。没有循环性。相反,存在一种归纳证明的回归,每个都依赖于自己的经验前提(Sober 1988; Norton 2003; Okasha 2001, 2005a,b)。

表达这一观点的一种方式是说休谟的论证基于量词转换谬误(Sober 1988; Okasha 2005a)。休谟说存在一个适用于所有归纳推理的普遍前提,而他应该说对于每个归纳推理,都存在一些前提。不同的归纳推理则依赖于不同的经验前提,从而避免了循环性的问题。

那么,假设休谟的问题确实是一个回归问题,而不是一个循环问题,那么将会有什么后果呢?这里有不同的观点。一方面,人们可能认为回归仍然会导致怀疑的结论(Schurz 和 Thorn 2020)。因此,尽管休谟陈述问题的确切形式是不正确的,但结论并没有本质上的不同(Sober 1988)。另一种可能性是,这种转变可以缓解甚至消除怀疑问题。例如,诺顿认为,结果是归纳问题的解决,因为证明的回归是良性终止的(Norton 2003)。而 Okasha 则更温和地建议,即使回归是无限的,“也许无限回归并不比恶性循环更糟糕”(Okasha 2005b: 253)。

任何对休谟循环性的解决都不仅仅依赖于论证应该用每个归纳推理特定的经验前提来取代 UP。还需要证明归纳推理没有共同的规则,否则仍然会存在至少一些规则循环性。Okasha 认为,贝叶斯信念更新模型是归纳可以以无规则方式描述的一个例证,但这是有问题的,因为在这个模型中,所有的归纳推理仍然共享贝叶斯条件化的共同规则。诺顿的材料归纳理论假设了对归纳的无规则描述,但不清楚它是否真的可以避免一些通用规则的作用(Achinstein 2010,Kelly 2010,Worrall 2010)。

5. 对证明的替代观念

休谟通常被认为对归纳推理 I 的证明可能性发表了否定的意见,例如通过 P8 这样的前提,尽管正如我们在第 2 节中所看到的,有些人质疑休谟是否最好解释为根本不对归纳推理 I 的证明做出结论。在本节中,我们将探讨不同方式质疑前提 P8 是否真的为归纳推理 I 的证明提供了一个有效的必要条件,并提出各种替代的证明观念。

5.1 假设和关键点

一种方法是转向对首先需要什么来证明推理的一般反思。例如,维特根斯坦对于询问归纳推理的理由是否有意义产生了疑问。

如果有人说过去的信息不能使他相信未来会发生某事,我将无法理解他。有人可能会问他:那么你期望听到什么呢?你认为什么样的信息可以成为这种信念的依据?...如果这些不是依据,那么什么才是依据呢?-如果你说这些不是依据,那么你肯定能够说明我们有权说我们的假设有依据的情况是什么...(维特根斯坦 1953:481)

例如,有人可能认为甚至不需要有一个推理链,其中每一步或预设都有一个论证来支持。维特根斯坦认为有一些原则是如此基本,以至于它们不需要任何进一步的论证支持。它们是研究的“铰链”。

维特根斯坦的思想发展出了一种“资格”的普遍概念,这是一种合理的保证,使我们能够持有某些命题,而不需要像“证明”那样具备相同的要求。资格为我们持有一个命题提供了认识权利,而不需要将信念建立在一个论证上。克里斯平·赖特(2004)认为,有一些原则,包括统一性原则,我们有权在这个意义上持有。

一些哲学家设定了一个任务,即确定一组或多组公理,为归纳推理提供一个合理的基础。例如,伯特兰·罗素认为,归纳推理的根源在于五个公理(Russell 1948)。另一方面,亚瑟·伯克斯提出,公理集并不是唯一的,可能存在多组与不同归纳方法相对应的公理集(Burks 1953, 1955)。

对所有这些观点的主要反对意见是,它们并没有真正解决归纳问题,不能充分确保归纳推理所依赖的基石。正如萨尔蒙所说,“为了解决问题而接受没有理由和无法证明的公理,等于将科学方法变成了信仰问题”(Salmon 1966: 48)。

5.2 普通语言解散

与其让无法辩护的经验前提为归纳推理提供规范支持,不如主张一种完全不同的正当化观念。像维特根斯坦一样,后来的普通语言哲学家,尤其是 P.F.斯特劳森,也质疑了对归纳推理的正当化要求的确切含义(斯特劳森 1952 年)。这被称为“普通语言解决”归纳问题。

斯特劳森指出,有可能要求对归纳推理进行演绎正当化是有意义的。但这是否有帮助并不清楚,因为这实际上是“要求归纳必须被证明真正是一种演绎的一种方式”(斯特劳森 1952 年:230)。相反,斯特劳森说,当我们询问特定的归纳推理是否正当时,我们通常是在判断它是否符合我们通常的归纳标准。他说,假设有人通过归纳推理形成了“所有 f 都是 g”的信念。斯特劳森说,如果有人问他为什么持有这种信念的理由或原因,

如果他回答说:“嗯,在我广泛而多样的经验中,我遇到了无数个 f 的情况,而从未遇到过一个不是 g 的 f 的情况。”,那么这个回答显然是令人满意的。他明显声称对自己的信念有一种特定类型的归纳支持、归纳证据。(斯特劳森 1952 年)

这仅仅是因为归纳支持,通常理解为在各种条件下观察到许多正面实例。

实际上,这种方法否认推理链是合理的必要条件。相反,归纳推理只有符合通常的归纳合理标准才能被证明是合理的。但是,我们是否可以问一下我们依赖这些归纳标准的原因是什么呢?

询问特定的归纳推理是否合理是有意义的。但是答案相当直接。有时候人们有足够的证据支持他们的结论,有时候则没有。询问归纳程序是否普遍合理也有意义吗?斯特劳森将这种问题类比于询问特定行为是否合法。他说,我们可以通过参考法律来回答这样的问题。

但是一般来说,询问法律是否合法是没有意义的。因为我们要依据什么法律标准呢?(斯特劳森 1952 年:257)

根据斯特劳森的观点,

根据分析命题,合理的做法是对一项陈述的信任程度与其支持证据的强度成比例;而且,虽然不是数学命题,但是一般化的证据在有利实例的数量和发现这些实例的各种情况方面越多,其证据就越强。因此,询问是否合理依赖归纳程序是就像询问是否合理将一个人的信念程度与证据的强度成比例。在这种情境下,“合理”就是这样定义的。(斯特劳森 1952 年:256-257)

因此,根据这个观点,关于是否合理依赖归纳推理就没有进一步的问题可问。

普通语言哲学家并没有明确反驳休谟的前提 P8。但实际上,他们所做的是提供了一个完全不同的故事,关于在相信归纳推理的结论上如何获得合理的证明。我们只需要符合归纳标准,对于这些标准是否有进一步的证明是没有真正意义的。

对这个观点的主要反对意见是,符合通常标准是不足以提供所需的证明的。我们需要知道的是,相信归纳推理的结论是否“在认识论上是合理的或者有理由认为它很可能是真实的”(BonJour 1998: 198)。休谟提出的问题是,尽管归纳推理在过去往往产生了真实的结论,但我们有理由认为我们现在进行的归纳推理的结论很可能是真实的吗?可以说,证明归纳推理遵循归纳标准并不足以证明其结论很可能是真实的。事实上,斯特劳森承认是否“归纳将继续成功”是一个问题,这与归纳是否合理的问题是不同的。他认为这个问题取决于一个“偶然的、事实性的问题”(Strawson 1952: 262)。但如果休谟关心的是这个问题,那么证明归纳是合理的并不是一个答案,除非这个主张被理解为涉及或暗示一个根据合理标准进行的归纳推理很可能有一个真实的结论。

5.3 归纳问题的实用辩护

另一种基于替代证明标准的解决方案是由莱辛巴赫(Reichenbach)(1938 [2006])提出的“实用”方法。莱辛巴赫确实认为休谟的论证是无懈可击的,但他仍然试图为归纳提供一种较弱的证明。为了强调与休谟所寻求的证明的不同,一些人给它起了一个不同的术语,并将莱辛巴赫的解决方案称为“辩护”,而不是对归纳的证明(Feigl 1950; Salmon 1963)。

莱辛巴赫认为,归纳推理的证明并不需要证明其结论是真实的。他说:“结论的真实性的证明只是归纳证明的充分条件,而不是必要条件”(Reichenbach 2006: 348)。他说,如果能够证明归纳推理是成功的必要条件,那么即使我们不知道它是否会成功,我们仍然有一些理由去遵循它。莱辛巴赫将其比作一个人患有一种疾病的情况,医生说:“我不知道手术是否能救这个人,但如果有任何治疗方法,那就是手术”(Reichenbach 1938 [2006: 349])。即使不知道手术是否会成功,这也为对这个人进行手术提供了某种程度的证明。

为了得到一个全面的解释,当然,我们需要更多地说明什么是“成功”的方法,或者“有效”的方法。莱辛巴赫认为,这应该与归纳的目标有关。他认为,这个目标是“找到频率趋于极限的事件序列”(1938 [2006: 350])。

莱辛巴赫将他的策略应用于一般形式的“统计归纳”,其中我们观察到 n 次观察中特定事件的相对频率 fn,然后根据更多的观察形成对频率的期望。然后,“归纳原则”规定,如果在一定数量的实例之后,观察到 m/n 的频率,对于任何延长观察序列的情况,频率将继续落在 m/n 的一个小区间内。休谟的例子是这个原则的特例,其中观察到的频率为 1。例如,在休谟的面包案例中,假设观察到面包在 n 次观察中滋养了 n 次(即观察频率为 100%),然后根据归纳原则,我们期望随着我们观察更多实例,滋养的频率将继续在一个非常小的区间内保持 100%。遵循这个归纳原则有时也被称为遵循“直线规则”。问题是如何证明使用这个规则的合理性。

莱辛巴赫认为,即使休谟认为我们不能证明对于规则的任何特定应用,结论可能是真实的,但对于实际行动的目的,我们不需要证明这一点。我们可以将归纳规则视为产生一个“假设”或我们按照其为真来处理的陈述。我们根据证据假设一个特定的频率 f,这就像是打赌或押注这个频率实际上是 f。假设频率的一个策略是遵循归纳规则。

Reichenbach 提出,我们可以证明归纳规则符合他更弱的证明条件。这并不需要证明遵循归纳原则总是有效的。可能世界是如此混乱,以至于我们无法构建具有任何限制的序列。在这种情况下,既不是归纳原则,也不是任何其他方法会成功。但是,他认为,如果存在一个限制,通过遵循归纳原则,我们最终会找到它。在一系列观察中,存在一些元素,超过这些元素,归纳原则将导致极限的真实值。尽管归纳规则在序列的早期可能会给出完全错误的结果,因为它遵循样本频率的偶然波动,但是如果存在这样的极限频率,它保证最终会逼近极限频率。因此,归纳规则作为一种假设工具是合理的,因为我们知道,如果可能通过归纳推理实现目标,我们将通过这种方法实现(Reichenbach 1949: 475)。

有人可能会质疑 Reichenbach 是否实现了他证明遵循归纳规则是成功的必要条件的目标。为了证明这一点,还需要证明没有其他方法也能实现这个目标。但是,正如 Reichenbach 自己所认识到的,许多其他推理规则以及直接规则也可能收敛于极限(Salmon 1966: 53)。实际上,任何渐近收敛于直接规则的方法也是如此。一类易于指定的这样的规则是将归纳规则与一个随着 n 增加而趋于零的函数 cn 相结合。

Reichenbach 提出了两个旨在避免这个问题的建议。一方面,他声称,由于我们没有真正的方法来选择方法,我们可能就只能使用归纳规则,因为它“更容易处理,因为它具有描述的简单性”。他还声称,体现“最小风险”的方法是遵循归纳规则(Reichenbach 1938 [2006: 355–356])。

还有一个担忧是可能存在一种完全不同的规则,它会收敛于极限。例如,我们可以考虑一个能够可靠地预测未来事件的预言家或灵媒。在这种情况下,Reichenbach 认为归纳仍然是必要的,因为它必须用来检查其他方法是否有效。只有通过使用归纳,Reichenbach 说,我们才能通过检查其记录来认识到替代方法的可靠性。

在评估这个论点时,区分归纳原理可以应用的层次是有帮助的。根据 Skyrms(2000)的观点,我们可以区分为一级,候选方法应用于普通事件或个体,以及二级,它们不是应用于个体或事件,而是应用于一级的论证。当归纳原理应用于一级时,我们称之为“对象归纳”,当归纳原理应用于二级时,我们称之为“元归纳”。Reichenbach 的回应并没有排除另一种方法在一级上可能比对象归纳更好的可能性。它只表明,那种其他方法的成功可能会被二级的元归纳所认可(Skyrms 2000)。尽管如此,Reichenbach 的思想后来被接纳并发展成为一种建议,即一个元归纳主义者不仅将归纳应用于观察的对象层次,还将归纳应用于他人方法的成功,通过这些手段,他可能能够像替代方法一样具有预测能力(Schurz 2008;更多关于元归纳的讨论请参见第 5.5 节)。

Reichenbach 的理由通常被认为是一种实用主义的理由,因为虽然它并没有提供未来事件的知识,但它提供了行动的充分理由(Reichenbach 1949: 481)。人们可能会质疑,实用主义的论证是否真的能够为遵循归纳规则提供一个通用的、普遍的理由。毫无疑问,实用主义的解决方案应该对依赖于情况的回报差异敏感。例如,Reichenbach 提供了以下类比来支持他的实用主义理由:

我们可以将我们的情况比作一个想要在海洋的未开发部分捕鱼的人。没有人告诉他这个地方是否有鱼。他应该投网吗?嗯,如果他想在那个地方捕鱼,我建议他投网,至少要冒险一试。即使在不确定的情况下,尝试也比不尝试并确保一无所获更可取。(Reichenbach 1938 [2006: 362–363])

正如 Lange 指出的那样,这里的论点“假设尝试没有成本”。在这种情况下,“捕鱼人投网既有得到一切又没有失去任何东西”(Lange 2011: 77)。但是,如果尝试会有一些显著的成本,那么最合理的行动方针是否是投网就不那么清楚了。同样,是否采取不做预测的政策而不是遵循归纳规则的政策是否有意义,可能取决于犯错的实际惩罚是什么。实用的解决方案可能无法为在所有情况下适用的遵循归纳规则提供合理性。

另一个问题是 Reichenbach 是否过于狭隘地指定了归纳的目标。找到频率收敛于极限的事件系列将验证与长期联系起来,而在短期内几乎不对可以假设的事情施加任何限制。然而,归纳实践实际上发生在短期内,也是真正需要理由的地方(BonJour 1998: 194; Salmon 1966: 53)。

5.4 形式学习理论

形式学习理论可以被看作是莱辛巴赫计划的一种延伸。它并不提供归纳推理的理由,即为什么它们应该被认为有可能提供真实结论的理由。相反,它提供了一种“目的手段”的认识论 -- 它提供了根据其在实现某些理想认识目标方面的最优性而选择特定方法的理由,即使在研究的任何阶段,它们产生的结果与真实性并不接近(Schulte 1999)。

形式学习理论特别关注于展示方法在逻辑上的可靠性,即在与我们的背景知识一致的任何数据序列中,它们能够得出真理(Kelly 1996)。然而,它的研究范围不仅限于此。正如我们刚才所看到的,莱辛巴赫面临的一个问题是,有太多的规则在极限情况下收敛于真实频率。那么在短期内我们应该选择哪一个呢?形式学习理论通过考虑除了长期收敛于真理之外的其他认识目标来扩展莱辛巴赫的一般策略。特别是,形式学习理论家们考虑了尽可能高效或快速地达到真理的目标,以及在过程中最小化思维转变或撤回的目标。然后有人认为,通常的归纳方法,它以对简单假设的偏好为特征(奥卡姆剃刀),可以得到合理的证明,因为它是唯一一个在长期内以尽可能高效的方式达到真理,并且最小化撤回次数的方法(Kelly 2007)。

Steel (2010) 提出了归纳原理(理解为沿着直线规则进行归纳概括的规则)可以通过显示遵循它既是必要的又是充分的来获得一种目的手段的合理性。这个证明是一种先验的数学证明,因此据称它避免了休谟的第二个角的循环性。然而,Steel 也不认为这种方法是试图抓住休谟的第一个角,因为这个证明只相对于某种认识论目标的选择。

与形式学习理论中的其他结果一样,这个解决方案也只相对于给定的假设空间和可能数据序列的概念是有效的。因此,一些人认为它没有解决休谟关于给出特定归纳推理的理由的问题(Howson 2011)。另一种态度是它确实解决了休谟问题的一个重要部分(Steel 2010)。关于形式学习理论对 Goodman 之谜的处理也存在类似的争议(Chart 2000,Schulte 2017)。

5.5 元归纳

追求广义莱辛巴赫计划的另一种方法是基于元归纳的 Gerhard Schurz 策略(Schurz 2008, 2017, 2019)。Schurz 区分了在事件层面上应用归纳方法,即所谓的“对象层面”归纳(OI),和在竞争预测方法层面上应用归纳方法,即所谓的“元归纳”(MI)。对象层面的归纳方法基于已观察到的事件进行预测,而元归纳方法根据不同可用预测方法的成功率对预测进行聚合。这里,方法的成功率是根据某种精确的预测成功评分方式来定义的。

元归纳方法的起点是归纳推理的目标不仅仅是像莱辛巴赫所说的寻找长期极限频率,而且还要在长期和短期内成功预测。即使休谟已经排除了归纳方法在实现成功预测方面的可靠性,也许仍然可以证明它在“预测上最优”。如果一种方法在所有竞争方法中无论接收到什么数据都能最好地进行成功预测,那么它就是“预测上最优”的。Schurz 运用机器学习中基于遗憾的学习框架的结果表明,存在一种元归纳策略,它在所有可被认知主体访问的预测方法中是预测上最优的(Cesa-Bianchi 和 Lugosi 2006,Schurz 2008, 2017, 2019)。这种元归纳策略被 Schurz 称为“wMI”,它预测可访问方法的预测的加权平均值,其中权重是“吸引力”,它衡量了该方法自身的成功率与 wMI 的成功率之间的差异。

归纳问题的主要结果是,wMI 策略在长期来看是最优的,因为它收敛于可访问的预测方法的最大成功率。短期性能的最坏情况界限也可以推导出来。这个最优性结果为使用 wMI 提供了一种先验的目的手段合理性的基础。换句话说,思想是,使用 wMI 是合理的,因为它在长期内实现了给定方法中可能的最佳成功率。

Schurz 还声称,wMI 的这种先验合理性,再加上归纳方法迄今比非归纳方法更成功的偶然事实,导致了归纳的一种后验非循环合理性。由于 wMI 在长期内将实现可用预测方法的最大成功率,因此使用它是合理的。但事实上,目标归纳预测方法迄今比非归纳方法更成功。因此,Schurz 说“在未来支持目标归纳策略是元归纳合理的”(Schurz 2019: 85)。他声称,这种合理性不是循环的,因为元归纳具有先验独立的合理性。这个想法是,既然使用 wMI 是先验合理的,那么使用目标层面上最成功的方法也是先验合理的。由于事实证明最成功的方法是目标归纳,所以我们有了一个非循环的后验论证,即使用目标归纳是合理的。

Schurz 关于 wMI 最优性的原始定理适用于有有限个预测方法的情况。一个讨论的焦点是这是否对其提供归纳问题的完整解决方案的要求构成了重要的限制。问题是是否有必要将最优性结果扩展到无限或者可能是一个不断扩大的策略池(Eckhardt 2010,Sterkenburg 2019,Schurz 2021a)。

另一个重要问题涉及到对象归纳被“元归纳地证明”的含义。元归纳策略 wMI 和对象归纳显然是不同的策略。如果 OI 停止工作并且另一种方法开始表现更好,它们可能会导致明天的不同预测。在这种情况下,wMI 将开始偏向另一种方法,wMI 将开始与 OI 分离。最优性结果提供了遵循 wMI 的理由。对象归纳如何继承这种证明呢?最多,似乎我们可以根据 OI 的预测与 wMI 的预测(大致)一致这一理由,在下一个时间步骤中遵循 OI(Sterkenburg 2020,Sterkenburg(即将出版))。然而,这需要一个更强的经验假设,不仅仅是观察到 OI 比非归纳方法更成功。它还需要类似于“作为经验事实,策略 OI 比其竞争对手更成功,以至于元归纳主义者将其归因于如此大的权重,使其预测(大致)与 OI 的预测一致”(Sterkenburg 2020: 538)。此外,即使我们允许经验证据支持这样一个强有力的主张,问题仍然存在,即元归纳的证明是支持遵循元归纳策略,而不是支持遵循 OI 策略(Sterkenburg(2020),第 3.3.2 节)。

6. 应对归纳怀疑

迄今为止,我们已经考虑了各种方式来试图通过抵制休谟论证的一个或另一个前提来解决归纳问题。然而,一些哲学家认为他的论证是无懈可击的,并因此接受了归纳怀疑主义的结论,即归纳推理无法被证明合理。那么,挑战就在于找到一种与这种看似激进的结论共存的方式。我们似乎在日常生活中普遍依赖归纳推理,而且人们普遍认为它是科学方法的基础。我们能够在这一切中继续前进,同时认真思考其中没有任何合理论证支持吗?

这里的一个选择是像尼古拉斯·麦克斯韦尔那样主张,归纳问题是在一个过于限制性的背景下提出的。麦克斯韦尔认为,如果我们采用一个不同于“标准经验主义”的科学观念,即他所称的“目标导向经验主义”(麦克斯韦尔 2017),那么这个问题就不会出现。

这里的另一个选择是认为归纳问题的重要性在某种程度上仅限于怀疑主义的背景下。休谟本人似乎也是这样思考的。例如,他说:

自然将始终保持她的权利,并最终战胜任何抽象推理。尽管我们应该得出结论,例如在前面的部分中,从所有经验中推理出来的推理中,心灵会采取一种不受任何论证或理解过程支持的步骤;这些推理对于几乎所有知识都至关重要,但这种发现永远不会影响这些推理。(E. 5.1.2)

休谟的目的显然不是要争论我们在日常生活中不应该进行归纳推理,事实上,他整个以自然主义术语描述心灵的方法和系统都依赖于归纳推理。因此,归纳问题只能被视为在哲学反思层面上才会出现的问题。

缓解归纳怀疑的另一种方法是限制其范围。例如,卡尔·波普尔认为归纳问题是不可逾越的,但他认为科学实际上根本不是基于归纳推理(波普尔 1935 [1959])。相反,他提出了一种演绎主义的科学观,根据这种观点,科学通过提出大胆的猜测,然后试图证伪这些猜测来进行。在这种解释的最简单版本中,当一个假设对实验中被发现为假的预测时,该假设被拒绝为被证伪。这个过程的逻辑完全是演绎的。假设蕴含了预测,而预测的错误通过演绎法推翻了假设。因此,波普尔声称科学不是基于休谟考虑的推断性推理。因此,至少对于科学来说,如果这些推理缺乏合理的基础,那么它们并不那么重要。

波普尔的观点在一个重要方面似乎是不完整的。总是有许多假设尚未被证据推翻,而且这些假设可能相互矛盾。根据严格的演绎框架,由于没有一个被证伪,它们都处于同等地位。然而,科学家通常会说其中一个假设比其他假设更受证据支持。我们似乎需要的不仅仅是演绎推理来支持实际决策(Salmon 1981)。波普尔确实提到了一种假设通过证据“证实”程度的概念。但可以说,这使他远离了严格的演绎科学观点。因此,纯粹的演绎主义似乎无法给出对科学方法的充分解释。

Bibliography

  • Achinstein, Peter, 2010, “The War on Induction: Whewell Takes on Newton and Mill (Norton Takes on Everyone)”, Philosophy of Science, 77(5): 728–739.

  • Armstrong, David M., 1983, What is a Law of Nature?, Cambridge: Cambridge University Press.

  • Baier, Annette C., 2009, A Progress of Sentiments, Harvard: Harvard University Press.

  • Bayes, Thomas, 1764, “An Essay Towards Solving a Problem in the Doctrine of Chances”, Philosophical Transactions of the Royal Society of London, 53: 370–418.

  • Beauchamp, Tom L, and Alexander Rosenberg, 1981, Hume and the Problem of Causation, Oxford: Oxford University Press.

  • Bertrand, Joseph Louis Francois, 1888, Calcul des probabilites, Paris: Gauthier-Villars.

  • BonJour, Laurence, 1998, In Defense of Pure Reason: A Rationalist Account of A Priori Justification, Cambridge: Cambridge University Press.

  • Borel, Emile, 1909, Elements de la theorie des probabilites, Paris: Herman et Fils.

  • Brown, M.B., 1987, “Review of The Rationality of Induction, D.C. Stove [1986]”, History and Philosophy of Logic, 8(1): 116–120.

  • Burks, Arthur W., 1953, “The Presupposition Theory of Induction”, Philosophy of Science, 20(3): 177–197.

  • –––, 1955, “On the Presuppositions of Induction”, Review of Metaphysics, 8(4): 574–611.

  • Campbell, Scott, 2001, “Fixing a Hole in the Ground of Induction”, Australasian Journal of Philosophy, 79(4): 553–563.

  • Campbell, Scott, and James Franklin, 2004, “Randomness and the Justification of Induction”, Synthese, 138(1): 79–99.

  • Carnap, Rudolph, 1950, Logical Foundations of Probability, Chicago: University of Chicago Press.

  • –––, 1952, The Continuum of Inductive Methods, Chicago: University of Chicago Press.

  • Carroll, John W., 2016, “Laws of Nature”, Stanford Encyclopedia of Philosophy (Fall 2016 Edition), Edward N. Zalta (ed.), URL = https://plato.stanford.edu/archives/fall2016/entries/laws-of-nature/.

  • Carroll, Lewis, 1895, “What the Tortoise said to Achilles”, Mind, 4(14): 278–280.

  • Cesa-Bianchi, Nicolo, and Gabor Lugosi, 2006, Prediction, Learning, and Games, Cambridge: Cambridge University Press.

  • Chart, David, 2000, “Schulte and Goodman’s Riddle”, British Journal for the Philosophy of Science, 51(1): 147–149.

  • Cleve, James van, 1984, “Reliability, Justification, and the Problem of Induction”, Midwest Studies In Philosophy: 555–567.

  • Cox, R. T., 1946, “Probability, frequency and reasonable expectation”, American Journal of Physics, 14: 1–10.

  • –––, 1961, The Algebra of Probable Inference, Baltimore, MD: Johns Hopkins University Press.

  • de Finetti, Bruno, 1964, “Foresight: its logical laws, its subjective sources”, in H.E. Kyburg (ed.), Studies in subjective probability, New York: Wiley, pp. 93–158.

  • de Pierris, Graciela and Michael Friedman, 2013, “Kant and Hume on Causality”, The Stanford Encyclopedia of Philosophy (Winter 2013 Edition), Edward N. Zalta (ed.), URL = <Kant and Hume on Causality (Stanford Encyclopedia of Philosophy/Winter 2013 Edition)>.

  • Dretske, Fred I., 1977, “Laws of Nature”, Philosophy of Science, 44(2): 248–68.

  • Eckhardt, Arnold, 2010, “Can the Best-Alternative-Justification Solve Hume’s Problem? (On the limits of a promising approach)”, Philosophy of Science, 77(4): 584–593.

  • Feigl, Herbert, 1950, “De Principiis non disputandum”, in Max Black (ed.), Philosophical Analysis, Ithaca, NY: Cornell University Press, pp. 119–56.

  • Foster, John, 2004, The Divine Lawmaker: Lectures on Induction, Laws of Nature and the Existence of God, Oxford: Clarendon Press.

  • Garrett, Don, 2002, Cognition and Commitment in Hume’s Philosophy, Oxford: Oxford University Press.

  • Ghosal, S., J. K. Ghosh, and A.W. van der Vaart, 2000, “Convergence rates of posterior distributions”, The Annals of Statistics, 28: 500–531.

  • Ghosal, S., J. Lember, and A. W. van der Vaart, 2008, “Non-parametric Bayesian model selection and averaging”, Electronic Journal of Statistics, 2: 63–89.

  • Giaquinto, Marcus, 1987, “Review of The Rationality of Induction, D.C. Stove [1986]”, Philosophy of Science, 54(4): 612–615.

  • Goodman, Nelson, 1955, Fact, Fiction and Forecast, Cambridge, MA: Harvard University Press.

  • Hacking, Ian, 1975, The Emergence of Probability: a Philosophical Study of Early Ideas About Probability, Induction and Statistical Inference, Cambridge: Cambridge University Press.

  • Hájek, Alan, 2011, “Interpretations of Probability”, The Stanford Encyclopedia of Philosophy (Winter 2012 Edition), Edward N. Zalta (ed.), URL = <Interpretations of Probability (Stanford Encyclopedia of Philosophy/Winter 2012 Edition)>.

  • Harman, Gilbert, 1968, “Enumerative Induction as Inference to the Best Explanation”, Journal of Philosophy, 65(18): 529–533.

  • Henderson, Leah, 2014, “Bayesianism and Inference to the Best Explanation”, The British Journal for the Philosophy of Science, 65(4): 687–715.

  • Howson, Colin, 2000, Hume’s Problem: Induction and the Justification of Belief, Oxford: Oxford University Press.

  • –––, 2011, “No Answer to Hume”, International Studies in the Philosophy of Science, 25(3): 279–284.

  • Huemer, Michael, 2009, “Explanationist Aid for the Theory of Inductive Logic”, The British Journal for the Philosophy of Science, 60(2): 345–375.

  • [T] Hume, David, 1739, A Treatise of Human Nature, Oxford: Oxford University Press. (Cited by book.part.section.paragraph.)

  • [E] –––, 1748, An Enquiry Concerning Human Understanding, Oxford: Oxford University Press. (Cited by section.part.paragraph.)

  • Jackson, Alexander, 2019, “How to solve Hume’s problem of induction”, Episteme 16: 157–174.

  • Jeffreys, Harold, 1939, Theory of Probability, Oxford: Oxford University Press.

  • Johnson, William Ernest, 1921, Logic, Cambridge: Cambridge University Press.

  • –––, 1932, “Probability: the Deductive and Inductive Problems”, Mind, 49(164): 409–423.

  • Kant, Immanuel, 1781, Kritik der reinen Vernunft. Translated as Critique of Pure Reason, Paul Guyer and Allen W. Wood, A., (eds.), Cambridge: Cambridge University Press, 1998.

  • –––, 1783, Prolegomena zu einer jeden künftigen Metaphysik, die als Wissenschaft wird auftreten können. Translated as Prologomena to Any Future Metaphysics, James W. Ellington (trans.), Indianapolis: Hackett publishing, 2002.

  • Kelly, Kevin T., 1996, The Logic of Reliable Inquiry, Oxford: Oxford University Press.

  • –––, 2007, “A new solution to the puzzle of simplicity”, Philosophy of Science, 74: 561–573.

  • Kelly, Thomas, 2010, “Hume, Norton and induction without rules”, Philosophy of Science, 77: 754–764.

  • Keynes, John Maynard, 1921, A Treatise on Probability, London: Macmillan.

  • Lange, Marc, 2011, “Hume and the Problem of induction”, in Dov Gabbay, Stephan Hartmann and John Woods (eds.), Inductive Logic, (Handbook of the History of Logic, Volume 10), Amsterdam: Elsevier, pp. 43–92.

  • Laplace, Pierre-Simon, 1814, Essai philosophique sur les probabilités, Paris. Translated in 1902 from the sixth French edition as A Philosophical Essay on Probabilities, by Frederick Wilson Truscott and Frederick Lincoln Emory, New York: John Wiley and Sons. Retranslated in 1995 from the fifth French edition (1825) as Philosophical Essay on Probabilities, by Andrew I. Dale, 1995, New York: Springer-Verlag.

  • Maher, Patrick, 1996, “The Hole in the Ground of Induction”, Australasian Journal of Philosophy, 74(3): 423–432.

  • Maxwell, Nicholas, 2017, Understanding Scientific Progress: Aim-Oriented Empiricism, St. Paul: Paragon House.

  • Mitchell, Tom, 1997, Machine Learning: McGraw-Hill.

  • Morris, William E., and Charlotte R. Brown, 2014 [2017], “David Hume”, The Stanford Encyclopedia of Philosophy (Spring 2017 Edition), Edward N. Zalta (ed.), URL = https://plato.stanford.edu/archives/spr2017/entries/hume/.

  • Norton, John D., 2003, “A Material Theory of Induction”, Philosophy of Science, 70(4): 647–670.

  • –––, 2010, “There are no universal rules for induction”, Philosophy of Science, 77: 765–777.

  • –––, 2021, The Material Theory of Induction: BSPS Open/University of Calgary Press.

  • Okasha, Samir, 2001, “What did Hume Really Show about Induction?”, The Philosophical Quarterly, 51(204): 307–327.

  • –––, 2005a, “Bayesianism and the Traditional Problem of Induction”, Croatian Journal of Philosophy, 5(14): 181–194.

  • –––, 2005b, “Does Hume’s Argument against Induction Rest on a Quantifier-Shift Fallacy?”, Proceedings of the Aristotelian Society, 105: 237–255.

  • Owen, David, 1999, Hume’s Reason, Oxford: Oxford University Press.

  • Papineau, David, 1992, “Reliabilism, Induction and Scepticism”, The Philosophical Quarterly, 42(166): 1–20.

  • Popper, Karl, 1935 [1959], Logik der Forschung, Wien: J. Springer. Translated by Popper as The Logic of Scientific Discovery, London: Hutchinson, 1959.

  • Ramsey, Frank P., 1926, “Truth and Probability”, in R.B. Braithwaite (ed.), The Foundations of Mathematics and Other Logical Essays, London: Routledge and Kegan-Paul Ltd., pp. 156–98.

  • Reichenbach, Hans, 1949, The Theory of Probability, Berkeley: University of California Press.

  • –––, 1938 [2006], Experience and Prediction: An Analysis of the Foundations and the Structure of Knowledge, Chicago: University of Chicago Press. Page numbers from the 2006 edition, Indiana: University of Notre Dame Press.

  • Romeijn, Jan-Willem, 2004, “Hypotheses and Inductive Predictions”, Synthese, 141(3): 333–364.

  • Russell, Bertrand, 1946, A History of Western Philosophy, London: George Allen and Unwin Ltd.

  • –––, 1948, Human Knowledge: Its Scope and Limits, New York: Simon and Schuster.

  • Salmon, Wesley C., 1963, “On Vindicating Induction”, Philosophy of Science, 30(3): 252–261.

  • –––, 1966, The Foundations of Scientific Inference, Pittsburgh: University of Pittsburgh Press.

  • –––, 1981, “Rational Prediction”, British Journal for the Philosophy of Science, 32(2): 115–125.

  • Salmon, Wesley C., 1953, “The Uniformity of Nature”, Philosophy and Phenomenological Research, 14(1): 39–48.

  • Savage, Leonard J, 1954, The Foundations of Statistics, New York: Dover Publications.

  • Schulte, Oliver, 1999, “Means-Ends Epistemology”, British Journal for the Philosophy of Science, 50(1): 1–31.

  • –––, 2000, “What to believe and what to take seriously: a reply to David Chart concerning the riddle of induction”, British Journal for the Philosophy of Science, 51: 151–153.

  • –––, 2017 [2018], “Formal Learning Theory”, The Stanford Encyclopedia of Philosophy (Spring 2018 Edition), Edward N. Zalta (ed.), URL = https://plato.stanford.edu/archives/spr2018/entries/learning-formal/.

  • Schurz, Gerhard, 2008, “The Meta-inductivist’s Winning Strategy in the Prediction Game: A New Approach to Hume’s Problem”, Philosophy of Science, 75(3): 278–305.

  • –––, 2017, “Optimality Justifications: New Foundations for Foundation-Oriented Epistemology”, Synthese, 73:1–23.

  • –––, 2019, Hume’s Problem Solved: the Optimality of Meta-induction, Cambridge, MA: MIT Press.

  • –––, 2021a, “Meta-induction over unboundedly many prediction methods: a reply to Arnold and Sterkenburg”, Philosophy of Science, 88: 320–340.

  • –––, 2021b, “The No Free Lunch Theorem: bad news for (White’s account of) the problem of induction”, Episteme, 18: 31–45.

  • Schurz, Gerhard, and Paul Thorn, 2020, “The material theory of object-induction and the universal optimality of meta-induction: two complementary accounts”, Studies in History and Philosophy of Science A, 82: 99–93.

  • Skyrms, Brian 2000, Choice and Chance: an introduction to inductive logic, Wadsworth.

  • –––, 2012, From Zeno to Arbitrage: Essays on Quantity, Coherence and Induction, Oxford: Oxford University Press.

  • Sober, Elliott, 1988, Reconstructing the Past: Parsimony, Evolution and Inference, Cambridge MA: MIT Press.

  • Steel, Daniel, 2010, “What If the Principle of Induction Is Normative? Formal Learning Theory and Hume’s Problem”, International Studies in the Philosophy of Science, 24(2): 171–185.

  • Sterkenburg, Tom, 2019, “The meta-inductive justification of induction: the pool of strategies”, Philosophy of Science, 86: 981–992.

  • –––, 2020, “The meta-inductive justification of induction”, Episteme, 17: 519–541.

  • –––, forthcoming, “Explaining the success of induction”, British Journal for the Philosophy of Science, https://doi.org/10.1086/717068.

  • Sterkenburg, Tom and Peter Grünwald, 2021, “The no-free-lunch theorems of supervised learning”, Synthese, 199: 9979–10015.

  • Stove, David C., 1986, The Rationality of Induction, Oxford: Clarendon Press.

  • Strawson, Peter Frederick, 1952, Introduction to Logical Theory, London: Methuen.

  • Tooley, Michael, 1977, “The Nature of Laws”, Canadian Journal of Philosophy, 7(4): 667–698.

  • White, Roger, 2015, “The problem of the problem of induction”, Episteme, 12: 275–290.

  • Will, Frederick L., 1948, “Donald Williams’ Theory of Induction”, Philosophical Review, 57(3): 231–247.

  • Williams, Donald C., 1947, The Ground of Induction, Harvard: Harvard University Press.

  • Wittgenstein, Ludwig, 1953, Philosophical Investigations, New Jersey: Prentice Hall.

  • Wolpert, D. H., 1997, “No free lunch theorems for optimization”, IEEE Transactions on Evolutionary Computation, 1: 67–82.

  • –––, 1992, “On the connecton between in-sample testing and generalization error”, Complex Systems, 6: 47–94.

  • –––, 1996, “The lack of a priori distinctions between learning algorithms”, Neural Computation 8: 1341–1390.

  • Worrall, John, 2010, “For Universal Rules, Against Induction”, Philosophy of Science, 77(5): 740–53.

  • Wright, Crispin, 2004, “Wittgensteinian Certainties”, in Denis McManus (ed.), Wittgenstein and Scepticism, London: Routledge, pp. 22–55.

  • Zabell, Sandy L., 1988, “Symmetry and Its Discontents”, in Brian Skyrms (ed.), Causation, Chance and Credence, Dordrecht: Springer Netherlands, pp. 155–190.

  • –––, 1989, “The Rule of Succession”, Erkenntnis, 31(2–3): 283–321.

Academic Tools

Other Internet Resources

Bayes’ Theorem | belief, formal representations of | confirmation | epistemology, formal | Feigl, Herbert | Goodman, Nelson | Hume, David | Kant, Immanuel: and Hume on causality | laws of nature | learning theory, formal | logic: inductive | Popper, Karl | probability, interpretations of | Reichenbach, Hans | simplicity | skepticism | statistics, philosophy of | Strawson, Peter Frederick

Acknowledgments

Particular thanks are due to Don Garrett and Tom Sterkenburg for helpful feedback on a draft of this entry. Thanks also to David Atkinson, Simon Friederich, Jeanne Peijnenburg, Theo Kuipers and Jan-Willem Romeijn for comments.

Copyright © 2022 by Leah Henderson <l.henderson@rug.nl>

最后更新于

Logo

道长哲学研讨会 2024