法律概然性 legal probabilism (Rafal Urbaniak and Marcello Di Bello)

首次发表于 2021 年 6 月 8 日星期二

法律概然性是一个研究计划,依赖于概率论来分析、建模和改进证据评估和审判过程中的决策。虽然“法律概然性”这个表达似乎是由哈克(2014b)创造的,但其基本思想可以追溯到概率论的早期阶段(例如,伯努利 1713 年)。文献中有时还会遇到另一个术语“数学审判”(Tribe,1971 年)。法律概然性在法学界仍然是少数派观点,但在二十世纪下半叶与法律经济学运动(Becker,1968 年;Calabresi,1961 年;Posner,1973 年)一起获得了更大的流行度。

为了说明法律概然性的应用范围,考虑一个简化的案例。爱丽丝被指控犯有谋杀罪。犯罪现场留下的痕迹与爱丽丝的基因匹配。一个目击者证明爱丽丝在犯罪后逃离了现场。另一个证人声称爱丽丝之前多次威胁过受害人。然而,爱丽丝有一个不在场证明。马克声称他整天都和她在一起。这个案例引发了几个问题。如何评估证据?如何结合相互矛盾的证据,比如指控的 DNA 匹配和不在场证词?如果在谋杀案中的决策标准是合理怀疑以外的证明,证据应该有多强才能达到这个标准?

法律概然性是一个理论框架,有助于解决这些不同的问题。 Finkelstein 和 Fairley(1970)首次系统分析了概率论,特别是贝叶斯定理如何帮助评估审判中的证据(见第 1 节)。在发现 DNA 指纹技术之后,许多法律概然性研究者关注如何使用概率论来量化 DNA 匹配的强度(见第 2 节)。人工智能领域的最新研究使得可以使用概率论(以贝叶斯网络的形式)来评估由多个组成部分组成的复杂证据体系(见第 3 节)。在 Lempert(1977)的工作之后,似然比现在常用作审判中呈现的证据相关性的概率度量(见第 4 节)。其他作者,从 Kaplan(1968)和 Cullison(1969)的开创性论文开始,运用概率论和决策论来建模审判中的决策和证明标准(见第 5 节)。

毫无疑问,法律概然性是有争议的。许多法律理论家和哲学家,从 Tribe(1971)开始,对其提出了几个批评。这些批评涉及从评估某人的刑事或民事责任的概率到审判决策的非人性化,以及误解证据评估和决策过程在审判程序中的进行方式。

法律概然性面临的一个关键挑战,近年来引起了哲学界的关注,来自法律证明的悖论或裸统计证据的难题。Nesson(1979),Cohen(1977)和 Thomson(1986)构建了一些场景,在这些场景中,尽管根据现有证据,被告的有罪或民事责任的概率很高,但对被告的判决似乎是不合理的(见第 6 节)。法律概然性面临的其他挑战包括连词问题和参考类别问题(见第 7 节)。

法律概然性也可以理解为一个广泛的研究计划,旨在通过概率论来分析整个审判系统,包括陪审团制度和审判程序等机构。一些早期的法国概率论者研究了陪审团规模、陪审团投票规则与误判无辜风险之间的关系(康多塞 1785;拉普拉斯 1814;泊松 1837;有关最近的讨论,请参见凯伊 1980;尼坦 2009;铃木 2015)。

在这种更激进的法律概然性版本的根源中,梦想着识别个体行为中的模式并改进法律机构(哈金 1990)。如今,数据的快速增长——加上机器学习和成本效益分析的普及——使这个梦想比以往任何时候都更加活跃(弗格森 2020)。有关将数学化、量化和成本效益分析应用于司法系统的批评,请参见艾伦(2013)和哈考特(2018)。然而,本条目不讨论这种广泛的法律概然性版本。


1. 概然性工具包

本节首先回顾了概率的公理和其解释,然后展示了概率论如何帮助人们在审判中发现可能犯下的错误,例如检察官谬误、基础率谬误和辩护律师谬误。本节还探讨了如何为假设分配概率以及如何在不同粒度级别上制定假设。

1.1 概率及其解释

标准概率理论由三个公理组成:

| | | | | --- | --- | --- |表 1

概率论中的一个重要概念是条件概率,即在命题 B 成立的条件下命题 A 成立的概率,用符号表示为 Pr(A∣B)。尽管有时被视为原始概念,条件概率通常被定义为命题的合取 Pr(A∧B)除以被条件限制的命题的概率 Pr(B),或者换句话说,

Pr(A∣B)=Pr(A∧B)Pr(B),假设 Pr(B)≠0。

这个概念在法律应用中至关重要。审判中的事实查明者可能想要知道“被告在犯罪发生时是否在现场”的概率,条件是“戴尔夫人声称她看到被告从现场逃走”。或者他们可能想要知道“被告是犯罪现场发现的痕迹的来源”的概率,条件是“DNA 专家声称被告的 DNA 与现场的痕迹相匹配”。一般来说,事实查明者对于关于发生了什么的给定假设 H 在现有证据 E 的条件下的概率 Pr(H∣E)感兴趣。

大多数法律概然性学家认为,在审判中争议的陈述所归属的概率,例如“被告是犯罪痕迹的来源”或“犯罪发生时被告在犯罪现场”应该被理解为基于证据的信念程度(例如,Cullison 1969; Kaye 1979b; Nance 2016)。这种解释解决了一个担忧,即由于过去事件发生或未发生,它们的概率应该是 1 或 0。即使客观机会是 1 或 0,根据可用证据,关于过去事件的陈述仍然可以被赋予不同的信念程度。此外,与频率相比,信念程度更适用于不可重复事件的应用,例如个人的行为,这通常是审判争议的焦点。对这些问题的进一步探讨超出了本条目的范围(有关更广泛的讨论,请参见关于概率解释的条目以及 Childers 2013; Gillies 2000; Mellor 2004; Skyrms 1966)。

有人担心,除了遵守概率公理外,信念程度最终是以主观和任意的方式分配的(Allen and Pardo 2019)。通过指出信念程度应该反映对可用证据的认真评估,其中也可以包括经验频率(见下文的 §1.2 和 ENFSI 2015 中的示例),可以缓解这种担忧。然而,在某些情况下,相关的经验频率将不可用。当发生这种情况时,仍然可以通过依靠常识和经验来评估信念程度。有时候并不需要为过去的每个陈述分配确切的概率。在这种情况下,相关的概率可以用概率测度集合(Shafer 1976; Walley 1991),参数值的概率分布或区间来近似表示(请参见后面的 §1.4)。

1.2 概率谬误

暂且不考虑将概率分配给不同陈述的实际困难,概率论是一种有价值的分析工具,可以检测到证据的错误解释和推理谬误,这些错误可能会被忽视。

1.2.1 假设独立性

概率论有助于识别的一个常见错误是在没有理由的情况下假设两个事件彼此独立。概率论的一个定理表明,两个事件的合取概率 A∧B 等于合取 A 和 B 的概率的乘积,即

Pr(A∧B)=Pr(A)×Pr(B),

假设 A 和 B 彼此独立,即条件概率 Pr(A∣B)与无条件概率 Pr(A)相同。更正式地说,注意到

Pr(A∣B)=Pr(A∧B)Pr(B),

因此

Pr(A∧B)=Pr(A)×Pr(B)

假设 Pr(A)=Pr(A∣B)。后者的等式意味着了解 B 不会改变对 A 的信念程度。

1964 年洛杉矶,珍妮特和马尔科姆·科林斯夫妇被指控抢劫的审判,说明了事件之间缺乏独立性可能被忽视的问题。夫妇是根据当时被认为不寻常的特征进行辨认的。检察官传唤了一位专家证人,一位大学数学家,要求他考虑以下特征,并假设它们具有以下概率:黑人男子留胡子(10 分之 1),男子留胡子(4 分之 1),白人女子金发(3 分之 1),女子扎马尾辫(10 分之 1),异族夫妇在汽车中(1000 分之 1),夫妇驾驶黄色敞篷车(10 分之 1)。数学家正确地计算了在独立性假设下,随机夫妇展示所有这些特征的概率:1200 万分之 1(假设个别概率估计是正确的)。依据这个论点,陪审团判定夫妇有罪。如果这些特征在洛杉矶如此罕见,而抢劫犯却具备这些特征——陪审团必然推理出——科林斯夫妇就是抢劫犯。

这一判决后来在加利福尼亚州最高法院的《People v. Collins》(68 Cal.2d 319, 1968)中被推翻。法院指出了假设将每个特征的概率相乘得到它们共同发生的概率的错误。只有在所讨论的特征在概率上是独立的情况下,这一假设才成立。但事实并非如此,因为“留胡子的男子”这一特征的出现很可能与“留胡子的男子”这一特征相关。同样的相关性可能存在于“金发白人女子”和“扎马尾辫的女子”这两个特征之间。除了缺乏独立性之外,另一个问题是每个特征相关的概率并非通过可靠的方法获得。

英国案例 R. v. Clark (EWCA Crim 54, 2000) 是另一个例子,说明事件之间缺乏独立性往往容易被忽视。Sally Clark 有两个儿子。她的第一个儿子在 1996 年去世,第二个儿子几年后的 1998 年以类似的情况去世。他们两个都在出生后几周内去世。这只是巧合吗?在审判中,儿科医生 Roy Meadow 作证称,像 Clark 一家这样富裕家庭的婴儿死于突发性婴儿猝死综合征(SIDS)的概率为 1/8,543。假设这两起死亡事件是独立事件,Meadow 计算出两个儿童都死于 SIDS 的概率为 18,543×18,543,约等于 173×106。

或者说是 1/73 百万。这个令人印象深刻的低数字无疑在案件的结果中起了作用。Sally Clark 被判谋杀她的两个婴儿儿子(尽管这个判决最终在上诉中被推翻)。1/(73×106)的数字是基于独立性的假设。这个假设似乎是错误的,因为环境或遗传因素可能使一个家庭易患 SIDS(有关这一点的更详细讨论,请参见 Dawid 2002;Barker 2017;Sesardic 2007)。

or 1 in 73 million. This impressively low number no doubt played a role in the outcome of the case. Sally Clark was convicted of murdering her two infant sons (though the conviction was ultimately reversed on appeal). The 1/(73×106) figure rests on the assumption of independence. This assumption is seemingly false since environmental or genetic factors may predispose a family to SIDS (for a fuller discussion of this point, see Dawid 2002; Barker 2017; Sesardic 2007).

1.2.2 检察官的谬误

在评估审判中呈现的证据时,人们经常犯的另一个错误是混淆条件概率的两个方向,即 Pr(A∣B)和 Pr(B∣A)。例如,如果你掷一颗骰子,结果是 2 的概率,假设它是偶数(等于 1/3),与结果是偶数的概率,假设它是 2(等于 1),是不同的。

在刑事案件中,对条件概率的两个方向的混淆可能导致夸大检察官假设的概率。假设一位专家证明,在犯罪现场发现的血液与被告的血液相匹配,而与犯罪无关的人——即不是犯罪现场发现的血液的来源的人——有 5%的概率会出现巧合。有些人可能会倾向于将这个陈述解释为被告不是血液的来源的概率为 5%,因此被告是血液的来源的概率为 95%。这种错误的解释被称为检察官的谬误,有时也被称为转位谬误(Thompson 和 Schumann 1987)。这个 5%的数字是条件概率 Pr(m∣¬s),即假设被告不是犯罪现场血液的来源(¬s),他仍然会匹配(m)的概率。这个 5%的数字不是概率 Pr(¬s∣m),即如果被告匹配(m),他不是来源(¬s)的概率。通过混淆这两个方向,并认为

Pr(¬s∣m)=Pr(m∣¬s)=5%,

这使人错误地得出结论,即 Pr(s∣m)=95%。

在前面讨论的柯林斯案中也发生了同样的混淆。即使计算是正确的,一个随机夫妇具有指定特征的概率为 1/1200 万,应该被解释为 Pr(m∣innocent),而不是根据目击者描述匹配柯林斯的情况下柯林斯无罪的概率 Pr(innocent∣m)。可以推测,陪审团判定柯林斯有罪是因为他们认为他们不可能不是抢劫犯。但是,假设 1/1200 万的数字是正确的,它只能表明 Pr(m∣innocent)等于 1/(12×106),而不能表明 Pr(innocent∣m)等于 1/(12×106)。

1.2.3 贝叶斯定理与基本率谬误

假设给定证据的假设的概率 Pr(H∣E)与给定假设的证据的概率 Pr(E∣H)之间的关系由贝叶斯定理捕捉到:

Pr(H∣E)=Pr(E∣H)Pr(E)×Pr(H),假设 Pr(E)≠0。

概率 Pr(H)被称为 H 的先验概率(在考虑证据 E 之前),而 Pr(H∣E)被称为 H 的后验概率。这个术语是标准的,但有点误导,因为它暗示了一个不一定存在的时间顺序。接下来,考虑比率

Pr(E∣H)Pr(E),有时被称为贝叶斯因子 [1]。这是观察到证据 E 假设 H 的概率 Pr(E∣H)(通常称为似然)与观察到 E 的概率 Pr(E)之间的比率。根据全概率法则,Pr(E)是由加上在假设 H 下观察到 E 的概率和在假设 ¬H 下观察到 E 的概率,分别乘以 H 和 ¬H 的先验概率所得到的:

sometimes called the Bayes factor.[1] This is the ratio between the probability Pr(E∣H) of observing evidence E assuming H (often called the likelihood) and the probability Pr(E) of observing E. By the law of total probability, Pr(E) results from adding the probability of observing E assuming H and the probability of observing E assuming ¬H, each weighted by the prior probabilities of H and ¬H respectively:

Pr(E)=Pr(E∣H)×Pr(H)+Pr(E∣¬H)×Pr(¬H).

从贝叶斯定理可以明显看出,将先验概率乘以贝叶斯因子可以得到后验概率 Pr(H∣E)。其他条件相同的情况下,先验概率 Pr(H)越低,后验概率 Pr(H∣E)也越低。基本率谬误就是忽视先验概率对后验概率的影响(Kahneman 和 Tversky 1973)。这导致人们认为给定证据的假设的后验概率与实际情况不同(Koehler 1996)。

考虑之前讨论过的血液证据的例子。根据贝叶斯定理,两个条件概率 Pr(¬s∣m)和 Pr(m∣¬s)之间存在以下关系:

Pr(¬s∣m)=Pr(m∣¬s)×Pr(¬s)Pr(m∣¬s)×Pr(¬s)+Pr(m∣s)×Pr(s).

在没有其他有力证据相反的情况下,初步认为被告与犯罪案件关系不大是非常可能的,就像其他人一样。举个例子,假设先验概率 Pr(¬s)=.99,因此 Pr(s)=.01(关于如何评估先验概率的更多内容将在第 1.4 节中介绍)。接下来,Pr(m∣s)可以近似设为 1,因为如果被告是犯罪现场的血液来源,他应该与现场的血液匹配(暂不考虑假阴性的可能性)。专家估计,不是来源的人与现场发现的血液巧合匹配的概率(即 Pr(m∣¬s))为.05。根据贝叶斯定理,

Pr(¬s∣m)=.05(.05×.99)+(1×.01)×.99≈.83.

被告是来源的后验概率 Pr(s∣m)大约为 1−.83=.17,远低于夸大的.95 的值。如果先验概率更低,这个后验概率会更低。对于柯林斯案件也适用类似的分析。如果柯林斯的有罪先验概率足够低——比如 1/600 万——那么根据目击者描述的匹配,后验有罪概率大约为.7,远不如(1−112×106)≈.9999999 那么令人印象深刻。

1.2.4 辩护律师的谬误

1.2.4 Defense attorney’s fallacy

尽管基本比率信息不应被忽视,但过分关注它并忽略其他证据会导致所谓的辩护律师谬误。与之前一样,假设检察官专家证明被告与在犯罪现场发现的痕迹相匹配,并且与犯罪无关的随机人士巧合匹配的概率为 5%,因此 Pr(m∣¬s)=.05。声称被告是痕迹的来源的可能性为 95%,或者用符号表示为 Pr(s∣ match)=.95,将会犯前述的检察官谬误。但是假设辩护方辩称,由于该城镇的人口为 10,000 人,其中 5%的人会巧合匹配,即 10,000×5%=500 人。由于被告可能是其他 499 人中的任何一个留下的痕迹,他有 1/500=.2%的可能性是来源,这是一个相当不令人印象深刻的数字。辩方得出的结论是,这个匹配是毫无价值的证据。

这种分析将检察官的案件描述得比实际情况要弱。如果调查人员将嫌疑人范围缩小到 100 人,这是辩方忽视的一个潜在信息,那么匹配会使被告有 16%的可能性是来源。这个事实可以使用贝叶斯定理进行验证(留给读者作为练习)。即使按照辩方的说法,嫌疑人范围多达 10,000 人,被告是来源的先验概率将为 1/10,000,由于被告与痕迹匹配,这个概率应该上升到(大约)1/500。鉴于从 1/10,000 到 1/500 的概率上升,这个匹配不应被视为毫无价值的证据(稍后在 §2.1 中详细讨论)。

1.3 贝叶斯定理的赔率版本

到目前为止,所考虑的贝叶斯定理版本在信息上要求较高,因为总概率法则——即贝叶斯因子 Pr(E∣H)/Pr(E)的分母 Pr(E)——要求考虑 H 和包含所有可能的替代假设 ¬H 的总体备选假设。贝叶斯定理的一个更简单的版本是所谓的赔率公式:

Pr(H∣E)Pr(H′∣E)=Pr(E∣H)Pr(E∣H′)×Pr(H)Pr(H′),

或者用文字来说:

后验几率=似然比 × 先验几率。

这个比率

Pr(H)Pr(H′)

代表先验几率,其中 H 和 H'是两个竞争的假设,不一定是互补的。似然比

Pr(E∣H)Pr(E∣H′)

比较了给定两个假设的相同证据 E 的概率。后验几率

Pr(H∣E)Pr(H′∣E)

比较给定证据的假设的概然性。这个比率与给定证据的特定假设的概率 Pr(H∣E)不同。

作为一个例子,考虑 Sally Clark 案例(在 §1.2 中讨论过)。要比较的两个假设是 Sally Clark 的儿子死于自然原因(自然)和 Clark 杀害了他们(杀害)。可用的证据是两个儿子在相似的情况下相继死亡(两次死亡)。根据贝叶斯定理(在赔率版本中),

Pr(杀死 ∣ 两个死亡)Pr(自然 ∣ 两个死亡)=Pr(两个死亡 ∣ 杀死)Pr(两个死亡 ∣ 自然)×Pr(杀死)Pr(自然).

法律概然性

Pr(两个死亡 ∣ 杀死)Pr(两个死亡 ∣ 自然)

比较每个假设(杀害与自然)下证据(两个死亡)的可能性。由于在任何一种假设下,两个婴儿都会死亡-自然原因或杀害-比率应该等于一(Dawid 2002)。那么先验几率如何?

Pr(杀害)Pr(自然)?

回想一下儿科医生 Roy Meadow 提供的 1/(73×106)的数字。这个数字旨在传达两个婴儿相继死于自然原因的可能性是多么小。如果两个婴儿死于自然原因的可能性如此小-人们可能会推理-那么他们实际上可能并没有死于自然原因,而 Clark 杀害了他们。但是她真的杀害了他们吗?

他们死于自然原因的先验概率应与母亲杀害他们的先验概率进行比较。为了有一个大致的概念,假设在像英国这样的中等规模国家,每年有 100 万个婴儿出生,其中有 100 个被母亲谋杀。因此,母亲在一年内杀害一个婴儿的机会是 1/10,000。同一个母亲杀害两个婴儿的机会是多少?假设我们采用(有争议的)独立性假设。根据这个假设,母亲杀害两个婴儿的机会是 1/100,000,000。在假设独立性的情况下,

Pr(natural)=173×106

并且

Pr(kill)=1100×106.

这意味着先验几率将等于 0.73。在似然比为 1 的情况下,后验几率也将等于 0.73。根据这个分析,克拉克杀害她的儿子的可能性将比他们死于自然原因的可能性小 0.73 倍,换句话说,自然原因假设比克拉克杀害她的儿子的假设更有可能发生 1.37 倍。

必须记住这种分析的局限性。0.73 的比率是一种将一个假设与另一个假设相比较的概率度量。仅凭这个比率,无法推断出各个假设的后验概率。只有在竞争的假设 H 和 H'是互斥且穷尽的情况下,即一个是另一个的否定,才能从后验几率推导出后验概率。

法律概然性= P(H∣E)P(H′∣E)

通过等式

Pr(H∣E)=法律概然性 1+法律概然性.

但是假设 "kill" 和 "natural" 并不是穷尽的,因为这两个婴儿可能以其他方式死亡。因此,后验几率

Pr(kill∣ 两个死亡)Pr(natural∣ 两个死亡)

不能转化为各个假设的后验概率。(在第 3.3 节中,我们将介绍更复杂的概率分析。)

1.4 数字从哪里来?

在迄今为止考虑的例子中,概率是基于经验频率和专家意见进行分配的。例如,专家证词称只有 5%的人拥有特定的血型,用来设定 Pr(m∣¬s)=.05。概率也可以基于常识进行分配,例如,假设如果某人是犯罪痕迹的来源,那么这个人必须与犯罪痕迹匹配,将 Pr(m∣s)设为 1(暂不考虑伪造、制造痕迹或测试结果的假阴性)。但是,概率并不总是需要被分配为确切的值。事实上,达成确切值的一致意见可能非常困难,特别是对于先验概率而言。这对于法律概然性来说是一个挑战(见第 7.3 节)。规避这一挑战的一种方法是避免设定确切的值,而是采用合理的区间。这种方法基于敏感性分析,即评估先验概率对其他概率的影响。

考虑亲子鉴定案件 State v. Boyd(331 N.W.2d 480, Minn. 1983)。专家证人 Polesky 博士证明,在从普通人群中随机选择 1,121 个无关男性之前,才能找到另一个具有所有适当基因的男性,以成为质疑儿童的生物父亲。这种表述可能会产生误导,因为预期的匹配 DNA 个体数不一定与实际在人群中找到的匹配个体数相同(错误地认为相同是期望值谬误)。更仔细的表述是,随机选择的人是匹配的概率为 1/1121,或用符号表示,

Pr(m∣¬father)=11121.

正如在 §1.2.3 中解释的那样,这种概率不能轻易地转化为遗传基因与 m 匹配的人是父亲的概率,或者用符号表示为 Pr(father∣m)。后者应该使用贝叶斯定理计算:

Pr(father∣m)=Pr(m∣father)×Pr(father)Pr(m∣father)×Pr(father)+Pr(m∣not-father)×Pr(not-father)

在实际实践中,建立亲子关系的公式更加复杂(Kaiser 和 Seber,1983 年),但为了说明的目的,我们将这种复杂性抽象出来。假设被告是父亲的先验概率很低,例如 0.01,或者用符号表示为 Pr(父亲)=0.01。将这个先验概率代入贝叶斯定理,以及 Pr(子女 ∣ 父亲)=1 和 Pr(子女 ∣ 非父亲)=1/1,121,得到一个关于亲子关系的概率 Pr(父亲 ∣ 子女),大约等于 0.92。

但为什么将先验概率 Pr(父亲)设为 0.01 而不是其他值呢?敏感性分析的思想是考虑一系列合理的概率分配,并研究这些选择的影响。在法律应用中,关键问题是是否对被告最有利的分配仍会产生对被告的强有力证据。在这个案例中,专家证词非常有力,因此在先验概率 Pr(父亲)的广泛范围内,后验概率 Pr(父亲 ∣ 子女)仍然很高,如图 1 所示。

图 1

一旦先验概率超过约 0.008,后验概率就会超过 0.9。在亲子鉴定案件中,根据母亲的证词和其他证据,很明显,在专家证词被考虑之前,父亲身份的概率应该比先验概率更高,无论先验概率确切是多少。在没有确定一个确切值的情况下,大于 0.008 的值范围将保证亲子关系的后验概率至少为 0.9。这足以满足统治亲子纠纷等民事案件的优势标准(有关证明标准,请参见第 5 节后面的内容)。

1.5 法律概然性、活动和犯罪程度假设

评估概率的困难与所选择的感兴趣的假设密切相关。在某种程度上,假设可以分为三个层次:犯罪、活动和来源层次的假设。在犯罪层次上,问题是被告是否有罪,就像陈述“史密斯犯有过失杀人罪”一样。在活动层次上,假设描述了发生了什么以及参与者做了什么或没有做什么。活动层次假设的一个例子是“史密斯刺伤了受害者”。最后,来源层次的假设描述了痕迹的来源,比如“受害者在现场留下了污渍”,而不具体说明痕迹是如何到达那里的。忽视假设层次的差异可能导致严重的混淆。

考虑一个 DNA 匹配是主要的罪证的案例。DNA 证据是目前最广泛使用的定量证据形式之一,但其与血液证据或其他形式的痕迹证据并没有太大区别。在作证关于 DNA 匹配时,审判专家通常会评估一个随机人与犯罪无关的可能会巧合匹配犯罪痕迹的概率(Foreman 等,2003 年)。这被称为基因型概率或随机匹配概率,可以非常低,大约是 1 亿分之一甚至更低(Donnelly,1995 年;Kaye 和 Sensabaugh,2011 年;Wasserman,2002 年)。人们很容易将随机匹配概率等同于 Pr(m∣ 无罪),并结合先验 Pr(无罪)使用贝叶斯定理计算无罪的后验概率 Pr(无罪 ∣m)。这是一个错误。当然推荐应用贝叶斯定理,有助于避免检察官谬误,即将 Pr(无罪 ∣m)和 Pr(m∣ 无罪)混淆。问题在于此处。将随机匹配概率等同于 Pr(m∣ 无罪)忽视了犯罪、活动和来源层面假设之间的差异。DNA 匹配不能直接回答有罪或无罪的问题。即使嫌疑人是现场遗留遗传物质的来源,匹配也不能证明被告确实到过现场并与受害人接触,即使他们确实接触过,也不能推断他们犯下了被指控的罪行。

很少形式的证据能够直接证明犯罪程度的假设。更容易进行概率量化的间接证据,如 DNA 匹配和其他痕迹证据,并不能直接证明。目击证词可能更直接地证明犯罪程度的假设,但它也不容易进行概率量化(参见 Friedman 1987,Wixted 和 Wells 2017 的最新结果,以及 Urbaniak 等人 2020 年相关问题的调查)。这使得很难对犯罪程度的假设分配概率。超越源级别的假设需要科学家、调查人员和律师之间的密切合作(参见 Cook 等人 1998 年的讨论)。

2. 证据的强度

在给定证据的情况下,假设的后验概率不应与证据支持假设的强度(或证据的证明价值、权重)混淆。证据的强度反映了它对假设概率的影响。假设 H 的先验概率非常低,比如 Pr(H)=.001,但考虑到证据 E 后,这个概率提高到 35%,即 Pr(H∣E)=.35。这是一个显著的上升。即使给定 E 的 H 的后验概率不高,E 仍然强烈支持 H。本节将探讨概率论如何帮助评估证据的强度。

2.1 贝叶斯因子 v. 似然比

证据强度的概念——与先验概率和后验概率不同——可以以多种不同的方式进行形式化捕捉(有关全面讨论,请参阅确认理论条目)。证据强度的一种度量是贝叶斯因子

Pr(E∣H)Pr(E)

(已在 §1.2.3 中讨论过)。这是一种直观上合理的证据强度度量。请注意,根据贝叶斯定理

Pr(H∣E)=BayesFactor(H,E)×Pr(H),

因此,当且仅当后验概率 Pr(H∣E)高于先验概率 Pr(H)时,贝叶斯因子大于一。贝叶斯因子越大(大于一的值),先验概率到后验概率的上移越大,E 对 H 的正面支持越强。相反,贝叶斯因子越小(小于一的值),先验概率到后验概率的下移越大,E 对 H 的负面支持越强。如果 Pr(H)=Pr(H∣E),则证据对 H 的先验概率没有上移或下移的影响。

贝叶斯因子是对证据 E 支持假设 H 的绝对度量,因为它将在假设 H 下的 E 的概率与总体下的 E 的概率进行比较。分母是根据总概率法则计算的:

Pr(E)=Pr(E∣H)Pr(H)+Pr(E∣¬H)Pr(¬H)。

可以将包罗万象的备选假设 ¬H 替换为更细粒度的备选集合,比如 H1、H2、…、Hk,只要 H 及其备选项覆盖了所有可能性空间。总概率法则将变为:

Pr(E)=Pr(E∣H)Pr(H)+k∑i=1Pr(E∣Hi)Pr(Hi).

而不是贝叶斯因子,证据的强度可以通过似然比来评估,似然比是一种比较性的度量,用于判断证据 E 是否比竞争假设 H'更支持假设 H,符号表示为

Pr(E∣H)Pr(E∣H')。

例如,一位专家可能作证,被告的夹克上的血迹如果穿着夹克的人打了受害者(假设 H),那么看到的可能性要比没有打受害者(假设 H')高十倍(Aitken, Roberts, & Jackson 2010, 38)。如果证据支持 H 而不是 H',比值将大于一;如果证据支持 H'而不是 H,比值将小于一。比值越大(大于一),证据越有利于支持 H 而不是 H'。比值越小(小于一),证据越有利于支持竞争假设 H'而不是 H。

可能性比值之间的关系

Pr(E∣H)Pr(E∣H')

和后验几率

Pr(H∣E)Pr(H′∣E)

在贝叶斯定理的几率版本中(见 §1.3 中的早期部分),这是显而易见的。如果似然比大于(小于)1,后验几率将大于(小于)H 的先验几率。因此,似然比是证据对两个假设 H 和 H′的几率的上升或下降影响的度量。

作为证据强度的度量标准,与似然比相竞争的一个更简单的概念是概率 Pr(E∣H)。人们很容易认为,只要 Pr(E∣H)很低,E 就应该是反对 H 的有力证据。以 Triggs 和 Buckleton(2014)的一个例子为例。在一个虐待儿童的案件中,检察官提供了一个证据,即一对夫妇的孩子摇晃(一种运动模式),而非虐待儿童中只有 3%摇晃,Pr(孩子摇晃 ∣ 无虐待)=.03。如果非虐待儿童摇晃的可能性很小,那么这个孩子摇晃可能看起来是虐待的有力证据。但是对这个 3%的解读是错误的。很有可能虐待儿童中有 3%摇晃,Pr(孩子摇晃 ∣ 虐待)=.03。如果在任何一个假设下摇晃都不太可能,也就是说似然比 Pr(孩子摇晃 ∣ 虐待)Pr(孩子摇晃 ∣ 无虐待)等于 1,那么摇晃就不能作为虐待的证据。为了避免对证据的夸大,最好通过似然比而不是给定假设下的证据概率来评估它(ENFSI 2015;Royall 1997)。

Pr(child rocks∣abuse)Pr(child rocks∣no abuse)

equals one—rocking cannot count as evidence of abuse. In order to avoid exaggerations of the evidence, it is best to assess it by means of the likelihood ratio rather the probability of the evidence given a hypothesis (ENFSI 2015; Royall 1997).

2.2 冷遇到的 DNA 匹配

为了更好地理解似然比,以 DNA 证据为案例研究是很有启发性的,特别是关注冷遇到的匹配。DNA 证据可以用来证实案件中的其他证据,也可以作为主要的指控证据。假设不同的调查线索指向一个名叫马克·史密斯的个体作为犯罪者。假设调查人员还在犯罪现场找到了几个由犯罪者留下的痕迹,并且实验室分析显示与这些痕迹相关的基因型与史密斯匹配。在这种情况下,DNA 匹配证实了对史密斯的其他证据。相反,假设没有调查线索能够让警方确定嫌疑人。唯一的证据是在犯罪现场找到的痕迹。警方将与这些痕迹相关的基因型与数据库中的基因型进行比对,并找到了一个匹配,即所谓的冷遇到的匹配。由于在冷遇到的案件中没有其他证据,冷遇到的匹配是对被告的主要证据。一些学者认为这种情况削弱了匹配的证据价值。其他人持不同意见。现在我们来审视一些这场辩论中的主要论点。

2.2.1 随机匹配 vs 数据库匹配

假设一位专家证明犯罪的基因迹象与被告匹配,并且随机匹配概然性极低,比如 1 亿分之一。随机匹配概然性,通常被解释为非源头个体巧合匹配的概然性 Pr(m∣¬s),是衡量 DNA 匹配强度的常见指标。这个概然性越低,匹配的证据越有力。严格来说,只有当似然比 Pr(DNA match∣s)Pr(DNA match∣¬s)显著大于 1 时,匹配才是被告是源头的强有力证据。

然而,在实践中,当随机匹配概然性低时,即 Pr(m∣¬s)低时,似然比应该显著大于 1,因为只要测试具有较低的假阴性率,源头个体匹配的概然性 Pr(m∣s)应该是高的。因此,从实际目的来看,低随机匹配概然性确实算作强有力的证据。

is significantly greater than one. In practice, however, when the random match probability is low—that is, Pr(m∣¬s) is low—the likelihood ratio should be significantly above one because the probability that the individual who is the source would match, Pr(m∣s), should be high so long as the test has a low false negative rate. For practical purposes, then, a low random match probability does count as strong incriminating evidence.

然而,当涉及到冷案匹配时,会出现进一步的复杂情况。帕克特案可以作为一个例证。2008 年,约翰·帕克特通过对 33.8 万个档案的数据库搜索被确认身份。他是数据库中唯一与 1972 年强奸受害者黛安娜·西尔维斯特收集到的痕迹相匹配的个体。专家证人作证称,帕克特的基因型在高加索男性中应该以 1/110 万的频率随机出现。这似乎是对帕克特无辜的有力证据。但是辩方的 DNA 专家比卡·巴洛指出,除了冷案匹配之外,对帕克特的证据很少。巴洛认为,正确评估冷案匹配需要将 1/110 万乘以数据库的大小。将这个乘积的结果称为数据库匹配概然性。将 1/110 万乘以 33.8 万,得到的数据库匹配概然性约为 1/3,一个不令人印象深刻的数字。如果数据库中的某个人的匹配概然性为 1/3,冷案匹配就不应被视为对帕克特的有力证据。这就是巴洛的论点。

巴洛根据 1996 年国家研究委员会的一份报告进行了研究,该报告通常被称为 NRC II(国家研究委员会 1996 年)。该报告建议,在冷案中,随机匹配概然性应该乘以数据库的大小。这个修正措施旨在防止数据库中无辜人员被错误匹配的风险增加。NRC II 使用了一个类比。如果你一次性投掷几个不同的硬币,第一次尝试时所有硬币都显示正面,这个结果似乎是硬币有偏倚的强有力证据。然而,如果你重复这个实验足够多次,几乎可以肯定在某个时刻所有硬币都会正面朝上。这个结果不应该被视为硬币有偏倚的证据。根据 NRC II 的说法,多次重复投掷硬币实验类似于通过搜索个人资料数据库来寻找匹配。随着数据库的增大,越有可能在数据库中找到与犯罪无关的人匹配。

这个类比的适用性受到了质疑(Donnelly 和 Friedman 1999)。毫无疑问,搜索一个更大的数据库会增加在某个时刻找到匹配的概率。但是这里相关的命题不是“数据库中至少有一个个人资料会与犯罪样本随机匹配”。相反,相关的命题是“被审判的被告个人资料会与犯罪样本随机匹配”。找到被告和犯罪样本之间的匹配概率并不会因为数据库中其他人的测试而增加。事实上,假设全世界的人都被记录在数据库中,一个唯一的冷案匹配将是极为有力的罪证,因为除了一个匹配的个体之外,所有人都被排除为嫌疑人。相反,如果随机匹配概然性乘以数据库的大小,匹配的证据价值应该非常低。这是违反直觉的。

有时候会使用另一个类比来主张冷命中匹配的证据价值应该被削弱。这个类比是在数据库中搜索匹配和多重假设检验之间的类比,后者是一种不可取的研究实践。在经典的假设检验中,如果单次检验一个假设的 I 型错误的概率为 0.05,那么通过多次检验同一个假设,这个概率会增加。数据库匹配的概率——据说——会纠正 I 型错误风险的增加。然而,正如 Balding(2002 年,2005 年)指出的,多重检验是指针对新证据多次检验同一个假设。在冷命中案件中,多个假设——每个假设都涉及数据库中的不同个体——只会被检验一次,如果出现负匹配,则被排除。从这个角度来看,被告是源头的假设是受到检验的众多假设之一。冷命中匹配支持这个假设,并排除其他假设。

2.2.2 冷命中匹配的似然比

一种更有原则的评估冷命中匹配的方法是基于似然比。该提议借鉴了所谓的岛屿问题的文献,由 Eggleston(1978 年),Dawid(1994 年)和 Dawid 和 Mortera(1996 年)研究。让检察官的假设 Hp 是“嫌疑人是犯罪痕迹的源头”,辩护假设 Hd 是“嫌疑人不是犯罪痕迹的源头”。让 M 是犯罪痕迹和嫌疑人(包括在数据库中)之间的 DNA 匹配,D 是没有任何一个数据库中的个人与犯罪痕迹匹配的信息。与 M 和 D 相关的似然比应该是(Balding 和 Donnelly 1996 年;Taroni 等人 2014 年):

V=Pr(M,D∣Hp)Pr(M,D∣Hd).

由于 Pr(A∧B)=Pr(A∣B)×Pr(B),对于任意的陈述 A 和 B,这个比率可以写成

V=Pr(M∣Hp,D)Pr(M∣Hd,D)×Pr(D∣Hp)Pr(D∣Hd).

第一个比率

Pr(M∣Hp,D)Pr(M∣Hd,D)

大约是 1/γ,其中 γ 是随机匹配概然性。第二个比率

Pr(D∣Hp)Pr(D∣Hd)

是数据库搜索比率,定义如下(详见 Balding 和 Donnelly 1996; Taroni 等人 2014):

Pr(D∣Hp)Pr(D∣Hd)=11−φ,

其中 Pr(S∣Hd)=φ,S 代表数据库中某人是犯罪痕迹的来源的命题。Donnelly 和 Friedman(1999)为这个比率推导出了类似的公式。随着数据库的增大,φ 增加,数据库搜索比率也增加。只有当数据库中没有人可能是来源时,这个比率才等于一。

由于冷命中匹配的似然比 V 是通过将 DNA 匹配的似然比和数据库搜索比率相乘得到的,V 始终大于仅仅匹配的似然比(除非 φ=0 的不切实际情况)。因此,冷命中的 DNA 匹配应被视为比先前确定的嫌疑人的 DNA 匹配更强的证据。Dawid 和 Mortera(1996)研究了不同的数据库搜索策略,并考虑了关于匹配信息本身不确定性的可能性,但总体观点保持不变。在合理的假设下,忽略数据库搜索将给出对冷命中匹配的证据强度的保守评估。

在基于冷命中匹配进行定罪时存在直观的抵制,但在普通匹配的情况下,这种抵制较弱(稍后在第 6 节中详细讨论)。然而,这种偏好基于普通 DNA 匹配的定罪似乎与冷命中匹配作为比普通匹配更强的罪证的主张相矛盾。然而,有一种方法可以调和双方。关键是要记住,通过似然比来衡量的证据强度不应与给定证据的有罪后验概率混淆。如果冷命中匹配是唯一的有罪证据,那么与其他证据(如调查线索)补充 DNA 匹配的情况相比,有罪的后验概率可能会较低。这种较低的后验概率将解释了对冷命中案件定罪的直观抵制,尽管冷命中匹配具有更强的证据价值。

2.3 选择竞争假设

似然比有助于评估证据的强度,正如前面关于冷命中匹配的讨论所示。然而,一个主要困难是选择应该进行比较的假设 H 和 H'。这些假设应该相互竞争 - 比如,在刑事审判中,H 是由起诉方提出的假设,而 H'是由辩护方提出的假设。但是,这个限制为操纵和误解证据留下了可能性。让我们来研究一下关于这个主题的文献中的一些主要争议。

2.3.1 临时假设和巴里·乔治

再次考虑一个简化的 DNA 证据案例。假设检察官提出了一个假设,即嫌疑人在犯罪现场留下了被发现的痕迹。实验室分析显示,被告的基因与这些痕迹相匹配,从而对这一假设提供了很好的支持。然而,辩护方提出了以下临时假设:“犯罪痕迹是由某个未知人士留下的,恰好与嫌疑人具有相同的基因型”。由于在任何一种假设下,DNA 匹配的概率都是 1,似然比等于 1(Evett, Jackson, and Lambert 2000)。这个问题是普遍存在的。对于任何一项证据和任何给定的检察官假设 H,都存在一个临时竞争假设 H∗,使得

Pr(E∣H)Pr(E∣H∗)=1.

假设 H∗ 是一个刚好的假设,它只是被选择出来,因为它能够像假设 H 一样解释证据(Mayo 2018: 30–55)。如果对竞争假设的选择没有进一步的限制,似乎没有任何证据能够定罪被告。

法官和陪审团通常会认识到特定情况下的假设,即那些不应该被认真对待的人为理论。也许,在审判参与者的常识下,可以足够地限制假设的选择方式。但是真实案例往往很复杂,选择竞争性假设并不明显是否合法,尤其那些不明显是特定情况下的假设的情况。

一个显著的例子是 R. v. George (2007 EWCA Crim 2722)。Barry George 被指控谋杀英国记者和电视名人 Jill Dando。一年后,在 George 的外套口袋中发现了一粒枪支残留物,与犯罪现场的残留物相匹配。这是针对他的关键证据。George 被判有罪,他的第一次上诉未获成功。在第一次上诉后,来自法庭科学服务的 Ian Evett 担心证据在审判中没有得到适当评估。陪审团被呈现了在辩护假设下,在 George 的外套中发现枪支残留物的条件概率。这个概率被估计为相当低。但是陪审团没有被呈现在检察官假设下,在 George 开枪射击 Dando 的情况下发现相同证据的条件概率。一位专家证人 Keeley 先生被要求提供两个条件概率,并估计它们为 1/100,这表明枪支残留物没有证明价值。George 在 2007 年再次上诉,并依靠 Keeley 的估计获得了上诉的胜利。

一项对审判记录的研究表明,基利选择的假设缺乏连贯性,因此基于它们的似然比毫无意义。有一次,基利将乔治口袋中发现的粒子来自乔治本人开枪的假设与来自其他来源的替代假设进行了比较。另一次,基利将检察官的假设视为“在乔治口袋中发现的粒子来自杀害丹多的枪”。但是,鉴于这个假设,证据的条件概率不应该很低,实际上应该是 1。对审判记录的最宽容解读表明,专家心中想到的是“乔治是杀害丹多的人”和“乔治的外套完整性被破坏”这两个假设(详见 Fenton 等人 2014 年的详细信息),但基利没有为何要将这些假设在似然比中进行比较提供任何理由。

相关的复杂性在于,竞争性假设可以涉及任何事实争议,从细微的细节,比如用来窒息受害者的布料是红色还是蓝色,到最终问题,比如被告是否刺伤了受害者。似然比在不同粒度的假设下会有所不同:犯罪、行为和来源级别的假设(关于这个区别,请参见 §1.5 中的早期内容)。甚至有可能,在来源级别上,似然比支持一方,比如起诉方,但在犯罪级别上,似然比支持另一方,比如辩护方,尽管两个级别的假设非常相似(Fenton 等人 2014 年)。

2.3.2 独占和穷尽?

巴里·乔治案中的混乱归因于在似然比中选择假设的规则不明确。其中一条规则可以是:选择互斥的竞争假设(它们不能同时为真)和穷尽的假设(它们不能同时为假)。通过这种方式,各方将无法选择特定的假设并偏向自己有利地评估证据。

似然比中的假设应该是互斥的和穷尽的还有其他充分的理由。如果它们不是这样,似然比可能会产生违反直觉的结果。为了理解为什么,首先考虑不互斥的假设。让 Hp 代表“被告有罪”,Hd 代表“被告不在犯罪现场”。让 E 代表在犯罪发生前十分钟,目击到被告在另一个地点通过电话说“继续,杀了他”。

法律概然性中,假设的互斥性和穷尽性是必要的。如果不满足这些条件,似然比可能会得出令人费解的结果。为了说明这一点,首先考虑不互斥的假设。让 Hp 代表“被告有罪”,Hd 代表“被告不在犯罪现场”。让 E 代表在犯罪发生前十分钟,目击到被告在另一个地点通过电话说“继续,杀了他”。

证据积极支持每个假设,然而在这种情况下,可能性比应该等于一。此外,考虑两个不完全的竞争假设。假设弗雷德和比尔试图抢劫一个人。受害者进行了抵抗,被打在头部并死亡。假设 Hp 代表“弗雷德造成了致命一击”,Hd 代表“比尔造成了致命一击”。这些假设并不是完全穷尽的,因为第三个假设是“这个人没有死于这一击”。假设 E 是受害者六个月前发生心脏病的信息。概然性比

Pr(E∣Hp)Pr(E∣Hd)

等于一,因为

Pr(E∣Hp)=Pr(E∣Hd).

然而,E 降低了 Hp 和 Hd 的概率。因此,在这种情况下,证据对每个假设的支持是负面的,与似然比所暗示的相反。

但是,仅依赖于互斥且穷尽的假设也并非没有复杂性。考虑一个专家决定通过否定起诉假设来制定辩护假设,比如说,“被告没有打击受害者的头部”。这种选择的辩护假设在评估证据时可能没有帮助。如果他没有打击受害者的头部,嫌疑人会携带这样的血迹的概率是多少?这取决于他是否在现场,他当时在做什么以及许多其他情况。正如 Evett、Jackson 和 Lambert(2000)指出的那样,用于评估证据强度的特定假设的选择将取决于情境因素。往往情况下,选择的假设不会是互斥的。对于陪审员或法官在审判中做出决定来说,比较互斥且穷尽的假设也可能没有帮助。例如,在亲子鉴定案件中,专家不应该比较“被告是孩子的父亲”和其否定,而应该比较“被告是孩子的父亲”和“孩子的父亲是与自称父亲无关的男子”(Biedermann 等,2014)。即使被告的亲属是潜在的父亲,考虑这种牵强的可能性会使评估证据变得比必要的更加困难(Evett 等,2000)。

独占性和穷尽性假设防止任意比较,并确保更有原则性的证据评估。缺点是这些假设涵盖了所有可能性的空间,而在这个空间中筛选是认知上不可行的(Allen 2017)。在这方面,比较更为限定的假设更可取。然而,这样做的危险在于似然比严重依赖于所比较的假设。在选择假设的自由度越大,作为证据价值度量的似然比就越变化多样。

2.4 两个污渍问题

一个进一步说明似然比作为证据强度度量的局限性的案例研究是两个污渍问题,最初由 Evett(1987)提出。

在 Evett 的原始表述中,两个不同来源的污渍留在犯罪现场,嫌疑人的血液与其中一个相匹配。让第一个假设是嫌疑人是犯罪的两个人之一,第二个假设是第一个假设的否定。Evett(1987)表明(详见他的论文),相对于这两个假设,匹配的似然比是 1/2q1,其中 q1 是第一个污渍特征的估计频率。令人惊讶的是,似然比不依赖于与第二个污渍相关的频率。

现在考虑一个更复杂的两个污渍情景。假设一起犯罪是由两个人犯下的,他们在犯罪现场留下了两个污渍:一个在枕头上,另一个在床单上。约翰·史密斯因其他原因被逮捕,他的 DNA 与枕头上的 DNA 相匹配,但与床单上的 DNA 不匹配。Meester 和 Sjerps(2004)认为,与数值不同的似然比相关的三对假设是可信的(详见他们的论文)。这三个选项列在表 2 中,其中 R 是史密斯基因型的随机匹配概率,δ 是史密斯是犯罪现场供体之一的先验概率。

| | | | | --- | --- | --- |表 2

即使可能性比率在数值上不同,它们在给定证据的情况下的后验概率是相同的。请注意,表中三个 Hp 的先验几率应以 δ 的形式书写。根据(Meester 和 Sjerps 2004)的建议,表中第一个假设的先验几率为 δ/(1-δ)。第二个假设的先验几率为(δ/2)/(1-δ)。第三个假设的先验几率为(δ/2)/(1-(δ/2))。在每种情况下,后验几率-先验几率乘以可能性比率的结果-是相同的:R×δ/(2(1-δ))。因此,尽管可能性比率存在差异,不同假设的后验几率是相同的,只要先验几率适当相关。

Meester 和 Sjerps(2004)建议,每个可能性比率都应附带一个表格解释,说明选择先验几率(或先验概率)将如何影响后验几率,适用于一定范围的先验(有关此策略的一般讨论,称为“敏感性分析”,请参见 §1.4 中的早期讨论)。通过这种方式,可能性比率的影响变得清晰,无论选择哪些假设。这种策略承认可能性比率的信息不足,应与其他信息(如一系列先验)结合使用,以便对证据进行充分评估。

法律应用的贝叶斯网络

到目前为止,我们已经研究了概率论如何帮助评估单个证据项目,例如 DNA 匹配。但事情往往更加复杂。在法律案件中,不同的证据线索可能会汇聚,例如两名证人证明被告在犯罪现场被目击,或者它们可能会分歧,例如一名证人声称被告在犯罪现场被目击,而 DNA 测试显示被告与现场之间没有基因匹配。复杂性的另一个来源是在审判中,各方提出的假设往往是复杂的陈述结构。如何将不同的陈述及其支持证据结合起来,评估整个检察官的案件(或辩护方的案件)?

原则上,可以通过顺序应用贝叶斯定理来评估给定多个证据的假设的概率。例如,考虑一种情况,被告面临两个证据:DNA 匹配和在现场发现的与被告头发颜色相匹配的头发证据。假设(通常如此)某人的头发颜色与某人的基因型无关。假设头发证据的似然比为 40,DNA 匹配的似然比为 200,即在有罪假设下找到这些证据的可能性比无罪假设下高 40 倍(和 200 倍)。如果有罪与无罪的先验几率为 1/1000,则后验几率将为 1/1000×40×200=8。

这些计算是直接的,但在更现实的情况下,会出现复杂性。审判中的各方通常会提出几个零散的索赔,需要将它们组合在一起形成一个关于发生了什么的理论。例如,检察官可能会提出目击证词,以主张被告从犯罪现场逃跑,同时提供文件证据作为动机的证明。不同的零散索赔,每个都由不同的证据支持,必须组合起来形成关于发生了什么的结构化假设。由于不同的索赔和不同的证据可能相互依赖,直接计算很快就变得难以管理。幸运的是,有一种工具可以使任务变得更容易:贝叶斯网络。本节介绍了在呈现、汇总和评估复杂证据和假设时部署贝叶斯网络的准则。

3.1 法律概然性的拯救

贝叶斯网络可以用于法律事实查明的概率推理的想法在八十年代末(Friedman 1986)和九十年代初(Edwards 1991)开始引起关注。两本最近关于该主题的书,强调法律应用,分别是 Fenton 和 Neil 2013 [2018] 和 Taroni 等人 2014。贝叶斯网络由两个组成部分组成:第一,表示变量之间依赖关系(由箭头表示)的有向无环图(由节点表示);第二,条件概率表。首先考虑图形组件。图形是无环的,因为连接节点的箭头不形成循环。作为示例,假设 H 是嫌疑人犯下谋杀的索赔,BT 是与犯罪现场血迹匹配的 B 型血的存在,W 是目击证人观察到嫌疑人在犯罪发生时附近的事实。贝叶斯网络的图形组件将如下所示:

图 2

节点 X 的祖先是通过沿着箭头向前到达 X 的所有节点。节点 X 的父节点是可以在一步内达到 X 的节点。节点 X 的后代是通过沿着箭头向前到达 X 的所有节点。子节点是可以在一步内达到 X 的节点。在这个例子中,H 是 W 和 BT 的父节点(和祖先),它们是它的子节点(和后代)。没有非父节点的祖先或非子节点的后代。

节点和箭头表示的变量之间存在概率依赖关系。为了描述这些关系,图形模型随附有条件概率表。对于没有父节点的节点(如 H),表格指定了其所有可能状态的先验概率。假设 H 代表一个具有两个可能状态的二元随机变量,则先验概率可以是:

| | | | --- | --- |表 3

H=凶手的 0.01 数值是基于以下假设:在没有任何证据指向被告的情况下,被告不太可能有罪。对于子节点,表格指定了在父节点状态组合下的条件概率。如果变量是二进制的,它们的值分配可以是:

| | | | | --- | --- | --- |表 4

| | | | | --- | --- | --- |表 5

根据上述表格,即使被告不是凶手,目击证词仍会以 0.4 的概然性将其定罪,而血液证据的概然性仅为 0.063。血型频率估计是现实的(Lucy 2013: 141),目击证词的条件概率也是如此。如预期的那样,目击证词被认为比血液匹配证据不可信(但关于评估目击证词的复杂性,请参见 Wixted 和 Wells 2017;Urbaniak 等人 2020)。

上述三个概率表是定义概率分布所需的全部内容。这些表没有指定不处于子/父关系的节点之间的概率依赖关系,例如 BT 和 W。由于它们之间没有箭头,节点 BT 和 W 在 H 的条件下被假定为独立,即 Pr(W∣H)=Pr(W∣H∧BT)。这一事实作为网络结构的一部分,表示了目击证词和血液证据之间的独立性。这一事实的一般化被称为所谓的马尔可夫条件(参见 Neapolitan [2004] 的教科书和人工智能条目中关于贝叶斯网络的补充部分)。

尽管上述的贝叶斯网络——包括一个有向无环图和概率表——很简单,但正确直观地评估给定证据的假设概率已经具有挑战性。试着猜测被告犯下谋杀罪的概率(H=凶手),给定以下证据状态:

  • 嫌疑人的血型与犯罪痕迹相匹配,但关于证人的信息不可得知。

  • 嫌疑人的血型与犯罪痕迹相匹配,但证人称他们没有看到嫌疑人在犯罪现场附近。

  • 嫌疑人的血型与犯罪现场的血迹相符,目击者称他们在犯罪现场附近看到了嫌疑人。

即使在这个复杂程度上,手工计算也变得繁琐。相比之下,贝叶斯网络的软件(例如,由 Marco Scutari 开发的 R 包 bnlearn,详见 Scutari 和 Denis 2015)将轻松给出以下结果:

| | | | --- | --- |表 6

或许令人惊讶的是,即使两个证据都是指控性的(BT=match,W=seen),H = 凶手的后验概率约为 0.22。

3.2 成语

在建模证据和假设之间的关系时,通常使用简单的图形模式(称为成语)。通过以模块化的方式组合这些基本模式,可以构建复杂的图形模型。构建贝叶斯网络的一般方法在(Neil, Fenton, and Nielson 2000; Hepler, Dawid, and Leucari 2007)中进行了讨论,一般的成语在(Fenton, Neil, and Lagnado 2013)中进行了讨论。下面是一些基本成语的示例。

证据成语是关于假设和证据之间关系的最基本的图形表示:

图 3

这个有向图表明影响的方向——虽然概率上的依赖性是双向的——从假设到证据(尽管可以但不必被解释为因果关系)。假设节点和证据节点可以是二元变量,例如“被告是犯罪现场痕迹的来源”(假设)和“被告与犯罪痕迹的基因匹配”(证据)。但变量不一定是二元的。假设节点可以取 1-40 的范围内的值,比如从枪击的距离(以米为单位),而证据节点可以是表示枪击残留物密度的连续变量(Taroni 等人,2014)。

一个更复杂的习语,称为证据准确性习语,由两个箭头进入证据节点(Bovens 和 Hartmann,2004; Fenton,Neil 和 Lagnado,2013)。一个箭头来自假设节点,另一个来自准确性节点。这个习语可以用来模拟,比如酒精测试:

图 4

箭头的方向表明证据的准确性(准确性节点)和酒精水平(假设节点)影响测试结果(证据节点)。图形模型表示不同的不确定性来源。与测试的敏感性和特异性相关的不确定性,即测试在酒精水平过高时报告酒精水平过高的概率(敏感性),以及测试在酒精水平正常时报告酒精水平正常的概率(特异性),由从假设节点(过高酒精水平)指向证据节点(过高证据)的箭头捕捉。其他不确定性来源包括警察虚报测试报告的可能性,以及驾驶员服用药物后影响酒精水平的可能性。可以通过添加准确性节点(如果每个因素都与其他因素分开考虑,则可以添加多个准确性节点)来考虑这些可能性。

当多个证据项目彼此依赖时(在许多法律案件中可能发生),这种情况由证据依赖习语建模。根据 Fenton 和 Neil(2013 [2018])的一个例子,如果两个朝同一位置的安全摄像头中的一个捕捉到一个看起来像被告但实际上不是他的人的图像,那么很可能同一个人经过第二个摄像头,第二个摄像头也捕捉到了同样的图像。在这种情况下,将第二个记录视为独立于第一个记录将导致对证据强度的过高估计。

图 5

网络结构是非常自然的。假设的真实性,比如被告在犯罪现场出现,会影响摄像机是否捕捉到一个看起来像被告的人的图像。然而,如果两个摄像机的录像彼此依赖(例如,它们以相似的角度指向同一位置),第二个摄像机捕捉到与第一个相同的图像并不会在已知第一个摄像机录像的情况下使假设更有可能。

最后,情景成语可以模拟复杂的假设,由在空间和时间中组织的事件序列(情景)组成。使用情景成语的图形模型将包括以下组件:首先,情景中的状态和事件的节点,每个节点与支持证据相连;其次,一个独立的情景节点,其子节点是状态和事件;最后,一个与情景节点的子节点对应的最终假设节点。图形模型如下所示(Vlek 等人,2014):

图 6 [图 6 的详细描述在补充材料中。]

情景节点统一了不同的事件和状态。由于这种统一作用,增加情景的某个部分的概率(例如状态/事件 2)也会增加其他部分(状态/事件 1 和状态/事件 3)的概率。这捕捉到了情景的不同组成部分形成一个相互连接的事件序列的事实。

通过其他图形设备(称为结构情景空间)与概率相结合,可以在 Shen 等人的工作(2007 年)、Bex(2011 年、2015 年)和 Verheij(2017 年)中找到对犯罪情景建模的讨论。另请参阅 Di Bello 和 Verheij(2018 年)的调查。Dawid 和 Mortera(2018 年)以贝叶斯网络的术语对情景进行了处理。Lacave 和 Díez(2002 年)展示了如何使用贝叶斯网络构建解释。

3.3 对整个案例进行建模

Kadane 和 Schum(2011 年)是最早尝试使用概率图对整个刑事案件进行建模的人之一,他们使用了 1920 年的 Sacco 和 Vanzetti 案例。最近,Fenton 和 Neil(2013 年 [2018 年])为 Sally Clark 案例(在 §1.3 中讨论过)构建了一个贝叶斯网络,如下所示:

图 7 [图 7 的详细描述在附录中。]

箭头表示变量之间的影响关系。萨莉·克拉克的儿子们,称之为 A 和 B,是死于 SIDS 还是谋杀(A.cause 和 B.cause)会影响到是否存在疾病迹象(A.disease 和 B.disease)和淤伤(A.bruising 和 B.bruising)。由于儿子 A 先死,A 是被谋杀还是死于 SIDS(A.cause)会影响到儿子 B 的死因(B.cause)。儿子们的死因决定了被谋杀的儿子数量(No.murdered),而被谋杀的儿子数量决定了萨莉·克拉克是否有罪(Guilty)。

根据 Fenton 和 Neil(2013 [2018])的计算(详见他们的论文),Guilty = Yes 的先验概率应为 0.0789。在考虑到审判中提出的证据后,例如存在淤伤迹象但没有现有疾病影响儿童,后验概率如下:

| | | | --- | --- |表 8

综合考虑的证据将罪行的概率从 0.0789 增加到 0.7019。这是一个显著的增加,但还不足以定罪。如果希望进行敏感性分析-请参见 §1.4 中的早期讨论-通过修改一些概率可以轻松实现。在上诉审判中,发现了新的证据,特别是证明儿子 A 受到了一种疾病的证据。一旦考虑到这一证据,罪行的概率降至 0.00459(如果 B 上也有疾病迹象,罪行的概率将进一步降至 0.0009)。有关如何获取概率的一般讨论,请参见 Renooij(2001)和 Gaag 等人(1999)。

4. 相关性

前面的章节模拟了证据评估,使用了贝叶斯定理(第 1 节),似然比(第 2 节)和贝叶斯网络(第 3 节)。然而,证据评估始于初步决策,即确定相关证据。一旦一条证据被认为是相关的,下一步就是评估其强度(证明价值,权重)。本节讨论了概率论如何帮助确定相关证据。

4.1 似然比

美国联邦证据规则将相关证据定义为对于判定行动的任何事实的存在具有比没有证据时更可能或更不可能的倾向的证据(规则 401)。

这个定义是用概率语言来表述的。法律概然性学派使用似然比来解释它,似然比是一种标准的概率测度,用于衡量证据的相关性(Aitken 等人,2010 年;Aitken 和 Taroni,1995 年 [2004];Lempert,1977 年;Lyon 和 Koehler,1996 年;Sullivan,2019 年)。似然比(在第 2 节中讨论)是在检察官或原告的假设下观察到证据的概率除以在辩护方假设下观察到相同证据的概率。

This definition is formulated in a probabilistic language. Legal probabilists interpret it using the likelihood ratio, a standard probabilistic measure of evidential relevance (Aitken et al. 2010; Aitken and Taroni 1995 [2004]; Lempert 1977; Lyon and Koehler 1996; Sullivan 2019). The likelihood ratio (discussed in Section 2) is the probability of observing the evidence given the prosecutor’s or plaintiff’s hypothesis, divided by the probability of observing the same evidence given the defense’s hypothesis.

令 E 为证据,H 为检察官或原告的假设,H'为辩护方的假设。似然比定义如下:

LR(E,H,H')=P(E∣H)P(E∣H')

在似然比解释中,相关性取决于竞争假设的选择。一条证据在与一对假设 H 和 H'相关时,只要似然比 LR(E,H,H')不等于 1,就被认为是相关的;否则被认为是不相关的。例如,在嫌疑人家中发现的血腥刀具是有利于检察官假设的相关证据,因为我们认为如果嫌疑人犯罪(检察官的假设),发现这样的证据的可能性要远高于他没有犯罪(辩护方的假设)(Finkelstein 2009)。一般来说,对于大于 1 的值,LR(E,H,H')>1,证据支持检察官或原告的假设 H;对于小于 1 的值,LR(E,H,H')<1,证据支持辩护方的假设 H'。如果证据在两个假设下的可能性相等,LR(E,H,H')=1,证据是不相关的。

4.2 小镇谋杀异议

这种相关性的解释已经受到质疑,因为有些情况下,证据在直觉上是相关的,但其概然比(可能性比)却等于一。以下是一个问题案例:

小镇谋杀:在一个小镇上,有人被指控犯有谋杀罪,有人目击他在谋杀发生前的时间驾车前往该小镇。检方的理论是他是为了犯罪而去那里的。辩方的理论是他是为了探望母亲而去那个小镇的。如果他有罪,这个证据的概然性等于他无罪时的概然性,因此概然比为 1...然而,全国各地的法庭上的每一位法官都会承认它 [作为相关证据]。(这个困难由罗纳德·艾伦提出,详见 Park 等人的讨论,2010 年)

这种情况的反例很多。假设一名囚犯和两名警卫因囚犯拒绝归还食物托盘而发生争执。囚犯没有收到家人寄给他的包裹,并以此为抗议而保留了托盘。辩护方称囚犯遭到了警卫的攻击,而起诉方称他袭击了警卫。关于寄给囚犯的包裹以及托盘的保留这一信息既不能支持任何一方的事实版本,但它是相关的证据(Pardo 2013)。

的确,如果一项证据 E 与两个竞争的假设 H 和 H'同样适用,那么 P(E∣H)=P(E∣H'),因此 LR(E,H,H')将等于 1。但可能性比可能会根据假设的选择而改变。规则 401 明确指出,相关证据应该具有使行动的决定更可能或更不可能的任何事实的存在的倾向 [我们的强调]。

any tendency to make the existence of any fact that is of consequence [emphasis ours] to the determination of the action more probable or less probable.

因此,要比较的假设范围应该是广泛的。仅仅因为对于 H 和 H'的特定选择,似然比等于一,这并不意味着对于任何对于确定发生了什么具有重要性的 H 和 H'的选择,似然比都等于一。在《小镇谋杀案》中,嫌疑人是否在镇上对于确定发生了什么具有重要性(如果他不在镇上,他就不能犯罪)。他被看到开车的事实是确定他是否在镇上的有用信息。

但是,如果要在似然比 LR(E,H,H')中比较的假设 H 和 H'的范围很广,这可能会引发另一个问题。确定证据的相关性所需的假设选择可能取决于其他证据,因此在听取所有证据之前很难确定相关性。罗纳德·艾伦和塞缪尔·格罗斯在 Park 等人(2010)中认为,这个事实使得概然性相关性解释变得不切实际。作为回应,大卫·凯指出,决定合理陪审团是否会发现证据 E 有用只需要看陪审团会合理考虑哪些假设或故事。由于陪审团将依赖于关于哪些故事是合理的几个线索,这个任务在计算上比遍历所有可能的假设组合要容易(Park 等人,2010)。

关于相关性悖论的问题在于,在复杂情况下,没有单一的似然比与证据相对应。问题的重点在于基于非排他或非穷尽假设的单一似然比。然而,只要证据对相关子假设具有概率影响,即使对检察官或辩护人的最终假设没有概率影响,证据仍然是相关的,符合《联邦证据规则》第 401 条的规定。贝叶斯网络(在前一节中讨论)有助于理解证据如何增加或减少不同子假设的概率(有关更多详细信息,请参见 de Zoete 等人 2019 年的研究)。

5. 证明标准

在证据在审判中被呈现、审查和交叉审问之后,经过培训的法官或陪审团必须做出决定(有关决定应该关于什么的一些建议,请参见 Laudan 2010 年的一些建议)。决策标准由法律定义,并包括证明标准,也称为说服的负担。如果对被告的证据足够强大,以满足所需的证明标准,被告应被判有罪。本节首先描述了法律中的证明标准,然后概述了证明标准的概率解释,并讨论了一些对这种解释的异议。

5.1 法律背景

在刑事诉讼中,统治标准是“合理怀疑以外的证明”。在民事案件中,标准通常是“证据的优势”。后者要求较低,因此同一证据可能足以满足优势标准,但不足以满足合理怀疑标准。一个生动的例子是 1995 年奥·J·辛普森被控谋杀妻子的审判。他被刑事指控无罪,但当受害者家属对他提起诉讼时,他们获胜了。根据合理怀疑标准,奥·J·辛普森没有杀害妻子,但根据优势标准,他确实杀害了妻子。在某些特别重要的民事诉讼中,有时会使用一种中间标准,称为“明确有力的证据”,例如决定是否应将某人强制送入医院设施。

如何定义证明标准,或者是否应该首先定义它们,仍然存在争议(Diamond 1990; Horowitz and Kirkpatrick 1996; Laudan 2006; Newman 1993; Walen 2015)。司法意见提供了不同的释义,有时相互冲突,关于这些标准的含义。 “合理怀疑以外的证明”的含义是最具争议的。它被等同于“道义确定性”或“坚定信念”(Commonwealth v. Webster, 59 Mass. 295, 1850),或者被视为

具有如此令人信服的证据,以至于一个理性的人在自己最重要的事务中不会犹豫地依赖和行动。 (美国联邦陪审团实践和指示,Devitt 等人,1987 年,12.10,354)

但法院也警告说,没有必要定义这个术语,因为“陪审员知道什么是合理的,并且对怀疑的含义非常熟悉”,试图定义它只会“使事情变得混乱”(美国诉 Glass 案,846 F.2d 386,1988 年)。

概率论可以为一个本来异质的法律学说带来概念上的清晰度,或者至少这是法律概然性学派的立场。

5.2 概率阈值

法律概然性主义者提出,将超越合理怀疑的证明解释为被告在审判中提出的证据下,其有罪的概率达到一个阈值,比如>.95。这种观点的变体很常见(例如,Bernoulli 1713; DeKay 1996; Kaplan 1968; Kaye 1979b; Laplace 1814; Laudan 2006)。从法律角度来看,要求以高概率确定有罪,但仍不到 1,符合超越合理怀疑的证明是最严格的标准,但“不涉及绝对确定的证明”,因此“不是毫无疑问的证明”(R. v. Lifchus, 1997, 3 SCR 320, 335)。

在民事纠纷中,对概率思想的依赖更加明确,标准“证据的优势”(也称为“概率平衡”)适用于决策。这个标准可以解释为要求原告(对被告提出投诉的一方)以大于.5 的概率证明其事实版本的要求。.5 的阈值,与刑事案件的更严格的.95 阈值相比,反映了优势要求比超越合理怀疑的证明要求更低。中间标准“明确有说服力的证据”比优势标准更严格,但不像超越合理怀疑的标准那样严格。由于它处于其他两者之间,可以解释为要求原告以.75-.8 的概率证明其事实版本。

有人担心,对数值阈值的机械应用会削弱审判决策的人性化功能。正如特赖布所说,

受到公式的说服力和小数点的精确性的影响,陪审团很少能够回忆起,更不用说执行他们的人性化功能了。(1971 年:1376)

然而,阈值可以根据每个案件中的成本和利益而有所不同(见后面的讨论)。因此,在考虑个体情况时,它们不需要机械地应用。(Hedden 和 Colyvan 2019)。此外,如果陪审团具备数字素养,他们不应忽视自己的人性化功能,因为他们不再被数字所吓倒。因此,这种担忧表明有必要确保陪审团具备数字素养,而不是完全放弃概率阈值。

Even if numerical thresholds cannot be used in the daily business of trial proceedings, they can still serve as theoretical concepts for understanding the role of proof standards in the justice system, such as regulating the relative frequency of false positive and false negative decisions or minimizing expected costs. A more stringent threshold will decrease the number of false positives (say false convictions) at the cost of increasing the number of false negatives (say false acquittals), and a less stringent threshold will increase the number of false positives while decreasing the number of false negatives. This trade-off has been described, among others, by Justice Harlan in his concurring opinion in re Winship, 397 U.S. 358, 397 (1970). As shown below, the formal apparatus of probability theory, in combination with expected utility theory, can make this point more precise.

5.3 Minimizing expected costs

Expected utility theory recommends agents to take the course of action that, among the available alternatives, maximizes expected utility. On this view, the standard of proof is met whenever the expected utility (or cost) of a decision against the defendant (say, a conviction) is greater (or lower) than the expected utility (or cost) of a decision in favor of the defendant (say, an acquittal) (DeKay 1996; Hamer 2004; Kaplan 1968). Let c(CI) be the cost of convicting a factually innocent defendant and c(AG) the cost of acquitting a factually guilty defendant. For a conviction to be justified, the expected cost of convicting an innocent—that is, c(CI) discounted by the probability of innocence [1−Pr(G∣E)]—must be lower than the expected cost of acquitting a guilty defendant—that is, c(AG) discounted by the probability of guilt Pr(G∣E). This holds just in case

Pr(G∣E)1−Pr(G∣E)>c(CI)c(AG).

此不等式用于确定应满足的概率阈值,以便对被告做出决策。当成本比率 c(CI)/c(AG)设定为 9 时——这在刑事案件中可能是合适的,因为定罪无辜往往被认为比无罪释放有罪被告更具有害(但请参见 Laudan 2016)——只有当 Pr(G∣E)达到.9 的阈值时,不等式才成立。同样的分析 mutatis mutandis 也适用于民事案件,其中错误的决策包括错误的责任归属(假阳性)和错误的责任不归属(假阴性)。如果成本比率为 1——这在民事案件中可能是合适的,因为假阳性和假阴性同样有害——只有当被告有责任的概率达到.5 的阈值时,不等式才成立。

图 8 [图 8 的详细描述在附录中。]

这种分析只考虑了错误决策的成本,但忽略了与正确决策相关的利益。更全面的分析会同时考虑两者(Lillquist 2002; Laudan and Saunders 2009),但基本观点将保持不变。审判决策被视为最大化整体社会福利的一种工具之一(Posner 1973)。根据这种证明标准的观点,门槛的严格程度取决于成本和利益,因此不同的案件可能需要不同的门槛。如果某些案件的指控比其他案件更严重,比如谋杀与小偷窃相比,只要对被告的错误决定的成本更为重要,就可能需要更高的门槛。关于证明标准是否应该以这种方式变化存在争议(Kaplow 2012; Picinali 2013; 另请参阅有关证据法律概念的条目)。

标准的“超出合理怀疑的证明”通常与布莱克斯通比例相配,即宁可让十个有罪的被告获得自由,也不愿意有一个无辜的人被定罪。实际上,确切的比例是有争议的(Volokh 1997)。人们很容易认为,比如说,0.9 的阈值可以保证虚假定罪和虚假无罪之间的比例为 1:9。但至少有两个原因使得这种想法过于草率。首先,概率阈值会影响错误决策的预期率。实际率可能会偏离其预期值(Kaye 1999)。其次,如果阈值为 0.9,预计对被告的决策中至多有 10%是错误的(虚假定罪),而对被告的决策中至多有 90%是错误的(虚假无罪)。确切的比例将取决于被告所分配的概率以及它们的分布情况(Allen 2014)。总的来说,可以说,无论基础分布如何,使得整体错误决策率最小化的阈值为 0.5(参见 Kaye 1982, 1999; Cheng & Pardo 2015 的证明)。

5.4 概率阈值的替代方案

学术文献中存在几种理论上的概率阈值解释的替代方案。Pennington 和 Hastie(1991, 1993)提出了故事模型,根据该模型,法官和陪审团首先通过构建发生的故事来理解证据,然后根据多个标准(如连贯性、与证据的契合度和完整性)选择最佳故事。Pardo 和 Allen(2008)认为,在法庭上,最能解释证据的事实版本应该占上风。关于连贯性和故事构建在证据评估和庭审决策中的作用,参见(Amaya 2015; Griffin 2013; Simon 2004)。

另一种方法是由 Gordon、Prakken 和 Walton(2007)以及 Prakken 和 Sartor(2009)提出的,他们认为审判是一个让论点和反论点相互对抗的场所。在所有事情都考虑在内的情况下,拥有最好论点的一方应该获胜。根据这种观点,概率估计本身可以成为反对和反论的目标。沿着这些线索,Stein(2008)认为,为了对被告做出裁决,证据应该经受住个别化的审查,而不仅仅是支持高概率的责任。

哲学家和法律理论家还提出了独特的认识论批评。Ho(2008)和 Haack(2014)认为,对于一个主张的认识论保证程度,这取决于多个因素,如证据支持主张的程度和综合性,不能等同于概率。Gardiner(2019)认为,证明标准应该排除所有相关的错误可能性,而这些可能性不一定与概率相关。最后,一些认识论学家认为,无论概率有多高,被赋予高概率的信念并不足以保证知识,而知识应该是审判裁决的标准(Blome-Tillmann 2017;Duff 等人 2007;Levanon 2019;Littlejohn 2020;Moss 即将出版)。

学者和评论家还提出了更具体的异议,这些异议不需要否定概率框架,而是需要进行改进。Nance(2016)认为,作出审判决定所依据的证据应该是相当完整的,即应该是一个对事实进行认真调查所能合理预期看到的所有证据。Davidson 和 Pargetter(1987)中也可以找到类似的论点。可以说,基于概率的决策阈值可以适应这些考虑,例如,当证据体系单方面或不完整时,可以降低民事或刑事责任的概率(Friedman 1996; Kaye 1979c, 1986)。另一种策略是对证据的完整性以及其他看似非概率性的标准给出基于概率的解释(Urbaniak 2018)。

还有大量其他异议。裸统计证据的难题和连词悖论是文献中最广泛讨论的两个问题。这些以及其他异议将在接下来的章节中进行讨论。

6. 裸统计证据

裸露的统计证据之谜包括假设情景,其中被告的民事或刑事责任的概率,鉴于证据,超过了必要的门槛。然而,许多人直觉上认为被告不应该被认定有责任。问题是如何在责任概率达到门槛的情况下,证明这种直觉的合理性。裸露的统计证据之谜涉及充分性问题,即一组证据是否足以满足适用于案件的证明标准。它们并不涉及某些证据是否应该在审判中被允许(关于区别,请参见 Picinali 2016)。

6.1 蓝色公共汽车,闯入者,囚犯

蓝色公共汽车(Tribe 1971)。布朗夫人被一辆公共汽车撞倒。众所周知,该城市 80%的公共汽车由蓝色公共汽车公司拥有,剩下的 20%由红色公共汽车公司拥有。除了布朗这个色盲之外,没有其他目击者。由于蓝色公共汽车公司拥有该城市 80%的公共汽车,布朗被蓝色公共汽车公司撞倒的可能性为 80%,远高于民事责任的 50%门槛。然而,仅仅提供 80%的裸露统计数据对于布朗在民事诉讼中胜诉来说是不足够的。

闯入者(科恩 1977)。众所周知,有 499 人支付了入场费观看一场牛仔竞技表演,但实际观众总人数为 1000 人。假设没有发放纸质门票,也没有证人能够确认那些支付了费用的人。对于任意随机挑选的观众来说,他们没有支付入场费的概率超过 50%。但即使这个概率超过了 0.5 的民事责任门槛,仅凭 449 人中的裸统计数据,牛仔竞技表演的组织者能够赢得针对任何观众的诉讼,这似乎是奇怪的。

囚犯(内森 1979)。100 名囚犯正在监狱操场锻炼。突然间,其中 99 人袭击并杀死了唯一值班的看守。有一个囚犯在这次袭击中没有任何参与。这些是案件中无可争议的事实,关于发生了什么没有进一步的信息。如果随机挑选一个囚犯,他有 99%的罪责概率。然而,直觉告诉我们,这还不足以确立超出合理怀疑的罪责。

这些情景就像彩票案例一样,其中“我的彩票是个失败者”的命题的概率很高,但直观上这个命题不能算作知识(参见 Harman 1968; Ebert, Smith, and Durbach 2018; Hawthorne 2004; Lawlor 2013; Nelkin 2000)。这些情景中的证据,特别是 Gatecrasher 和 Prisoner,没有具体指向某个个体,而是适用于群体中的任何成员。就像在彩票案例中,任何一张彩票都很有可能失败一样,参加了牛仔竞技表演或者在监狱院子里的任何囚犯都很有可能承担责任。从这个意义上说,裸露的统计证据有时与个体化或特定案例的证据相对比,比如痕迹证据或目击证词(Colyvan, Regan, and Ferson 2001; Stein 2005; Thomson 1986; Williams 1979)。然而,这种区别是有争议的。毕竟,任何形式的证据都依赖于将被告归类为与其他人一起的类别,即那些具有某种面部特征或在某个地方的人的类别(Harcourt 2006; Saks and Kidd 1980; Schauer 2003; Schoeman 1987; Wright 1988)。Tillers(1997, 2005)指出,基于他人行为推断个体行为并不总是令人反感的,例如,加入帮派或者加入三 K 党可能表明某人的信仰。

尽管对于仅基于裸统计数据作出的责任判决存在直观上的抵制,但对于基于更传统形式的证据(如痕迹或目击证词)作出的判决,这种抵制较为不明显。这种不对称可能只是历史的产物,因为诚实证人的证词一直是盎格鲁-美国审判制度的基石。然而,对于裸统计证据的抵制以及对其他形式证据的偏好也已经得到了实证验证(Arkes、Shoots-Reinhard 和 Mayes 2012;Niedermeier、Kerr 和 Messé 1999;Wells 1992),并不仅限于法律背景(Ebert 等人 2018;Friedman 和 Turri 2015;Sykes 和 Johnson 1999)。

一些学者对于涉及裸统计证据的假设情景的相关性表示了保留意见。由于这些情景与审判实践相去甚远,它们可能不是理论化审判的可靠指南(Allen 和 Leiter 2001;Dant 1988;Schmalbeck 1986)。然而,这些情景在一定程度上是以真实案例为模型的。例如,Blue Bus 是以 Smith v. Rapid Transit, Inc. 317 Mas. 469 (1945)为蓝本。这个假设情景也与具有里程碑意义的案例 Sindell v. Abbott Laboratories, 26 Cal. 3d 588 (1980)相似,其中不同公司推销了同一种后来被证明会导致某个人患癌症的药物。由于该药物由多家公司销售,无法确定哪家公司应负责任。利用关于这两家公司市场份额的统计数据来归责是在缺乏更好、更个体化证据的情况下进行的。

6.2 冷命中

法律学者们将裸露的统计证据与冷案中的 DNA 证据进行了类比(Roth 2010)。冷案的特殊之处在于,被告是通过对几个不同基因型的数据库搜索来确定的,因此,冷案中的证据几乎完全由犯罪痕迹与被告的 DNA 匹配构成(参见 §2.2 中的早期讨论)。这种匹配——通常情况下——还会附带一个基因型频率的统计估计,比如说,有一亿人中有一个人与这个匹配的基因型相同。鉴于证据的主要是统计性质,冷案可以被看作是 Prisoner 或 Gatecrasher 等情景的现实例子。但是,我们是否应该这样看待冷案是有争议的。一些作者将裸露的统计证据和冷案匹配放在同等地位(Smith 2018),而其他人则不这样认为(Enoch and Fisher 2015;Enoch, Spectre, and Fisher 2012)。

美国的一些上诉法院裁定,即使冷案匹配没有其他证据的证实,也足以构成刑事责任的充分依据(Malcom 2008)。例如,法官哈德威克写道,

如果在一个地点发现的 DNA 物质的数量和类型与偶然接触不一致,并且有一百万亿分之一的可能性是其他人是这个物质的来源,那么这个证据在法律上足以支持有罪判决。密苏里州诉 Abdelmalik 案,273 S.W.3d, 61, 66 (Mo. Ct. App. 2008)

上诉法院的这些声明支持这样一种观点:冷命中 DNA 匹配背后的统计数据与裸统计证据不同(Cheng 和 Nunn 2016;Di Bello 2019)。

6.3 修正主义回应

裸统计证据的难题是法律概然性面临的最困难的问题之一。它们直接挑战了高概率应足以支持对刑事或民事责任的判断的主张。法律概然性的一种回应方式是建议在假设情况下修正我们的直觉,并质疑它们作为制定证明标准的指南的相关性。法律概然性可以主张,相对于统计证据,传统形式的证据更受偏见(Laudan 2006;Papineau 即将出版)。他们可以指出,心理学和认知科学的研究表明,目击证词和指纹证据经常是不可靠的(Simons 和 Chabris 1999),容易受到操纵(Loftus 1979 [1996]),并受到主观因素和背景因素的影响(Dror、Charlton 和 Péron 2006;Zabell 2005)。另一方面,依赖统计证据应该提高审判决策的整体准确性(Koehler 和 Shaviro 1990)。法律概然性还可以主张,裸统计证据的难题仅限于假设情况,而在更现实的情况下,我们对统计证据的判断可能会有所不同(Hedden 和 Colyvan 2019;Ross 2021)。

然而,很少有人为这种修正主义观点辩护。文献主要试图证明裸统计证据与其他形式的证据之间的直观差异。接下来将讨论文献中的一些提议,重点是概率论的提议。对裸统计证据悖论的非概率解决方案的审查超出了本条目的范围(有关批判性调查,请参见 Redmayne 2008;Gardiner 2018;Pardo 2019)。

6.4 非修正主义回应

以下是法律概然性主义者对裸统计证据悖论的六种非修正主义策略。

首先,法律概然性主义者可以否认在像 Gatecrasher 这样的情景中,责任的概率高到足以达到所需的门槛。Kaye(1979a)认为,除了裸统计证据之外没有其他证据时,这对于原告来说是不足以获胜的,因为证据过于薄弱可疑。这种情况应该导致事实查明者将责任的概率降低到所需的门槛以下。在类似的观点上,Nance(2016)认为,当在审判中呈现的证据是不完整的,即在审判中合理预期会看到的证据缺失时,不应该认定被告有责任。这种策略在像 Blue Bus 这样的情景中可能奏效,其中证据的匮乏很可能是原告的过错。但困难在于,不清楚这种策略是否适用于像 Gatecrasher 或 Prisoner 这样的情景,其中证据的匮乏是情景本身的特点,而不是任何人的过错。

其次,法律概然性主义者可以诉诸参照类问题(Colyvan、Regan 和 Ferson 2001;另见后文第 7 节)。一个个体可能属于不同的参照类。如果吸烟者中有 3%患有肺癌,而经常锻炼者中有 0.1%患有肺癌,那么一个既吸烟又经常锻炼的人会怎样呢?在 Gatecrasher 案例中,单独挑选出在体育场的人群而不是有非法入侵历史的人群是任意的。没有明确的理由说明为什么选择了这个参照类而不是其他参照类。选择另一个参照类可能会对被告的责任概率得出不同的结论。这种方法也得到了坚决反对法律概然性的学者的认可(Allen 和 Pardo 2007)。批评者指出,参照类问题影响着任何基于证据的判断。在评估任何证据的强度时,可以使用不同的参照类,比如那些详细描述所见情况的证人类别或那些紧张的证人类别(Redmayne 2008)。

第三,法律概然性学派可以观察到,基于裸统计证据的概然性主张对可能的相反证据不够坚韧(关于信念的坚韧性和稳定性,请参见 Skyrms 1980;Leitgeb 2014)。如果一个目击者声称囚犯没有参与暴乱,那么他对杀害警卫的罪行的概率应该显著降低。可以推测,审判裁决不应该如此易变。即使有可能出现进一步证据,它们也应该在一定程度上保持稳定(Bolinger 2021)。这种方法的一个问题是,总是可以找到更多证据来改变人们的概然性评估。另一个问题是,裸统计证据的难题是一种没有进一步证据可用的情况。但是,添加概然性主张不可修订的保证并不能减少裸统计数据的问题。

第四,法律概然性主义者可以坚持认为仅基于裸统计数据的裁决并不能促进期望效用最大化的目标。这并不是因为裸统计数据是不好的证据,而是因为依赖这些数据可能会产生一些意想不到的成本,比如错误负担的次优分配或缺乏威慑力。例如,在《蓝色公共汽车》案中,对市场份额最大的公司做出的裁决可能会对较大的公司产生一种反常的经济激励(波斯纳 1973)。目前尚不清楚这种解释如何适用于其他案例,如《闯入者》或《囚徒》案,甚至还有一些《蓝色公共汽车》案的变体不容易受到这种反对(韦尔斯 1992)。另外,达尔曼(2020)认为,基于裸统计证据的裁决并不能为合法行为提供任何额外的激励,因为它们无法区分合法行为和非法行为。(关于威慑力和裸统计数据,还可参见伊诺克、斯佩克特和费舍尔 2012;伊诺克和费舍尔 2015)。

第五,法律概然性的另一种回应方式是承认裸统计证据的悖论展示了简单概率阈值作为证明标准的不足(Urbaniak 2019)。一些学者并不关注责任的后验概率,而是关注可能性比 P(E∣H)/P(E∣H′)。他们的观点是,尽管裸统计证据可以支持高的责任后验概率,但这些证据的可能性比等于一,因为无论被告做了什么,都可以用这些证据来指控被告。如果是这样,裸统计证据就没有证据价值(Cheng 2012; Sullivan 2019)。然而,Dahlman (2020)批评了这个观点,指出在合理的假设下,裸统计证据的可能性比显著大于一。Di Bello (2019)认为,在类似 Prisoner 和 Gatecrasher 的案例中,裸统计证据的可能性比可能会根据考虑的背景信息而有不同的取值范围。因此,在这些情景中,裸统计证据的可能性比既不是一,也不是大于一,而是严格来说是未知的(关于这个观点的批评,参见 Urbaniak et al. 2020)。

最后,法律概然性主义者可以利用知识的概念重新阐述概率证明标准。莫斯(2018)认为,概率信念和完全信念一样,可以构成知识。这种概率知识的概念可以用来制定审判决策的证明标准(莫斯,2018:第 10 章;莫斯,即将出版)。对于民事案件的优势标准,如果根据审判中提供的证据,法官或陪审团对被告的责任至少有 0.5 的确信度,并且这种概率信念构成知识,那么这一标准将得到满足。而在刑事案件中,"合理怀疑以外的证明" 则要求对被告极有可能有罪的概率信念具有知识,或者仅仅要求对有罪的完全知识。在裸露的统计证据不足以支持完全知识或概率知识的情况下,基于知识的解释提供了解决裸露的统计证据难题的方法。此外,概率知识对于证明标准的解释承诺维护了概率本身不足以构成法律证明的直觉,同时也承认了概率在审判决策中的关键作用(然而,从法律角度对基于知识的法律证明解释的批评,请参见艾伦 2021 年的文章)。

7. 进一步的反对意见

除了裸露的统计证据的悖论之外,连词悖论是对法律概然性主义的最广泛讨论的反对意见之一。本节将与其他几个反对意见一起讨论这个悖论。其中许多反对意见可以追溯到科恩(1977)的开创性工作,他还对贝叶斯认识论提出了一般性的批评(有关进一步讨论,请参见厄尔曼 1992 年;博文斯和哈特曼 2004 年;布拉德利 2015 年以及贝叶斯认识论条目)。

7.1 关于连词的困难

假设原告需要根据证据的法定标准证明两个独立的主张 A 和 B,例如,证据的概然性(法律概然性)(法律概然性可以解释为要求事实的概率大于 0.5)。如果原告已经以 0.7 的概率证明了每个主张,那么证明的责任应该得到满足。然而,如果这两个主张是独立的,它们的连词的概率只有 0.7×0.7=0.49,低于所需的阈值。可以说,普通法体系订阅了一个连词原则,即如果 A 和 B 根据法定证明标准得到证实,那么它们的连词也是如此。批评认为,概率论无法捕捉到这个原则。这就是所谓的连词悖论或关于连词的困难。它最初由科恩(1977)提出,并自那时以来一直非常流行(艾伦 1986; 艾伦和斯坦 2013; 艾伦和帕多 2019; 哈克 2014; 施瓦茨和索伯 2017; 斯坦 2005)。

在不否认普通法的连词原则的情况下,法律概然性学派可以以几种不同的方式做出回应。道维德(1987)认为,如果将证据支持以似然比的概率模型化,而不是后验概率,那么关于连词的困难就会消失。他写道,

适当测量时,由几个独立证词的结合提供的支持超过任何一个成分提供的支持。

尽管最初的悖论涉及责任的后验概率,但道维德认为该悖论在似然比中并不存在。加尔博利诺(2014)也建议转向似然比。然而,当证据项目 a 和 b 相对于复合假设 A∧B 进行评估时,似然比的结合悖论仍然存在。假设 a 和 b 分别对 A 和 B 提供积极支持。乌尔巴尼亚克(2019)表明,综合似然比为

Pr(a∧b∣A∧B)Pr(a∧b∣¬(A∧B))

可能低于个体似然比

Pr(a∣A)Pr(a∣¬A)

Pr(b∣B)Pr(b∣¬B).

Cheng (2012)提供了另一种基于概率的解决方案来解决连词悖论。他认为,在民事案件中,证明的标准应该要求原告的假设在证据上比被告的假设更有可能性。根据这种观点,在一个案件中,给定整体证据的情况下,A∧B 的概率应该与给定相同证据的替代假设的概率进行比较。要考虑的替代假设如下:

  • A∧¬B,

  • ¬A∧B,并且

  • ¬A∧¬B。

在适当的假设下,这些替代方案的概率将低于在 A 和 B 分别由证据支持的情况下的 A∧B 的概率。因此,每当个别主张 A 和 B 的证明标准得到满足时,复合主张 A∧B 的标准也应该得到满足。Kaplow(2014)提出了类似的论证。Urbaniak(2019)指出,Cheng 将辩护假设分为三个子情况,即 A∧¬B,¬A∧B 和 ¬A∧¬B,但没有考虑到替代方案 ¬(A∧B)。¬(A∧B)的概率实际上可能超过 A∧B 的概率。如果 ¬(A∧B)是替代假设,即使个别主张 A 和 B 的标准得到满足,复合主张 A∧B 的标准也可能不会得到满足(关于 Cheng 方法的另一个批评,请参见 Allen&Stein 2013)。

最后,法律概然性主义者可以采取整体性方法来应对连词悖论。这个解决方案曾被法律概然性主义的反对者(Allen 1986;Allen 和 Pardo 2019)所辩护,但也可以被法律概然性主义者采纳。整体性方法建议的是,不是评估在个别证据下个别主张的后验概率,而是评估在所有可用证据的基础上,整体复合主张(比如 A∧B)的概率(Hedden 和 Colyvan,2019;但请参见 Allen 2020 的回应)。贝叶斯网络(参见第 3 节中的早期讨论)可以帮助整体性评估证据(de Zoete,Sjerps 和 Meester 2017;de Zoete 和 Sjerps 2018;Neil 等人 2019)。

7.2 Cohen 的其他反对意见

Cohen(1977)对法律概然性主义提出了几个其他反对意见。这些意见不如裸统计证据悖论或连词悖论那样出名,但仍值得研究。

7.2.1 完备性

陈述 Pr(¬H∣E)=1−Pr(H∣E) 是概率计算的一个定理。如果给定 E 的情况下 H 的概率很低,那么给定相同证据的情况下 ¬H 的概率必然很高。这个事实似乎会产生出自无知的证据。如果 E 是对 H 的薄弱证据(即 Pr(H∣E) 很低),那么它必然是对 ¬H 的强有力证据(即 Pr(¬H∣E) 很高)。这似乎是错误的。直观上,有些证据可以微弱地支持一个假设和它的否定。例如,假设有人听说被告在犯罪发生时在酒吧过夜。这个传闻对于被告在酒吧过夜的主张是薄弱的证据。但这并不意味着这个传闻是被告没有在酒吧过夜的强有力证据。证据实际上可能与假设毫无关系。概率似乎无法捕捉到这个事实,或者至少这是反对的观点。

这个困难促使 Dempster(1968)和 Shafer(1976)发展了一种非经典的概率和证据支持理论。然而,法律概然性学派并不需要拒绝经典概率理论。他们可以回应说,刚才描述的困难之所以出现,仅仅是因为倾向于用后验概率 Pr(H∣E) 来衡量证据的强度,而不是通过似然比来衡量(关于这个区别,请参见第 2 节中的早期内容)。如果 E 微弱地支持 H——也就是说,似然比

Pr(E∣H)Pr(E∣¬H)

法律概然性(E∣H)法律概然性(E∣¬H)

法律概然性(E∣¬H)法律概然性(E∣H)

将略低于一。

7.2.2 证实

当两个或更多独立的证人证明同一命题的真实性,并且他们的故事相对不太可能时,该命题的概率应显著增加。这种“信心提升”的现象被称为证实。在间接证据的情况下,类似的现象被称为收敛。科恩(1977)认为,没有任何概率支持度的测量能够捕捉到这种现象。他研究了不同的概率提议——布尔的公式(布尔 1857 年),埃克洛夫的原则(埃克洛夫 1964 年),Lambert 和 Kruskal 的公式(1988 年)——并发现它们都不足够。他认为,从证实中预期到的信心提升没有被这些提议中的任何一个充分捕捉到。

近年来,对证实的更好的法律概然性解释已经被提出(Fenton 和 Neil 2013 [2018];Robertson,Vignaux 和 Berger 2016;Taroni 等人 2014)。这一工作的一个重要主题是,通过将各个证据的似然比相乘,可以用概率术语解释证实。思想是,将不同证据的似然比相乘的结果超过了与各个证据相关联的似然比(参见 Bovens 和 Hartmann 2004:第 5 章的一般讨论)。然而,科恩坚持认为,由于证实而产生的置信提升应该是大的,而大的提升并没有通过将似然比相乘的结果来反映出来。需要进一步探讨的是置信提升的大小以及影响提升的证据特征。Urbaniak 和 Janda(2020)对科恩的反对意见和解决方案候选人进行了详细讨论。

7.3 先验问题

法律概然性经常面临的另一个反对意见是先验问题。这个问题在我们开始评估给定可用证据的假设的后验概率 Pr(H∣E)时出现。

为了进行计算,贝叶斯定理需要作为起点的假设的先验概率 Pr(H),而不考虑证据。正确评估这个先验概率并不明显。已经提出了不同的策略。

首先,先验概率可以等于 1/k,其中 k 是可能的等概率假设的数量。如果有 k 个可能的假设,并且没有一个比其他更有可能,那么将 1/k 分配给每个假设是自然的。然而,这种方法会使先验概率对假设的选择非常敏感,因此可能是任意的。此外,这种方法在刑事案件中特别不适用。如果两个假设是“被告有罪”和“被告无罪”,那么每个假设的先验概率将是 50%。然而,在刑事案件中,被告应被假定为无罪,直到被证明有罪。有罪的先验概率在 0.5 的水平上似乎过高。无罪推定——在许多国家为所有被告提供的程序保护——应要求将有罪的先验概率设定为一个小值(Allen 等,1995)。但是目前尚不清楚这个值应该有多低。0.001 足够低吗,还是应该是 0.000001?也许只能说,在刑事案件中,有罪的先验概率应该非常低(Friedman,2000)。

或者,先验概率可以等同于 1/n,其中 n 是在审判中可能犯下罪行或民事错误的总可疑人或违法者的数量。这也是一个合理的提议。由于肯定有人犯了错,如果没有进一步的证据表明其他人可能犯下了这个错误,那么 1/n 是一个合理的起点。但是这个提议也很快遇到了困难。在某些情况下,是否有人犯了错本身就可能存在争议。或者可能存在这样的情况,即确实发生了违法行为,被告参与其中,但不清楚是什么违法行为,比如谋杀或过失杀人。

为了避免上述困难,其他模型依赖于相关的背景信息,例如人们犯罪机会的地理信息(Fenton 等,2019 年)。但是,即使这些模型在提供了基于充分信息的先验概率评估方面取得了成功,仍然存在更深层次的困难。也就是说,无论如何进行先验概率评估,都很可能违反现有审判制度的规范要求(Dahlman,2017 年;Engel,2012 年;Schweizer,2013 年)。如果先验概率的评估依赖于人口统计信息,那么属于某些人口统计群体的人将被视为犯错的先验概率较高。但是,如果某些人的先验概率高于其他人的先验概率,即使他们面临的证据与那些先验概率较低的人面临的证据相同,也会更容易定罪或找到责任。这种结果可以被视为不公平,特别是在刑事案件中,因为它使那些因为所属人口统计群体而被分配更高先验概率的无辜者面临更高的定罪风险(Di Bello 和 O'Neil,2020 年)。

或许,正如一些人所建议的那样,法律概然性理论家应该放弃先验概率,而是依靠似然比作为审判决策的指南(Sullivan 2019)。另一种避免先验问题的策略是考虑一个值的区间,并观察不同可能的先验对后验概率的影响程度(Finkelstein and Fairley 1970),如第 1.4 节所讨论的。

7.4 参考类问题

对法律概然性的另一个挑战是参考类问题。参考类问题最初由文恩(Venn)(1866)提出,因为同一事件可能属于多个参考类,其中事件的频率不同。一种常见的方法,由莱辛巴赫(Reichenbach)(1935 [1949: 374])等人提出,是依靠“可编制可靠统计数据的最窄类”。在某些情况下,这可能有效,前提是可靠的统计数据可用。但是,如果某人属于同样狭窄的不同类别,该怎么办?

考虑尼日利亚公民查尔斯·肖努比的案例,他在新泽西州工作,于 1991 年 12 月 10 日在纽约的 JFK 机场被捕,因走私海洛因进入美国。他在胃肠道中携带了 103 个气球,含有 427.4 克海洛因。在判决过程中,检察官辩称,由于肖努比在被捕前在美国和尼日利亚之间进行了七次往返,他走私的海洛因总量超过了 427.4 克。检方提供了 1990 年 9 月 1 日至 1991 年 12 月 10 日期间在 JFK 机场被捕的 117 名尼日利亚毒贩的海洛因数量数据。检方的专家博约姆博士计算出,在肖努比的最后一次旅行之前,他走私的总量至少为 2090.2 克(美国诉肖努比案 895 F. Supp 460,E.D.N.Y. 1995)。

肖努比是“在尼日利亚和纽约之间旅行时携带海洛因的人”这个参考类别的成员,但也是“乔治·华盛顿大桥的收费员”这个类别的成员。为什么要依赖前者而不是后者来推断肖努比走私了多少海洛因进入美国?(Colyvan,Regan 和 Ferson 2001)。接下来将探讨参考类别问题对法律概然性的具体困难以及法律概然性者可能如何回应。

7.4.1 挑战

Allen 和 Pardo(2007)认为,参照类问题对法律概然性以及更具体地对证据强度的概率测量(如似然比)构成了挑战(请参见第 2 节中的早期内容)。问题在于,同一证据可能根据所选择的参照类而被分配不同的似然比。例如,与 DNA 匹配相关的似然比的分母是在没有与犯罪无关的随机人员是来源的情况下匹配的概率。这个概率取决于在特定人群中的个人资料的频率。但是应该选择哪个参照人群呢?由于自然界中没有任何东西能够选择一个参照类而不选择另一个参照类,所以似然比将成为证据强度的任意测量,正如这个论点所指出的。

诱人的是,我们可以通过指出专家证人使用多个参照类并考虑合理的值范围来对这个挑战予以否定(Nance 2007)。事实上,在 DNA 证据的评估中,使用多个参照类是常见的做法。例如,在达林诉州案件(Darling v. State, 808 So. 2d 145 (Fla. 2002))中,一名居住在奥兰多的波兰妇女遭到性侵和谋杀。DNA 专家就多个随机匹配概率作证,依赖于来自迈阿密地区的非洲裔美国人、白人和东南部西班牙裔的频率。由于施害者可能属于这些种族中的任何一种,专家考虑的这些群体在不同的可能发生情况下都是相关的。

与专家证人不同,上诉法院通常更喜欢只考虑一个参考类别。在另一起案件中,迈克尔·皮萨罗(Michael Pizarro)因与犯罪痕迹相符而被判强奸和窒息他的 13 岁同父异母妹妹(People v. Pizarro, 110 Cal.App.4th 530, 2003)。FBI 分析师在审判中作证,称与同一基因型的其他无关的西班牙裔个体发现的可能性约为 1/250,000。由于作案者的种族不明,皮萨罗提出上诉,称 DNA 证据不可采纳。上诉法院支持皮萨罗,并反对提供西班牙裔人口以及任何其他种族或民族群体的频率估计。法院写道:

如果作案者实际上是亚洲人,那么与作案者相似的西班牙裔、白人、黑人或美洲原住民的数量并不重要。

当专家证人就多个参考类别作证时,上诉法院表现出的不安是可以理解的。也许,应选择对被告最有利的参考类别,给予被告怀疑的利益。在某些情况下,这可能是合适的。但是假设与 DNA 匹配相关的随机匹配概率对于 A 组的人是 1/10,而对于 B 组的人是 1/1 亿。总是选择对被告最有利的参考类别,在某些情况下会削弱 DNA 匹配的证据力度超过必要程度。

7.4.2 相关性和关键问题

法律概然性学派制定了不同的标准来确定最合适的参考类别。弗兰克林(2011)持乐观态度。根据他的方法,关于事件或结果 B 的推断的最合适参考类别是由与 B 相关的所有特征的交集所定义的类别。关联性是根据可用数据统计测量的,即 B 与所讨论特征的协变性。协变性将使用适当的统计标准进行测量,例如两个变量之间的相关系数。例如,在 Shonubi 案例中,诸如尼日利亚人、毒品走私者、前往 JFK 的特征对于推断 Shonubi 携带的毒品总量是相关的。其他可用数据的特征,例如在乔治华盛顿大桥的收费员,是不相关的。然而,弗兰克林方法的乐观态度受到参考类别问题的普遍性的影响(有关更多详细信息,请参见 Hájek 2007)。

除了仅关注相关性外,选择最合适的参考类别还可以包括一系列统计(或认识论)标准以及非认识论标准。达尔曼(2018)提出了一系列关键问题,例如:参考类别是异质的还是同质的?它是否稳健?它是否使参考类别的人处于不公平的劣势?前两个问题是认识论的,但第三个问题不是。如果某些种族或社会经济群体的人更经常参与犯罪行为,依赖于种族或社会经济参考类别可能会加剧社会对这些群体成员的污名和偏见。因此,应该避免依赖这些参考类别,不是因为它们是无关的,而是因为它们是有偏见的。

7.4.3 模型选择

参考类问题可以被看作是模型选择问题的一个特例(Cheng 2009)。模型应该在一定程度上捕捉到数据,但不应过度拟合数据。数据中的随机变动不应被纳入模型中。在统计学中,存在着不同的模型选择标准,其中最著名的是阿卡奇信息准则(AIC),它是衡量模型与数据拟合程度和复杂性之间权衡的一种流行指标。再次考虑 Shonubi 案例。为了预测 Shonubi 运输的海洛因总量,可以使用一个简单的线性模型,其中每个参考类都有一个根据单次旅行携带的毒品数量经验确定的乘数 β,用于预期的毒品总量。选择过于通用的类别(比如“航空乘客”)会降低模型的经验适应性,但过于狭窄的类别会引入随机噪声。使用“收费员”类别的模型在统计指标(如 AIC)方面显然表现不如基于“尼日利亚毒品走私者在 JFK”的模型。

Colyvan 和 Regan(2007)认为,参考类问题是一种模型不确定性形式。对他们来说,参考类问题源于对应该采用的特定统计模型的不确定性。模型不确定性在 Shonubi 案例中是显而易见的,因为讨论了替代模型。第一个模型是将 Shonubi 在被逮捕时携带的数量乘以他在尼日利亚和纽约之间的旅行次数。不可否认,这个模型过于简单。控方的专家证人 Boyum 博士提出了第二个模型。它基于 DEA 的数据,通过从 117 个已知案例中重新采样七个净重的集合,模拟了 10 万个可能的七次旅行系列。

Boyum 的模型受到了该案件中另一位专家 Finkelstein 博士的批评,他抱怨该模型没有考虑到行程之间的系统性差异。据推测,走私者在经验增加时往往会携带更多的物品。当他们携带更多的物品时,他们被逮捕的可能性应该更大。如果行程效应成立,数据大部分将涉及倾向于携带更多物品的高级走私者。没有找到支持或反对行程效应理论的实证证据。数据中缺乏有关以前行程次数的信息,因此无法建立适当的回归模型来研究行程效应。另一方面,Weinstein 法官认为初学者走私者确实会练习吞咽葡萄,因此学习曲线不应过于陡峭。此外,初学者比高级走私者更容易被逮捕。如果是这样,数据就不会受到行程效应的偏倚。有趣的是,有关尼日利亚贩毒活动的信息削弱了行程效应理论:毒品贩卖集团不会浪费金钱派半满的毒品运输者,而是让他们在出发前几周练习吞咽气球(Treaser 1992; Wren 1999)。

在 Shonubi 案件决定之后,对证据进行了统计分析。这些分析考虑了其他潜在的误差来源,如异常值和有偏数据。Gastwirth、Freidlin 和 Miao(2000)表明,由于对异常值的敏感性,推断总量超过 3000 克是不稳定的。然而,即使从对被告最有利的角度来看数据,毒品的总量也应超过 1000 克的阈值(Gastwirth、Freidlin 和 Miao 2000;Izenman 2000a,b)。

除了 Shonubi 案件,许多其他案件以各自的方式提出了参考类别或模型选择的问题。只列举几个例子:

  • Vuyanich v. Republic National Bank 涉及种族和性别歧视指控。该案涉及九名不同的专家证人使用各种统计分析方法。该案以一份 127 页的意见结束。

  • E.E.O.C. v. Federal Reserve Bank of Richmond 是一个类似的案件,其中涉及到用于群体比较的各种方法的适用性以及用于就业数据分析的聚合级别的选择。

  • Gulf South Insulation v. U.S. Consumer Product Safety Commission 与禁止使用脲醛泡沫绝缘材料有关。困难在于选择一种风险评估模型来计算癌症发病率增加的风险。

这些案例既有趣又复杂。它们在 Fienberg(1989)中进行了详细讨论。

Bibliography

  • Aitken, Colin, Paul Roberts, and Graham Jackson, 2010, “Fundamentals of Probability and Statistical Evidence in Criminal Proceedings: Guidance for Judges, Lawyers, Forensic Scientists and Expert Witnesses” (Practitioners Guide No 1), Royal Statistical Society’s Working Group on Statistics and the Law. [Aitken, Roberts, and Jackson 2010 available online]

  • Aitken, Colin G.G. and Franco Taroni, 1995 [2004], Statistics and the Evaluation of Evidence for Forensic Scientists, Chichester, UK: John Wiley & Sons. Second edition, 2004. doi:10.1002/0470011238

  • Allen, Ronald J., 1986, “A Reconceptualization of Civil Trials”, Boston University Law Review, 66: 401–437.

  • –––, 2013, “Complexity, the Generation of Legal Knowledge, and the Future of Litigation”, UCLA Law Review, 60: 1384–1411.

  • –––, 2014, “Burdens of Proof”, Law, Probability and Risk, 13(3–4): 195–219. doi:10.1093/lpr/mgu005

  • –––, 2017, “The Nature of Juridical Proof: Probability as a Tool in Plausible Reasoning”. International Journal of Evidence and Proof, 21(2): 133-142.

  • –––, 2020, “Legal Probabilism–––A Qualified Rejection: A Response to Hedden and Colyvan”. Journal of Political Philosophy, 28(1): 117-128.

  • –––, 2021, “Naturalized Epistemology and the Law of Evidence Revisited”, Quaestio Facti, 2: 253–283.

  • Allen, Ronald J., David J. Balding, Peter Donnelly, Richard Friedman, David H. Kaye, Lewis Henry LaRue, Roger C. Park, Bernard Robertson, and Alexander Stein, 1995, “Probability and Proof in State v. Skipper: An Internet Exchange”, Jurimetrics, 35(3): 277–310.

  • Allen, Ronald J. and Brian Leiter, 2001, “Naturalized Epistemology and the Law of Evidence”, Virginia Law Review, 87(8): 1491–1550.

  • Allen, Ronald J. and Alex Stein, 2013, “Evidence, Probability and the Burden of Proof”, Arizona Law Journal, 55(3): 557–602.

  • Allen, Ronald J. and Michael S. Pardo, 2007, “The Problematic Value of Mathematical Models of Evidence”, The Journal of Legal Studies, 36(1): 107–140. doi:10.1086/508269

  • –––, 2019, “Relative Plausibility and Its Critics”, The International Journal of Evidence & Proof, 23(1–2): 5–59. doi:10.1177/1365712718813781

  • Amaya, Amalia, 2015, The Tapestry of Reason: An Inquiry into the Nature of Coherence and its Role in Legal Argument, Oxford: Hart Publishing.

  • Arkes, Hal R., Brittany Shoots-Reinhard, and Ryan S. Mayes, 2012, “Disjunction Between Probability and Verdict in Juror Decision Making”, Journal of Behavioral Decision Making, 25(3): 276–294. doi:10.1002/bdm.734

  • Balding, David J., 2002, “The DNA Database Search Controversy”, Biometrics, 58(1): 241–244. doi:10.1111/j.0006-341X.2002.00241.x

  • –––, 2005, Weight-of-Evidence for Forensic DNA Profiles, Hoboken, NJ: John Wiley & Sons.

  • Balding, David J. and Peter Donnelly, 1996, “Evaluating DNA Profile Evidence When the Suspect Is Identified Through a Database Search”, Journal of Forensic Sciences, 41(4): 13961J. doi:10.1520/JFS13961J

  • Barker, Matthew J., 2017, “Connecting Applied and Theoretical Bayesian Epistemology: Data Relevance, Pragmatics, and the Legal Case of Sally Clark”, Journal of Applied Philosophy, 34(2): 242–262. doi:10.1111/japp.12181

  • Becker, Gary S., 1968, “Crime and Punishment: An Economic Approach”, Journal of Political Economy, 76(2): 169–217. doi:10.1086/259394

  • Bernoulli, Jacobi, 1713, Ars Conjectandi, Basileae : Impensis Thurnisiorum, fratrum. Translated as The Art of Conjecture, 2005, Edith Dudley Sylla (trans), Baltimore: John Hopkins University Press.

  • Bex, Floris J., 2011, Arguments, Stories and Criminal Evidence: A Formal Hybrid Theory (Law and Philosophy Library 92), Dordrecht: Springer Netherlands. doi:10.1007/978-94-007-0140-3

  • –––, 2015, “An Integrated Theory of Causal Stories and Evidential Arguments”, in Proceedings of the 15th International Conference on Artificial Intelligence and Law (ICAIL ’15), San Diego CA: ACM Press, 13–22. doi:10.1145/2746090.2746094

  • Biedermann, Alex, Tacha Hicks, Franco Taroni, Christophe Champod, and Colin Aitken, 2014, “On the Use of the Likelihood Ratio for Forensic Evaluation: Response to Fenton et al.”, Science & Justice, 54(4): 316–318. doi:10.1016/j.scijus.2014.04.001

  • Blome-Tillmann, Michael, 2017, “‘More Likely Than Not’—Knowledge First and the Role of Bare Statistical Evidence in Courts of Law”, in Adam Carter, Emma Gordon, & Benjamin Jarvi (eds.), Knowledge First—Approaches in Epistemology and Mind, Oxford: Oxford University Press, pp. 278–292. doi:10.1093/oso/9780198716310.003.0014

  • Bolinger, Renèe Jorgensen, 2021, “Explaining the Justificatory Asymmetry Between Statistical and Individualized Evidence”, in The Social Epistemology of Legal Trials, Zachary Hoskins and Jon Robson (eds.), New York: Routledge, pages 60–76.

  • Boole, George, 1857, “On the Application of the Theory of Probabilities to the Question of the Combination of Testimonies or Judgments”, Transactions of the Royal Society of Edinburgh, 21(4): 597–653. doi:10.1017/S0080456800032312

  • Bovens, Luc and Stephan Hartmann, 2004, Bayesian Epistemology, Oxford: Oxford University Press. doi:10.1093/0199269750.001.0001

  • Bradley, Darren, 2015, A Critical Introduction to Formal Epistemology, London: Bloomsbury Publishing.

  • Calabresi, Guido, 1961, “Some Thoughts on Risk Distribution and the Law of Torts”, Yale Law Journal, 70(4): 499–553.

  • Cheng, Edward K., 2009, “A Practical Solution to the Reference Class Problem”, Columbia Law Review, 109: 2081–2105.

  • –––, 2012, “Reconceptualizing the Burden of Proof”, Yale Law Journal, 122(5): 1254–1279.

  • Cheng, Edward K. and G. Alexander Nunn, 2016, “DNA, Blue Bus, and Phase Changes”, The International Journal of Evidence & Proof, 20(2): 112–120. doi:10.1177/1365712715623556

  • Cheng, Edward K. and Michael S. Pardo, 2015, “Accuracy, Optimality and the Preponderance Standard”, Law, Probability and Risk, 14(3): 193–212. doi:10.1093/lpr/mgv001

  • Childers, Timothy, 2013, Philosophy and Probability, Oxford: Oxford University Press.

  • Cohen, L. Jonathan, 1977, The Probable and The Provable, Oxford: Oxford University Press. doi:10.1093/acprof:oso/9780198244127.001.0001

  • –––, 1981, “Subjective Probability and the Paradox of the Gatecrasher”, Arizona State Law Journal, 1981: 627–634.

  • Colyvan, Mark and Helen M. Regan, 2007, “Legal Decisions and the Reference Class Problem”, The International Journal of Evidence & Proof, 11(4): 274–285. doi:10.1350/ijep.2007.11.4.274

  • Colyvan, Mark, Helen M. Regan, and Scott Ferson, 2001, “Is It a Crime to Belong to a Reference Class”, Journal of Political Philosophy, 9(2): 168–181. doi:10.1111/1467-9760.00123

  • Condorcet, Marquis de, 1785, Essai sur l’application de l’analyse à la probabilité des décisions rendues à la pluralité des voix, Paris.

  • Cook, R., I.W. Evett, G. Jackson, P.J. Jones, and J.A. Lambert, 1998, “A Hierarchy of Propositions: Deciding Which Level to Address in Casework”, Science & Justice, 38(4): 231–239. doi:10.1016/S1355-0306(98)72117-3

  • Cullison, Alan D., 1969, “Probability Analysis of Judicial Fact-Finding: A Preliminary Outline of the Subjective Approach”, Toledo Law Review, 1: 538–598.

  • Dahlman, Christian, 2017, “Unacceptable Generalizations in Arguments on Legal Evidence”, Argumentation, 31(1): 83–99. doi:10.1007/s10503-016-9399-1

  • –––, 2018, “Determining the Base Rate for Guilt”, Law, Probability and Risk, 17(1): 15–28. doi:10.1093/lpr/mgx009

  • –––, 2020, “Naked Statistical Evidence and Incentives for Lawful Conduct”, The International Journal of Evidence & Proof, 24(2): 162–179. doi:10.1177/1365712720913333

  • Dant, Mary, 1988, “Gambling on the Truth: The Use of Purely Statistical Evidence as a Basis for Civil Liability”, Columbia Journal of Law and Social Problems, 22: 31–70.

  • Davidson, Barbara and Robert Pargetter, 1987, “Guilt beyond Reasonable Doubt”, Australasian Journal of Philosophy, 65(2): 182–187. doi:10.1080/00048408712342861

  • Dawid, Alexander Philip, 1987, “The Difficulty About Conjunction”, The Statistician, 36(2/3): 91–97. doi:10.2307/2348501

  • –––, 1994, “The Island Problem: Coherent Use of Identification Evidence”, in Aspects of Uncertainty: A Tribute to D. V. Lindley, P. R. Freeman and A. F. M. Smith (eds.), Chichester/New York: Wiley, pp. 159–170.

  • –––, 2002, “Bayes’s Theorem and Weighing Evidence by Juries”, in Bayes’s Theorem, Richard Swinburne (ed.), Oxford: Oxford University Press, pp. 71–90.

  • Dawid, A. Philip and Julia Mortera, 1996, “Coherent Analysis of Forensic Identification Evidence”, Journal of the Royal Statistical Society: Series B (Methodological), 58(2): 425–443. doi:10.1111/j.2517-6161.1996.tb02091.x

  • –––, 2018, “Graphical Models for Forensic Analysis”, in Handbook of Graphical Models, Marloes Maathuis, Mathias Drton, Steffen Lauritzen, and Martin Wainwright (eds.), Boca Raton, FL: CRC Press, pp. 491–514.

  • DeKay, Michael L., 1996, “The Difference between Blackstone-Like Error Ratios and Probabilistic Standards of Proof”, Law & Social Inquiry, 21(1): 95–132. doi:10.1111/j.1747-4469.1996.tb00013.x

  • Dempster, A. P., 1968, “A Generalization of Bayesian Inference”, Journal of the Royal Statistical Society: Series B (Methodological), 30(2): 205–232. doi:10.1111/j.2517-6161.1968.tb00722.x

  • Devitt, Edward J., Charles B. Blackmar and Michael A .Wolff, 1987, Federal Jury Practice and Instructions, (4th ed), St. Paul: West Publishing Company.

  • de Zoete, Jacob, Marjan Sjerps, and Ronald Meester, 2017, “Evaluating Evidence in Linked Crimes with Multiple Offenders”, Science & Justice, 57(3): 228–238. doi:10.1016/j.scijus.2017.01.003

  • de Zoete, Jacob, Norman Fenton, Takao Noguchi, and David Lagnado, 2019, “Resolving the So-Called ‘Probabilistic Paradoxes in Legal Reasoning’ with Bayesian Networks”, Science & Justice, 59(4): 367–379. doi:10.1016/j.scijus.2019.03.003

  • de Zoete, Jacob and Marjan Sjerps, 2018, “Combining Multiple Pieces of Evidence Using a Lower Bound for the LR”, Law, Probability and Risk, 17(2): 163–178. doi:10.1093/lpr/mgy006

  • Diamond, Henry A., 1990, “Reasonable Doubt: To Define, or Not to Define”, Columbia Law Review, 90(6): 1716–1736.

  • Di Bello, Marcello, 2019, “Trial by Statistics: Is a High Probability of Guilt Enough to Convict?”, Mind, 128(512): 1045–1084. doi:10.1093/mind/fzy026

  • Di Bello, Marcello and Collin O’Neil, 2020, “Profile Evidence, Fairness, and the Risks of Mistaken Convictions”, Ethics, 130(2): 147–178. doi:10.1086/705764

  • Di Bello, Marcello and Bart Verheij, 2018, “Evidential Reasoning”, in Handbook of Legal Reasoning and Argumentation, Giorgio Bongiovanni, Gerald Postema, Antonino Rotolo, Giovanni Sartor, Chiara Valentini, and Douglas Walton (eds.), Dordrecht: Springer Netherlands, 447–493. doi:10.1007/978-90-481-9452-0_16

  • Donnelly, Peter, 1995, “Nonindependence of Matches at Different Loci in DNA Profiles: Quantifying the Effect of Close Relatives on the Match Probability”, Heredity, 75(1): 26–34. doi:10.1038/hdy.1995.100

  • Donnelly, Peter and Richard D. Friedman, 1999, “DNA Database Searches and the Legal Consumption of Scientific Evidence”, Michigan Law Review, 97(4): 931–984. doi:10.2307/1290377

  • Dror, Itiel E., David Charlton, and Ailsa E. Péron, 2006, “Contextual Information Renders Experts Vulnerable to Making Erroneous Identifications”, Forensic Science International, 156(1): 74–78. doi:10.1016/j.forsciint.2005.10.017

  • Duff, Antony, Lindsay Farmer, Sandra Marshall, and Victor Tadros, 2007, The Trial on Trial (Volume 3): Towards a Normative Theory of the Criminal Trial, Oxford: Hart Publishing.

  • Earman, John, 1992, Bayes or Bust? A Critical Examination of Bayesian Confirmation Theory, Cambridge, MA: MIT Press.

  • Ebert, Philip A., Martin Smith, and Ian Durbach, 2018, “Lottery Judgments: A Philosophical and Experimental Study”, Philosophical Psychology, 31(1): 110–138. doi:10.1080/09515089.2017.1367767

  • Edwards, Ward, 1991, “Influence Diagrams, Bayesian Imperialism, and the Collins Case: An Appeal to Reason”, Cardozo Law Review, 13: 1025–1074.

  • Eggleston, Richard, 1978, Evidence, Proof and Probability, London: Weidenfeld and Nicolson.

  • Ekelöf, Per Olof, 1964, “Free Evaluation of Evidence”, Scandinavian Studies in Law, 8: 47–66.

  • [ENFSI] European Network of Forensic Science Institutes, 2015, ENFSI Guidelines for Evaluative Reporting in Forensic Sciences. [ENFSI 2015 available online]

  • Engel, Christoph, 2012, “Neglect the Base Rate: It’s the Law!”, Max Planck Institute (MPI) for Research on Collective Goods Preprint, 2012/23. doi:10.2139/ssrn.2192423

  • Enoch, David and Talia Fisher, 2015, “Sense and ‘Sensitivity’: Epistemic and Instrumental Approaches to Statistical Evidence”, Stanford Law Review, 67: 557–611.

  • Enoch, David, Levi Spectre, and Talia Fisher, 2012, “Statistical Evidence, Sensitivity, and the Legal Value of Knowledge”, Philosophy & Public Affairs, 40(3): 197–224. doi:10.1111/papa.12000

  • Evett, I.W., 1987, “On Meaningful Questions: A Two-Trace Transfer Problem”, Journal of the Forensic Science Society, 27(6): 375–381. doi:10.1016/S0015-7368(87)72785-6

  • Evett, I.W., G. Jackson, and J.A. Lambert, 2000, “More on the Hierarchy of Propositions: Exploring the Distinction between Explanations and Propositions”, Science & Justice, 40(1): 3–10. doi:10.1016/S1355-0306(00)71926-5

  • Fenton, Norman, Daniel Berger, David Lagnado, Martin Neil, and Anne Hsu, 2014, “When ‘Neutral’ Evidence Still Has Probative Value (with Implications from the Barry George Case)”, Science & Justice, 54(4): 274–287. doi:10.1016/j.scijus.2013.07.002

  • Fenton, Norman, David Lagnado, Christian Dahlman, and Martin Neil, 2019, “The Opportunity Prior: A Proof-Based Prior for Criminal Cases”, Law, Probability and Risk, 15(4): 237–253. doi:10.1093/lpr/mgz007

  • Fenton, Norman and Martin Neil, 2013 [2018], Risk Assessment and Decision Analysis with Bayesian Networks, Boca Raton, FL: Chapman and Hall/ CRC Press. Second edition, 2018.

  • Fenton, Norman, Martin Neil, and David A. Lagnado, 2013, “A General Structure for Legal Arguments About Evidence Using Bayesian Networks”, Cognitive Science, 37(1): 61–102. doi:10.1111/cogs.12004

  • Ferguson, Andrew Guthrie, 2020, “Big Data Prosecution and Brady”, UCLA Law Review, 67: 180–256.

  • Fienberg, Stephen E. (ed.), 1989, The Evolving Role of Statistical Assessments as Evidence in the Courts, New York: Springer New York. doi:10.1007/978-1-4612-3604-7

  • Finkelstein, Michael O., 2009, Basic Concepts of Probability and Statistics in the Law, New York, NY: Springer New York. doi:10.1007/b105519

  • Finkelstein, Michael O. and William B. Fairley, 1970, “A Bayesian Approach to Identification Evidence”, Harvard Law Review, 83(3): 489–517. doi:10.2307/1339656

  • Foreman, L.A., C. Champod, I.W. Evett, J.A. Lambert, and S. Pope, 2003, “Interpreting DNA Evidence: A Review”, International Statistical Review, 71(3): 473–495. doi:10.1111/j.1751-5823.2003.tb00207.x

  • Franklin, James, 2011, “Objective Bayesian Conceptualisation of Proof and Reference Class Problems”, Sydney Law Review, 33(3): 545–561.

  • Friedman, Ori and John Turri, 2015, “Is Probabilistic Evidence a Source of Knowledge?”, Cognitive Science, 39(5): 1062–1080. doi:10.1111/cogs.12182

  • Friedman, Richard D., 1986, “A Diagrammatic Approach to Evidence”, Boston University Law Review, 66(4): 571–622.

  • –––, 1987, “Route Analysis of Credibility and Hearsay”, The Yale Law Journal, 97(4): 667–742.

  • –––, 1996, “Assessing Evidence”, (Review of Aitken & Taroni 1995 and Robertson & Vignaux 1995) Michigan Law Review, 94(6): 1810–1838.

  • –––, 2000, “A Presumption of Innocence, Not of Even Odds”, Stanford Law Review, 52(4): 873–887.

  • Gaag, Linda C. van der, Silja Renooij, Cilia L. M. Witteman, Berthe M. P. Aleman, and Babs G. Taal, 1999, “How to Elicit Many Probabilities”, UAI'99: Proceedings of the Fifteenth conference on Uncertainty in artificial intelligence, pp. 647–654. [Gaag et al. 1999 available online

  • Garbolino, Paolo, 2014, Probabilità e logica della prova, Milan: Giuffrè Editore.

  • Gardiner, Georgi, 2018, “Legal Burdens of Proof and Statistical Evidence”, in David Coady & James Chase (eds.), Routledge Handbook of Applied Epistemology, London: Routledge, ch. 14.

  • –––, 2019, “The Reasonable and the Relevant: Legal Standards of Proof”, Philosophy & Public Affairs, 47(3): 288–318. doi:10.1111/papa.12149

  • Gastwirth, Joseph L. (ed.), 2000, Statistical Science in the Courtroom, New York, NY: Springer New York. doi:10.1007/978-1-4612-1216-4

  • Gastwirth, Joseph L., Boris Freidlin, and Weiwen Miao, 2000, “The Shonubi Case as an Example of the Legal System’s Failure to Appreciate Statistical Evidence”, in Gastwirth 2000: 405–413. doi:10.1007/978-1-4612-1216-4_21

  • Gillies, Donald, 2000, Philosophical Theories of Probability (Philosophical Issues in Science), London: Routledge.

  • Gordon, Thomas F., Henry Prakken, and Douglas Walton, 2007, “The Carneades Model of Argument and Burden of Proof”, Artificial Intelligence, 171(10–15): 875–896. doi:10.1016/j.artint.2007.04.010

  • Griffin, Lisa, 2013, “Narrative, Truth, and Trial”, Georgetown Law Journal, 101: 281–335.

  • Haack, Susan, 2014a, Evidence Matters: Science, Proof, and Truth in the Law, Cambridge: Cambridge University Press. doi:10.1017/CBO9781139626866

  • –––, 2014b, “Legal Probabilism: An Epistemological Dissent”, in Haack 2014a: 47–77.

  • Hacking, Ian, 1990, The Taming of Chance, Cambridge: Cambridge University Press. doi:10.1017/CBO9780511819766

  • Hájek, Alan, 2007, “The Reference Class Problem Is Your Problem Too”, Synthese, 156(3): 563–585.

  • Hamer, David, 2004, “Probabilistic Standards of Proof, Their Complements and the Errors That Are Expected to Flow from Them”, University of New England Law Journal, 1(1): 71–107.

  • Harcourt, Bernard E., 2006, Against Prediction: Profiling, Policing, and Punishing in an Actuarial Age, Chicago: University Of Chicago Press.

  • –––, 2018, “The Systems Fallacy: A Genealogy and Critique of Public Policy and Cost-Benefit Analysis”, The Journal of Legal Studies, 47(2): 419–447. doi:10.1086/698135

  • Harman, Gilbert, 1968, “Knowledge, Inference, and Explanation”, American Philosophical Quartely, 5(3): 164–173.

  • Hawthorne, John, 2004, Knowledge and Lotteries, Oxford: Clarendon Press. doi:10.1093/0199269556.001.0001

  • Hedden, Brian and Mark Colyvan, 2019, “Legal Probabilism: A Qualified Defence”, Journal of Political Philosophy, 27(4): 448–468. doi:10.1111/jopp.12180

  • Hepler, Amanda B., A. Philip Dawid, and Valentina Leucari, 2007, “Object-Oriented Graphical Representations of Complex Patterns of Evidence”, Law, Probability and Risk, 6(1–4): 275–293. doi:10.1093/lpr/mgm005

  • Ho Hock Lai, 2008, A Philosophy of Evidence Law: Justice in the Search for Truth, Oxford: Oxford University Press.

  • Horowitz, Irwin A. and Laird C. Kirkpatrick, 1996, “A Concept in Search of a Definition: The Effects of Reasonable Doubt Instructions on Certainty of Guilt Standards and Jury Verdicts.”, Law and Human Behavior, 20(6): 655–670. doi:10.1007/BF01499236

  • Izenman, Alan Julian, 2000a, “Assessing the Statistical Evidence in the Shonubi Case”, in Gastwirth 2000: 415–443. doi:10.1007/978-1-4612-1216-4_22

  • –––, 2000b, “Introduction to Two Views on the Shonubi Case”, in Gastwirth 2000: 393–403. doi:10.1007/978-1-4612-1216-4_20

  • Kadane, Joseph B. and David A. Schum, 2011, A Probabilistic Analysis of the Sacco and Vanzetti Evidence, New York: John Wiley & Sons.

  • Kahneman, Daniel and Amos Tversky, 1973, “On the Psychology of Prediction”, Psychological Review, 80(4): 237–251. doi:10.1037/h0034747

  • Kaiser L. and Seber, G.A., 1983, “Paternity testing: I. Calculation of paternity indexes”, American Journal of Medical Genetics, 15(2): 323–329. doi:10.1002/ajmg.1320150216

  • Kaplan, John, 1968, “Decision Theory and the Fact-Finding Process”, Stanford Law Review, 20(6): 1065–1092.

  • Kaplow, Louis, 2012, “Burden of Proof”, Yale Law Journal, 121(4): 738–1013.

  • –––, 2014, “Likelihood Ratio Tests and Legal Decision Rules”, American Law and Economics Review, 16(1): 1–39. doi:10.1093/aler/aht020

  • Kaye, David H., 1979a, “Probability Theory Meets Res Ipsa Loquitur”, Michigan Law Review, 77(6): 1456–1484.

  • –––, 1979b, “The Laws of Probability and the Law of the Land”, The University of Chicago Law Review, 47(1): 34–56.

  • –––, 1979c, “The Paradox of the Gatecrasher and Other Stories”, The Arizona State Law Journal, 1979: 101–110.

  • –––, 1980, “Mathematical Models and Legal Realities: Some Comments on the Poisson Model of Jury Behavior”, Connecticut Law Review, 13(1): 1–15.

  • –––, 1982, “The Limits of the Preponderance of the Evidence Standard: Justifiably Naked Statistical Evidence and Multiple Causation”, American Bar Foundation Research Journal, 7(2): 487–516. doi:10.1111/j.1747-4469.1982.tb00464.x

  • –––, 1986, “Do We Need a Calculus of Weight to Understand Proof Beyond a Reasonable Doubt?” Boston University Law Review, 66: 657–672.

  • –––, 1999, “Clarifying the Burden of Persuasion: What Bayesian Rules Do and Not Do”, International Commentary on Evidence, 3(1): 1–28. doi:10.1177/136571279900300101

  • Kaye, David H. and George F. Sensabaugh, 2011, “Reference Guide on DNA Identification Evidence”, in Reference Manual on Scientific Evidence, third edition, Federal Judicial Center, 129–210.

  • Koehler, Jonathan J., 1996, “The Base Rate Fallacy Reconsidered: Descriptive, Normative, and Methodological Challenges”, Behavioral and Brain Sciences, 19(1): 1–17. doi:10.1017/S0140525X00041157

  • Koehler, Jonathan J. and Daniel N. Shaviro, 1990, “Veridical Verdicts: Increasing Verdict Accuracy Through the Use of Overtly Probabilistic Evidence and Methods”, Cornell Law Review, 75(2): 247–279.

  • Kruskal, William, 1988, “Miracles and Statistics: The Casual Assumption of Independence”, Journal of the American Statistical Association, 83(404): 929–940. doi:10.1080/01621459.1988.10478682

  • Lacave, Carmen and Francisco J Díez, 2002, “A Review of Explanation Methods for Bayesian Networks”, The Knowledge Engineering Review, 17(2): 107–127. doi:10.1017/S026988890200019X

  • Laplace, Pierre-Simon, 1814, Essai Philosophique sur les Probabilités, Paris. Translated as A philosophical essay on probabilities, Frederick Wilson Truscott and Frederick Lincoln Emory (trans), 1951, New York: Dover.

  • Laudan, Larry, 2006, Truth, Error, and Criminal Law: An Essay in Legal Epistemology, Cambridge: Cambridge University Press. doi:10.1017/CBO9780511617515

  • –––, 2010, “Need Verdicts Come in Pairs?”, The International Journal of Evidence & Proof, 14(1): 1–24. doi:10.1350/ijep.2010.14.1.338

  • –––, 2016, The Law’s Flaws: Rethinking Trials and Errors?, London: College Publications.

  • Laudan, Larry and Harry Saunders, 2009, “Re-Thinking the Criminal Standard of Proof: Seeking Consensus about the Utilities of Trial Outcomes”, International Commentary on Evidence, 7(2): article 1. [Laudan and Saunders 2009 available online]

  • Lawlor, Krista, 2013, Assurance: An Austinian View of Knowledge and Knowledge Claims, Oxford: Oxford University Press. doi:10.1093/acprof:oso/9780199657896.001.0001

  • Leitgeb, Hannes, 2014, “The Stability Theory of Belief”, Philosophical Review, 123(2): 131–171. doi:10.1215/00318108-2400575

  • Lempert, Richard O., 1977, “Modeling Relevance”, Michigan Law Review, 75: 1021–1057.

  • Levanon, Liat, 2019, “Statistical Evidence, Assertions and Responsibility”, The Modern Law Review, 82(2): 269–292. doi:10.1111/1468-2230.12404

  • Lillquist, Erik, 2002, “Recasting Reasonable Doubt: Decision Theory and the Virtues of Variability”, University of California Davies Law Review, 36(1): 85–197

  • Littlejohn, Clayton, 2020, “Truth, Knowledge, and the Standard of Proof in Criminal Law”, Synthese, 197(12): 5253–5286. doi:10.1007/s11229-017-1608-4

  • Loftus, Elizabeth F., 1979 [1996], Eyewitness Testimony, Cambridge, MA: Harvard University Press. Revised edition, 1996.

  • Lucy, David, 2013, Introduction to Statistics for Forensic Scientists, Chichester: John Wiley & Sons.

  • Lyon, Thomas D. and Jonathan J. Koehler, 1996, “Relevance Ratio: Evaluating the Probative Value of Expert Testimony in Child Sexual Abuse Cases”, Cornell Law Review, 82(1): 43–78.

  • Malcom, Brooke G., 2008, “Convictions Predicated on DNA Evidence Alone: How Reliable Evidence Became Infallible”, Columbia Law Review, 38(2): 313–338.

  • Mayo, Deborah G., 2018, Statistical Inference as Severe Testing: How to Get Beyond the Statistics Wars, Cambridge: Cambridge University Press. doi:10.1017/9781107286184

  • Meester, Ronald and Marjan Sjerps, 2004, “Why the Effect of Prior Odds Should Accompany the Likelihood Ratio When Reporting DNA Evidence”, Law, Probability and Risk, 3(1): 51–62. doi:10.1093/lpr/3.1.51

  • Mellor, David Hugh, 2004, Probability: A Philosophical Introduction, London: Routledge.

  • Moss, Sarah, 2018, Probabilistic Knowledge, Oxford: Oxford University Press.

  • –––, forthcoming, “Knowledge and Legal Proof”, Oxford Studies in Epistemology 7, Oxford: Oxford University Press.

  • Nance, Dale A., 2007, “The Reference Class Problem and Mathematical Models of Inference”, The International Journal of Evidence & Proof, 11(4): 259–273. doi:10.1350/ijep.2007.11.4.259

  • –––, 2016, The Burdens of Proof: Discriminatory Power, Weight of Evidence, and Tenacity of Belief, Cambridge: Cambridge University Press. doi:10.1017/CBO9781316415771

  • National Research Council, [NRC II] 1996, The Evaluation of Forensic DNA Evidence, Washington, DC: The National Academies Press. doi:10.17226/5141.

  • Neapolitan, Richard E., 2004, Learning Bayesian Networks, Upper Saddle River, NJ: Pearson/Prentice Hall.

  • Neil, Martin, Norman Fenton, David Lagnado, and Richard David Gill, 2019, “Modelling Competing Legal Arguments Using Bayesian Model Comparison and Averaging”, Artificial Intelligence and Law, 27(4): 403–430. doi:10.1007/s10506-019-09250-3

  • Neil, Martin, Norman Fenton, and Lars Nielson, 2000, “Building Large-Scale Bayesian Networks”, The Knowledge Engineering Review, 15(3): 257–284. doi:10.1017/S0269888900003039

  • Nelkin, Dana K., 2000, “The Lottery Paradox, Knowledge, and Rationality”, Philosophical Review, 109(3): 373–408. doi:10.1215/00318108-109-3-373

  • Nesson, Charles R., 1979, “Reasonable Doubt and Permissive Inferences: The Value of Complexity”, Harvard Law Review, 92(6): 1187–1225. doi:10.2307/1340444

  • Newman, Jon O., 1993, “Beyon ‘Reasonable Doub’”, New York University Law Review, 68(5): 979–1002.

  • Niedermeier, Keith E., Norbert L. Kerr, and Lawrence A. Messé, 1999, “Jurors’ Use of Naked Statistical Evidence: Exploring Bases and Implications of the Wells Effect.”, Journal of Personality and Social Psychology, 76(4): 533–542. doi:10.1037/0022-3514.76.4.533

  • Nitzan, Shmuel, 2009, Collective Preference and Choice, Cambridge: Cambridge University Press. doi:10.1017/CBO9780511803871

  • Papineau, David, forthcoming, “The Disvalue of Knowledge”, Synthese, first online: 4 October 2019. doi:10.1007/s11229-019-02405-4

  • Pardo, Michael S., 2013, “The Nature and Purpose of Evidence Theory”, Vanderbilt Law Review, 66: 547–613.

  • –––, 2019, “The Paradoxes of Legal Proof: A Critical Guide”, Boston University Law Review, 99(1): 233–290.

  • Pardo, Michael S. and Ronald J. Allen, 2008, “Juridical Proof and the Best Explanation”, Law and Philosophy, 27(3): 223–268. doi:10.1007/s10982-007-9016-4

  • Park, Roger C., Peter Tillers, Frederick C. Moss, D. Michael Risinger, David H. Kaye, Ronald J. Allen, Samuel R. Gross, Bruce L. Hay, Michael S. Pardo, and Paul F. Kirgis, 2010, “Bayes Wars Redivivus—An Exchange”, International Commentary on Evidence, 8(1). doi:10.2202/1554-4567.1115

  • Pennington, Nancy and Reid Hastie, 1991, “A Cognitive Theory of Juror Decision Making: The Story Model”, Cardozo Law Review, 13: 519–557.

  • –––, 1993, “Reasoning in Explanation-Based Decision Making”, Cognition, 49(1–2): 123–163. doi:10.1016/0010-0277(93)90038-W

  • Picinali, Federico, 2013, “Two Meanings of ‘Reasonableness’: Dispelling the ‘Floating’ Reasonable Doubt”, The Modern Law Review, 76(5): 845–875. doi:10.1111/1468-2230.12038

  • –––, 2016, “Base-Rates of Negative Traits: Instructions for Use in Criminal Trials: Base-Rates of Negative Traits”, Journal of Applied Philosophy, 33(1): 69–87. doi:10.1111/japp.12109

  • Poisson, Siméon Denis, 1837, Recherches sur la Probabilité des Jugements en Matière Criminelle et en Matière Civile, Paris: Bachelier. Translated as Researches into the Probabilities of Judgements in Criminal and Civil Cases, 2013, Oscar Sheynin (trans), Berlin: NG-Verlag.

  • Posner, Richard, 1973, The Economic Analysis of Law, Boston: Brown & Company.

  • Prakken, Henry and Giovanni Sartor, 2009, “A Logical Analysis of Burdens of Proof”, in Legal Evidence and Proof: Statistics, Stories, Logic, Hendrik Kaptein, Henry Prakken, & Bart Verheij (eds.), London/New York: Routledge, pp. 223–253.

  • Redmayne, Mike, 2008, “Exploring the Proof Paradoxes”, Legal Theory, 14(4): 281–309. doi:10.1017/S1352325208080117

  • Reichenbach, Hans, 1935 [1949], Wahrscheinlichkeitslehre; eine untersuchung über die logischen und mathematischen grundlagen der wahrscheinlichkeitsrechnung, Leiden: A. W. Sijthoff’s uitgeversmaatschappij. Translated as The Theory of Probability: An Inquiry into the Logical and Mathematical Foundations of the Calculus of Probability, second edition, Ernest H. Hutten and Maria Reichenbach (trans), Berkeley, CA: University of California Press.

  • Renooij, Silja, 2001, “Probability Elicitation for Belief Networks: Issues to Consider”, The Knowledge Engineering Review, 16(3): 255–269. doi:10.1017/S0269888901000145

  • Robertson, Bernard and G.A. Vignaux, 1995 [2016], Interpreting Evidence: Evaluating Forensic Science in the Courtroom, Chichester, UK: John Wiley & Sons. Second edition is Robertson, Vignaux, and Berger 2016.

  • Robertson, Bernard, G.A. Vignaux, and Charles E.H. Berger, 2016, Interpreting Evidence: Evaluating Forensic Science in the Courtroom, second edition, Chichester, UK: John Wiley & Sons. First edition is Robertson and Vignaux 1995. doi:10.1002/9781118492475

  • Ross, Lewis, 2021, “Rehabilitating Statistical Evidence”, Philosophy and Phenomenological Research, 102(1): 3–23. doi:10.1111/phpr.12622

  • Roth, Andrea, 2010, “Safety in Numbers? Deciding When DNA Alone Is Enough to Convict”, New York University Law Review, 85(4): 1130–1185.

  • Royall, Richard M., 1997, Statistical Evidence: A Likelihood Paradigm, London/New York: Chapman & Hall.

  • Saks, Michael J. and Robert F. Kidd, 1980, “Human Information Processing and Adjudication: Trial by Heuristics”, Law and Society Review, 15(1): 123–160.

  • Schmalbeck, Richard, 1986, “The Trouble with Statistical Evidence”, Law and Contemporary Problems, 49(3): 221–236.

  • Schoeman, Ferdinand, 1987, “Statistical vs. Direct Evidence”, Noûs, 21(2): 179–198. doi:10.2307/2214913

  • Schwartz, David S. and Elliott R. Sober, 2017, “The Conjunction Problem and the Logic of Jury Findings”, William & Mary Law Review, 59(2): 619–692.

  • Schweizer, Mark, 2013, “The Law Doesn’t Say Much About Base Rates”, SSRN Electronic Journal. doi:10.2139/ssrn.2329387

  • Scutari, Marco and Jean-Baptiste Denis, 2015, Bayesian Networks: With Examples in R, New York: Chapman and Hall/CRC. doi:10.1201/b17065

  • Sesardic, Neven, 2007, “Sudden Infant Death or Murder? A Royal Confusion About Probabilities”, The British Journal for the Philosophy of Science, 58(2): 299–329. doi:10.1093/bjps/axm015

  • Shafer, Glenn, 1976, A Mathematical Theory of Evidence, Princeton, NJ: Princeton University Press.

  • Schauer, Frederick, 2003, Profiles, Probabilities, and Stereotypes, Cambridge, MA: Belknap Press.

  • Shen, Qiang, Jeroen Keppens, Colin Aitken, Burkhard Schafer, and Mark Lee, 2007, “A Scenario-Driven Decision Support System for Serious Crime Investigation”, Law, Probability and Risk, 5(2): 87–117. doi:10.1093/lpr/mgl014

  • Simon, Dan, 2004, “A Third View of the Black Box: Cognitive Coherence in Legal Decision Making”, University of Chicago Law Review, 71: 511–586.

  • Simons, Daniel J and Christopher F Chabris, 1999, “Gorillas in Our Midst: Sustained Inattentional Blindness for Dynamic Events”, Perception, 28(9): 1059–1074. doi:10.1068/p281059

  • Skyrms, Brian, 1966, Choice and Chance: An Introduction to Inductive Logic, Belmont, CA: Dickenson Pub.

  • –––, 1980, Causal Necessity: a Pragmatic Investigation of the Necessity of Laws, New Haven, CT: Yale University Press.

  • Smith, Martin, 2018, “When Does Evidence Suffice for Conviction?”, Mind, 127(508): 1193–1218. doi:10.1093/mind/fzx026

  • Stein, Alex, 2005, Foundations of Evidence Law, Oxford: Oxford University Press. doi:10.1093/acprof:oso/9780198257363.001.0001

  • –––, 2008, “The Right to Silence Helps the Innocent: A Response to Critics”, Cardozo Law Review, 30(3): 1115–1140.

  • Sullivan, Sean Patrick, 2019, “A Likelihood Story: The Theory of Legal Fact-Finding”, University of Colorado Law Review, 90(1): 1–66.

  • Suzuki, Jeff, 2015, Constitutional Calculus: The Math of Justice and the Myth of Common Sense, Baltimore, MD: Johns Hopkins University Press.

  • Sykes, Deanna L. and Joel T. Johnson, 1999, “Probabilistic Evidence Versus the Representation of an Event: The Curious Case of Mrs. Prob’s Dog”, Basic and Applied Social Psychology, 21(3): 199–212. doi:10.1207/S15324834BASP2103_4

  • Taroni, Franco, Alex Biedermann, Silvia Bozza, Paolo Garbolino, and Colin Aitken, 2014, Bayesian Networks for Probabilistic Inference and Decision Analysis in Forensic Science, second edition, Chichester, UK: John Wiley & Sons, Ltd. doi:10.1002/9781118914762

  • Thompson, William C. and Edward L. Schumann, 1987, “Interpretation of Statistical Evidence in Criminal Trials: The Prosecutor’s Fallacy and the Defense Attorney’s Fallacy.”, Law and Human Behavior, 11(3): 167–187. doi:10.1007/BF01044641

  • Thomson, Judith Jarvis, 1986, “Liability and Individualized Evidence”, Law and Contemporary Problems, 49(3): 199–219.

  • Tillers, Peter, 1997, “Introduction: Three Contributions to Three Important Problems in Evidence Scholarship”, Cardozo Law Review, 18: 1875–1889. [The portion of this article that discusses statistical evidence is often referred to as ‘United States v. Shonubi: A Statistical Oddity' available.]

  • –––, 2005, “If Wishes Were Horses: Discursive Comments on Attempts to Prevent Individuals from Being Unfairly Burdened by Their Reference Classes”, Law, Probability and Risk, 4(1–2): 33–49. doi:10.1093/lpr/mgi001

  • Treaser, Joseph B., 1992, “Nigerian Connection Floods U.S. Airport with Asian Heroin”, New York Times, National edition, 15 February 1992, Section 1, Page 1.

  • Tribe, Laurence H., 1971, “Trial by Mathematics: Precision and Ritual in the Legal Process”, Harvard Law Review, 84(6): 1329–1393. doi:10.2307/1339610

  • Triggs, Christopher M. and John S. Buckleton, 2004, “Comment on: Why the Effect of Prior Odds Should Accompany the Likelihood Ratio When Reporting DNA Evidence”, Law, Probability and Risk, 3(1): 73–82. doi:10.1093/lpr/3.1.73

  • Urbaniak, Rafal, 2018, “Narration in Judiciary Fact-Finding: A Probabilistic Explication”, Artificial Intelligence and Law, 26(4): 345–376. doi:10.1007/s10506-018-9219-z

  • –––, 2019, “Probabilistic Legal Decision Standards Still Fail”, Journal of Applied Logics, 6(5): 865–902.

  • Urbaniak, Rafal and Pavel Janda, 2020, “Probabilistic Models of Legal Corroboration”, The International Journal of Evidence & Proof, 24(1): 12–34. doi:10.1177/1365712719864608

  • Urbaniak, Rafal, Alicja Kowalewska, Pavel Janda, and Patryk Dziurosz-Serafinowicz, 2020, “Decision-Theoretic and Risk-Based Approaches to Naked Statistical Evidence: Some Consequences and Challenges”, Law, Probability and Risk, 19(1): 67–83. doi:10.1093/lpr/mgaa001

  • Venn, John, 1866, The Logic of Chance: An Essay on the Foundations and Province of the Theory of Probability, with Especial Reference to Its Application to Moral and Social Science, London/Cambridge: Macmillan.

  • Verheij, Bart, 2017, “Proof with and without Probabilities: Correct Evidential Reasoning with Presumptive Arguments, Coherent Hypotheses and Degrees of Uncertainty”, Artificial Intelligence and Law, 25(1): 127–154. doi:10.1007/s10506-017-9199-4

  • Vlek, Charlotte S., Henry Prakken, Silja Renooij, and Bart Verheij, 2014, “Building Bayesian Networks for Legal Evidence with Narratives: A Case Study Evaluation”, Artificial Intelligence and Law, 22(4): 375–421. doi:10.1007/s10506-014-9161-7

  • Volokh, Alexander, 1997, “n Guilty Men”, University of Pennsylvania Law Review, 146(2): 173–216.

  • Walen, Alec, 2015, “Proof Beyond a Reasonable Doubt: A Balanced Retributive Account”, Louisiana Law Review, 76(2): 355–446.

  • Walley, Peter, 1991, Statistical Reasoning with Imprecise Probabilities, London: Chapman and Hall.

  • Wasserman, David, 2002, “Forensic DNA Typing”, in A Companion to Genethics, Justine Burley and John Harris (eds.), Oxford, UK: Blackwell Publishing, 349–363. doi:10.1002/9780470756423.ch26

  • Wells, Gary L., 1992, “Naked Statistical Evidence of Liability: Is Subjective Probability Enough?”, Journal of Personality and Social Psychology, 62(5): 739–752. doi:10.1037/0022-3514.62.5.739

  • Williams, Glanville, 1979, “The Mathematics of Proof (Parts I and II)”, Criminal Law Review, 297–312 (part I) and 340–354 (part II).

  • Wixted, John T. and Gary L. Wells, 2017, “The Relationship Between Eyewitness Confidence and Identification Accuracy: A New Synthesis”, Psychological Science in the Public Interest, 18(1): 10–65. doi:10.1177/1529100616686966

  • Wren, Christopher S., 1999, “A Pipeline of the Poor Feeds the Flow of Heroin: Traffickers Field More ‘Swallowers’ To Evade Sophisticated Drug Crackdown”, New York Times, National Edition, 21 February 1998, section 1, page 37.

  • Wright, Richard W., 1988, “Causation, Responsibility, Risk, Probability, Naked Statistics, and Proof: Pruning the Bramble Bush by Clarifying the Concepts”, Iowa Law Review, 73: 1001–1077.

  • Zabell, Sandy L., 2005, “Fingerprint Evidence”, Journal of Law and Policy, 13(1): 143–179.

Academic Tools

Other Internet Resources

Journals that publish widely on law and probability

Other Resources

abduction | Bayes’ Theorem | confirmation | epistemology, formal | epistemology: Bayesian | evidence: the legal concept of | legal reasoning: interpretation and coherence in

Acknowledgments

For comments on an earlier version of this entry, many thanks to Ronald Allen, Alex Biedermann, Christian Dahlman, Patryk Dziurosz-Serafinowicz, Norman Fenton, Pavel Janda, David Kaye, Alicja Kowalewska, Weronika Majek, Sarah Moss, Pawel Pawlowski. Rafal Urbaniak’s research for this entry has been supported by the National Science Centre grant 2016/22/E/HS1/00304.

Copyright © 2021 by Rafal Urbaniak <rfl.urbaniak@gmail.com> Marcello Di Bello <mdibello@asu.edu>

最后更新于

Logo

道长哲学研讨会 2024