系统发生分析 phylogenetic inference (Matt Haber and Joel Velasco)

首次发表于 2021 年 12 月 8 日,实质修订于 2022 年 6 月 30 日。

系统发生学是研究个体、生物群体(如种群、物种或更高级分类单元)或其他具有进化历史的生物实体(如基因、生化物质或发育机制)的进化历史和关系的学科。系统发生分析是推断这一历史的任务,与其他推断问题一样,对于这些推断如何得到合理解释存在有趣且困难的问题。

在本条目中,我们将探讨系统发生分析是什么以及它是如何工作的。在第一部分中,我们简要介绍了系统发生学及其历史。在第二部分中,我们探讨了系统发生分析为哲学家提供了有价值的问题,并且哲学方法对系统发生学的科学研究做出了贡献。这将有助于展示为什么系统发生分析不仅仅是一个生物学研究问题,而且也是一个哲学问题。最后,在第三部分中,我们将讨论一些关于系统发生学基础问题的当代辩论,以及系统发生分析的未来展望。


1. 生物学中的系统发生学

1.1 系统发生学入门和介绍

系统发生是对进化历史的重建。因此,进化的发现是系统发生学历史的良好起点。尽管达尔文并不是第一个提出某些物种与其他物种有亲缘关系的人,但正是《物种起源》(达尔文 1859)使许多生物学家相信共同祖先并开始构建系统发生树。这立即产生的一个持续影响是,如何将系统发生树(即进化历史的重建)与分类学(即我们如何对分类单元进行分组)联系起来的问题。

图 1 系统发生(或进化)树在生物学研究文章中已经变得司空见惯。该树显示了关于肺鱼和腔棘鱼在四足动物进化历史中相对位置的最新假设(Amemiya 等人 2013 年:312,图 1)。【图 6 的详细描述在补充材料中。】

达尔文之前的分类学侧重于根据“自然系统”进行分类,其中由于它们的“自然亲缘关系”,分类单元被统一为大的群体(Winsor 1976)。为了澄清亲缘关系的概念,理查德·欧文使用术语“同源物”来指代“不同动物中的相同器官在各种形态和功能下的存在”(Owen 1843)。将其放入进化框架中,将这些群体统一起来的自然亲缘关系被视为从共同祖先经过改变后的后代的结果,“同源性”已成为比较生物学中的一个核心术语(Donoghue 1992; Hall 1994)。为了了解同源性与系统发生分析的关系,并介绍一些基本术语,考虑一个示例系统发生树(图 1)将会很有用。

图 1 提供了一个典型的现代系统发生树的例子——一个显示亲缘关系的分支图。像这样的系统发生树包括分支(线条)和节点(线条分支或汇合的地方,取决于您阅读树的方向)。末端分支上标有正在研究其进化关系的实体。在这种情况下,这些实体可以是物种或更高的分类单元,但也可以为其他分类水平构建树,或者任何其他可以研究其进化关系的生物实体(例如病毒、DNA 片段、灭绝的分类单元)。系统发生学方法甚至可以用于研究个体发生或文化进化,例如,它们已被用于构建细胞命运图,以揭示单个生物体的发育部分之间的关系(Salipante 和 Horwitz 2006),并用于重建语言家族的扩张并帮助估计历史人类迁移模式(Gray 和 Jordan 2000;Gray 和 Atkinson 2003;Gray,Drummond 和 Greenhill 2009)。最近,系统发生学工具已被用于辅助 COVID-19 的流行病学研究(Lemieux 等人,2021)。

由于现代生物学的许多内容都需要能够阅读系统发生树,因此良好的指南很常见。这包括期刊文章(例如,Baum,Smith 和 Donovan 2005;Baum 2008;Yang 和 Rannala 2012),在线指南(例如,Understanding Evolution,其他互联网资源)以及更全面的教材(例如,Felsenstein 2004;Lemey,Salemi 和 Vandamme [eds] 2009;Wiley 和 Lieberman 2011;Baum 和 Smith 2013)。在这里,我们只提供了一个简要介绍,但建议读者寻找更全面和技术性的介绍时参考其中任何一本(以及其他一些)。

在图 1 中的系统发生树上,时间从左到右流逝,现存群体标记在右侧分支的末端。[1] 从左边开始,有两个不同的分支,一个通向软骨鱼类(鲨鱼和鳐鱼),另一个通向一个节点。从该节点开始,分支分开,一个通向硬骨鱼类,另一个通向另一个更近的节点(最终通向青蛙、蜥蜴和哺乳动物等其他分类单元)。分支可以被看作是代表祖先谱系,节点代表分化(或分裂)为不同谱系分支的共同祖先。

我们也可以通过从右向左追溯分支,将图 1 中的树读取出来。这个方向让我们回到过去的时间,并通过观察共同祖先的近期性来判断哪些群体与其他群体更密切相关。例如,与河豚鱼相比,肺鱼与青蛙更密切相关,因为肺鱼和青蛙彼此之间共享一个更近的共同祖先,而与河豚鱼的共同祖先相比则更近。要看到这一点,沿着每个群体的分支向后追溯,从右向左开始。在到达肺鱼和青蛙之间的节点之前,你会收敛于一个节点,而在到达这些分类单元和河豚鱼之间的节点之前。另一种说法是,有一个包括肺鱼和青蛙但不包括河豚鱼的单系群(或类群)。

一个单系群由一个祖先和其所有后代组成。一些熟悉的群体事实上并不是单系群。例如,如果我们试图将河豚和鲨鱼合并为一个单独的群体,排除掉青蛙和其他四足动物(如传统的鱼类),我们得到的就是一个旁系群。旁系群中的个体都共享一个共同的祖先,但排除了该祖先的一些后代。像“飞行四足动物”(鸟类加上蝙蝠)这样的人为群体被称为多系群,因为它们具有多个不同的起源。由于旁系群和多系群没有独特的单一历史(即,树上没有一支只通向这个群体的分支),它们不能像单系群那样在解释中发挥作用,即它们缺乏单系群的实用性和解释力量(Velasco 2008a)。例如,生物学家可能对研究花卉多样性是否受传粉者综合征(如蛾、鸟或蜜蜂)驱动感兴趣,或者反之亦然。系统发生学原理对这些竞争性假设预测不同的单系群模式,这些模式可以通过实证测试,并由生物学家在设计实验时用于测试这些情况下选择的证据(Whittall&Hodges 2007)。如果没有单系群的解释和组织原则,这是不可能的,这也是它在系统发生学中占主导地位的原因之一。

树上的每个节点都是一个单系群的起源。例如,哺乳动物形成一个单一、统一的单系群的说法,只是意味着所有哺乳动物都共享(即是后代)一个共同的祖先。我们有非常充分的理由相信这是真实的。例如,只有哺乳动物具有某些特征(或性状),如乳腺、毛发和中耳的三块骨头。这些特征都是同源的,即它们的相似性是由共同的祖先所解释的。(同源性状通常与类似性状相对比,即相似性不是由共同的祖先解释,而是由其他过程解释,例如趋同进化或逆转)。人类和大象的乳腺是同源的,因为这个特征是从它们的共同祖先那里继承下来的。在图 1 中,哺乳动物的祖先位于节点上,分别通向鸭嘴兽和其他哺乳动物。一旦特征在一个分支上出现(作为进化的新奇性),它们可以传递给该谱系的后代(不变或修改)。由于鸭嘴兽和老鼠都有乳腺,但早期节点没有分支出的分类单元没有,我们可以推断乳腺在哺乳动物和鸟类分离的节点之后进化,但在哺乳动物节点之前。这是系统发生树在生物学中支持推理性论断的一种方式。如果乳腺在哺乳动物和鸟类分离的节点之前进化,那么我们可能会在鸟类或蜥蜴上发现乳腺。鸭嘴兽和老鼠也是在羊膜囊内出生的,火鸡和蜥蜴也是如此。然而,青蛙没有羊膜囊。这告诉我们羊膜囊是在青蛙谱系与其他四足动物分支出之后进化的。类似的推理方法使我们能够推断骨骼、四足动物肢体结构、羽毛等的进化历史。 这些同源性形成了特征的嵌套层次结构,就像单系群一样嵌套,所以,例如,哺乳动物是羊膜动物的一部分,而羊膜动物本身是四足动物的一部分。另一方面,虽然哺乳动物和鸟类都是羊膜动物的一部分,但它们完全没有重叠。事实上,没有任何生物既有乳腺又有羽毛。

因此,解释特征分布需要知道哪些群体是克隆群(即单系群)。系统发生树准确地描述了这一点,说明了哪些群体是克隆群。这些信息被称为树的拓扑结构,它传达了节点的相对顺序,但没有关于它们在时间上的绝对日期的信息。知道哪些群体是克隆群使我们能够重建特征性状的进化过程,而特征性状的分布是我们首先推断哪些群体是克隆群的基本方式。这种推理方式(由威利·亨尼希(1966)称为“相互照明”)引起了系统发生推断的批评者对循环推理的指责(例如,Sokal&Sneath 1963),而支持者则试图解释为什么这种担忧是不合适的(参见 Wiley 1975; Sober 1988b 等)。实际上,特征的嵌套层次结构正是系统学家首先将分类群体分类为嵌套层次结构的原因,而达尔文认为分类系统的嵌套层次结构是共同祖先最重要的证据(Winsor 2009; Sober 2009, 2010)。理解特征同源性的含义以及推断同源性的问题将在后面讨论(§2.1)。复杂化的是,同源性群体并不总是形成明确的嵌套层次结构,而在这些情况下确定哪些系统发生假设得到最好的支持是引发关于系统发生推断的争论的重要部分(有关此问题的更多信息,请参见 §2 和 §3)。

解释特征分布只是冰山一角。系统发生学对进化生物学的所有研究都至关重要。系统发生学是系统分类学和种群遗传学领域联系的核心。了解系统发生是研究进化生物学、功能遗传学、比较解剖学和进化发育生物学问题的重要第一步。就像进化是生物学中统一的组织主题一样,系统发生学是更广泛的生物推理的支撑。正如 Sterelny 和 Griffiths(1999: 379)所说,“除非将其放在系统发生的背景下,否则生物学中的任何事物都没有意义”。

1.2 从达尔文到现在:三个交织的历史

达尔文《物种起源》之后的大约 100 年里,生物学中的系统发生研究是常见且重要的。然而,系统发生学在很大程度上缺乏基础理论或可解释的方法论,而是依靠系统分类学家对某些群体有广泛知识的判断,判断哪些特征看起来真正同源,哪些特征转化似乎合理。一些系统发生树因为同源性明确而得到广泛认可,推理也很容易。早在 19 世纪末,系统分类学家就对图 1 中许多群体的分支顺序达成了共识。然而,早在 1938 年发现始祖鱼后,关于始祖鱼和肺鱼的相对位置就立即引起了争议(Thomson 1991),这一争议至今仍引起生物学家的关注(例如,Bockmann,De Carvalho 和 De Carvalho 2013; Amemiya 等,2013; Takezaki 和 Nishihara 2017)。

珊瑚鱼和腔棘鱼对于理解四足动物的起源至关重要,这是达尔文以来进化历史重建中的一个重大问题。但这只是众多例子中的一个。Bowler(1996)对这段时间内系统发生学的发展进行了调查,并更详细地讨论了一些争论,例如节肢动物是否形成一个单系群,以及鸟类的起源问题,特别是它们与灭绝的恐龙的关系。

尽管在系统发生学方面仍存在重要的分歧,但这些争议的性质已经发生了重大变化,因为系统发生学家不再主要依赖个别专家判断。二十世纪中叶出现了关于系统发生学理论基础的竞争性解释/理论(§1.2.1),大量新的算法方法用于构建系统发生学和分类学,并开始相对容易地获取和使用计算能力(§1.2.3),同时结合了各种形式的分子数据作为新的证据来源(§1.2.2)。生物学家试图将这些新特征纳入系统发生学的方法和理论中,关于这是否从根本上改变了系统发生学的性质的争论随之产生。与此同时,关于系统发生学基础和分类学的适当方法的争论也变得非常普遍,并与关于这些新方法和新数据的论证交织在一起。

传统上,系统发生学的出现主要是在 20 世纪分类学思想的三大主要学派之间的辩论背景下,通常被称为“系统发生学之战”(§1.2.1)。尽管这一点非常重要,但过于关注这段历史可能会掩盖分子革命(§1.2.2)和越来越多地获得更强大计算能力(§1.2.3)对系统发生学的建立产生的影响。下面我们将考虑 20 世纪这些发展如何影响系统发生学作为一个独立的研究领域的出现。然而,这些发展之间存在许多交叉主题(通常由个别研究者之间的忠诚关系加强),这表明,最终需要一种综合的方法来获得丰富而细致入微的系统发生学历史。

1.2.1 系统发生学之战

从历史上看,系统发生学是从更大的生物系统学领域中出现的,这是研究生命多样性和生物之间关系的生物学领域。如今,系统学家通常仅将“相关性”视为共同祖先的近期性,但这并不总是如此。在达尔文之前的分类学家讨论了各个群体之间的关系及其在“自然系统”中的位置,尽管进化理论的兴起使得一种相关性是家族关系的观念成为可能,但并没有消除更广泛概念的想法。关于系统发生学在分类和分类学中的作用的争论很普遍(例如,赫胥黎 [编] 1940; 温索尔 1995),尽管从 20 世纪 50 年代末开始,随着合作变成了推动他们议程的组织化研究计划,这些争论开始采取新的形式。

在对这一时期的分析中,大卫·赫尔(1988 年:第 5 章)将他的其中一章命名为“战争中的系统学家”,因此有时使用“系统学战争”来描述这一时期的辩论。赫尔(1970 年)有影响力地比较了三种“当代系统学哲学”,通常被称为表型学(或数值分类学,以 Sokal&Sneath(1963 年)的同名教材为基础),分类学或系统发生学(以 Hennig 的 1966 年基础性著作为基础,其早期版本于 1950 年以德文出版),以及进化系统学(沿袭辛普森 [1961] 和梅尔 [1969] 等支持者的观点)。

表型学家争论称,我们没有足够的确定性来知道共同祖先,以此作为我们“相关性”概念的基础,并坚持认为分类学家的工作是发现相似性群集(Sokal&Sneath 1963)。表型学家对他们所认为的系统学的根深蒂固的方法持批评态度,认为传统的选择假设的方法主要依赖于生物学家的相对突出性或地位,而不是良好的科学方法。他们明确将自己的观点框定在关于何为“良好科学”的争论背景下,并试图推动独立和客观的评估竞争分类群的方法,这些方法依赖于透明和可重复的方法。这包括主张在生物理论和相似性群的构建之间更大的分离。

大约在同一时间,另一群人(系统发生学家)坚持认为共同祖先的近期性提供了最好的理论基础来解释相关性(Hennig 1966)。与表型学家一样,他们也致力于推广良好的系统分类科学方法,并对传统方法持有相似的批评态度。系统发生学家的特点是坚持认为物种水平以上的所有分类群应该是单系群。因此,如果鸟类是从恐龙进化而来的,那么它们就是恐龙(Padian&Horner 2002)。如果以一种排除鸟类的方式来定义恐龙(或更广义的爬行动物),那么这个群体就是旁系群,因此在系统发生分类系统中不能成为一个分类单元。恩斯特·迈尔(Ernst Mayr)嘲笑地称他们为“支系学家”,因为他们过于专注于恢复支系(即单系群)(Mayr 1965a),尽管从业者们乐于接受这个称号。当系统发生分类原则得到一贯执行时,往往会对长期存在的传统分类进行重大修订,这往往引发了深刻的争议(例如,Halstead 1978; Gardiner et al. 1979)。

系统发生学和分析学都是针对系统分类学中根深蒂固观点的发展而来的。作为回应,致力于传统方法的生物学家试图阐明他们方法的理论基础,这被称为进化系统发生学。以恩斯特·迈尔为最杰出的倡导者,进化系统发生学家试图将系统发生纳入分类中,但也允许分类可能(甚至更多地)代表了群体之间的重要适应差异(Simpson 1961; Mayr 1969)。在这些辩论中经常涉及的一个著名例子是鸟类和鳄鱼的分类位置。迈尔认为,尽管鸟类是从恐龙和爬行动物中演化而来的,但鸟类具有一系列适应性特征,这使得将它们作为一个独特的群体与爬行动物在分类上具有等同的地位成为合理的。然而,尽管鳄鱼与鸟类的亲缘关系比与蜥蜴更近,属于与蜥蜴不同的一个支系,迈尔仍将鳄鱼归类为爬行动物的“等级”——一个具有良好整合适应性复合体的群体(Mayr 1974)。因此,与分析学家不同,进化系统发生学家主张在分类学中包括爬行动物和其他旁系群体。

理解这些辩论的一种自然方式是将其视为系统学家将“重建系统发生树”和“分类一组分类单元”作为两个不同的任务,并探讨这些任务如何(如果有的话)相互信息化(Mayr 1965a,1974; Griffiths 1974; Hennig 1975; de Queiroz & Gauthier 1990, 1992)。就这个特定问题而言,系统发生学在很大程度上取得了胜利;如今,当科学家指定更高的分类单元时,他们通常总是在描述单系群。单系群原则已被证明是一种强大的解释和组织工具,对其的承诺已广泛增长,并且现在主导着系统发生学,除了在生物学领域的理论和方法论中发挥作用。这也是为什么有时将这个时期称为“系统发生学革命”的原因之一(Hull 1988; Kearney 2007; Haber 2009)。

然而,还有另一种框架可供选择。也就是说,随着生物学家转向使用系统发生学(而不是传统分类学)来支持他们的解释和证明他们的推理,对分类学分类的争议逐渐淡化。根据这种观点,对系统发生假设的争议具有影响力;随着它们在科学推理中被系统发生学所取代,对分类的争议变得不那么重要。约瑟夫·费尔森斯坦(2004 年:145)将其称为“不太重要派”,并认为“系统发生学家在我宣布其存在之前很久就已经选择了这个派别”。系统发生学应该如何影响、提供信息或限制分类学分类仍然是一个活跃的辩论(参见埃雷舍夫斯基 2001 年以及关于采用系统发生学分类法的辩论,以及其他关于系统发生学分类的辩论),尽管这个辩论与系统发生的推理无关。关于分类学分类的当代辩论主要集中在如何从系统发生学中推断出分类的问题上;对于重建系统发生的连贯性几乎没有争议。根据这种观点,生物分类学并不被视为系统发生学的竞争对手,而是依赖于它,而不是相反。像费尔森斯坦一样的系统发生学家可以在很大程度上继续重建系统发生,而不必关注分类问题,尽管一些关于系统发生单元的形而上学问题可能会影响到系统发生本身的推理(见 §2.6.2)。

作为一个重要的附带说明,在前一段中我们说“大部分”,因为——就像生物学中的许多情况一样——并没有一致的意见。值得注意的是,将自己视为模式分类学派的生物学家会对我们关于系统发生学的许多描述提出质疑,包括本条目的第一句话:“系统发生学是对进化历史的重建。”虽然有许多观点可以与模式分类学派联系起来,但它们通常都认为这种说法无法证明将一个过程读入到主要是关于模式的说法中。对于模式分类学派来说,系统发生树通常被视为从特征证据中得出的图形表示;在这方面,系统发生学只是对这些特征进行分类。对于模式分类学派来说,直接从系统发生树中推断过程或进化历史,或者更糟糕的是,在系统发生分析中加入进化过程的假设,都是错误的。他们出于许多原因进行了辩护,通常是基于哲学的理由,即模式分类学派体现了良好的科学推理,或者进化论的主张需要额外的推理步骤,这些步骤需要明确表达(Farris 1983)。这导致了更大的分类学界的分裂。这个过程/模式的分裂的一个结果是,“分类学家”这个术语变得模糊、有争议和不精确,不总是清楚谁被视为什么样的分类学家(Carpenter 1987,The Editors 2016,Quinn 2017,Brower 2018a,Williams and Ebach 2018)。例如,虽然模式分类学派拒绝对进化做任何先验假设(Brower 2019),所谓的过程(或者有时是系统发生)分类学派认为进化论的主张是系统发生学的基础,而其他人(例如统计系统发生学家)则不再使用“分类学家”这个标签(有关这个有争议的分类法更多信息,请参见 §2.3 和小节 §2.3.1)。 我们建议在这个领域写作的哲学家们仔细说明“cladist/m”这个术语的确切含义,如果他们使用这个术语的话,并警告不要将其与“phylogenetics”混用。

哲学家们在系统发生学的其他主题上的关注较多,而不是模式/过程的分离。这有些令人惊讶,因为有丰富的哲学主题可以被哲学家们作为科学解释和推理性质,或者生物学方法论中理论的角色的数据进行深入探讨或利用。关于过程与模式 cladism 的基础文献,请参阅 Beatty(1982)对模式 cladism 的指定的介绍,以及 Brady(1982)、Patterson(1982)和 Platnick(1982)的回应。两本最近的模式 cladist 教材包括 Williams&Ebach(2020)和 Brower&Schuh(2021)。在系统发生学中,有一个广泛但有限的文献,其中包括模式 cladists 和过程 cladists 之间的辩论,例如 Carpenter(1987)、Brower(2000、2002、2019)和 Lee(2002)只是哲学家们在科学推理和方法论的证明方面可能探索的大量文献中的一小部分。

不管是因为系统发生学家达成一致还是因为它们变得不那么重要,关于分类学哲学的争议是否平息下来,将系统发生学战争视为一场活跃的争议而不是历史性的争议,这是哲学家的错误。然而,它仍然是系统发生学历史上的重要事件,核心概念上的辩论对当代系统发生学的辩论产生了影响(Haber 2009)。争论的焦点不仅仅是系统发生学家应该采用什么样的“相关性”概念,而是在推断历史和构建分类的背景下,什么构成了良好的科学,以及客观性、可测试性和可重复性等概念在科学中的相对价值(甚至连连贯性)。但是,系统发生学家不再争论系统发生学推断是否可以作为一种科学活动得到证明,而是争论如何最好地进行。这种变化的很大一部分原因是由于新的分子数据来源的可用性以及利用它的新方法的引入。现在我们转向这段历史。

1.2.2 分子革命

像费尔森斯坦、斯特纳和利德加德(2018)一样,鼓励生物学的历史学家和哲学家“超越系统发生学之争”。他们的观点并不是这个问题不重要,而是过于狭隘地关注它会掩盖这一时期其他重要历史进展的影响。我们同意这一点。为了解决这个问题,斯特纳和利德加德建议关注这一时期系统发生学家的实践,而不是更狭义地关注定义争议(体现了所谓的实践中的科学哲学方法(Ankeny、Chang、Boumans 和 Boon 2011))。这样做可以揭示出,在系统发生学之争的同时,还有数学化系统发生学和分子数据的融入这两个方法论革命。这些趋势贯穿于不同的系统发生学派别,引发了一系列争议。这在系统发生学中尤为严重,数学和计算工具的使用的兴起既受到了热烈欢迎,也遭到了强烈抵制。我们首先简要描述了分子数据对系统发生学的影响,然后在 1.2.3 节中介绍了数学和统计工具如何被纳入系统发生学方法(有关这些主题的其他历史请参见 Dietrich 1994、1998;Hagen 2001;Sterner 和 Lidgard 2018)。

让我们首先考虑将分析中的分子数据纳入系统发生学中的吸引力 - 甚至可能排除形态特征(例如,Scotland,Olmstead 和 Bennett 2003,但请参见 Wiens 2004)。对于系统发生学而言,分子革命最重要的方面之一是系统发生学家可获得的大量新数据,包括对于细菌等群体而言化石数据稀缺或严重缺乏的情况。然而,仅仅是分子数据的规模和可用性并不是其吸引力所在。随着收集、编码和整理这些数据变得更加容易,生物学家们认为分子系统发生学提供了一种独立的证据来源,可以加强对共同祖先和系统发生模式的证据(Zuckerkandl 和 Pauling 1965)。相比之下,像 Theodosius Dobzhanksy,Ernst Mayr 和 George Gaylord Simpson 这样的传统系统发生学家对分子进化研究持怀疑态度,特别是对它们在某种程度上优越或能够取代形态研究的观点(Dietrich 1998)。

许多最早的分子研究通常支持已建立的系统发生学,例如,Margoliash(1963)讨论了细胞色素 c 的进化,但仅假定物种的接收系统发生是正确的。后来,Fitch&Margoliash(1967)仅从细胞色素 c 数据构建了一个系统发生树,主要是为了演示分子系统发生学的方法以及如何测试结果的可靠性。有趣的是,他们提到的“异常”之一是乌龟被放置在离鸟类比蛇更近的位置 - 但事实证明这并不是异常!自那时以来,绝大多数分子研究都将乌龟置于鳄鱼类(包括鸟类和鳄鱼)的姐妹群体,包括迄今为止进行的最大规模的基因组研究(Crawford 等人 2015)。

乌龟的系统发生以及其他最近的分子研究案例(例如肺鱼和腔棘鱼的研究,参见 Amemiya 等人 2013 年;Takezaki 和 Nishihara 2017 年)阐明了一个普遍观点。即使在我们拥有大量化石和易于获取的具有详细解剖和形态学研究的现存标本的群体中,分子证据通常被认为是解决争议甚至推翻先前广泛持有观点的依据。这部分是由于分子数据的庞大量,可以压倒其他证据来源,但也因为分子数据可能被视为“中立”演化,即由突变和遗传漂变而非自然选择(Duret 2008 年)的结果,因此不太容易显示类似性(收敛进化的结果),这可能被误认为是同源性(共同祖先的结果)。(类比是两个类似性的关系,是一种“同源异形”关系,即相似性不是由共同祖先传承而来的特征。)

类比是共同祖先证据的假阳性。据推测,形态特征更容易受到选择压力的影响,从而产生这些假阳性,因此来自较少受选择压力影响的分子数据(即中性位点)更适合重建系统发生历史。通过这些系统发生树,可以更好地识别类比,为自然选择(以趋同进化或其他进化过程的形式)作为解释生物多样性和性状分布模式的证据提供支持(Whittall&Hodges 2007 提供了关于传粉者模式和形态的这种推理的很好例子)。换句话说,分子数据帮助生物学家解释为什么看似同源的特征未能形成嵌套的等级体系。分子数据可以确定其中哪些可能是类比,从而有助于解决在系统发生分析中本应看似冲突的问题。这是生物学家利用系统发生树提供基于数据和理论的进化解释的一种方式,与“故事”相对立。

除了在系统发生学家已经有大量证据的情况下增加更多证据外,分子研究还可以揭示其他证据来源极其薄弱的情况。例如,分子数据可以保留在形态水平上被数百万年的适应性变化所掩盖的深层系统发生历史。系统发生学家描绘植物和动物系统发生中最早的分支以及真核生物不同群体之间的关系时,认识到分子数据既可以测试又可以丰富这些深层系统发生假设(Kenrick&Crane 1997; Baldauf 2003)。随后的分子系统发生分析已经证明使用分子数据(例如氨基酸序列,RNA 转录组以及核和线粒体基因组)构建深层系统发生假设的成果(Heckman 等人 2001; Dunn,Giribet,Edgecombe 和 Hejnol 2014)。

Emile Zuckerkandl 和 Linus Pauling 引入和使用分子钟假设提供了分子数据强大实用性的一个很好的例子,并且是分子系统发生学历史上的一个重要早期事件。术语“分子钟”是在 Zuckerkandl&Pauling(1965)中首次提出的,但他们在早期出版物中已经使用了这个术语而没有命名它(Zuckerkandl&Pauling 1962; Pauling&Zuckerkandl 1963)。基本思想相当简单。给定一定的分子进化速率,可以根据一组分子数据映射到系统发生拓扑结构上来估计分支和节点的相对年龄。因此,分子进化模型被纳入系统发生方法(§1.2.3)。

随着越来越多的蛋白质序列可用,Zuckerkandl 和 Pauling 注意到同源蛋白质在不同类群中显示出轻微但系统性不同的序列。例如,人类和马血红蛋白 α 链之间有 18 个氨基酸差异,而大猩猩和人类之间只有两个差异。[3]

然后,Zuckerkandl 和 Pauling 假设氨基酸变化与时间大致成正比,因此人类和马的分歧时间是人类和大猩猩之间的九倍。使用古生物学估计进行校准,Zuckerkandl 和 Pauling 得出结论,人类和大猩猩分歧仅发生在 1450 万年前,比传统观念要近得多。这种推理方式不仅限于分子系统发生学,还被引入到其他数据类型的应用中,例如,从系统发生学技术中类似的推理已被应用于语言树分歧时间的估计,以估计印欧语系和波利尼西亚人类迁移(Gray&Jordan 2000; Gray&Atkinson 2003; Gray,Drummond 和 Greenhill 2009)。 (有关分子钟早期发展的更多信息,请参见 Morgan 1998。)

后来,人们认为进化的中性理论 [4] 为分子钟假说提供了一些理论上的依据(Kimura 1968, 1969; Duret 2008),尽管 Dietrich(1994)认为,关系是相反的,Zuckerkandl 和 Pauling 的研究首先为中性理论的发展提供了基础。

分子钟只是系统发生学中分子生物学重要性的众多例子之一。重要的是,纳入分子数据有助于将系统发生学研究扩展到真核生物之外,即分子革命从根本上改变(或者可以说是创造了)微生物系统发生学领域。从 1969 年开始,卡尔·沃斯开始对原核生物界的核糖体 RNA(rRNA)进行测序,以了解细菌的系统发生。这项工作进展缓慢且困难,但到 1975 年,沃斯和他的实验室已经测序了 27 种不同的细菌分类群的 rRNA(Woese 等,1975 年)。1977 年,沃斯和乔治·福克斯引起了轰动。他们对一些原核生物的基因进行了测序,这些基因的 rRNA 基因缺乏所有先前已知的细菌 rRNA 基因的标志,并且与真核生物一样与细菌关系疏远。沃斯和福克斯将它们命名为“古细菌”,以强调它们的独特性(Woese&Fox,1977 年)。1990 年,沃斯,坎德勒和威利斯(1990 年)首次尝试根据分子数据构建包括细菌,古细菌和真核生物的生命普遍树,该项目至今仍在进行中(Ciccarelli 等,2006 年; Hinchliff 等,2015 年; Hug 等,2016 年)。所有这些都只有因为有了分子序列数据。

1.2.3 系统发生学的数学化和基本系统发生学方法的引入

分子数据的引入在系统发生学中具有重要意义。除了产生大量数据和分子数据在其他数据稀缺的情况下提供证据的方式之外,这种新类型的数据在推动系统发生学的数学化方面也具有重要意义。分子数据适合进行数学和统计分析,部分原因是(a)分子数据的编码容易;(b)分子进化可以被数学建模,并随后纳入统计方法;(c)数学和统计工具有助于分析所考虑的大量分子数据。因此,尽管分子革命和系统发生学的数学化不一定要同时进行,但它们同时进行并不令人意外。

许多作者讨论了数学思维和计算工具在系统发生学中的兴起,特别是与数值分类学和表型分类学有关(例如,Hagen 2001;Sterner&Lidgard 2014, 2018)。在这里,我们重点关注用于推断系统发生树的统计方法的兴起,稍后(§2)我们将讨论关于使用这些方法的哲学辩论。关于系统发生方法的良好和更全面的教科书介绍包括 Felsenstein(2004),Lemey 等人(2009)和 Baum&Smith(2013)。Yang 和 Rannala(2012)在分子系统发生学的背景下提供了有用的最新综述。

吸纳分子数据既鼓励又促进了数学工具的采用。我们在分子钟的讨论中(§1.2.2)对此有所了解,分子钟利用分子进化的估计速率来估计分歧时间。大约在同一时间,安东尼·爱德华兹(Anthony Edwards)和卢卡·卡瓦利-斯福尔扎(Luca Cavalli-Sforza)-都是 R.A.费舍尔(R.A. Fisher)的学生-开始将系统发生推断视为统计问题。在最初独立解决这个问题后,他们合作撰写了可能是首批以统计框架呈现系统发生推断的论文(如 Felsenstein 2001, 2004 所述);爱德华兹对这项工作的回忆可以在爱德华兹(1996)中找到。

在最早用于推断系统发生的算法方法中,有一类被称为“距离”方法。“距离”可以代表我们用于构建树的任何字符编码方案,无论是分子的还是形态的,例如,两个 DNA 序列样本之间的核苷酸差异的数量。距离方法使用这些成对距离来推断系统发生。

最早开发的距离方法在统计上是最有理据的,即卡瓦利-斯福尔扎和爱德华兹(1967)的最小二乘法。在这里,每个拓扑结构都有一组“最佳拟合”的分支长度,拟合程度通过将预期距离与每对分类单元之间的实际距离的差的平方和来衡量。最佳树拓扑是那些最佳拟合分支长度比其他任何树的最佳拟合分支长度更好的树。

另一类方法被称为最简法。在这里,我们只需要衡量一个字符状态转变为另一个字符状态所需的步骤数。请记住,不同的树假设会生成当前字符分布的不同解释。最简法的基本思想是,用最少的进化变化数来解释这些字符分布的树假设应该被优先选择。

第一个最简算法发表于 Camin 和 Sokal(1965),此后出现了许多最简的变体。例如,人们可能希望相对于其他变化加权某些特定类型的变化,甚至完全禁止某些类型的变化(如逆转)。关于这些方法的调查以及执行它们的不同算法的集合可以在 Felsenstein(2004)中找到。最简法是分类学派系的选择方法,这也是为什么在上面的“系统发生学之战”(§1.2.1)中描绘的历史与此处描绘的数学化历史交织在一起的原因之一。关于最简法作为推理方法的优越性的哲学论证将在第 2.3 节中讨论。

如果我们将系统发生学推理视为更一般的统计推理的一个实例,那么可能会想到似然和贝叶斯方法作为展示更一般的统计范式的方法。两者都需要计算概率,因此需要进化变化模型,即对进化过程的描述以及对字符状态可能变化(例如从一个核苷酸到另一个核苷酸)的概率分配。让我们简要地了解一下这意味着什么,因为如何以及是否将进化模型纳入系统发生学推理一直是一个重要的辩论话题。

如果数据是来自不同终端分类群的观察到的核苷酸序列,那么我们要计算的是这些观察到的核苷酸序列在竞争的系统发生假设的末端上出现的概率。计算这个概率的最简单方法是使用朱克斯-坎特模型(Jukes & Cantor 1969)。该模型假设四种核苷酸的频率相等,并且任何一个核苷酸变为另一个核苷酸的概率是均匀的。(这些假设通常是不成立的,但是在进化模型中反映这一点会引入额外的参数,增加计算时间——这是 1969 年一种宝贵且有限的资源。)朱克斯-坎特模型提供了一个进化模型,可以计算任何给定序列可能从另一个更原始的序列进化而来的相关概率。不同的树拓扑结构将产生不同的概率,即观察到的序列从假设的祖先状态进化而来的概率。这个条件概率 P(Data|Tree)被称为树的似然度。

尽管朱克斯-坎特模型仍在使用,但更复杂的进化模型也可用,例如 K80 模型(Kimura 1980)、HKY85 模型(Hasegawa, Kishino, & Yano 1985)和 Tamura-Nei 模型(Tamura & Nei 1993)。这些模型引入了更多的参数,例如关于核苷酸等频率和/或改变核苷酸状态的均匀概率的假设可以放松甚至定制;模型还可以包含分子钟假设。

这些参数丰富的模型反映了对分子进化的更好理解(例如,核苷酸之间的转换和转位 [5] 速率很少相等),以及成本降低和计算能力不断增强的组合,使得更多参数丰富的分析成为可能。可用的模型数量众多,这本身就引发了一个有趣的统计问题,即模型选择问题,即我们在系统发生学工具中使用哪种进化模型?有关这个问题的讨论,请参见(Posada&Crandall 1998; Sullivan&Joyce 2005; Posada 2008)。

一旦我们选择了一个模型或一组模型来进行工作,我们现在可以计算在这些附加参数(θ)条件下的概率。这个似然可以形式化地表示为:

L(树,θ|数据)=P(数据|树,θ)

作为提醒,给定一组数据的假设的可能性仅等于给定该假设的数据的条件概率。在这些基于模型的系统发生学方法中,数据在特定的系统发生树假设和规定的参数的条件下。

在模型中使用不同的参数值将导致树的不同可能性。最大似然估计是树假设以及最大化该似然性的拟合参数。Felsenstein(1981)提供了第一个计算可行的计算似然性的算法,并且随着现代计算能力与可用的大量序列数据的结合,似然性方法已成为系统发生学中最常用的方法。

就像似然性方法一样,贝叶斯方法在进行任何推断之前都需要一个进化模型。根本区别在于,似然性推断将模型的参数视为固定但未知值的干扰参数。在最大似然的频率方法中,这些参数被设置为最佳拟合值。贝叶斯推断将参数视为具有未知分布的随机变量,并使用概率作为不确定性的度量。树的概率是在特定模型假设下的条件概率 P(Tree|Data)。当我们将模型参数 θ 纳入考虑时,根据贝叶斯定理,我们有:

P(Tree,θ|Data)=P(Data|Tree,θ)∗P(Tree)P(Data).

有争议的是,这要求我们对可能的假设以及模型中的参数附加先验概率。Pickett 和 Randle(2005)声称无法以一致的方式分配先验概率。Velasco(2007)认为这种说法基于一个错误,尽管问题仍然很困难。他后来主张对树拓扑进行先验分配,但对分支长度或模型参数的先验问题保持开放(Velasco 2008b)。Alfaro 和 Holder(2006)试图解决其中一些问题。

Anthony Edwards(1970)是第一个讨论系统发生学中贝叶斯方法的人,但当时在计算上无法进行这些推断。在 1990 年代,三个独立的团体分别开发了实践中进行系统发生学贝叶斯推断的方法(Rannala&Yang 1996; Mau&Newton 1997; Yang&Rannala 1997; Li,Pearl,&Doss 2000)。每个团体都使用贝叶斯马尔可夫链蒙特卡洛(MCMC)算法来估计后验概率,其他团体进一步改进了这些方法(例如,Larget&Simon 1999; Ané,Larget,Baum,Smith,&Rokas 2007; Huelsenbeck,Ané,Larget,&Ronquist 2008)。 (请参阅 Archibald,Mort,&Crawford 2003 年关于贝叶斯系统发生学方法的早期非技术入门。)随着统计和计算的进一步改进,贝叶斯方法现在在文献中与似然方法一起相当常见。

2. 系统发生学与哲学

第 1 节作为对系统发生学历史和问题的介绍。在本节中,我们将探讨系统发生学与哲学的交织关系,特别是我们将研究一些具有明显哲学特色的系统发生学基础性辩论,并指出系统发生学研究可以阐明的更传统的哲学问题。

从本质上讲,系统发生学推断是关于评估竞争假设的。在一个重要的意义上,系统发生学家面临的是科学哲学家所认定的理论被证据所不确定的问题。多个竞争的系统发生树可以解释相同的数据,但以冲突的方式;系统发生学家的任务是确定哪个假设最好地解释这些数据。将问题分为两个部分将是有用的:

  1. 确定证据是什么;和

  2. 构建一个系统发生树来解释我们所拥有的证据。

在系统发生学推断的情况下,我们处于一个在哲学上有趣且令人困惑的境地,似乎这两个问题无法真正分开。

2.1 对齐和字符编码

哪种系统发生分析方法是最合理的这个问题显然很重要,但是它忽略了系统发生分析中一个重要的步骤——构建一个字符数据矩阵。Mishler(2005)认为这是最重要的一步!根据 Winther(2009)的观点,我们可以将导致数据矩阵构建的字符分析与将数据作为输入并产生系统发生树的系统发生分析分开。字符分析的第一阶段在生物学中已经广泛讨论过(尽管肯定没有第二阶段讨论得广泛)。除了关于同源性的大量文献外,关于字符的有用的工作集还包括 Wagner(2000)和 Scotland&Pennington(2000)编辑的集合。

字符分析包括识别我们正在观察的生物的字符,特别是识别一个生物中的字符与另一个生物中的字符相同的情况。这是同源性的问题。一个不同但相关的问题是分配字符状态。例如,一只熊可能有黑色的毛,而另一只熊有白色的毛。在这里,“毛”是字符,但在这两个生物中,它处于不同的状态(毛的颜色)。虽然通常将字符和字符状态分开处理,但这两者在本质上是不同的问题还是同一个问题的不同方面,这是一个有争议的问题(Stevens 2000; Freudenstein 2005; Sereno 2005)。

识别和编码字符当然是一个生物学问题,但也是一个哲学问题。我们根据什么基础来判断一个字符是否同源于另一个字符?关于这个问题的辩论可以追溯到当代生物学的起源,例如,理查德·欧文在达尔文之前的时期提出的同源概念对恩斯特·黑克尔在达尔文进化理论背景下发展同源解释的工作产生了影响。在二十世纪中叶,表型学家们认为字符的识别必须是“无理论”的,并主张使用相似性作为识别同源的指南(Sokal&Sneath 1963; Sneath&Sokal 1973)。试图以这种方式使用相似性存在着众所周知的哲学和生物学问题(例如,Goodman 1972),其中许多问题是在系统分类学战争期间对严格表型学的反对意见中提出的(例如,Mayr 1965b; Neff 1986; Rieppel&Kearney 2002,但请参见 Lewens 2012,以了解当代背景下对表型学的最新辩护)。

在系统发生学的背景下,同源性被视为从共同祖先经过改变后的结果。在这个背景下,相似性和一致性是共享进化历史的表达。同时,同源性也被视为我们可以推断系统发生假设的假设(随后,测试和解释我们的同源性假设)。显然,即使在当代系统发生学的背景下,关于如何确定特征和识别同源性的问题仍然存在。Richards(2002 年,2003 年)担心由于没有确定特征的算法,我们依赖于非法的、非科学的因素,从而使特征识别和系统发生分析最终成为主观的。Rieppel 和 Kearney(2007 年)以及 Winther(2009 年)回应说,由于依赖于各种因果标准,特征分析可以被认为是客观的;Kendig(2016 年)采取了稍微不同的策略,拒绝了我们需要发展“同源性”的分析定义的想法,而是将生物实践作为确定特征的指南。

虽然特征分析和系统发生分析在逻辑上是独立的任务,但理论上它们应该相互交织在一起。给定的系统发生树可以使同源性的评估更或者更不可信。避免这个问题的一个提议是引入“主要”同源性(基于结构特征的初始特征识别)和“次要”同源性(由于共同祖先而产生的相似性),这些通过系统发生分析推断出来(Pinna 1991;参见 Roffe 2020 年对这一区别的最新哲学处理)。另一方面,Rieppel 和 Kearney(2002 年)认为,特征假设需要独立可验证,而系统发生分析可以清楚地提供特征编码错误的证据,即使这不是预期的目标。

分子数据对于个体化特征和编码到矩阵中提出了一系列不同的挑战,DNA 序列数据很好地说明了这一点。只有四种碱基核苷酸,编码很容易(§1.2.3),现代实验室技术提供了高度可靠的 DNA 碱基序列。但是在这里,问题是如何对齐。我们如何知道一段核苷酸序列应该对应于其他分类单元中的类似段落?我们可以考虑染色体位置,甚至功能相似性,尽管每个问题都引发了其他问题,即我们如何决定应该将什么视为同源特征(甚至是偶然的)跨分类单元。随着我们考虑基因复制/丢失或重组等历史过程如何增加这些问题的复杂性,这变得更加复杂。这就是位置同源的问题。与形态特征编码一样,分子对齐与系统发生分析紧密相连,并提出了各种联合推理方法(Redelings&Suchard 2005; Wheeler 等,2006)。

2.2 计算限制和大数据

考虑到我们上面关于特征分析和系统发生分析相互关联的内容,我们现在将继续进行第二部分,即数据分析。在这个阶段,计算限制变得非常重要。即使我们只关心推断系统发生的拓扑结构,可能的树的数量相对于我们在树上包含的末端分支的数量呈指数增长。计算可能的树拓扑的公式相对简单(Felsenstein 2004):

(2n−3)!2n−2(n−2)!

其中 n 是分类单元的数量。总结起来,即使是终端分支的微小扩展也会导致可能拓扑的数量呈指数增长。例如,对于一个由 4 个物种组成的群体,可能的系统发生树有 15 个,对于 10 个物种有超过 3400 万个,对于 20 个物种有 8×1021 个。[6]

这意味着对所有可能的假设进行详尽评估很快变得几乎不可能,即使我们的计算能力随着增加的计算能力而增长。找到最简洁的树、最大似然树,甚至进行多序列比对都是 NP 完全问题 [7](Graham & Foulds 1982; Wang & Jiang 1994; Chor & Tuller 2005)。贝叶斯推断同样具有计算上的难解性(Ronquist, Mark, & Huelsenbeck 2009)。

作为回应,研究人员已经开发了启发式搜索策略来探索可能的树空间。例如,在贝叶斯分析中,可能树的概率空间非常大,随机选择一棵树作为起点将非常低效。它几乎肯定无法提供后验概率分布的良好估计,因为有趣的区域只占该分布空间的一小部分(Ronquist 等人,2009 年)。一个常见的启发式方法是从最简法或距离法树开始。尽管这些方法通常比基于模型的方法表现更差,但它们的计算成本要低得多,并且可以快速生成一个最初合理的树,贝叶斯系统发生学家可以将其作为探索树概率空间的起点(例如,使用山爬坡算法,如马尔可夫链蒙特卡洛(MCMC)采样)。这些创新是计算系统发生学成为统计学和计算机科学中重要领域的原因之一。对于对科学家如何探索和使用所谓的“大数据”感兴趣的科学哲学家来说,研究系统发生学家如何开发、调整和使用启发式搜索策略将是有益的。

暂且不考虑计算和实际问题,我们面临一个看似直接的认识论问题——哪种方法在授权系统发生推断方面是最合理的?我们通过研究支持一种特定方法——最简法的论证来开始对这个问题的探讨。

2.3 最简法的理论依据

简约法是系统发生学家最早采用的方法之一。这通常被认为包括了亨尼希(1966 年)在他的重要著作《系统发生学》中提出的一种被称为“亨尼希推理”的系统发生分析过程(鲍姆和史密斯 2013 年)。和其他简约法一样,这种方法旨在通过引用最少数量的进化事件来解释同源性的分布,从而确定解释同源性分布的树形结构。

简约法技术变得更加复杂,随着更大的数据集的评估和更大的树形结构的构建,简约法方法的证明和适应也得到了进一步发展。早期,这在系统发生学战争的背景下进行,其中重视将方法辩护为合理的科学方法。因此,这些辩论往往涉及科学哲学,系统发生学家争论在推断历史的背景下什么样的科学方法被视为良好的科学方法。这有助于解释卡尔·波普尔的工作对其产生的影响。早期的简约法拥护者被波普尔的证伪主义科学方法所吸引,因为它提供了科学活动的划界标准,并且批判了逻辑实证主义方法。证伪主义的理论依据被用来批评数值分类学家,认为他们依赖有缺陷的假设演绎方法进行验证。

Wiley(1975)提供了一个以伪证主义为基础的简约性辩护的典型例子,该例子证明了其深远的影响力,例如,Eldredge&Cracraft(1980)在他们的影响力教科书中采用了 Wiley 的核心理由,Farris(1983)在他对简约性的有影响力的辩护中也采用了这一理由。根据 Wiley 的解释,每个分类学特征都被视为同源性,并独立于其他特征进行考虑。对于每个同源性,生成一个树的假设,该假设需要最少的进化变化来解释跨分类群的特征分布模式。这些是同源性的假设,在伪证主义的解释中,这些假设是相互可测试的。也就是说,为每个特征生成的树假设构成了对其他每个特征假设的测试;被证伪的同源性假设被视为同源异形的特设假设。最大简约树是生成最少同源性假设的拓扑结构,并被视为最有证据的树。添加新的特征或分类群构成了对这些假设的进一步测试,并产生了更多的潜在证伪者。这样,简约性同时是一种树构建和评估的方式(Haber 2009);Wiley(1975),Eldredge 和 Cracraft(1980)以及 Farris(1983)将其描述为关于系统发生推断的推理的逻辑基础,并引用了伪证主义的哲学理论。

无论这是否代表了波普尔的证伪主义的忠实解释,或者证伪主义是否代表了科学推理的最佳(甚至是可取的)模式,这已经成为哲学家们讨论的问题(Hull 1983, 1999; Sober 1988b),尽管在某种程度上,这并不重要。(对于一个具有哲学思维的生物学家对波普尔在系统发生学中的作用的调查,请参见 Gaffney 1979,Rieppel 2008 或 Santis 2020。)无论如何,用证伪主义的术语来描述简约性提供了一个重要的理由,至今仍然有共鸣。最近在系统发生学推理中对波普尔的引用更多地关注简约性还是基于模型的方法,如最大似然(§1.2.3)与证伪主义更加契合(例如,Siddall & Kluge 1997; de Queiroz & Poe 2001, 2003; Kluge 2001),以及概率和统计推理是否与研究特定历史事件相关(Siddall & Kluge 1997; Haber 2005)。(有关历史科学的一般哲学,请参见 Turner 2007; Cleland 2011; Currie 2018, 2019。)在第 2.4 节中,我们将描述 Felsenstein(1978)发现简约性容易出现系统性错误,这对于这种基本的证伪主义理据构成了严峻的挑战。

简约法可以在没有伪证主义的情况下进行辩护,并且还提供了其他的理由,这些理由与该方法的名字相吻合,即简约推理原则或奥卡姆剃刀的运用(例如,Kluge 2005)。这相当于(i)将简约(原则)作为我们评估竞争的系统发生假设的标准,并且(ii)认为简约(方法)是实现这一目标的最佳方式,通过寻找最小化解释角色分布所需的进化新颖性数量的树。这也可以被表述为识别最小化同源性的特设假设数量的树。尽管这种对简单性的诉求可能与伪证主义的辩护相结合(如上所述),但它们在逻辑上是独立的辩护。在科学中,对简约原则的直观吸引力是肯定的,奥卡姆剃刀之所以具有影响力是有充分的理由的。但是,通过对简单性的诉求来证明简约方法并不那么简单。评估哪些系统发生方法是奥卡姆剃刀所证明的取决于计算的是什么(Haber 2009)。Sober(1988b,2015 等)对简单性和简约原则在系统发生学中的作用提供了有用的讨论。

已经提出了其他哲学上的简约辩护。Fitzhugh(2008 等)认为,系统发生推理问题最好理解为一种演绎问题,并且将其视为统计(或归纳)推理问题等同于范畴错误。Sober(1988b)同意系统发生学涉及演绎推理,尽管认为这证明了使用统计方法(尤其是似然性)。

值得回顾的是,为什么模式分类学家特别反对基于模型的系统发生学重建方法。模式分类学家通常拒绝包含关于进化过程的假设的系统发生学重建方法(§1.2.1),例如,Brower(2019: 717)将模式分类学与过程分类学(或传统分类学或系统发生学)区分开的一个核心承诺是拒绝“从分类单元之间的关系模式推断中引入先验进化背景假设”。因此,模式分类学家强烈反对似然性和其他基于模型的系统发生学方法,因为这些方法明确地包含了进化模型(§1.2.3 和 §2.4)。这通常与对统计方法的普遍拒绝和对简约性的承诺相结合,例如,“从一开始,统计推断系统发生学方法就是错误的,因为它基于这样一个观念:要研究系统发生学,首先必须详细了解进化的过程。这不可能是科学知识获取的方式”(Farris 1983: 17)。

作为回应,统计系统发生学家认为最简法隐含地包含了进化模型,而基于模型的方法则将其明确化,并因此可以受到质疑(de Queiroz&Poe 2001, 2003; Swofford&Sullivan 2009)。这个分歧在模式分类学家看待最简法的其他支持者时进一步体现出来,正如 Brower(2019: 717)引用 Kluge&Farris(1999)所指出的:“尽管在关键背景知识方面存在意见分歧,但在证据、分析或结果方面,模式分类学家和过程分类学家之间没有实际区别。从方法论的角度来看,所有的分类学家都仅仅通过共同衍征来进行分类。”也就是说,模式分类学家和过程分类学家之间的区别在于对方法论和推理的解释上;在与统计系统发生学家的更大争论中,他们是联盟关系。然而,请注意,“分类学家”这个术语的含义正在被引入越来越细微的区别(更不用说“统计系统发生学家”了,他们通常与基于模型的方法相关联)。这反映了这个术语如何变得有争议,并与各种竞争性承诺相关联。在第 2.3.1 节中,值得稍作停留来梳理一下这个问题。

2.3.1 谁拥有“分类学家”这个术语?

在 1.2.1 节中,我们使用“系统发生学”一词来指代一种分类学派别,认为更高级的分类群必须是单系群,与表型学/数值分类学和进化分类学的竞争派别形成对比。在这个历史背景下,“系统发生学”有时与“系统发生学”互换使用。我们警告不要这样做,尤其是在讨论更现代的实践时。虽然很难确定这些术语开始具有不同内涵的确切日期,但 Felsenstein(1978)和 Beatty(1982)可以作为这些术语开始分化并具有更细微含义的标志。这尤其适用于术语“系统发生学家”,这个术语已经成为一个备受争议的术语,并且被大型系统发生学领域内的子群体所声称。

一个恰当的例子是期刊《系统发生学》,其编辑在 2016 年发表了一篇具有争议的社论,声明提交的稿件应反映该期刊及其赞助的专业学会(Willi Hennig 学会)的哲学承诺(编辑们,2016)。他们写道,

该期刊的认识论范式是简约性。有强有力的哲学论证支持简约性与其他系统发生分析方法(例如,Farris,1983)的对比。

编辑继续规定:“提交给本期刊的系统发生学数据集应使用最简法进行分析”。如果通过其他方法生成的树显示不同结果,作者可以选择包含这些拓扑结构,但前提是作者“准备从哲学的角度进行辩护”(引自编辑 2016 年:1)。在这里,编辑们利用《系统发生学》杂志的认可来确立“系统发生学”应该如何被理解,以及自称为“系统发生学家”意味着对系统发生学推理的理论和哲学承诺的特定意义,即对最简法的专属承诺,甚至完全拒绝基于模型的统计方法。

Aleta Quinn(2017)认为,“cladist”这个术语仍然被多个重叠(但重要地不同)的派别所声称。她直面这种模糊性,提供了一个有用的“外语词典”,解释了“cladist”在系统发生学中的用法。Quinn 认为这个术语需要澄清,从文献中提取了七种不同的意义。这包括主张遵循特定系统发生方法(例如,最简法,如 Cladistics 编辑部的情况)或哲学理论(尤其是波普尔的伪证主义版本)的系统发生学家,尽管“cladist”的各种不同意义的区分远远超出了这个范围。作为对 Quinn 的回应,Williams 和 Ebach(2018)提出了第八种(也是他们首选的)cladist 的意义,而 Brower(2018a)则对 Quinn 的文章以及其他澄清模式系统发生的哲学基础和承诺的尝试提供了专注的评论。例如,模式系统发生的一个区别性特征是拒绝对系统发生方法中的进化理论进行先验假设。一些哲学家和生物学家(例如 Pearson 2010)将其解释为理论中立性或最小性的主张。Brower(2019)对这种解释提出了质疑,认为理论中立性的主张是特定于进化假设,而不是更一般的主张。

主要的要点是哲学家在使用“cladist”这个术语时应该小心。虽然围绕这个术语有很多有趣的哲学话题需要探讨,但必须承认它已经变得模糊不清。这个术语有太多的意义,不能不清楚地指定具体引用的意义而使用。我们鼓励写关于系统发生学的哲学家们效仿系统学家的做法,避免将“cladist”、“cladistics”和其他相关词语作为“系统发生学”的同义词使用。相反,哲学家们应该保留使用这些术语,并仔细指定这些术语所指的系统发生学家(或他们的工作)的子集。

2.4 长枝吸引和基于模型的方法

在第 2.3 节中,我们提到了最简洁性的证伪主义辩护受到了一种严重挑战,即在某些条件下会产生系统性错误。约瑟夫·费尔森斯坦(Joseph Felsenstein)在 1978 年的论文《最简洁性或兼容性方法将会产生误导的情况》中首次描述了被称为“长枝吸引”的现象。虽然这并不是简洁性和基于模型的系统发生学方法之间辩论的开始,但它代表了关于系统发生学推理的重要转折点。

长枝吸引是指某些方法倾向于将长枝(即具有更多进化变化的分支)优先分组在一起,而不考虑它们的实际历史。旨在确定需要最少进化变化来解释数据的树的方法,会更倾向于解释共同祖先而非趋同进化,即使在趋同进化发生的情况下也是如此。例如,想象一下具有快速进化的 DNA 序列的两个分支。仅仅是偶然的机会,这两个分支可能在同一位点上有相同的突变,最简原则将其视为这些分支共享近期历史的证据。在许多情况下,这些相似突变发生的机会非常高,以至于我们预计这些趋同情况的数量将压倒真正同源的信号。在这些情况下,最简原则方法在统计上是不一致的。当随着添加更多数据,方法能够保证识别出正确解决方案时,它被认为是统计上一致的。不能做到这一点的方法是统计上不一致的。在这种情况下,最简原则不仅不一致,而且随着添加更多数据,该方法可靠地返回对特定的错误结果的增加支持,因此是“积极误导的”。

长枝吸引不仅仅是一个操作问题,它还挑战了简约主义的伪证基础(Haber 2009)。回想一下,在 Wiley(1975)的有影响力的解释中,系统发生树在发现或添加更多数据(特征)时可能被伪证(§2.3)。如果有一个更简约的树可以解释这些数据,那么先前最简约的树就被视为伪证(或包含更多的同源假设)。Felsenstein 的发现是,在某些情况下,随着更多的特征被包括在简约分析中,简约主义将倾向于拒绝报告实际系统发生关系的假设,同时证实更简约但不正确的系统发生假设。这破坏了简约分析的逻辑理据。

Felsenstein(1978)是一篇影响深远的论文,产生了许多研究项目。这是一篇主要关注不同方法在不同生物条件下的表现的理论和抽象的论文。一个自然的问题是这些条件在实际研究的系统中有多普遍。当然,这是一个经验性问题,可以作为这样的研究来进行,尽管对如何解释经验案例的争议一直存在争议(Huelsenbeck 1997; Whiting 1998; Siddall & Whiting 1999; Yang & Rannala 2012)。

在 20 世纪 90 年代,实验系统发生学家使用经验和模拟研究更严格地经验性地测试竞争系统发生方法的性能。这包括测试竞争方法来重建已知的体内系统发生(细菌噬菌体)的系统发生树(经过精心构建、跟踪和归档多代)和更复杂的模拟系统发生树(利用实验室台上日益增长的处理能力)(Hillis,Bull,White,Badgett 和 Molineux 1992; Hillis 和 Bull 1993; Hillis,Huelsenbeck 和 Cunningham 1994)。这些研究在很大程度上证实了距离和最简原则方法容易受到长枝吸引的影响,而基于模型的统计方法(如似然性)则避免了这些认识陷阱。

2.5 系统发生学与统计学哲学

费尔森斯坦(1978)的论文之所以具有影响力,是因为他坚持将统计一致性作为评估竞争统计方法的标准。对于费尔森斯坦和许多其他系统发生学家来说,证明最简原则在统计上不一致是一个致命的打击。但并非所有人都同意。事实上,一些作者认为这几乎是一个无关紧要的考虑。现在,我们转向这场关于一致性重要性的辩论,作为哲学在系统发生理论中发挥核心作用的一个例子。

像爱德华兹和卡瓦利-斯福尔扎之前的人一样,费尔森斯坦(1978 年)将系统发生学的推理视为统计学问题。杰尔齐·内曼(1971 年)指出,分子系统发生学这一新兴领域是新颖且有趣的统计问题的来源。在过去的五十年里,这个领域的重要性不断扩大,以至于系统发生学推理现在已经成为统计学中的核心问题之一。同样,关于推断系统发生树的算法的研究在计算机科学中也非常重要。

如果将系统发生学推理视为统计推理问题,可能会认为理想统计方法的一般论证也适用于这种情况。例如,最大似然法或贝叶斯方法可以在这些基础上进行辩护。从这个角度来看,简约法是一种统计方法,因此我们可以研究其统计特性(费尔森斯坦 1983 年,2004 年)。安东尼·爱德华兹(1996 年)声称,他最初使用“最小进化”原则是作为最大似然解的近似,他认为这是基于一般的统计原则,即简约法可以作为一种统计方法进行评估。从那时起,许多作者在一系列案例中显示了简约法和似然之间的确切联系(费尔森斯坦 1973 年;索伯 1985 年;塔夫利和斯蒂尔 1997 年;斯蒂尔和彭尼 2000 年)。

在费尔森斯坦和埃利奥特·索伯关于简约法和似然的交流中,费尔森斯坦辩护说一致性“是一种基本属性”,特别是它比似然更基本(费尔森斯坦和索伯 1986 年)。他重申了他早期的观点,即简约法可以作为一种统计方法进行评估。

最大似然方法本身并不可取,但是因为它们具有一致性和渐近效率等可取的统计特性。(Felsenstein 1978: 408)

凭借这种态度,Felsenstein 只是在遵循统计学中一个古老而受尊敬的立场。例如,Fisher (1956: 141) 将一致性称为“估计的基本准则”,并表示不一致的估计量是“不体面使用的”(Fisher 1935 [1950: 11]). Neyman (1952: 188) 同意这一观点。

与 Felsenstein 的立场相反,Sober 声称

一个方法并不是通过展示它在一个极特殊的情况下工作得很好来“证明”它的合理性;也不是通过展示它在另一个特殊情况下搞砸了事情来“反驳”它的合理性。(Sober 1988b: 76)

他提出反对一致性的一个特定论据是它可能与似然性相冲突。Sober(1988a)举了一个例子,说明似然推断可能不一致。但是 Sober 遵循 Anthony Edwards(1972)的观点,即似然性是一个“原始假设”,不需要基于重复抽样的证明。如果一个似然推断可能不具备统计一致性但仍然是合理的,那么显然一致性不能成为合理推断的必要标准。

一些作者表达了对一致性的另一种担忧,他们指出我们可能无法确定使用哪种一致的方法。正如《系统发生学》的编辑们在为使用最简法辩护的社论中所说的那样

我们不认为统计不一致性的假设问题构成了拒绝简约性的哲学论证。所有的系统发生学方法,包括简约性,都可能对给定的数据集产生不一致或其他不准确的结果。(编辑们 2016 年)

众所周知,最大似然估计在各种条件下都被证明是一致的(Wald 1949),但有几位作者认为这些条件不适用于估计树拓扑,因为树拓扑是离散的而不是连续的参数(Yang 1996;Siddall 1998;Farris 1999)。然而,Swofford 等人(2001 年)认为 Wald 的条件确实适用,而 Yang(1994 年)、Chang(1996 年)和 Rogers(2001 年)证明了最大似然在不同的字符演化假设下是一致的。但无论哪种假设足以使似然一致,肯定需要一些关于进化过程的假设。但是,当我们使用的模型不是正确的模型时会发生什么?当这与观点相结合时,即正确的模型应该是真实的,而我们可能永远无法知道我们的模型是真实的,甚至可能根本没有真实模型,正如一些模式分类学家所声称的那样(例如,Brower 2016 年,2018b 年)。正如 Felsenstein(2004 年:272)所说,

如果我们在分析中使用了正确的模型,似然通常是一致的。当我们使用错误的模型时,几乎没有保证。

2.6 系统发生学与哲学

统发生学是哲学论证在众多领域中对系统发生学工作的贡献之一。虽然系统发生学是生物学的一个子领域(可以说也是统计学和计算机科学的子领域),但系统发生推断是哲学家和生物学家共同研究的一个主题,通常存在重叠的方式。事实上,科学和哲学之间的边界在这里是模糊的,类似于十七和十八世纪的一些自然哲学。这意味着系统发生推断是哲学家探索的一个极其丰富的领域。生物学家正在积极讨论系统发生方法论的概念基础、证明、目标、解释模型等。在这些辩论中,哲学家经常扮演着核心角色(例如,Hull 1988; Sober 1988b)。这也意味着许多生物学家渴望以有意义且深入的方式与哲学家进行交流(例如,Sterner & Lidgard 2018; Havstad & Smith 2019)。

一般来说,系统发生推断最好归类为认识论问题。毕竟,这是一个推断问题,尽管是专门针对我们如何证明或基于我们对系统发生的信念的问题。一个对过去如何获得知识感到好奇的认识论者几乎无法找到比系统发生学更好的选择(Sober 1988b)。而且,正如我们所见,统计学和归纳推理的哲学在这里起着重要作用。但是,超越认识论,任何对科学工作方式感兴趣的哲学家都可以从系统发生学中学到东西。在这里,我们将研究形而上学和一般科学哲学的案例。

2.6.1 系统发生学作为科学的一般哲学

理解生命的进化历史的细节不仅仅是一个独立的问题(尽管这个问题本身很有趣)。生命的历史和地球的历史是紧密相连的,因此在一个领域的知识有助于我们在另一个领域进行推理。了解化石嵌入岩石中的类型以及系统发生树可以帮助科学家确定岩石的年代,就像通过独立手段确定岩石的年代有助于确定化石的年代和估计系统发生的方面一样(Grantham 2004)。而且,就像地球的物理和化学塑造了生物一样,生物也塑造了地球。光合作用的蓝细菌在大约 24 亿年前部分地负责了大氧化事件,氧气在地球大气中的积累从根本上改变了地球的化学和物理性质。

这种与其他科学的纠缠使得系统发生学成为科学哲学家的丰富资源。它提供了一个模型,更好地理解当专业领域相互通知和依赖时科学是如何工作的。哲学家可以借鉴系统发生学来更好地理解科学复合体的社会结构(Longino 1990, 2019)(以及依赖其他领域的复杂科学),或者描述什么构成了所谓的“服务科学”的良好科学活动,即其产品主要由其他科学家作为最终用户使用的科学。

用一种方式来构建系统发生学之争的辩论,就是科学家们在争论什么构成了良好科学的问题。在这里,我们有机会强调这场辩论中可能被低估的一个方面。也就是说,良好的科学是否需要理论?虽然许多哲学家研究的传统科学显然是由理论驱动的(或者至少与理论紧密相关),但对于其他科学来说,情况并非总是如此。将牛顿力学或种群遗传学与干细胞研究(Fagan 2013)或发育生物学(Love 2014)进行对比,就不清楚是否存在任何潜在的理论结构。

在系统发生学的情况下,如何明确表达任何这些竞争观点的精确理论尚不清楚。它可能更准确地被描述为竞争的承诺集合,其中一些可能类似于(或是)科学理论(取决于“科学理论”的描述),而其他承诺可能更好地用科学实践或推理方式来描述(Giere 1979 [1997]; Griesemer 2000)。

系统发生学的理论结构是否存在仍然是一个悬而未决的辩论。然而,尽管研究、学习和发展系统发生学方法的科学家在这些辩论中有很多利益,但大多数使用这些方法的最终用户对这些竞争方法持相当中立的态度(在许多情况下,对支持这些方法的潜在理论也是如此)。在实践中,大多数使用系统发生学方法的生物学家通常会使用很多种方法。科学哲学家可以考虑这是否等同于方法论多元主义或理论中立,以及在竞争方法学下产生的树是否构成了可靠的结果(例如,在识别相同的单系群或同源性时)。

系统发生学的推理对更广泛的哲学家也应该具有兴趣,因为它可以作为其他哲学问题的案例研究。系统发生学的最近历史为哲学家提供了科学家如何从一组承诺转变为另一组承诺的测试案例(Hull 1988),归纳逻辑和概率在解释和模型构建中的作用(Sober 1988a,b; Haber 2005),以及什么构成了一个良好的科学解释(Felsenstein&Sober 1986; Sober 2004; Haber 2009)。O'Hara(1988)和 Ereshefsky(2012)通过系统发生学来研究叙事或历史解释在科学中的功能。哲学家使用系统发生学评估哲学论文的其他例子包括 Velasco(2012)和 Vassend(2020)使用系统发生学来研究建模和理想化的实践,以及 Haber(2005)研究系统发生学推理告诉我们如何使用概率推理来评估单个历史事件。 Aleta Quinn 提出了一个关于当代系统分类学争议的分类法,她认为这些争议源于对总体证据原则应用的争议(2019),并使用系统发生学的案例来研究科学中最佳解释的推理支持者所面临的一个众所周知的反对意见(2016),即“最好的糟糕选择论证”(van Fraassen 1989)或“未充分考虑的反对意见”(Lipton 2004)。最后,Andreasen(1998,2000)通过系统发生学来回答生物种族是否真实的问题。

2.6.2 系统发生学作为一个形而上学问题

虽然我们所描述的系统发生学在很大程度上是一个认识论的事业,但整个生物系统分类学充满了重要且有争议的形而上学问题,这些问题似乎在很大程度上与推理问题无关。无论你将分类单元视为传统的自然种类(Devitt 2008),稳态属性群(Boyd 1999;Wilson,Barker 和 Brigandt 2007),个体(Ghiselin 1966, 1974;Hull 1976, 1978;Sober 1980;Ereshefsky 1991;Haber 2016a)还是其他什么(Slater 2013, 2014),这通常对于关于系统发生推理的辩论几乎没有影响,尤其是在哲学文献中进行的辩论。

然而,早期的系统发生学家确实看到了他们观点的形而上学含义,并且这影响了他们如何解决系统发生重建问题。简单来说,如果你认为分类单元是历史实体,并且系统发生的目标是重建它们的历史,那么这个任务与如果你认为目标是寻找非历史的相似性或共享的本质特征(Hull 1970;Griffiths 1974)是非常不同的。尽管在广义上普遍采用了系统发生项目,但在系统发生学的某些领域,关于形而上学如何影响推理方法的辩论仍在继续。

形而上学上的竞争观点是否影响系统发生推理?是的,尽管只是间接地和间接地,并且非常重要的是要注意不要混淆分类问题与重建系统发生的问题,即使它们有重叠之处。让我们简要地看一下前者,然后对它可能与系统发生推理间接和间接重叠的方式进行一些评论。

Ereshefsky(2001)认为,对系统发生学原则的承诺意味着对生物分类的实践和规范进行改革。具体而言,他建议放弃传统的林奈命名实践,转而采用系统发生学知识为基础的实践。这一观点源自最早的系统发生学文献,旨在围绕单系群的原则改革生物分类(例如,Hennig 1966;Griffiths 1976;Wiley 1981)。对于许多系统发生学家来说,这一目标至今仍在继续,最近主要围绕着 PhyloCode 的发展(参见其他互联网资源;de Queiroz & Gauthier 1990, 1992, 1994;Cantino & de Queiroz 2020)。尽管完全取代林奈分类法的结构性改革在广泛范围内难以获得推广和采纳,但分类学家在分类和系统学中普遍采用了单系群作为指导原则,即使在所谓的传统分类学中也是如此(尽管微生物系统学更为抵抗;参见 §3.1)。

当然,生物学家如何重建系统发生学并确定单系群是基于系统发生法典和其他系统发生分类的分类自由问题。这只是说,系统发生推断将在很大程度上独立于这些形而上学和分类问题之外进行,除非这些分类向生物学家提供了他们首先要重建历史的目标是什么的信息。Haber(2019)为这一挑战提供了一个框架,认为系统发生的单位是分歧和多样化的单位。Ereshefsky(2001)和其他系统发生分类的支持者提供了一种具体的方式来解释这些单位,Haber 将其描述为一个丰富的、普遍的研究项目,类似于生物哲学中的其他“单位”问题。就像我们如何解释选择单位可能会影响我们研究或推断进化过程的方式一样,我们如何确定分歧和多样化的单位将影响我们在系统发生学中进行推断的方式。(有关相关基础问题,请参见 de Queiroz 2007。)

Padian & Horner (2002)提供了一个粗粒度的例子,说明形而上学的承诺与系统发生学问题重叠,他们辩护将鸟类视为恐龙的唯一现存分支。在这种情况下,他们将“变形主义”思维与类型学思维进行了对比。在前者中,分类单元的身份与历史连续性相关,并与任何内在特征的表达无关。因此,古代兽脚类恐龙转变为现存的鸟类分支意味着鸟类是恐龙,而这应该在我们的系统发生重建中得到体现。相反,他们认为,类型学解释将把鸟类视为与恐龙不同,并冒着系统发生重建错误地描绘这些分类单元的历史关系的风险。此外,他们认为,变形主义和类型学方法将以不同方式对待鸟类和古代兽脚类的特征作为证据和数据;什么才算是推理相关的甚至本身就是问题。在这里,Padian 和 Horner 从系统发生学中确定了形而上学的承诺,以论证古生物学家应该如何重建进化历史,什么算作证据,以及哪些证据对于得出这些推理是重要的,即如何编码特征被视为理论承诺所带来的方法论争议。(有关进一步讨论,请参见 Haber 2016b 的其他互联网资源。)

3. 展望:新的挑战和机遇

我们开始注意到,系统发生学重建了进化历史,并且不同类型的实体都有进化历史,例如基因、生物体、种群和物种都有家系历史。假设我们正在尝试重建物种或更高分类单元的历史(事实上,“系统发生学”本身有时被定义为这样,例如 Wiley 1981;S. Edwards 2009)。标准方法,如最简原则、似然度和贝叶斯方法,都直接推断出性状的历史。那么这些性状的历史与物种的系统发生有什么联系呢?未明示的假设是这些性状的历史是相同的,并与物种的历史一致。我们在本条目中得出结论,这个未明示的假设经常被违反,我们考虑这对系统发生推断的理论和实践有什么影响。正如我们将看到的,审视这个未明示的假设迫使我们直接面对一个问题,即系统发生实际上代表了什么,因此“系统发生推断”甚至意味着什么。

为了便于进入这个主题,我们将系统发生树及其所代表的历史视为简单的二叉分支实体,即直接的分支和节点结构。然而,这是一种理想化,实际的系统发生历史通常比这更复杂。分支可以融合在一起,分支事件的复杂性超出了单向的瞬时节点所暗示的。

正如科学哲学家们所知,科学中的理想化既常见又具有重要目的(例如,Cartwright 1983;McMullin 1985;Wimsatt 2007;Weisberg 2007)。然而,停下来思考一下这些理想化和简化假设是否需要重新审视,是否妨碍了研究,或者产生了其他障碍,可能会带来一些成果。事实上,这正是最近在系统发生学中发生的情况。重新审视系统发生学中简化假设的效用既来自该领域外部(尤其是微生物学),也来自内部(因为系统发生学家开始意识到融入更多复杂性可能带来的好处)。这对于科学来说是一件好事,也是一件健康的事情。它给科学家和哲学家施加了压力,进一步阐明科学的核心承诺,并考虑如何解释新的挑战。挑战也可以促使科学适应和修订这些核心承诺,因为新的证据、理论和工具被发现或发展,或者重新审视底层的简化假设和理想化的效用。这反过来有助于科学哲学家理解科学如何推进。(Haber 2019 在系统发生学的背景下描述了这一点作为富有成效的干扰。)

重新审视理想化系统发生历史复杂性的效用为系统发生学家未来的发展带来了困难和新机遇(Haber 2012, 2019;Velasco 2012)。在这里,我们简要概述了放松这些假设所涉及的内容,以及当这些假设不再成立时我们所承认的复杂性的种类。在此之后,我们简要描述了这对系统发生学的核心承诺和项目的影响。

3.1 网状化与不一致性

在前面的章节中,我们将系统发生树视为直接分叉的模型,并经常参考图 1。分支代表祖先谱系,节点代表谱系分裂。然而,这种对系统发生学的看法也是高度理想化的,至少反映了三个简化假设:(1)谱系分裂但不融合;(2)一条谱系上的变化不会影响其他谱系;(3)分裂是单一、简单的事件。事实证明,这些假设都是错误的。

为了思考谱系的分裂或融合,我们首先必须回答一个问题,即谱系代表什么。在谱系树的情况下,尖端代表物种,自然的答案是谱系追踪物种的演化历程,节点代表物种分化事件。但是考虑到谱系分裂但不融合的假设,杂交可能是最明显的反例。毕竟,杂交相对较为常见,尤其是涉及性繁殖的有魅力的大型动物和植物的情况。

在杂交引起的物种分化的情况下,整个谱系可以融合。这种情况发生的频率目前存在争议,当然也取决于首先如何定义物种。但在植物中,这是一种普遍现象,也已知在动物中发生(Mallet 2007; Schumer, Rosenthal, & Andolfatto 2014)。

虽然大多数杂交事件并不导致新物种的产生,但很多时候会导致内渗——即从一个谱系引入遗传信息到另一个谱系。如果我们将这个过程建模为一个谱系连接到另一个谱系,就违反了系统发生学中谱系是严格分支树图的假设。但如果我们不直接连接这些谱系,就违反了系统发生学中的另一个背景假设,即沿着一个分支的变化不会影响其他分支。无论哪种情况,现在我们都面临着一种情况,即某些特征的分支历史与其他特征的历史或整个物种的历史不同。在遗传历史的情况下,这被称为谱系不一致。

虽然有性繁殖物种之间的杂交已经为我们关于谱系独立性的假设提供了很好的反例,但更大的挑战来自微生物学。更具体地说,在微生物基因组学中,我们发现高水平的水平(或横向)基因转移(HGT 或 LGT)。对于不熟悉微生物基因组学的读者来说,可以将其视为杂交的微生物类比,尽管存在重要的定性和定量差异。

从定性上讲,水平基因转移并不是一种繁殖方式,尽管它涉及微生物间基因组部分的转移。与繁殖不同,基因组的转移通常不是发生在父代和子代微生物之间,而是相邻的微生物之间。大致上,当微生物接触时,它们可以交换基因组的部分,这意味着这些基因组部分的历史可能与我们发现这些遗传单位的微生物有所不同。水平基因转移对微生物来说可能非常有利,基因组部分可以迅速在微生物群体中传播,尤其是如果它们携带有益特征的话。从定量上讲,微生物中的水平基因转移率非常高且普遍,尤其相对于哺乳动物物种中的杂交而言。

广泛的水平基因转移的结果是微生物基因经常具有不同的历史,基因组部分有时会从一个谱系流向非常远的相关谱系。微生物学家和生物哲学家已经开始探讨水平基因转移在微生物基因组学中是否完全削弱了系统发生学的实用性,以及这对生命之树隐喻的实用性产生了怎样的影响(例如,Martin 1999; Doolittle 1999; Velasco 2013,还可以参考《生物学与哲学》的专题问题 [O’Malley, Martin, & Dupré 2010])。

最终简化的假设将谱系分裂视为完全将一个谱系分成两个独立的新分支的单一事件,我们可以清晰地追踪。当我们思考物种形成的过程时,很明显物种形成和谱系分离通常不是瞬间发生的(de Queiroz 1998; Harrison 1998)。不太清楚的是这对系统发生学的影响。仔细思考谱系分裂和谱系内部结构迫使我们审视我们追踪的谱系的多层次组织的性质和关系(Haber 2012, 2019)。更包容的谱系包含较不包容的谱系作为其部分,反映了生物学中的分层组织特征-这是早期系统发生学家所重视的谱系特征,例如 Hennig 1966; Griffiths 1974)。例如,物种树在其分支中包含基因树(Maddison 1997)。

当个体基因历史与其他基因或其所属物种的系统发生树不一致时,我们就有了谱系不一致。我们已经看到了杂交和水平基因转移如何引起不一致,但随着系统发生学与种群遗传学的日益联系,不完全谱系分化成为了另一个重要的不一致来源。在一个种群中,两个基因的副本将在过去共享一个被称为共同祖先的点,这被称为它们的合并点。如果同一物种谱系中的两个基因谱系未能在该物种分支内合并(即,它们的合并点早于最近的物种分化或谱系分支),我们就有了所谓的不完全谱系分化(ILS)。在不完全谱系分化的情况下,有可能一个基因谱系首先与另一物种的基因谱系合并,从而导致谱系不一致。这产生了 Avise 和 Robinson(2008)所称的半等位基因,即其系统发生历史与更高级别的系统发生不一致的同源特征,这是由于不完全谱系分化。Maddison(1997)提供了一个非常易读的介绍,介绍了基因树和物种树之间的关系以及谱系不一致的问题,而 Degnan 和 Rosenberg(2009)则是对不完全谱系分化的生物学及其对系统发生分析的影响的稍微更高级的介绍。

总结一下,我们首先讨论了在 1990 年代之前通常进行的系统发生学分析。首先,推断出一些特征(例如基因)的历史。每个历史都是一个特定的分支树。现在假设这些历史与物种历史相同。正是这个假设使得最简法或最大似然等方法能够评估竞争的假设。尽管我们知道通常情况下这是一种理想化的假设,假设物种历史也是一个分支树,假设(1)谱系分裂但不融合,(2)信息不在谱系之间传递,(3)分裂是单一的、简单的事件。这些假设都是错误的。

3.2 对系统发生学分析的影响

杂交、水平基因转移、谱系不一致以及其他涉及生物谱系结构和过程的复杂性所产生的交错和谱系不一致,在系统发生学中,历史上常常被理想化的假设所掩盖。在许多情况下,将系统发生树视为基因谱系历史的理想化模型是有用且适当的研究问题。图 1 提供了一个很好的例子。这反映了相对于我们的研究问题的分辨率水平如何影响我们使用系统发生学工具的方式(O'Hara 1993)。

但是当这些理想化的假设受到批判性质询时会发生什么?首先,不同实体具有不同的、常常是不兼容的系谱历史,这就对系统发生的本质提出了质疑。一种思路是,系统发生应该直接追踪遗传历史,而不是物种形成的历史。正如 Maddison(1995: 285)所说,

物种系统发生的一个可能解释是它仅仅描绘了遗传信息传递的路径,没有其他更多的含义。

Baum 和 Shaw(1995)、Baum(2007)和 Velasco(2010、2019)代表了一系列致力于发展这种“一致性树”思想的论文。Baum(2009)将这种关于系统发生历史的思路纳入了关于物种和其他分类单元本质的辩论中。

哲学家们特别关注微生物基因组学中的网状结构,并且有充分的理由(O'Malley 等人 2010 年的一期专题是专门研究这个主题的,是一个有用的资源)。这些问题通常被视为对系统发生学方法本身的挑战,或者在其他情况下,是关于系统发生学工具如何应用于微生物基因组学的问题(Martin 1999; Doolittle 1999)。微生物系统中的水平基因转移的广泛存在也对物种和其他系统发生单位的概念和形而上学承诺提出了挑战(Franklin 2007)。

然而,今天系统发生学领域的大部分工作仍然以相同的目标进行,但生物学家们使用更好、更强大的工具将这些复杂性纳入他们的系统发生模型中。Haber(2019)对系统发生分析中的网状结构和谱系不一致性进行了哲学性的探讨,询问系统发生树的分支是否“过于稀疏”,以及是否掩盖了这些谱系内部结构中的相关细节。系统发生学家有很多充分的理由希望在他们的系统发生重建中包含网状结构。除此之外,这意味着将谱系不一致性视为可以被挖掘的数据,而不是需要被过滤掉的噪音(Haber 2012, 2019)。哲学家们开始更加关注网状结构和不一致性对系统发生分析的影响,不仅限于微生物基因组学领域。这些研究包括系统发生学家们如何解释和适应我们对网状结构和不一致性的理解(参见 Haber&Molter 2019 年专题专辑)。

种群生物学家是最早将从这些谱系的内部结构中提取关于谱系历史的信息的方法操作化的人,即通过研究种群中个体的结构,种群生物学家开发了推断这些个体历史共同祖先点的方法(Hudson 1983; Kingman 1982, 2000; Tajima 1983)。这些方法利用了一个事实,即在一个谱系分裂后,需要时间才能完全反映在这些谱系部分的亲属关系中。或者换句话说,一个谱系的各个部分之间的亲属关系需要时间才能比与其他谱系部分的关系更密切。这些方法可以被看作是在统计工具应用于分子生物学的更大背景下的方法的持续发展(§1.2.3)。

Maddison(1997)代表了对谱系系统发生推断中谱系内部结构作用的新认识的更近期的起点。简而言之,分子和计算技术的不断进步提供了机会,可以产生对感兴趣系统的谱系结构更加精细解析的系统发生树。很快就变得明显的是,这种系统的分层结构可能导致在生物层次的不同层次(甚至在同一层次内)出现不一致的系统发生树(或者说谱系树)。例如,Maddison 描述了个体基因或核苷酸的谱系树可能与我们采样这些基因的生物体或种群的谱系树显示不同的谱系拓扑结构。这不是错误或同源性的结果,而是基因水平谱系与它们所在的更高层次谱系之间的真实谱系不一致。

Maddison(1997)也直接涉及我们应该如何将我们对谱系内部结构的了解纳入我们的系统发生学分析模型中,以及我们如何在早期的共同祖先模型研究基础上进行进一步的建设。Maddison 是最早深刻认识到基因组学的新工作对系统发生学的影响可能是多么重大的人之一,无论是在不一致性如何给系统发生学分析带来严峻挑战和机遇方面。这有助于推动系统发生学领域的新发展(例如,Maddison&Knowles 2006; Degnan&Rosenberg 2006, 2009; Baum 2007; Nakhleh 2013; Hahn&Nakhleh 2016; Mallet,Besansky,&Hahn 2016)。

Haber(2019)提供了两个理由,说明为什么系统发生学分析的这些新发展对哲学家来说是有趣的。首先,他提供了一个实时的例子,说明科学家们从将系统的一个特征视为噪声到将其视为有力证据的转变。Pease 等人(2016)就是一个典型例子。他们使用一些新开发的工具来进行高度不一致系统的系统发生学分析,以提供番茄类群的重建。早期的分析认为该系统噪声太大,无法提取出强烈的系统发生学信号,而这些新模型允许进行一种重建,能够识别出特定的不一致模式。这代表了系统发生学家在重建和识别能力上的重大进展。

其次,系统发生学中对不一致性和网状关系的新态度提供了科学界从一套承诺转向另一套承诺的一个例子。Haber(2019)提供了一个具体的例子。他将系统发生学方法论中根深蒂固的核心承诺之一描述为“解决”竞争的系统发生树(Felsenstein 1988)。也就是说,在不同的分析或数据产生冲突的系统发生树的情况下,目标应该是通过确定最有支持的系统发生树来解决这种冲突。然而,在一个承认谱系不一致性的模型中,冲突的树可能准确地反映了一个网状或不一致的系统发生历史,例如,如果不同的数据强烈支持不同的系统发生树,一个可能的解释是我们发现了一种不一致性的实例。Nakhleh(2013)建议,这意味着系统发生学家现在还必须考虑冲突的树是否可以“调和”而不是解决。Haber(2019)认为,这是他所称之为“有益的干扰”的一个例子,这是科学可能推进的一种方式。

系统发生学推理中不一致性的概念和认识论影响在最近关于 Sukumaran 和 Knowles(2017)对多物种共同祖先(Rannala&Yang 2003; Yang&Rannala 2010)的工作和评论的辩论中汇集在一起。非常粗略地说,多物种共同祖先将共同祖先的原理从种群遗传学扩展到系统发生学。在种群遗传学中,一个基因可以从单个种群的多个个体中采样;共同祖先理论提供了一种模拟该基因的祖先历史到一个共同祖先的方式,即历史的合并点。多物种共同祖先做类似的事情,但是采样来自多个种群(甚至物种)。这些和其他技术是为了应对 Maddison(1997)提出的挑战而发展起来的,即发展能够将物种形成视为一个延续过程的方法。粗略地说,基因、个体生物、种群和分类单元内的物种谱系都可以“分离”,或者具有不同的系统发生历史,并展示“分歧的分形层次结构”(Sukumaran&Knowles 2017:1607)。多物种共同祖先技术有助于揭示复杂多层次谱系的细粒度结构(Haber 2012),这引发了关于这些内部谱系结构与物种划定和其他系统发生推理之间关系的讨论(例如,de Queiroz 2007; Knowles&Carstens 2007; Haber 2012; Carstens,Pelletier,Reid 和 Satler 2013; Hahn&Nakhleh 2016; Mallet 等 2016; Velasco 2019)。

Sukumaran 和 Knowles(2017)提供了一个很好的例子,说明多物种共同祖先所许可的推理类型以及形而上学关注点与认识论关注点的重叠。他们关注从多物种共同祖先方法中可以得出哪些推理类型,并认为仅仅将这些方法所确定的单位视为物种是错误的,因为它们可能实际上是种群层次的结构(即物种的种群,而不是独立的物种)。他们试图强调,将种群结构误认为物种(或者过快地从前者推断出后者,而没有进一步的证据),会人为地和无根据地增加物种数量,从而削弱了系统发生学试图通过这种方式许可的推理类型:

具体而言,从保护生物学到宏观进化动力学的所有领域,都将受到物种作为分析单位的充分估计数量的影响,特别是在基因组资源提供了在多物种共同祖先下检测越来越精细的遗传结构的前所未有的能力时。(Sukumaran&Knowles 2017:1607)

这可以被视为关于这些多物种共同祖先方法所确定的分歧和多样化单位的主张(形而上学主张),以及可以从这些方法中得出关于这些单位的推理类型(认识论主张)(Haber 2019)。

要明确的是,形而上学和认识论之间的关系并非直接,而是间接的,但对于系统发生学方法所许可的推理来说非常重要。例如,Sukumaran 和 Knowles(2017)通过发出呼吁,要求系统发生学家在仅依赖基因组数据和使用多物种共祖作为识别物种的简单方法时,采取更加谨慎的立场。他们提出了一种更加谨慎的推理立场,将多物种共祖所确定的单位视为种群水平的结构(可能与物种划定相对应,也可能不相对应)。这只是一个例子,展示了哲学家们在深入研究这一领域时可以参与的丰富讨论。

Bibliography

  • Albert, Victor A., 2006, Parsimony, Phylogeny, and Genomics, Oxford: Oxford University Press. doi:10.1093/acprof:oso/9780199297306.001.0001

  • Alfaro, Michael E. and Mark T. Holder, 2006, “The Posterior and the Prior in Bayesian Phylogenetics”, Annual Review of Ecology, Evolution, and Systematics, 37: 19–42. doi:10.1146/annurev.ecolsys.37.091305.110021

  • Amemiya, Chris T., Jessica Alföldi, Alison P. Lee, Shaohua Fan, Hervé Philippe, Iain MacCallum, Ingo Braasch, Tereza Manousaki, Igor Schneider, Nicolas Rohner, Chris Organ, Domitille Chalopin, Jeramiah J. Smith, Mark Robinson, Rosemary A. Dorrington, Marco Gerdol, Bronwen Aken, Maria Assunta Biscotti, Marco Barucca, Denis Baurain, et al., 2013, “The African Coelacanth Genome Provides Insights into Tetrapod Evolution”, Nature, 496(7445): 311–316. doi:10.1038/nature12027

  • Andreasen, Robin O., 1998, “A New Perspective on the Race Debate”, The British Journal for the Philosophy of Science, 49(2): 199–225. doi:10.1093/bjps/49.2.199

  • –––, 2000, “Race: Biological Reality or Social Construct?”, Philosophy of Science, 67: S653–S666. doi:10.1086/392853

  • Ané, Cécile, Bret Larget, David A. Baum, Stacey D. Smith, and Antonis Rokas, 2007, “Bayesian Estimation of Concordance among Gene Trees”, Molecular Biology and Evolution, 24(2): 412–426. doi:10.1093/molbev/msl170

  • Ankeny, Rachel, Hasok Chang, Marcel Boumans, and Mieke Boon, 2011, “Introduction: Philosophy of Science in Practice”, European Journal for Philosophy of Science, 1(3): 303–307. doi:10.1007/s13194-011-0036-4

  • Archibald, Jenny K., Mark E. Mort, and Daniel J. Crawford, 2003, “Bayesian Inference of Phylogeny: A Non-Technical Primer”, TAXON, 52(2): 187–191. doi:10.2307/3647388

  • Avise, John C. and Terence J. Robinson, 2008, “Hemiplasy: A New Term in the Lexicon of Phylogenetics”, Systematic Biology, 57(3): 503–507. doi:10.1080/10635150802164587

  • Baldauf, S. L., 2003, “The Deep Roots of Eukaryotes”, Science, 300(5626): 1703–1706. doi:10.1126/science.1085544

  • Baum, David A., 2007, “Concordance Trees, Concordance Factors, and the Exploration of Reticulate Genealogy”, TAXON, 56(2): 417–426. doi:10.1002/tax.562013

  • –––, 2008, “Reading a Phylogenetic Tree: The Meaning of Monophyletic Groups”, Nature Education, 1(1): 190.

  • –––, 2009, “Species as Ranked Taxa”, Systematic Biology, 58(1): 74–86. doi:10.1093/sysbio/syp011

  • Baum, David A. and Kerry L. Shaw, 1995, “Genealogical Perspectives of the Species Problem”, in Hoch and Stephenson 1995: 289–303,

  • Baum, David A. and Stacey D. Smith, 2013, Tree Thinking: An Introduction to Phylogenetic Biology, Greenwood Village, CO: Roberts and co.

  • Baum, David A., Stacey DeWitt Smith, and Samuel S. S. Donovan, 2005, “The Tree-Thinking Challenge”, Science, 310(5750): 979–980. doi:10.1126/science.1117727

  • Beatty, John, 1982, “Classes and Cladists”, Systematic Biology, 31(1): 25–34. doi:10.1093/sysbio/31.1.25

  • Bockmann, Flávio A., Marcelo R. De Carvalho, and Murilo De Carvalho, 2013, “The Salmon, the Lungfish (or the Coelacanth) and the Cow: A Revival?”, Zootaxa, 3750(3): 265–276. doi:10.11646/zootaxa.3750.3.6

  • Bowler, Peter J., 1996, Life’s Splendid Drama: Evolutionary Biology and the Reconstruction of Life’s Ancestry, 1860–1940, Chicago, IL: University of Chicago Press.

  • Boyd, Richard, 1999, “Homeostasis, Species and Higher Taxa”, in Species: New Interdisciplinary Essays, Robert A. Wilson (ed.), Cambridge, MA: MIT Press, pp. 141–185.

  • Brady, Ronald H., 1982, “Theoretical Issues and ‘Pattern Cladistics’”, Systematic Biology, 31(3): 286–291. doi:10.1093/sysbio/31.3.286

  • Brower, Andrew V.Z., 2000, “Evolution is Not a Necessary Assumption of Cladistics”, Cladistics, 16(1):143–154. doi:10.1111/j.1096-0031.2000.tb00351.x

  • –––, 2002, “Cladistics, Phylogeny, Evidence and Explanation—a Reply to Lee”, Zoologica Scripta, 31(2): 221–223. doi:10.1046/j.1463-6409.2002.00102.x

  • –––, 2016, “Are We All Cladists?”, in The Future of Phylogenetic Systematics: The Legacy of Willi Hennig, David Williams, Michael Schmitt, and Quentin Wheeler (eds.), (Systematics Association Special Volume Series 86), Cambridge: Cambridge University Press, 88–114. doi:10.1017/CBO9781316338797.007

  • –––, 2018a, “Fifty Shades of Cladism”, Biology & Philosophy, 33(1): 8. doi:10.1007/s10539-018-9622-6

  • –––, 2018b, “Statistical Consistency and Phylogenetic Inference: A Brief Review”, Cladistics, 34(5): 562–567. doi:10.1111/cla.12216

  • –––, 2019, “Background Knowledge: The Assumptions of Pattern Cladistics”, Cladistics, 35(6): 717-731. doi:10.1111/cla.12379

  • Brower, Andrew V.Z. and Randall T. Schuh, 2021, Biological Systematics: Principles and Applications, Ithaca, NY: Cornell University Press.

  • Camin, Joseph H. and Robert R. Sokal, 1965, “A Method for Deducing Branching Sequences in Phylogeny”, Evolution, 19(3): 311–326. doi:10.1111/j.1558-5646.1965.tb01722.x

  • Cantino, Philip D. and Kevin de Queiroz, 2020, “International Code of Phylogenetic Nomenclature, Version 6”, [Cantion & de Queiroz 2020 available online].

  • Carstens, Bryan C., Tara A. Pelletier, Noah M. Reid, and Jordan D. Satler, 2013, “How to Fail at Species Delimitation”, Molecular Ecology, 22(17): 4369–4383. doi:10.1111/mec.12413

  • Carpenter, James M., 1987, “Cladistics of Cladists”, Cladistics, 3(4): 363–375. doi:10.1111/j.1096-0031.1987.tb00899.x

  • Cartwright, Nancy, 1983, How the Laws of Physics Lie, Oxford: Oxford University Press. doi:10.1093/0198247044.001.0001

  • Cavalli-Sforza, L. L. and A. W. Edwards, 1967, “Phylogenetic Analysis. Models and Estimation Procedures”, American Journal of Human Genetics, 19(3 Pt 1): 233–257. [Cavalli-Sforza and Edwards 1967 available online]

  • Chang, Joseph T., 1996, “Full Reconstruction of Markov Models on Evolutionary Trees: Identifiability and Consistency”, Mathematical Biosciences, 137(1): 51–73. doi:10.1016/S0025-5564(96)00075-2

  • Chor, Benny and Tamir Tuller, 2005, “Maximum Likelihood of Evolutionary Trees: Hardness and Approximation”, Bioinformatics, 21(suppl 1), Oxford University Press: i97–i106. doi:10.1093/bioinformatics/bti1027

  • Ciccarelli, Francesca D., Tobias Doerks, Christian von Mering, Christopher J. Creevey, Berend Snel, and Peer Bork, 2006, “Toward Automatic Reconstruction of a Highly Resolved Tree of Life”, Science, 311(5765): 1283–1287. doi:10.1126/science.1123061

  • Cleland, Carol E., 2011, “Prediction and Explanation in Historical Natural Science”, The British Journal for the Philosophy of Science, 62(3): 551–582. doi:10.1093/bjps/axq024

  • Crawford, Nicholas G., James F. Parham, Anna B. Sellas, Brant C. Faircloth, Travis C. Glenn, Theodore J. Papenfuss, James B. Henderson, Madison H. Hansen, and W. Brian Simison, 2015, “A Phylogenomic Analysis of Turtles”, Molecular Phylogenetics and Evolution, 83: 250–257. doi:10.1016/j.ympev.2014.10.021

  • Currie, Adrian, 2018, Rock, Bone, and Ruin: An Optimist’s Guide to the Historical Sciences, Boston, MA: MIT Press.

  • –––, 2019, Scientific Knowledge and the Deep Past: History Matters, Cambridge: Cambridge University Press. doi:10.1017/9781108582490

  • Darwin, Charles, 1859, On the Origin of Species, London: John Murray.

  • Degnan, James H. and Noah A. Rosenberg, 2006, “Discordance of Species Trees with Their Most Likely Gene Trees”, PLoS Genetics, 2(5): e68. doi:10.1371/journal.pgen.0020068

  • –––, 2009, “Gene Tree Discordance, Phylogenetic Inference and the Multispecies Coalescent”, Trends in Ecology & Evolution, 24(6): 332–340. doi:10.1016/j.tree.2009.01.009

  • de Queiroz, Kevin, 1998, “The General Lineage Concept of Species, Species Criteria, and the Process of Speciation: A Conceptual Unification and Terminological Recommendations”, in Howard and Berlocher 1998: 57–75.

  • –––, 2007, “Species Concepts and Species Delimitation”, Systematic Biology, 56(6): 879–886. doi:10.1080/10635150701701083

  • de Queiroz, Kevin and Jacques Gauthier, 1990, “Phylogeny as a Central Principle in Taxonomy: Phylogenetic Definitions of Taxon Names”, Systematic Zoology, 39(4): 307–322. doi:10.2307/2992353

  • –––, 1992, “Phylogenetic Taxonomy”, Annual Review of Ecology and Systematics, 23(1): 449–480. doi:10.1146/annurev.es.23.110192.002313

  • –––, 1994, “Toward a Phylogenetic System of Biological Nomenclature”, Trends in Ecology & Evolution, 9(1): 27–31. doi:10.1016/0169-5347(94)90231-3

  • de Queiroz, Kevin and Steven Poe, 2001, “Philosophy and Phylogenetic Inference: A Comparison of Likelihood and Parsimony Methods in the Context of Karl Popper’s Writings on Corroboration”, Systematic Biology, 50(3): 305–321. doi:10.1080/106351501300317941

  • –––, 2003, “Failed Refutations: Further Comments on Parsimony and Likelihood Methods and Their Relationship to Popper’s Degree of Corroboration”, Systematic Biology, 52(3): 352–367. doi:10.1080/10635150309324

  • Devitt, Michael, 2008, “Resurrecting Biological Essentialism”, Philosophy of Science, 75(3): 344–382. doi:10.1086/593566

  • Dietrich, Michael R., 1994, “The Origins of the Neutral Theory of Molecular Evolution”, Journal of the History of Biology, 27(1): 21–59. doi:10.1007/BF01058626

  • –––, 1998, “Paradox and Persuasion: Negotiating the Place of Molecular Evolution within Evolutionary Biology”, Journal of the History of Biology, 31(1): 85–111. doi:10.1023/A:1004257523100

  • Donoghue, Michael J., 1992, “Homology”, in Keywords in Evolutionary Biology, Evelyn Fox Keller and Elisabeth A. Lloyd (eds.), Cambridge, MA: Harvard University Press, 170–179.

  • Doolittle, W. Ford, 1999, “Phylogenetic Classification and the Universal Tree”, Science, 284(5423): 2124–2128. doi:10.1126/science.284.5423.2124

  • Dunn, Casey W., Gonzalo Giribet, Gregory D. Edgecombe, and Andreas Hejnol, 2014, “Animal Phylogeny and Its Evolutionary Implications”, Annual Review of Ecology, Evolution, and Systematics, 45: 371–395. doi:10.1146/annurev-ecolsys-120213-091627

  • Duret, Laurent, 2008, “Neutral Theory: The Null Hypothesis of Molecular Evolution”, Nature Education, 1(1): 218.

  • Editors, 2016, “Editorial”, Cladistics, 32(1): 1. doi:10.1111/cla.12148

  • Edwards, Anthony W. F., 1970, “Estimation of the Branch Points of a Branching Diffusion Process”, Journal of the Royal Statistical Society: Series B (Methodological), 32(2): 155–164. doi:10.1111/j.2517-6161.1970.tb00828.x

  • –––, 1972, Likelihood: An Account of the Statistical Concept of Likelihood and Its Application to Scientific Inference, Cambridge: Cambridge University Press.

  • –––, 1996, “The Origin and Early Development of the Method of Minimum Evolution for the Reconstruction of Phylogenetic Trees”, Systematic Biology, 45(1): 79–91. doi:10.1093/sysbio/45.1.79

  • Edwards, Scott V., 2009, “Is a New and General Theory of Molecular Systematics Emerging?”, Evolution, 63(1): 1–19. doi:10.1111/j.1558-5646.2008.00549.x

  • Eldredge, Niles and Joel Cracraft, 1980, Phylogenetic Patterns and the Evolutionary Process, New York: Columbia University Press.

  • Ereshefsky, Marc, 1991, “Species, Higher Taxa, and the Units of Evolution”, Philosophy of Science, 58(1): 84–101. doi:10.1086/289600

  • –––, 2001, The Poverty of the Linnaean Hierarchy, Cambridge: Cambridge University Press. doi:10.1017/CBO9780511498459

  • –––, 2012, “Homology Thinking”, Biology and Philosophy, 27(3): 381–400. doi:10.1007/s10539-012-9313-7

  • Fagan, Melinda Bonnie, 2013, Philosophy of Stem Cell Biology: Knowledge in Flesh and Blood, New York: Palgrave Macmillan. doi:10.1057/9781137296023

  • Farris, James S., 1983, “The Logical Basis of Phylogenetic Analysis”, in Advances in Cladistics: Proceedings of the Third Meeting of the Willi Hennig Society, Vol. 2, N. I. Platnick & V. A. Funk (eds.), New York: Columbia University Press, pp. 7–36.

  • –––, 1999, “Likelihood and Inconsistency”, Cladistics, 15(2): 199–204. doi:10.1111/j.1096-0031.1999.tb00262.x

  • Felsenstein, Joseph, 1973, “Maximum Likelihood and Minimum-Steps Methods for Estimating Evolutionary Trees from Data on Discrete Characters”, Systematic Zoology, 22(3): 240–249. doi:10.1093/sysbio/22.3.240

  • –––, 1978, “Cases in Which Parsimony or Compatibility Methods Will Be Positively Misleading”, Systematic Zoology, 27(4): 401–410. doi:10.2307/2412923

  • –––, 1981, “Evolutionary Trees from DNA Sequences: A Maximum Likelihood Approach”, Journal of Molecular Evolution, 17(6): 368–376. doi:10.1007/BF01734359

  • –––, 1983, “Parsimony in Systematics: Biological and Statistical Issues”, Annual Review of Ecology and Systematics, 14(1): 313–333. doi:10.1146/annurev.es.14.110183.001525

  • –––, 1988, “Phylogenies from Molecular Sequences: Inference and Reliability”, Annual Review of Genetics, 22(1): 521–565. doi:10.1146/annurev.ge.22.120188.002513

  • –––, 2001, “The Troubled Growth of Statistical Phylogenetics”, Systematic Biology, 50(4): 465–467. doi:10.1080/10635150119297

  • –––, 2004, Inferring Phylogenies, volume 2, Sunderland, MA: Sinauer Associates.

  • Felsenstein, Joseph and Elliott Sober, 1986, “Parsimony and Likelihood: An Exchange”, Systematic Zoology, 35(4): 617–626. doi:10.2307/2413121

  • Fisher, Ronald A., 1935 [1950], Statistical Methods for Research Workers, Edinburgh: Oliver and Boyd. Eleventh edition 1950.

  • –––, 1956, Statistical Methods and Scientific Inference, first edition, Edinburgh: Oliver and Boyd.

  • Fitch, Walter M. and Emanuel Margoliash, 1967, “Construction of Phylogenetic Trees: A Method Based on Mutation Distances as Estimated from Cytochrome c Sequences Is of General Applicability”, Science, 155(3760): 279–284. doi:10.1126/science.155.3760.279

  • Fitzhugh, Kirk, 2008, “Abductive Inference: Implications for ‘Linnean’ and ‘Phylogenetic’ Approaches for Representing Biological Systematization”, Evolutionary Biology, 35(1): 52–82. doi:10.1007/s11692-008-9015-x

  • Franklin, L. R., 2007, “Bacteria, Sex, and Systematics”, Philosophy of Science, 74(1): 69–95. doi:10.1086/519476

  • Freudenstein, John V., 2005, “Characters, States and Homology”, Systematic Biology, 54(6): 965–973. doi:10.1080/10635150500354654

  • Gaffney, Eugene S., 1979, “An Introduction to the Logic of Phylogeny Reconstruction”, in Phylogenetic Analysis and Paleontology, Joel Cracraft and Niles Eldredge (eds), New York: Columbia University Press, pp. 79–111.

  • Gardiner, B. G., P. Janvier, C. Patterson, P. L. Forey, P. H. Greenwood, R. S. Miles, and R. P. S. Jefferies, 1979, “The Salmon, the Lungfish and the Cow: A Reply”, Nature, 277(5693): 175–176. doi:10.1038/277175b0

  • Ghiselin, Michael T., 1966, “On Psychologism in the Logic of Taxonomic Controversies”, Systematic Zoology, 15(3): 207–215. doi:10.2307/2411392

  • –––, 1974, “A Radical Solution to the Species Problem”, Systematic Zoology, 23(4): 536–544. doi:10.2307/2412471

  • Giere, Ronald N., 1979 [1997], Understanding Scientific Reasoning, New York: Holt, Rinehart, and Winston. Fourth edition, Fort Worth, TX: Harcourt Brace College Publishers, 1997.

  • Goodman, Nelson, 1972, “Seven Strictures on Similarity”, in his Problems and Projects, Indianapolis, IN: The Bobbs-Merrill Company, pp. 437–446.

  • Graham, R.L. and L.R. Foulds, 1982, “Unlikelihood That Minimal Phylogenies for a Realistic Biological Study Can Be Constructed in Reasonable Computational Time”, Mathematical Biosciences, 60(2): 133–142. doi:10.1016/0025-5564(82)90125-0

  • Grantham, Todd, 2004, “The Role of Fossils in Phylogeny Reconstruction: Why Is It so Difficult to Integrate Paleobiological and Neontological Evolutionary Biology?”, Biology and Philosophy, 19(5): 687–720. doi:10.1007/s10539-005-0370-z

  • Gray, Russell D. and Quentin D. Atkinson, 2003, “Language-Tree Divergence Times Support the Anatolian Theory of Indo-European Origin”, Nature, 426(6965): 435–439. doi:10.1038/nature02029

  • Gray, Russell D., A. J. Drummond, and S. J. Greenhill, 2009, “Language Phylogenies Reveal Expansion Pulses and Pauses in Pacific Settlement”, Science, 323(5913): 479–483. doi:10.1126/science.1166858

  • Gray, Russell D. and Fiona M. Jordan, 2000, “Language Trees Support the Express-Train Sequence of Austronesian Expansion”, Nature, 405(6790): 1052–1055. doi:10.1038/35016575

  • Griesemer, James, 2000, “Development, Culture, and the Units of Inheritance”, Philosophy of Science, 67(S1): S348–S368. doi:10.1086/392831

  • Griffiths, Graham C. D., 1974, “On the Foundations of Biological Systematics”, Acta Biotheoretica, 23(3–4): 85–131. doi:10.1007/BF01556343

  • –––, 1976, “The Future of Linnaean Nomenclature”, Systematic Zoology, 25(2): 168–173. doi:10.2307/2412743

  • Haber, Matthew H., 2005, “On Probability and Systematics: Possibility, Probability, and Phylogenetic Inference”, Systematic Biology, 54(5): 831–841. doi:10.1080/106351591007444

  • –––, 2009, “Phylogenetic Inference”, in A Companion to the Philosophy of History and Historiography, Aviezer Tucker (ed.), (Blackwell Companions to Philosophy 41), Oxford, UK: Wiley-Blackwell, 231–242. doi:10.1002/9781444304916.ch20

  • –––, 2012, “Multilevel Lineages and Multidimensional Trees: The Levels of Lineage and Phylogeny Reconstruction”, Philosophy of Science, 79(5): 609–623. doi:10.1086/667849

  • –––, 2016a, “The Individuality Thesis (3 Ways)”, Biology & Philosophy, 31(6): 913–930. doi:10.1007/s10539-016-9548-9

  • –––, 2019, “Species in the Age of Discordance”, Philosophy, Theory, and Practice in Biology, 11: art. 21. doi:10.3998/ptpbio.16039257.0011.021

  • Haber, Matthew H. and Daniel J. Molter, 2019, “Species in the Age of Discordance: Meeting Report and Introduction”, Philosophy, Theory, and Practice in Biology, 11: art. 12. doi:10.3998/ptpbio.16039257.0011.012

  • Hagen, Joel B., 2001, “The Introduction of Computers into Systematic Research in the United States during the 1960s”, Studies in History and Philosophy of Science Part C: Studies in History and Philosophy of Biological and Biomedical Sciences, 32(2): 291–314. doi:10.1016/S1369-8486(01)00005-X

  • Hahn, Matthew W. and Luay Nakhleh, 2016, “Irrational Exuberance for Resolved Species Trees”, Evolution, 70(1): 7–17. doi:10.1111/evo.12832

  • Hall, Brian K., 1994, Homology: The Hierarchical Basis of Comparative Biology, San Diego, CA: Academic Press.

  • Halstead, L. B., 1978, “The Cladistic Revolution–Can It Make the Grade?”, Nature, 276(5690): 759–760. doi:10.1038/276759a0

  • Harrison, Richard G., 1998, “Linking Evolutionary Pattern and Process”, in Howard and Berlocher 1998: 19–31.

  • Hasegawa, Masami, Hirohisa Kishino, and Taka-aki Yano, 1985, “Dating of the Human-Ape Splitting by a Molecular Clock of Mitochondrial DNA”, Journal of Molecular Evolution, 22(2): 160–174. doi:10.1007/BF02101694

  • Havstad, Joyce C. and N. Adam Smith, 2019, “Fossils with Feathers and Philosophy of Science”, Systematic Biology, 68(5): 840–851. doi:10.1093/sysbio/syz010

  • Heckman, Daniel S., David M. Geiser, Brooke R. Eidell, Rebecca L. Stauffer, Natalie L. Kardos, and S. Blair Hedges, 2001, “Molecular Evidence for the Early Colonization of Land by Fungi and Plants”, Science, 293(5532): 1129–1133. doi:10.1126/science.1061457

  • Hennig, Willi, 1966, Phylogenetic Systematics, D. Dwight Davis and Rainer Zangerl (trans.), Urbana, IL: University of Illinois Press; this is a revised and translated version of the German original, Grundzüge einer Theorie der phylogenetischen Systematik, Berlin: Deutscher Zentralverlag, 1950.

  • –––, 1975, “‘Cladistic Analysis or Cladistic Classification’: A Reply to Ernst Mayr”, Systematic Zoology, 24(2): 244–256. doi:10.1093/sysbio/24.2.244

  • Hillis, David M. and James J. Bull, 1993, “An Empirical Test of Bootstrapping as a Method for Assessing Confidence in Phylogenetic Analysis”, Systematic Biology, 42(2): 182–192. doi:10.1093/sysbio/42.2.182

  • Hillis, David M., James J. Bull, Mary E. White, Marty R. Badgett, and Ian J. Molineux, 1992, “Experimental Phylogenetics: Generation of a Known Phylogeny”, Science, 255(5044): 589–592. doi:10.1126/science.1736360

  • Hillis, David M., John P. Huelsenbeck, and Clifford W. Cunningham, 1994, “Application and Accuracy of Molecular Phylogenies”, Science, 264(5159): 671–677. doi:10.1126/science.8171318

  • Hinchliff, Cody E., Stephen A. Smith, James F. Allman, J. Gordon Burleigh, Ruchi Chaudhary, Lyndon M. Coghill, Keith A. Crandall, Jiabin Deng, Bryan T. Drew, Romina Gazis, Karl Gude, David S. Hibbett, Laura A. Katz, H. Dail Laughinghouse, Emily Jane McTavish, Peter E. Midford, Christopher L. Owen, Richard H. Ree, Jonathan A. Rees, Douglas E. Soltis, et al., 2015, “Synthesis of Phylogeny and Taxonomy into a Comprehensive Tree of Life”, Proceedings of the National Academy of Sciences, 112(41): 12764–12769. doi:10.1073/pnas.1423041112

  • Hoch, Peter C. and A. G. Stephenson (eds), 1995, Experimental and Molecular Approaches to Plant Biosystematics, St. Louis, MO: Proceedings of the Fifth International Symposium of the International Organization of Plant Biosystematists; Missouri Botanical Garden Press.

  • Howard, Daniel J. and Stewart H. Berlocher (eds.), 1998, Endless Forms: Species and Speciation, New York: Oxford University Press.

  • Hudson, Richard R., 1983, “Properties of a Neutral Allele Model with Intragenic Recombination”, Theoretical Population Biology, 23(2): 183–201. doi:10.1016/0040-5809(83)90013-8

  • Huelsenbeck, John P., 1997, “Is the Felsenstein Zone a Fly Trap?”, Systematic Biology, 46(1): 69–74. doi:10.1093/sysbio/46.1.69

  • Huelsenbeck, John P., Cécile Ané, Bret Larget, and Fredrik Ronquist, 2008, “A Bayesian Perspective on a Non-Parsimonious Parsimony Model”, Systematic Biology, 57(3): 406–419. doi:10.1080/10635150802166046

  • Hug, Laura A., Brett J. Baker, Karthik Anantharaman, Christopher T. Brown, Alexander J. Probst, Cindy J. Castelle, Cristina N. Butterfield, Alex W. Hernsdorf, Yuki Amano, Kotaro Ise, Yohey Suzuki, Natasha Dudek, David A. Relman, Kari M. Finstad, Ronald Amundson, Brian C. Thomas, and Jillian F. Banfield, 2016, “A New View of the Tree of Life”, Nature Microbiology, 1(5): 16048. doi:10.1038/nmicrobiol.2016.48

  • Hull, David L., 1970, “Contemporary Systematic Philosophies”, Annual Review of Ecology and Systematics, 1(1): 19–54. doi:10.1146/annurev.es.01.110170.000315

  • –––, 1976, “Are Species Really Individuals?”, Systematic Zoology, 25(2): 174–191. doi:10.2307/2412744

  • –––, 1978, “A Matter of Individuality”, Philosophy of Science, 45(3): 335–360. doi:10.1086/288811

  • –––, 1983, “Karl Popper and Plato’s Metaphor”, in Advances in Cladistics, Vol. 2, N. I. Platnick & V. A. Funk (eds.), New York: Columbia University Press, pp. 177–189.

  • –––, 1988, Science as a Process: An Evolutionary Account of the Social and Conceptual Development of Science, Chicago, IL: The University of Chicago Press.

  • –––, 1999, “The Use and Abuse of Sir Karl Popper”, Biology and Philosophy, 14(4): 481–504. doi:10.1023/A:1006554919188

  • Huxley, Julian (ed.), 1940, The New Systematics., Oxford: Clarendon Press.

  • Jukes, Thomas H. and Charles R. Cantor, 1969, “Evolution of Protein Molecules”, in Mammalian Protein Metabolism, volume 3, New York: Academic Press, 21–132. doi:10.1016/B978-1-4832-3211-9.50009-7

  • Kearney, Maureen, 2007, “Philosophy and Phylogenetics: Historical and Current Connections”, in The Cambridge Companion to the Philosophy of Biology, David L. Hull and Michael Ruse (eds.), Cambridge: Cambridge University Press, 211–232. doi:10.1017/CCOL9780521851282.011

  • Kendig, Catherine, 2016, “Homologizing as Kinding”, in Natural Kinds and Classification in Scientific Practice, Catherine Kendig (ed.), London: Routledge, 106-125.

  • Kenrick, Paul and Peter R. Crane, 1997, “The Origin and Early Evolution of Plants on Land”, Nature, 389(6646): 33–39. doi:10.1038/37918

  • Kimura, Motoo, 1968, “Evolutionary Rate at the Molecular Level”, Nature, 217(5129): 624–626. doi:10.1038/217624a0

  • –––, 1969, “The Rate of Molecular Evolution Considered from the Standpoint of Population Genetics”, Proceedings of the National Academy of Sciences, 63(4): 1181–1188. doi:10.1073/pnas.63.4.1181

  • –––, 1980, “A Simple Method for Estimating Evolutionary Rates of Base Substitutions through Comparative Studies of Nucleotide Sequences”, Journal of Molecular Evolution, 16(2): 111–120. doi:10.1007/BF01731581

  • Kingman, J. F. C., 1982, “On the Genealogy of Large Populations”, Journal of Applied Probability, 19: 27–43. doi:10.2307/3213548

  • –––, 2000, “Origins of the Coalescent: 1974–1982”, Genetics, 156(4): 1461–1463.

  • Kluge, Arnold G., 2001, “Philosophical Conjectures and Their Refutation”, Systematic Biology, 50(3): 322–330. doi:10.1080/10635150119615

  • –––, 2005, “What Is the Rationale for ‘Ockham’s Razor’(aka Parsimony) in Phylogenetic Inference”, in Albert 2005: 15–42.

  • Kluge, Arnold G. and James S. Farris, 1999, “Taxic Homology = Overall Similarity”, Cladistics, 15(2): 205–212. doi:10.1111/j.1096-0031.1999.tb00263.x

  • Knowles, L. Lacey and Bryan C. Carstens, 2007, “Delimiting Species without Monophyletic Gene Trees”, Systematic Biology, 56(6): 887–895. doi:10.1080/10635150701701091

  • Larget, Bret and Donald L. Simon, 1999, “Markov Chain Monte Carlo Algorithms for the Bayesian Analysis of Phylogenetic Trees”, Molecular Biology and Evolution, 16(6): 750–759. doi:10.1093/oxfordjournals.molbev.a026160

  • Lee, Michael S.Y., 2002, “Divergent Evolution, Hierarchy, and Cladistics”, Zoologica Scripta, 31(2): 217–219. doi:10.1046/j.1463-6409.2002.00101.x

  • Lemey, Philippe, Marco Salemi, and Anne-Mieke Vandamme (eds.), 2009, The Phylogenetic Handbook: A Practical Approach to Phylogenetic Analysis and Hypothesis Testing, second edition, Cambridge: Cambridge University Press. doi:10.1017/CBO9780511819049

  • Lemieux, Jacob E., Katherine J. Siddle, Bennett M. Shaw, Christine Loreth, Stephen F. Schaffner, Adrianne Gladden-Young, Gordon Adams, Timelia Fink, Christopher H. Tomkins-Tinch, Lydia A. Krasilnikova, Katherine C. DeRuff, Melissa Rudy, Matthew R. Bauer, Kim A. Lagerborg, Erica Normandin, Sinéad B. Chapman, Steven K. Reilly, Melis N. Anahtar, Aaron E. Lin, Amber Carter, et al., 2021, “Phylogenetic Analysis of SARS-CoV-2 in Boston Highlights the Impact of Superspreading Events”, Science, 371(6529): 574–575. doi:10.1126/science.abe3261

  • Lewens, Tim, 2012, “Pheneticism Reconsidered”, Biology and Philosophy, 27(2), Springer Netherlands: 159–177. doi:10.1007/s10539-011-9302-2

  • Li, Shuying, Dennis K. Pearl, and Hani Doss, 2000, “Phylogenetic Tree Construction Using Markov Chain Monte Carlo”, Journal of the American Statistical Association, 95(450): 493–508. doi:10.1080/01621459.2000.10474227

  • Lipton, Peter, 2004, Inference to the Best Explanation, second edition, London: Routledge. doi:10.4324/9780203470855

  • Longino, Helen E., 1990, Science as Social Knowledge: Values and Objectivity in Scientific Inquiry, Princeton, NJ: Princeton University Press.

  • –––, 2019, “The Social Dimensions of Scientific Knowledge”, in The Stanford Encyclopedia of Philosophy (Summer 2019), Edward N. Zalta (ed.). URL= https://plato.stanford.edu/archives/sum2019/entries/scientific-knowledge-social/

  • Love, Alan C., 2014, “The Erotetic Organization of Developmental Biology”, in Towards a Theory of Development, Alessandro Minelli and Thomas Pradeu (eds.), Oxford: Oxford University Press, 33–55. doi:10.1093/acprof:oso/9780199671427.003.0003

  • Maddison, Wayne P., 1995, “Phylogenetic Histories Within and Among Species”, in Hoch and Stephenson 1995: 273–287.

  • –––, 1997, “Gene Trees in Species Trees”, Systematic Biology, 46(3): 523–536. doi:10.1093/sysbio/46.3.523

  • Maddison, Wayne P. and L. Lacey Knowles, 2006, “Inferring Phylogeny Despite Incomplete Lineage Sorting”, Systematic Biology, 55(1): 21–30. doi:10.1080/10635150500354928

  • Mallet, James, 2007, “Hybrid Speciation”, Nature, 446(7133): 279–283. doi:10.1038/nature05706

  • Mallet, James, Nora Besansky, and Matthew W. Hahn, 2016, “How Reticulated Are Species?”, BioEssays, 38(2): 140–149. doi:10.1002/bies.201500149

  • Margoliash, Emanuel, 1963, “Primary Structure and Evolution of Cytochrome c”, Proceedings of the National Academy of Sciences, 50(4): 672–679. doi:10.1073/pnas.50.4.672

  • Martin, William, 1999, “Mosaic Bacterial Chromosomes: A Challenge En Route to a Tree of Genomes”, BioEssays, 21(2): 99–104. doi:10.1002/(SICI)1521-1878(199902)21:2<99::AID-BIES3>3.0.CO;2-B

  • Mau, Bob and Michael A. Newton, 1997, “Phylogenetic Inference for Binary Data on Dendograms Using Markov Chain Monte Carlo”, Journal of Computational and Graphical Statistics, 6(1): 122–131. doi:10.1080/10618600.1997.10474731

  • Mayr, Ernst, 1965a, “Classification and Phylogeny”, American Zoologist, 5(1): 165–174. doi:10.1093/icb/5.1.165

  • –––, 1965b, “Numerical Phenetics and Taxonomic Theory”, Systematic Zoology, 14(2): 73–97. doi:10.2307/2411730

  • –––, 1969, Principles of Systematic Zoology, New York: MacGraw-Hill.

  • –––, 1974, “Cladistic Analysis or Cladistic Classification?”, Journal of Zoological Systematics and Evolutionary Research, 12(1): 94–128. doi:10.1111/j.1439-0469.1974.tb00160.x

  • McMullin, Ernan, 1985, “Galilean Idealization”, Studies in History and Philosophy of Science Part A, 16(3): 247–273. doi:10.1016/0039-3681(85)90003-2

  • Mishler, Brent D., 2005, “The Logic of the Data Matrix in Phylogenetic Analysis”, in Albert 2005: 57–70.

  • Morgan, Gregory J., 1998, “Emile Zuckerkandl, Linus Pauling, and the Molecular Evolutionary Clock, 1959-1965”, Journal of the History of Biology, 31(2): 155–178. doi:10.1023/A:1004394418084

  • Nakhleh, Luay, 2013, “Computational Approaches to Species Phylogeny Inference and Gene Tree Reconciliation”, Trends in Ecology & Evolution, 28(12): 719–728. doi:https://doi.org/10.1016/j.tree.2013.09.004

  • Neff, Nancy A., 1986, “A Rational Basis for a Priori Character Weighting”, Systematic Zoology, 35(1): 110–123. doi:10.1093/sysbio/35.1.110

  • Neyman, Jerzy, 1952, Lectures and Conferences on Mathematical Statistics and Probability, second edition, Washington, DC: Graduate School, United States Department of Agriculture.

  • –––, 1971, “Molecular Studies of Evolution: A Source of Novel Statistical Problems”, in Statistical Decision Theory and Related Topics, Shanti S. Gupta and James Yackel (eds), New York: Academic Press, 1–27.

  • O’Hara, Robert J., 1988, “Homage to Clio, or, Toward an Historical Philosophy for Evolutionary Biology”, Systematic Zoology, 37(2): 142–155. doi:10.2307/2992272

  • –––, 1993, “Systematic Generalization, Historical Fate, and the Species Problem”, Systematic Biology, 42(3): 231–246. doi:10.1093/sysbio/42.3.231

  • O’Malley, Maureen A., William Martin, and John Dupré, 2010, “The Tree of Life: Introduction to an Evolutionary Debate”, Biology and Philosophy, 25(4): 441–453. doi:10.1007/s10539-010-9208-4

  • Owen, Richard, 1843, Lectures on the Comparative Anatomy and Physiology of the Invertebrate Animals, London: Longman, Brown, Greene, and Longmans.

  • Padian, Kevin and John R. Horner, 2002, “Typology versus Transformation in the Origin of Birds”, Trends in Ecology & Evolution, 17(3): 120–124. doi:10.1016/S0169-5347(01)02409-0

  • Patterson, Colin, 1982, “Classes and Cladists or Individuals and Evolution”, Systematic Biology, 31(3): 284–286. doi:10.1093/sysbio/31.3.284

  • Pauling, Linus and Emile Zuckerkandl, 1963, “Chemical Paleogenetics. Molecular ‘Restoration Studies’ of Extinct Forms of Life”, Acta Chemica Scandinavica, 17 supl.: 9–16. doi:10.3891/acta.chem.scand.17s-0009

  • Pearson, Christopher H., 2010, “Pattern Cladism, Homology, and Theory-Neutrality”, History and Philosophy of the Life Sciences, 32(4): 475–492.

  • Pease, James B., David C. Haak, Matthew W. Hahn, and Leonie C. Moyle, 2016, “Phylogenomics Reveals Three Sources of Adaptive Variation during a Rapid Radiation”, PLOS Biology, 14(2): 1–24. doi:10.1371/journal.pbio.1002379

  • Pickett, K. M. and Randle, C. P., 2005, “Strange bayes indeed: uniform topological priors imply non–uniform clade priors”, Molecular Phylogenetics and Evolution, 34(1): 203–211. doing:10.1016/j.ympev.2004.09.001

  • Pinna, Mário C. C. de, 1991, “Concepts and Tests of Homology in the Cladistic Paradigm”, Cladistics, 7(4): 367–394. doi:10.1111/j.1096-0031.1991.tb00045.x

  • Platnick, Norman I., 1982, “Defining Characters and Evolutionary Groups”, Systematic Biology, 31(3): 282–282. doi:10.1093/sysbio/31.3.282

  • Posada, David, 2008, “JModelTest: Phylogenetic Model Averaging”, Molecular Biology and Evolution, 25(7): 1253–1256. doi:10.1093/molbev/msn083

  • Posada, David and Keith A. Crandall, 1998, “MODELTEST: Testing the Model of DNA Substitution”, Bioinformatics, 14(9): 817–818. doi:10.1093/bioinformatics/14.9.817

  • Quinn, Aleta, 2016, “Phylogenetic Inference to the Best Explanation and the Bad Lot Argument”, Synthese, 193(9): 3025–3039. doi:10.1007/s11229-015-0908-9

  • –––, 2017, “When Is a Cladist Not a Cladist?”, Biology & Philosophy, 32(4): 581–598. doi:10.1007/s10539-017-9577-z

  • –––, 2019, “Diagnosing Discordance: Signal in Data, Conflict in Paradigms”, Philosophy, Theory, and Practice in Biology, 11(July): art. 017. doi:10.3998/ptpbio.16039257.0011.017

  • Rannala, Bruce and Ziheng Yang, 1996, “Probability Distribution of Molecular Evolutionary Trees: A New Method of Phylogenetic Inference”, Journal of Molecular Evolution, 43(3): 304–311. doi:10.1007/BF02338839

  • –––, 2003, “Bayes Estimation of Species Divergence Times and Ancestral Population Sizes Using DNA Sequences from Multiple Loci”, Genetics, 164(4): 1645–1656. doi:10.1093/genetics/164.4.1645

  • Redelings, Benjamin D. and Marc A. Suchard, 2005, “Joint Bayesian Estimation of Alignment and Phylogeny”, Systematic Biology, 54(3): 401–418. doi:10.1080/10635150590947041

  • Richards, Richard, 2002, “Kuhnian Values and Cladistic Parsimony”, Perspectives on Science, 10(1): 1–27. doi:10.1162/106361402762674780

  • –––, 2003, “Character Individuation in Phylogenetic Inference”, Philosophy of Science, 70(2): 264–279. doi:10.1086/375467

  • Rieppel, Olivier, 2008, “Re-Writing Popper’s Philosophy of Science for Systematics”, History and Philosophy of the Life Sciences, 30(3–4): 293–316.

  • Rieppel, Olivier and Maureen Kearney, 2002, “Similarity”, Biological Journal of the Linnean Society, 75(1): 59–82. doi:10.1046/j.1095-8312.2002.00006.x

  • –––, 2007, “The Poverty of Taxonomic Characters”, Biology & Philosophy, 22(1): 95–113. doi:10.1007/s10539-006-9024-z

  • Roffé, Ariel Jonathan, 2020, “Dynamic Homology and Circularity in Cladistic Analysis”, Biology & Philosophy, 35(1): art. 21. doi:10.1007/s10539-020-9737-4

  • Rogers, James S., 2001, “Maximum Likelihood Estimation of Phylogenetic Trees Is Consistent When Substitution Rates Vary According to the Invariable Sites plus Gamma Distribution”, Systematic Biology, 50(5): 713–722. doi:10.1080/106351501753328839

  • Ronquist, Fredrik, Paul van der Mark, and John P. Huelsenbeck, 2009, “Bayesian Phylogenetic Analysis Using MRBAYES”, in Lemey, Salemi, and Vandamme 2009: 210–266. doi:10.1017/CBO9780511819049.009

  • Salipante, Stephen J. and Marshall S. Horwitz, 2006, “Phylogenetic Fate Mapping”, Proceedings of the National Academy of Sciences, 103(14): 5448–5453. doi:10.1073/pnas.0601265103

  • Santis, Marcelo Domingos de, 2020, “Popper as a process: revisiting the appropriation of the Popperian philosophy by the cladists during the ‘systematics wars’”, Arquivos De Zoologia, 51(2): 13–20. doi:10.11606/2176-7793/2020.51.02

  • Schumer, Molly, Gil G. Rosenthal, and Peter Andolfatto, 2014, “How Common Is Homoploid Hybrid Speciation?”, Evolution, 68(6): 1553–1560. doi:10.1111/evo.12399

  • Scotland, Robert and R. Toby Pennington (eds.), 2000, Homology and Systematics: Coding Characters for Phylogenetic Analysis, London: CRC Press. doi:10.1201/9781482268249

  • Scotland, Robert W., Richard G. Olmstead, and Jonathan R. Bennett, 2003, “Phylogeny Reconstruction: The Role of Morphology”, Systematic Biology, 52(4): 539–548. doi:10.1080/10635150309309

  • Sereno, Paul C., 2005, “The Logical Basis of Phylogenetic Taxonomy”, Systematic Biology, 54(4): 595–619. doi:10.1080/106351591007453

  • Siddall, Mark E., 1998, “Success of Parsimony in the Four-Taxon Case: Long-Branch Repulsion by Likelihood in the Farris Zone”, Cladistics, 14(3): 209–220. doi:10.1111/j.1096-0031.1998.tb00334.x

  • Siddall, Mark E. and Arnold G. Kluge, 1997, “Probabilism and Phylogenetic Inference”, Cladistics, 13(4): 313–336. doi:10.1111/j.1096-0031.1997.tb00322.x

  • Siddall, Mark E. and Michael F. Whiting, 1999, “Long-Branch Abstractions”, Cladistics, 15(1): 9–24. doi:10.1111/j.1096-0031.1999.tb00391.x

  • Simpson, George Gaylord, 1961, Principles of Animal Taxonomy, New York: Columbia University Press.

  • Slater, Matthew H., 2013, Are Species Real? An Essay on the Metaphysics of Species, (New Directions in the Philosophy of Science), New York: Palgrave Macmillan. doi:10.1057/9780230393233

  • –––, 2015, “Natural Kindness”, The British Journal for the Philosophy of Science, 66(2): 375–411. doi:10.1093/bjps/axt033

  • Sneath, Peter H. A. and Robert R. Sokal, 1973, Numerical Taxonomy. The Principles and Practice of Numerical Classification., San Francisco, CA: W. H. Freeman.

  • Sober, Elliott, 1980, “Evolution, Population Thinking, and Essentialism”, Philosophy of Science, 47(3): 350–383. doi:10.1086/288942

  • –––, 1985, “A Likelihood Justification of Parsimony”, Cladistics, 1(3): 209–233. doi:10.1111/j.1096-0031.1985.tb00424.x

  • –––, 1988a, “Likelihood and Convergence”, Philosophy of Science, 55(2): 228–237. doi:10.1086/289429

  • –––, 1988b, Reconstructing the Past: Parsimony, Evolution, and Inference, Cambridge, MA: MIT Press.

  • –––, 2004, “The Contest Between Parsimony and Likelihood”, Systematic Biology, 53(4): 644–653. doi:10.1080/10635150490468657

  • –––, 2009, “Did Darwin Write the Origin Backwards?”, Proceedings of the National Academy of Sciences, 106(Supplement 1): 10048–10055. doi:10.1073/pnas.0901109106

  • –––, 2010, Did Darwin Write the “Origin” Backwards? Philosophical Essays on Darwin’s Theory, Amherst, NY: Prometheus Books.

  • –––, 2015, Ockham’s Razors: A User’s Manual, Cambridge: Cambridge University Press. doi:10.1017/CBO9781107705937

  • Sokal, Robert R. and Peter H. A. Sneath, 1963, Principles of Numerical Taxonomy, San Francisco, CA: W. H. Freeman.

  • Steel, Mike and David Penny, 2000, “Parsimony, Likelihood, and the Role of Models in Molecular Phylogenetics”, Molecular Biology and Evolution, 17(6): 839–850. doi:10.1093/oxfordjournals.molbev.a026364

  • Sterelny, Kim and Paul Griffiths, 1999, Sex and Death: An Introduction to Philosophy of Biology, (Science and Its Conceptual Foundations), Chicago, IL: University of Chicago Press.

  • Sterner, Beckett and Scott Lidgard, 2014, “The Normative Structure of Mathematization in Systematic Biology”, Studies in History and Philosophy of Science Part C: Studies in History and Philosophy of Biological and Biomedical Sciences, 46: 44–54. doi:http://dx.doi.org/10.1016/j.shpsc.2014.03.001

  • –––, 2018, “Moving Past the Systematics Wars”, Journal of the History of Biology, 51(1): 31–67. doi:10.1007/s10739-017-9471-1

  • Stevens, Peter F., 2000, “On Characters and Character States: Do Overlapping and Non-Overlapping Variation, Morphology and Molecules All Yield Data of the Same Value?”, in Scotland and Pennington 2000: 81–105.

  • Sukumaran, Jeet and L. Lacey Knowles, 2017, “Multispecies Coalescent Delimits Structure, Not Species”, Proceedings of the National Academy of Sciences, 114(7): 1607–1612. doi:10.1073/pnas.1607921114

  • Sullivan, Jack and Paul Joyce, 2005, “Model Selection in Phylogenetics”, Annual Review of Ecology, Evolution, and Systematics, 36: 445–466. doi:10.1146/annurev.ecolsys.36.102003.152633

  • Swofford, David L. and Jack Sullivan, 2009, “Phylogeny Inference Based on Parsimony and Other Methods Using PAUP”, in The Phylogenetic Handbook: A Practical Approach to Phylogenetic Analysis and Hypothesis Testing, P. Lemey, M. Salemi, and A-M, Vandamme (eds.), Cambridge: Cambridge University Press., pp. 267-312.

  • Swofford, David L., Peter J. Waddell, John P. Huelsenbeck, Peter G. Foster, Paul O. Lewis, and James S. Rogers, 2001, “Bias in Phylogenetic Estimation and Its Relevance to the Choice between Parsimony and Likelihood Methods”, Systematic Biology, 50(4): 525–539. doi:10.1080/106351501750435086

  • Tajima, Fumio, 1983, “Evolutionary Relationship of DNA Sequences in Finite Populations”, Genetics, 105(2): 437–460. doi:10.1093/genetics/105.2.437

  • Takezaki, Naoko and Hidenori Nishihara, 2017, “Support for Lungfish as the Closest Relative of Tetrapods by Using Slowly Evolving Ray-Finned Fish as the Outgroup”, Genome Biology and Evolution, 9(1): 93–101. doi:10.1093/gbe/evw288

  • Tamura, K. and M. Nei, 1993, “Estimation of the Number of Nucleotide Substitutions in the Control Region of Mitochondrial DNA in Humans and Chimpanzees”, Molecular Biology and Evolution, 10(3): 512–526. doi:10.1093/oxfordjournals.molbev.a040023

  • Thomson, Keith Stewart, 1991, Living Fossil: The Story of the Coelacanth, New York: W.W. Norton.

  • Tuffley, Chris and Mike Steel, 1997, “Links between Maximum Likelihood and Maximum Parsimony under a Simple Model of Site Substitution”, Bulletin of Mathematical Biology, 59(3): 581–607. doi:10.1007/BF02459467

  • Turner, Derek, 2007, Making Prehistory: Historical Science and the Scientific Realism Debate, Cambridge: Cambridge University Press. doi:10.1017/CBO9780511487385

  • van Fraassen, Bas C., 1989, Laws and Symmetry, Oxford: Oxford University Press. doi:10.1093/0198248601.001.0001

  • Vassend, Olav B., 2020, “A Verisimilitude Framework for Inductive Inference, with an Application to Phylogenetics”, The British Journal for the Philosophy of Science, 71(4): 1359–1383. doi:10.1093/bjps/axy054

  • Velasco, Joel D., 2007, “Why Non-Uniform Priors on Clades Are Both Unavoidable and Unobjectionable”, Molecular Phylogenetics and Evolution, 45(2): 748–749. doi:10.1016/j.ympev.2007.08.003

  • –––, 2008a, “Species Concepts Should Not Conflict with Evolutionary History, but Often Do”, Studies in History and Philosophy of Science Part C: Studies in History and Philosophy of Biological and Biomedical Sciences, 39(4): 407–414. doi:10.1016/j.shpsc.2008.09.007

  • –––, 2008b, “The Prior Probabilities of Phylogenetic Trees”, Biology & Philosophy, 23(4): 455–473. doi:10.1007/s10539-007-9105-7

  • –––, 2010, “Species, Genes, and the Tree of Life”, The British Journal for the Philosophy of Science, 61(3): 599–619. doi:10.1093/bjps/axp051

  • –––, 2012, “The Future of Systematics: Tree Thinking without the Tree”, Philosophy of Science, 79(5): 624–636. doi:10.1086/667878

  • –––, 2013, “The Tree of Life”, in The Cambridge Encyclopedia of Darwin and Evolutionary Thought, Michael Ruse (ed.), Cambridge: Cambridge University Press, 340–345. doi:10.1017/CBO9781139026895.043

  • –––, 2019, “The Foundations of Concordance Views of Phylogeny”, Philosophy, Theory, and Practice in Biology, 11(July): art. 020. doi:10.3998/ptpbio.16039257.0011.020

  • Wagner, Günter P. (ed.), 2000, The Character Concept in Evolutionary Biology, San Diego, CA: Academic Press. doi:10.1016/B978-0-12-730055-9.X5005-8

  • Wald, Abraham, 1949, “Note on the Consistency of the Maximum Likelihood Estimate”, The Annals of Mathematical Statistics, 20(4): 595–601. doi:10.1214/aoms/1177729952

  • Wang, Lusheng and Tao Jiang, 1994, “On the Complexity of Multiple Sequence Alignment”, Journal of Computational Biology, 1(4): 337–348. doi:10.1089/cmb.1994.1.337

  • Weisberg, Michael, 2007, “Three Kinds of Idealization”, Journal of Philosophy, 104(12): 639–659. doi:10.5840/jphil20071041240

  • Wheeler, Ward C., Lone Aagesen, Claudia P. Arango, Julián Faivovich, Taran Grant, Cyrille D’Haese, Daniel Janies, William Leo Smith, Andrés Varón, and Gonzalo Giribet, 2006, Dynamic Homology and Phylogenetic Systematics: A Unified Approach Using POY, Washington, DC: American Museum of Natural History.

  • Whiting, Michael F., 1998, “Long-Branch Distraction and the Strepsiptera”, Systematic Biology, 47(1): 134–137. doi:10.1080/106351598261076

  • Whittall, Justen B. and Scott A. Hodges, 2007, “Pollinator Shifts Drive Increasingly Long Nectar Spurs in Columbine Flowers”, Nature, 447(7145): 706–709. doi:10.1038/nature05857

  • Wiens, John J., 2004, “The Role of Morphological Data in Phylogeny Reconstruction”, Systematic Biology, 53(4): 653–661. doi:10.1080/10635150490472959

  • Wiley, E. O., 1975, “Karl R. Popper, Systematics, and Classification: A Reply to Walter Bock and Other Evolutionary Taxonomists”, Systematic Zoology, 24(2): 233–243. doi:10.1093/sysbio/24.2.233

  • –––, 1981, Phylogenetics: The Theory and Practice of Phylogenetic Systematics, New York: Wiley. Second edition is Wiley and Lieberman 2011.

  • Wiley, E. O. and Bruce S. Lieberman, 2011, Phylogenetics: Theory and Practice of Phylogenetic Systematics, second edition, Hoboken, NJ: John Wiley & Sons. See Wiley 1981 for first edition. doi:10.1002/9781118017883

  • Williams, David M. and Malte C. Ebach, 2018, “A Cladist Is a Systematist Who Seeks a Natural Classification: Some Comments on Quinn (2017)”, Biology & Philosophy, 33(1–2): art. 10. doi:10.1007/s10539-018-9621-7

  • Williams, David M. and Malte C. Ebach, Cladistics: A Guide to Biological Classification, 3rd Edition, Cambridge: Cambridge University Press. doi:10.1017/9781139047678.

  • Wilson, Robert A., Matthew J. Barker, and Ingo Brigandt, 2007, “When Traditional Essentialism Fails: Biological Natural Kinds”, Philosophical Topics, 35(1–2): 189–215. doi:10.5840/philtopics2007351/29

  • Wimsatt, William C., 2007, Re-Engineering Philosophy for Limited Beings: Piecewise Approximations to Reality, Cambridge, MA: Harvard University Press.

  • Winsor, Mary Pickard, 1976, Starfish, Jellyfish, and the Order of Life: Issues in Nineteenth Century Science, New Haven, CT: Yale University Press.

  • –––, 1995, “The English Debate on Taxonomy and Phylogeny, 1937–1940”, History and Philosophy of the Life Sciences, 17(2): 227–252.

  • –––, 2009, “Taxonomy Was the Foundation of Darwin’s Evolution”, TAXON, 58(1): 43–49. doi:10.1002/tax.581007

  • Winther, Rasmus Grønfeldt, 2009, “Character Analysis in Cladistics: Abstraction, Reification, and the Search for Objectivity”, Acta Biotheoretica, 57(1–2): 129–162. doi:10.1007/s10441-008-9064-7

  • Woese, Carl R. and George E. Fox, 1977, “Phylogenetic Structure of the Prokaryotic Domain: The Primary Kingdoms”, Proceedings of the National Academy of Sciences, 74(11): 5088–5090. doi:10.1073/pnas.74.11.5088

  • Woese, Carl R., George E. Fox, Lawrence Zablen, Tsuneko Uchida, Linda Bonen, Kenneth Pechman, Bobby J. Lewis, and David Stahl, 1975, “Conservation of Primary Structure in 16S Ribosomal RNA”, Nature, 254(5495): 83–86. doi:10.1038/254083a0

  • Woese, Carl R., Otto Kandler, and Mark L. Wheelis, 1990, “Towards a Natural System of Organisms: Proposal for the Domains Archaea, Bacteria, and Eucarya”, Proceedings of the National Academy of Sciences, 87(12): 4576–4579. doi:10.1073/pnas.87.12.4576

  • Yang, Ziheng, 1994, “Statistical Properties of the Maximum Likelihood Method of Phylogenetic Estimation and Comparison with Distance Matrix Methods”, Systematic Biology, 43(3): 329–342. doi:10.1093/sysbio/43.3.329

  • –––, 1996, “Phylogenetic Analysis Using Parsimony and Likelihood Methods”, Journal of Molecular Evolution, 42(2): 294–307. doi:10.1007/BF02198856

  • Yang, Ziheng and Bruce Rannala, 1997, “Bayesian Phylogenetic Inference Using DNA Sequences: A Markov Chain Monte Carlo Method”, Molecular Biology and Evolution, 14(7): 717–724. doi:10.1093/oxfordjournals.molbev.a025811

  • –––, 2010, “Bayesian Species Delimitation Using Multilocus Sequence Data”, Proceedings of the National Academy of Sciences, 107(20): 9264–9269. doi:10.1073/pnas.0913022107

  • –––, 2012, “Molecular Phylogenetics: Principles and Practice”, Nature Reviews Genetics, 13(5): 303–314. doi:10.1038/nrg3186

  • Zuckerkandl, Emile and Linus Pauling, 1962, “Molecular Disease, Evolution, and Genic Heterogeneity”, in Horizons in Biochemistry: Albert Szent-Györgyi Dedicatory Volume, Michael Kasha and Bernard Pullman (eds.), New York: Academic Press, 189–225.

  • –––, 1965, “Evolutionary Divergence and Convergence in Proteins”, in Evolving Genes and Proteins, Vernon Bryson and Henry J. Vogel (eds.), New York: Academic Press, 97–166. doi:10.1016/B978-1-4832-2734-4.50017-6

  • Zuckerkandl, Emile and Walter A. Schroeder, 1961, “Amino-Acid Composition of the Polypeptide Chains of Gorilla Haemoglobin”, Nature, 192(4806): 984–985. doi:10.1038/192984a0

Academic Tools

Other Internet Resources

adaptationism | biology: philosophy of | developmental biology | developmental biology: evolution and development | empiricism: logical | evolution | evolution: cultural | genetics: ecological | genomics and postgenomics | microbiology, philosophy of | molecular biology | Popper, Karl | species | statistics, philosophy of | underdetermination, of scientific theories

Copyright © 2022 by Matt Haber <matt.haber@utah.edu> Joel Velasco <joel.velasco@ttu.edu>

最后更新于

Logo

道长哲学研讨会 2024