基因组学和后基因组学 genomics and postgenomics (Stephan Guttinger and John Dupré)

首次发布于 2016 年 10 月 20 日星期四

大约 30 年前,研究人员和其他利益相关者开始建立第一个基因组学计划,即人类基因组计划(HGP)(请参阅下面其他互联网资源部分中有关人类基因组计划(HGP)的链接)。1980 年代构想的一项大胆计划于 1990 年成为一个官方的多中心、国际性项目,并于 2003 年完成。

十多年后,基因组学仍然是一个大生意(也是一个大生意):奥巴马政府在 2015 年 1 月宣布他们打算测序一百万人类基因组(请参阅下面其他互联网资源部分中的精准医学计划;另请参阅 Reardon 2015)。商业头脑的克雷格·文特(Craig Venter)再次加入其中,这次参与了一个私人资助的合作项目,旨在在未来十年内测序两百万个基因组(Ledford 2016)。同样重要的是,我们不仅看到相同的参与者再次冲突,而且看到相同的承诺再次被提出,新闻稿和其他公告中再次出现“突破性的健康益处”和“新医学突破”的讨论(例如 Collins&Varmus 2015 或 NIH 2015)。

但现在也有许多不同之处。例如,中国已经成为基因组学领域的重要参与者,北京基因组研究所(BGI,前身为北京基因组研究所)已经在 2011 年宣布旨在测序一百万个基因组。此外,DNA 测序不再是这些大规模计划的唯一目标:新基因组学当然仍然是以基因组为基础的工作,但它是一个转变的企业,也关注有关蛋白质、DNA 甲基化模式或被研究对象的生理和环境数据;DNA 序列数据现在仅构成推动所谓“精准”或“个性化”医学的更大画面的一部分。诸如此类的发展导致许多人将当下称为“后基因组”时代(Richardson&Stevens 2015)。本条目的目标是审视这个不断发展的基因组学和后基因组学研究领域,并概述其中引发的一些核心哲学问题。

第 1 部分将介绍和讨论几个关键术语,如“基因组”或“基因组学”。第 2 部分将转向阅读和解释基因组意味着什么的问题。人类基因组的测序和绘图涉及什么,以及在人类基因组计划背景下出现了哪些哲学问题?测序是如何演变为一个更大的“后基因组”企业的,这一转变带来了哪些问题?为了回答最后一个问题,第 3 部分将考虑两个不同的项目,也许是新兴领域,即 HapMap 项目和宏基因组学。在补充文件《ENCODE 项目和 ENCODE 争议》中,我们将研究 ENCODE 项目及其周围的争议。这三个案例将突出在基因组学和后基因组学背景下一再出现的关键问题。

指出本文不涉及的内容也很重要。斯坦福哲学百科全书(SEP)中已经有许多条目专门涉及基因、遗传学以及 HGP,因此,本条目不会详细讨论“基因”概念的历史或哲学问题(请参阅 SEP 条目基因,以及分子生物学、分子遗传学和人类基因组计划的条目),也不会涉及 HGP 的历史(请参阅 SEP 条目,人类基因组计划)。在基因组学中也起到作用的更广泛问题,如生物信息的概念和还原主义问题,也已在一系列 SEP 条目中讨论过(有关还原主义的更多信息,请参阅生物学中的还原主义;基因;HGP;和分子遗传学,有关“遗传程序”隐喻和生物信息的更多信息,请参阅生物信息;基因;分子遗传学;和分子生物学的条目)。此外,可能最重要的是,我们的重点将放在基因组学引发的认识论、本体论和方法论问题上,而不是 DNA 测序不可避免带来的伦理、法律和社会问题(但请参阅 HGP 条目以获取更多信息)。


1. 术语和定义

1.1 基因—基因组—基因组学

“基因组学”一词源自“基因组”一词,而“基因组”本身部分源自“基因”一词。这些不同术语的含义和关系绝非简单。

“基因”一词是由丹麦生物学家威廉·约翰森(Wilhelm Johannsen)于 1909 年引入的,他用它来指代规定生物体遗传特征的(当时尚未表征的)元素(请参阅“基因”和“分子遗传学”条目,了解“基因”一词复杂历史的概述)。

1920 年,德国植物学家汉斯·温克勒(Hans Winkler,1877-1945)在他的著作《植物和动物王国中无性生殖的普遍性和原因》(Prevalence and Cause of Parthenogenesis in the Plant and Animal Kingdom)中引入了术语“基因组”。温克勒对这一术语的定义如下:

我建议使用“基因组”这个表达来表示与相关原生质一起构成系统单位的单倍体染色体组 [...].(温克勒 1920: 165)

我建议使用“基因组”这个表达来表示与相关原生质一起构成系统单位的单倍体染色体组 [通常翻译为“物种”]。(S.G.翻译)

该术语的词源尚不清楚,但大多数作者和百科全书条目认为它是德语单词“Gen”和“Chromosom”的组合,导致了复合词“Genom”。一般来说,后缀-ome 的起源和不同含义并不完全清楚,现在有几种解释试图为当代生命科学中不断蓬勃发展的-omes 术语带来一些结构和/或含义(参见,例如,Lederberg&McCray 2001; Fields&Johnston 2002; Yadav 2007; Eisen 2012:Baker 2013; 有趣/娱乐性列表,请参见下面的其他互联网资源中的-omes 和-omics)。

最后,术语“基因组学”是在 1986 年的一次会议上发明的,当时几位科学家在一家酒吧里集思广益,为弗兰克·鲁德尔(耶鲁大学)和维克多·麦库西克(约翰斯·霍普金斯大学)正在建立的一本新期刊想出一个名称。这本期刊的目的是发表关于基因组的测序、图谱绘制和比较的数据。为了涵盖这些不同的活动,并类比于已经建立的遗传学学科,托马斯·罗德里克(杰克逊实验室)提出了术语“基因组学”(Kuska 1998)。与参与其中的人们不知情的是,这是生命科学史上的一个重要时刻,因为在这里首次出现了后缀-omics。

1.2 什么是基因组?

查看术语的历史和词源当然并不一定告诉我们很多关于它在当前科学背景下的使用方式。那么在当今的生命科学中,基因组是什么?它是我们在真核细胞核中找到的染色体(单倍体)组,符合温克勒最初的定义吗?还是我们在生物体中找到的基因的总体或细胞中存在的 DNA 的总体?如果是这样,那么是哪种 DNA?目前流通的大多数定义都是对这个问题的不同方法的复杂混合。这可以通过查看几个关键在线资源中给出的定义来加以说明(有关术语“基因组”的更多定义,请参见 Keller 2011 中的表 1)。

该术语在 genome.gov 网站术语表中定义:

基因组是细胞中发现的全部遗传指令。在人类中,基因组由 23 对染色体组成,这些染色体位于细胞核中,以及细胞线粒体中发现的一个小染色体。每组 23 条染色体包含大约 31 亿个碱基的 DNA 序列。(Talking Glossary: genome, in the Other Internet Resources)

这就是美国国家医学图书馆的定义方式:

基因组是一个生物体的完整 DNA 组成,包括其所有基因。每个基因组包含构建和维持该生物体所需的所有信息。在人类中,整个基因组的副本——超过 30 亿个 DNA 碱基对——包含在所有具有细胞核的细胞中。(NIH 2016)

同样地,自然杂志的教育门户网站:

基因组是生物体中的完整遗传信息组。它提供了生物体运作所需的所有信息。在生物体中,基因组存储在称为染色体的长 DNA 分子中。(Scitable: genome, in the Other Internet Resources)

所有这些定义既涉及信息,也涉及生物体发育和/或功能的指令。在前两种情况中,基因组也被认定为一种物质实体,第一种情况是染色体,第二种是一系列碱基对。自然只允许信息“存储在”染色体中。

这两个方面的结合是非常棘手的。美国国家医学图书馆的定义暗示着“构建和维持生物体所需的所有信息”都包含在 DNA 中,这显然是错误的:许多环境因素,更不用说母细胞质中的因素,都是第一个任务所需的,更明显的是(食物、光线等)是第二个任务所需的。此外,几乎总是情况下,生物体需要共生伙伴才能正常运作,这样的定义将暗示这些共生体的 DNA 是第一个生物体的基因组的一部分,这个结果很少有人会欢迎。《自然》的定义在第二句中也犯了同样的错误。genome.gov 的定义似乎将染色体既与一组指令,又与一种物质实体联系起来,这似乎将一个物质对象与一个抽象实体混为一谈,这看起来相当棘手。

这个问题并不难理解。尝试结合基因组的物质基础和信息内容,正如所有这些定义所做的那样,不可避免地假定这两者之间存在一些简单的关系;但实际上,这种关系是极其复杂的。因为基因组的信息内容在多种方式上依赖于并非基因组的一部分的元素,纯粹以信息内容来解释似乎是一个毫无希望的项目。

一个普遍认为可以迅速摒弃的观点是,基因组只是生物体基因的总和。问题在于,即使忽略了关于基因是什么的众所周知的问题(参见 Barnes&Dupré 2008 年;SEP 关于基因的条目),根据任何可行的基因定义,基因组远不止于基因,至少在人类和其他具有相对较多非编码 DNA 的生物体的情况下,染色体中实际 DNA 的只是基因组的一部分。即使“基因”被解释为最广泛的意义,包括具有某种可识别功能的基因组的任何部分,也没有人否认大量 DNA 是没有功能的。其余的 DNA 将不构成基因组的一部分,这一结果与我们所知的所有基因组定义相矛盾,并使“全基因组测序”等熟悉概念变得荒谬,该概念指的是对染色体中发现的所有 DNA 的分析。

我们建议,解决这个问题有两种最初可行的方法。[5] 第一种,也是经常被隐含或明确假定为正确的方法,是将基因组定义为核苷酸序列。这可能包含或不包含额外的 DNA,比如线粒体或叶绿体;genome.gov 的定义明确包括前者。这个问题在关于所谓的线粒体移植的道德允许性的辩论中起着重要作用(顺便说一句,这个称谓对 DNA 的几乎神奇重要性相对于细胞的其他内容来说,说得很多),但这并不是一个具有重大哲学意义的问题。另一种方法是将基因组严格理解为一个物质对象,大多数情况下可能是核染色体。

第一种方法的问题在于它在很大程度上是基于这样的假设,即核苷酸序列包含基因组中的所有重要信息。但事实上,随着对表观遗传学的日益了解,越来越清楚地认识到这并非如此。表观遗传学是研究影响基因组序列中哪些部分被转录成 RNA(基因组影响所含生物体的过程的第一阶段)的物质修饰的学科。表观遗传学中最广泛研究的两类修饰是甲基化(将甲基基团(-CH3)附加到四种核苷酸之一——胞嘧啶上)和组蛋白蛋白质的各种化学修饰,组蛋白是染色体核心结构的形成者,DNA 双螺旋就缠绕在其周围(Bickmore & van Steensel 2013; Cutter & Hayes 2015)。因此,核苷酸序列提供了(极其庞大的)基因组可能产生的转录本集合,但基因组的表观状态决定了实际产生的转录本(Jones 2012)。因此,如果我们想要理解整个系统的生物学相关行为,那么基因组的这两个特征(作为物质对象)必须被指定。

因此,如果以序列来定义基因组的动机是为了捕捉其信息内容,那么这个定义就无法实现其目标。事实上,最接近这个目标的定义是将基因组识别为物质对象,即染色体组成的集合(这种对基因组的解释在 Barnes&Dupré 2008 年的详细论述中得到了支持)。这个定义的一个含义,生物学家经常认为是违反直觉的,即根据这个定义,基因组将不仅包括 DNA,还包括作为染色体物质组成部分的组蛋白蛋白质。但当然,前面讨论的要点是组蛋白的可变化学状态实际上是基因组中一些信息固有的基础。

甲基化现象以稍微不同的方式表明了同样的观点。构成熟悉序列的核苷酸是胞嘧啶、胸腺嘧啶、腺嘌呤和鸟嘌呤。当甲基基团附着到胞嘧啶分子时,所得的核苷酸严格来说不是胞嘧啶,而是 5-甲基胞嘧啶。因此,除非将序列的标准表示中的字母'C'解释为“胞嘧啶或 5-甲基胞嘧啶”,否则它只是对基因组特征的部分准确表示。更重要的是,这种表示未能捕捉基因组的关键功能方面。

最后一个关键点是,最近清楚地表明,基因组作为物质对象具有远远超出基因组学(Bustin&Misteli 2016)最广泛解释的功能。基因组似乎在一系列细胞过程中发挥着至关重要的作用。首先,其物理排列成各种大小的区域在基因表达的协调中起着核心作用。但远非基因学,它是一个大对象,其中的机械力参与各种细胞过程和细胞稳态,并且染色质纤维为蛋白质和膜提供支架(Bustin&Misteli 2016)。除非我们要引入一个新词来指代这个在生物学中至关重要的实体,否则只有对基因组的物质概念才能捕捉其全部活动范围。

有人可能会对上述关于甲基化的论点提出异议,认为虽然甲基化是一种相对短暂的状态,但底层的四个字母序列却极其持久,可以延续多代。Richard Dawkins(1976)曾着名强调了这种持久性在演化中的重要性,甚至将基因描述为“不朽的”。因此,也许有充分理由将“C”理解为指代一个分离。

这并不是讨论基因不朽的准神学观点的地方。然而,这确实指出了关于基因本质的一个根本问题。即使基因以某种方式是不变的不朽物质,基因组却并非如此。基因组是一个极其动态的实体,不断地改变其属性,通常是对环境做出适应性响应。此外,即使其核苷酸序列的恒定性也仅仅是通过不断应用各种编辑和修复机制来维持的。事实上,我们认为它远非永恒的物质,更好地将其视为一个过程,一个在维持结构和功能稳定性方面至关重要的高度复杂的动态活动集合,不仅对生物体本身的稳定性至关重要,而且通过其在繁殖中的作用,对谱系的稳定性也至关重要。重要的是,这些关系是双向的,具体而言,生物体对于维持基因组的必要稳定性方面也至关重要。[6]

2. 阅读基因组

第一个被测序的基因组是病毒的基因组,即细菌噬菌体 ΦX174 的基因组,由弗雷德里克·桑格(Frederick Sanger)于 1977 年测序(Sanger 等,1977 年)。直到 1985 年左右,世界各地的不同实验室开始对几种其他病毒进行研究,甚至开始测序模式生物,如细菌大肠杆菌或线虫秀丽隐杆线虫。[7]

在当时的各种不同测序工作中,人类基因组计划(HGP)当然是最突出的。人类基因组不仅相对较大(大约 32 亿个碱基对(bps)),对我们作为人类具有重要意义,而且 HGP 本身被设想为一个多样化的大规模研究项目,具有各种不同的方向和目标。从这个项目中获取序列是在更广泛媒体中引起最多关注的一个目标,但许多人肯定会同意,在 HGP 中发展的其他发现和实践同样重要,甚至更为重要。

在接下来的内容中,我们将把 HGP 视为基因组学发展为一个研究领域和一套技术的中心。为了便于阐述,我们将在这里谈论一个 HGP 前期和一个 HGP 后期。显然,这是一个简化;基因组学故事并不只沿着一个单一轨迹发展,也没有一个明确的 HGP 前后基因组时代之间的明显分界线(Richardson&Stevens 2015)。然而,作为结构化讨论的一种方式,这种区分将是一个有用的工具。

2.1 进入 HGP 前期

在 Sanger 和 Maxam 以及 Gilbert 于 1975 年发表其 DNA 测序方法十年后,第一次关于人类基因组计划的具体讨论开始出现在文献中(Dulbecco 1986),以及在不同的研讨会上(Sinsheimer 1989;Palca 1986)。人类基因组计划(HGP)本身于 1990 年成为现实,当时它作为美国联邦计划正式启动(请参阅下面其他互联网资源部分的 1990 年简史和时间表 [NHGRI])。

在人类基因组计划启动之前,人们对其寄予了很高的期望(有人会说“炒作”),这不可避免地也引起了该项目的批评者(Koshland 1989;Luria 等,1989)的关注。像往常一样,资金问题起着关键作用。当人类基因组计划启动时,在生命科学领域并没有正在进行的“大科学”项目。因此,HGP 对于生物学来说是一个真正的首次。但是,推动这样一个吸收了生物科学拨款中相当比例的资金的大型项目,遭遇了许多其他科学家的阻力。

有三个关键批评:1)一些人声称 HGP 是浪费金钱,因为测序了许多无用(即:垃圾)的 DNA;重点应更直接地放在基因组的功能部分,即基因或调控元件上,这可以通过更简单和更便宜的方法实现(Brenner 1990;Weinberg 1991;Rechsteiner 1991;Lewontin 1992;Rosenberg 1994)。其他人声称 2)HGP 是浪费金钱,因为它仅仅是一个描述性的项目,而不是一个假设驱动的项目。这个问题在该项目完成十年后变得更加突出,当人们意识到大数据科学已经到来时(例如,参见 Weinberg 2010)。

最后但同样重要的是,还有批评 3)认为 HGP 在根本上是错误的,因为它假定仅凭借序列知识就能理解我们的身体如何运作,如何发展疾病,并且这种理解最终将导致治愈许多疾病(Lewontin 1992; Tauber & Sarkar 1992; Kitcher 1994)。这种更一般性的批评针对生物医学问题狭隘地聚焦于序列的方法也在 20 年后出现在关于使用常见遗传变体了解常见疾病和特征的讨论中(见第 3.1.2 节)。

评估这种批评是困难的。毫无疑问,对 HGP 和许多其他基因组学后继项目的热情往往建立在对 DNA 力量以及其在生物系统中的卓越作用的简化假设之上。另一方面,可以争论的是,许多意想不到的好处实际上是独立于这些假设而来自基因组学。例如,能够对基因组序列进行非常精确的比较已经带来了在揭示进化历史细节方面的重大进展,更不用说其在法医 DNA 测试等技术中的应用了。此外,可以认为,正如 Waters(2007b)所说,使基因组在生物研究中如此核心的不是错误地认为它们是一切的最终原因,而是它们为对生物体或细胞进行精确干预提供的独特可能性。

2.2 HGP 的结果和影响

HGP 的主要产出通常被视为“人类基因组序列”。人类基因组草稿序列(约 90%完成)于 2000 年 6 月宣布,随后在 2001 年公布了 HGP(国际人类基因组测序协会 2001)和私人资助计划(文特等人 2001)产生的草稿序列。人类基因组的完整(或几乎完整(99%))序列于 2003 年发布,这也标志着 HGP 的正式结束(国际人类基因组测序协会 2004)。

但认为“人类”基因组序列是关键产出的观点在几个方面都是错误的。首先,一般来说,并不存在所谓的“人类”基因组,因为每个个体(除了单卵双生子外)在其基因组中携带自己一套小大变异。在 HGP 中产生的序列仅仅是一个特定序列的示例,意味着它只能作为参考基因组。重要的是,HGP 和文特项目提供的参考序列并不对应于单个人的基因组,因为用于生成它们的 DNA 来源于多个个体。这两个测序工作产生的基因组因此是复合参考序列。但 HGP 不仅仅产生了 DNA 序列。在这里,我们将强调 HGP 的三个结果或方面,这对于项目完成后的时期也很重要。

HGP 的一个关键特点是涉及对一系列不同模式生物的基因组测序,这一方面在哲学文献和其他地方对该项目的讨论中经常被忽视(Ankeny 2001;有关已测序基因组的可搜索列表,请参阅下面其他互联网资源部分的有关生物体的基因组信息)。HGP 不仅提供了人类的第一个参考基因组,还提供了第一个细菌基因组(流感嗜血杆菌,Fleischmann 等人,1995 年),第一个真核基因组(酿酒酵母,Goffeau 等人,1996 年)以及关键模式生物的基因组(大肠杆菌,Blattner 等人,1997 年;秀丽隐杆线虫,C. elegans 测序 consorium,1998 年;拟南芥,拟南芥基因组计划,2000 年;果蝇,Adams 等人,2000 年,Myers 等人,2000 年)。

HGP 带来的另一个关键成果是技术发展的加速。可以肯定地说,如果没有 HGP(以及随后由国家人类基因组研究所(NHGRI)于 2004 年创建的先进测序技术奖等后续举措(NIH 2004 年)),下一代测序(NGS)方法的快速发展不会如此迅速,整个基因组测序的成本也不会像现在这样迅速下降(有关 NGS 发展的评论,请参阅 Mardis 2011)。而这些测序技术的改进还带来了进一步的后果,例如使科学家能够以不同方式和从不同来源采样 DNA,因为新的测序方法可以更快速地处理更多的 DNA 材料,并且可以使用更少的起始材料。最终,这使得全新的亚学科成为可能,例如宏基因组学(请参见第 3.2 节)。

基因组计划的最后一个值得注意的成果是科学家们对基因组结构的了解。从基因组计划开始,并在进一步研究的基础上,研究人员对人类基因组的精细结构、动态和功能获得了更加详细的图景。人类基因组中存在的基因数量比预期的要少得多,而且还存在着更多的重复 DNA 和可移动元件(据估计,约 45%的人类 DNA 由可移动元件或其不活跃残留物组成)。这些发现涉及到一个更一般和更古老的关于基因组大小和复杂性的讨论,我们接下来将转向这个话题。

2.3 基因组大小、C 值悖论和垃圾 DNA

自 20 世纪 50 年代以来,人们就已经知道不同生物体之间的基因组大小差异很大(Mirsky & Ris 1951;另请参阅 Gregory 2001),但从一开始就清楚这种多样性具有一些令人惊讶的特征。其中一个特征是生物体的复杂性与其基因组大小之间缺乏相关性。

2.3.1 基因组学和后基因组学中的 C 值悖论

假设基因组的信息化解释,人们会预期一个生物体越复杂,其基因组中应该包含更多的 DNA(事实上,至少直到 1960 年左右,许多生物学家都是这样假设的)。如何定义和评估生物体的复杂性是一个棘手的问题,但直觉上似乎合理地假设,一个单细胞的阿米巴比洋葱更简单,而洋葱比人类这样的大型后生动物更简单,无论是在工作复杂性还是生物体结构方面。人们期望人类细胞的 DNA 含量应该比洋葱或阿米巴要大得多。然而,事实证明,洋葱和阿米巴的基因组比人类更大。例如,洋葱的基因组约有 160 亿个碱基对,这意味着它大约是人类基因组大小的五倍(Gregory 2007)。在许多其他情况下也可以找到基因组大小与复杂性之间的缺乏相关性(有关不同基因组大小的概述,请参见下面其他互联网资源部分的动物基因组大小数据库)。

早期还发现,同一属中非常相似的物种在基因组大小上存在很大变异,尽管它们具有相似的表型和核型(即基因组中染色体的数量和形状)。例如,在毛茛科中,DNA 含量变化高达 80 倍(Rothfels 等人,1966 年)。此外,Holm-Hansen(1969 年)表明,尽管所有单细胞藻类物种在发育复杂性上相似,但它们的 DNA 含量存在 2000 倍的差异。正是这些发现给予了解决这一被称为 C 值悖论(Thomas,1971 年)的差异的迫切性。术语“C 值”指的是每个细胞核中单倍体 DNA 的恒定(“C”)量(“值”),以 DNA 每个细胞核的皮克克拉姆为单位进行测量。C 值是衡量每个基因组含有的 DNA 量的指标(我们可以看到这里 Winkler 对基因组的原始定义正在发挥作用)。

2.3.2 废弃 DNA

这些关于基因组大小的讨论与基因数量的担忧密切相关。基因组大小与基因数量的考虑正是最初引发“废弃 DNA”概念的原因(Ohno,1972 年)。这一概念背后的推理是:如果假设 a)更复杂的生物将比较简单的生物具有更多的 DNA,b)基因数量与基因组大小成比例增加,那么更复杂生物的基因组应该比较简单生物的基因组含有更多的基因。例如,人类细胞的 DNA 含量约为大肠杆菌的 750 倍,这意味着人类细胞应该拥有约 370 万个基因,因为大肠杆菌约有 5000 个基因。显然情况并非如此;即使在 20 世纪 70 年代,人们普遍认为人类基因组可能含有不超过 15 万个基因(Crollius 等人,2000 年)。这种差异导致结论:我们基因组中绝大多数的 DNA 不可能是基因,因此正如 Ohno 所说的那样是“废弃物”。

垃圾 DNA 讨论引起的问题也被称为“G 值悖论”(‘G’代表‘基因’),直接涉及生物体中基因数量与复杂性之间的差异(Hahn & Wray 2002)。这一悖论得到了 HGP 的研究结果的支持。正如 Gregory(2005)和其他评论者所指出的,人类基因组包含的基因数量远少于预期是 HGP 最令人惊讶的结果之一。项目开始前的初步估计范围在 50,000 到 150,000 之间。在 2001 年第一份序列草稿发布后,这些估计减少到大约 30,000 至 35,000,现在进一步修订为约 20,000(Gregory 2001)。

一些研究人员认为通过认识到基因组中存在非编码 DNA,C 值悖论已得到充分解决(Gregory 2001)。‘简单’生物体中较大的基因组大小仅意味着它们拥有大量的非编码 DNA。但正如 Gregory 所指出的,我们基因组中大部分 DNA 是非编码的这一事实,可能使 C 值的差异不再是一个悖论,但却引发了一系列更多的谜团(这额外的 DNA 来自哪里?它的功能是什么?等等),这就是为什么他建议将 C 值称为一个谜团而不是一个悖论(Gregory 2001)。C 值谜团包含许多不同和层叠的问题,这些问题需要多元化的方法来回答,Gregory 如此声称。

2001 年发布的基因组草案和 2003 年 HGP 的结束并没有为研究人员提供解决这些长期问题所需的所有工具和见解。但是在 HGP 之后,研究人员可以在最初的测序工作基础上继续深入了解基因组的运作,超越了单纯的序列。这使他们能够更直接地解决诸如垃圾 DNA 的重要性和 C 值悖论等问题(或者至少从不同角度解决)。后 HGP 阶段还以对最佳研究方法的激烈辩论为特征:生物研究是否最好以小规模还是大规模进行的问题在后 HGP 时代一再出现,特别是随着其他后 HGP 大规模项目的兴起。下一部分将讨论象征着后 HGP 时代各种努力和愿望的两个项目/研究领域,这些项目/研究领域将有助于阐明这些发展引发的一些哲学问题。

超越测序

后 HGP 阶段以不同项目蓬勃发展为特征,这些项目与 HGP 的起源密切相关,但在许多方面超越了 HGP。本节讨论了两个这样的后 HGP 项目,即国际 HapMap 项目和一个名为“宏基因组学”的新研究领域。这些例子指出了后基因组时代发展方向的一些重要方向,并确定了标志这一新时期的一些关键特征和问题,尽管肯定不是全部。

3.1 国际 HapMap 项目

国际 HapMap 项目是一个于 2002 年启动的多中心项目,于 2005 年初步结束(NIH 2002)。缩写‘HapMap’代表‘单倍型图谱’,间接地指的是该项目的主要目标,即绘制人类基因组中的常见遗传变异。

3.1.1 HapMap 项目与基因组变异

众所周知,每个人的基因组都是不同的。然而,个体的基因组之间可以以几种方式不同,从较长的 DNA 片段的缺失、插入或重排到染色体特定位置的单个核苷酸差异。后一种变异形式是 HapMap 项目的重点。如果我们比对两个个体的 DNA 序列,它们在数百个核苷酸上将是相同的;两个人的 DNA 通常显示大约 99.9%的序列同一性(Li&Sadler 1991;Wang 等,1998;Cargill 等,1999)。但是 0.1%的差异意味着大约每 1000 个核苷酸中将在任何两个个体之间有一个单个核苷酸的差异。

特定基因组位点的任何变异被称为“等位基因”。如果在染色体上的特定位点上可以在人群中找到一个基因的两个不同版本,那么这意味着该人群中存在该基因的两个不同等位基因。如果这些单个核苷酸等位基因中的一个在特定人群中超过 1%,则被视为“常见”变异,研究人员称之为“多态性”,或者更准确地说是“单核苷酸多态性”(缩写为“SNP”;发音为“snip”)。如果在人群中发现的变异少于 1%,研究人员简单地称之为“突变”(或者也称为“点突变”)。每个个体平均有约 300 万个 SNP,整个人类群体中存在超过 1000 万个 SNP 池(HapMap 2005)。

许多这些等位基因是(或有更高的遗传可能性)一起遗传的,这意味着它们在减数分裂过程中不容易通过重组事件分离。这导致了不同等位基因在两个或更多位点上的非随机关联,这一现象被称为“连锁不平衡”或“LD”。LD 的概念对 HapMap 项目至关重要,因为一些 SNP 保持关联(而簇本身可能会随着时间通过重组事件分离),这解释了基因组的单倍型结构。术语“单倍型”简单地指的是一组特定的等位基因(在这种情况下是 SNP),这些等位基因 a)位于同一染色体上,b)通常作为一个整体遗传。HapMap 项目的目标是描述人类 SNP,它们在不同人群中的频率以及它们之间的相关性。第一份单倍型图谱于 2005 年发布,报告了来自四个不同人群的 269 个样本的数据。五年后,又发表了一份后续报告,这次报告了来自 11 个不同人群的 1184 个个体的数据。

认识到基因组中的遗传变异结构可以用单倍型来理解至少有两个重要原因。首先,这为在群体中进行(单核苷酸)遗传变异的相对简单和高效分析打开了大门:SNP 的聚类意味着原则上只需测试每个簇中的一个或几个 SNP(所谓的“标记 SNP”)即可验证整个变体簇的存在。这使得在整个基因组水平上对大量受试者的遗传变异进行分析成为可能,而在那个时候,全基因组测序对于这样的任务来说仍然过于昂贵(HapMap 2003)。因此,单倍型图的发展是实现现在所谓的“全基因组关联研究”(GWAS)的关键一步(见第 3.1.2 节)。

其次,由于单倍型的分布在不同人群之间有所不同,HapMap 项目着重于从不同人群中取样 DNA。这是这类研究的一个重要方面,因为它无意中将种族问题和其生物学基础的问题重新引入到基因组学中。这一点将在第 3.1.4 节中重新讨论。

3.1.2 HapMap、GWAS 和个性化医学的理念

驱动 HapMap 项目的一个关键点是 SNP 可用于揭示个体 DNA 序列与特定疾病或特征之间的关联。从表面上看,SNP 只是一个人基因组中的一个区分标记。这些标记使研究人员能够筛选具有不同表型的人群,例如那些患有某种疾病(例如高血压)和那些没有患病的人。通过观察两组中特定 SNP 或单倍型的频率,研究人员可以利用统计分析来洞察特定 SNP 或单倍型与特征之间的关联(Cardon & Bell 2001)。如上所述,这种分析可以集中在被视为整个 SNP 群的代理的标记 SNP 上(如果该群具有高 LD)。

一旦一个单倍型与特定疾病相关联,其他人就可以筛选出是否存在该单倍型,从而了解他们所属的风险群体。尽管该测试不会告诉携带与疾病相关的 SNP 的人是否会患病,但它仍然可以为他们提供一些关于患病几率的信息。此外,即使标记 SNP 本身可能不是导致表型变异的遗传变异,它可能与所谓的“因果 SNP” 相关。因此,了解与疾病或特征相关的 SNP 可以为研究人员提供线索,指出哪些基因或调控 DNA 区域可能在该疾病的发展中起因果作用。因此,关联研究的发现在某些情况下可以有助于分析疾病本身。

最初,HapMap 仅寻找常见变异(根据定义,SNP 仅包括常见变异)。这与 Lander(1996)、Cargill 等人(1999)和 Chakravarti(1999)提出的所谓常见疾病/常见变异(CD/CV)假设一致。[18] 这一假设大致上认为,常见疾病与人群中常见的遗传变异有关。

常见变异与常见疾病之间的联系也解释了为什么 HapMap 项目在确定人类基因组序列之后就被宣传为“下一个重大事件”:正是通过单倍型图谱,基因组学才真正开始对生物医学研究产生影响,最终影响我们对疾病的理解。[19]

3.1.3 HapMap 及其批评者

但是 HapMap 项目并非没有批评者;事实上,生物学家大卫·博茨坦称其为“一次伟大的失败”(引自霍尔 2010 年)。[20] 例如,一些评论者担心该项目只不过是一个填补已完成人类基因组计划留下的空白的填鸭式项目,因此是对宝贵资金的浪费(库辛 2002 年)。但更多时候,对 HapMap 项目的批评是关于后人类基因组计划研究应该如何进行的更广泛辩论的一部分。因此,HapMap 项目可以提供一个有用的窗口,展示了标志(或玷污)后人类基因组计划时代的一些关键倾向和争议。

HapMap 的一种间接批评源自 GWAS 未能为研究人员提供关于我们遗传基因与我们的身体可能患病情况之间联系更清晰信息的明显失败。在这些批评者看来,CD/CV 假说是关键问题,因为常见变异根本无法解释常见疾病的遗传性的大部分。这一观察引发了“遗传性缺失”的概念(艾克勒等人 2010 年)。

基因组学中对常见变异的普遍关注受到其他作者的批评,他们声称遗传学家的重点应该放在罕见变异上(McClellan & King 2010)。他们声称,这些罕见变异是缺失遗传性将被发现的地方。罕见变异的问题在于它们无法在使用 SNP 数据库的 GWAS 中被检测到,因为 SNP 从定义上是常见变异。此外,发现罕见变异是一个技术挑战,因为研究人员必须分析非常多个体的基因组数据才能可靠地做到这一点。对罕见变异的追寻是当前推动测序数百万(而不是数百或数千)基因组的主要原因之一。正如前面讨论的那样,由于下一代 DNA 测序成本降低和速度提高,这种大规模方法近年来变得可行。

当前转向全基因组测序也将有助于解决对 GWAS/SNP/HapMap 方法的另一个批评,即其严格关注基因组中单个碱基对变化。基因组中的其他变化,例如重复元件拷贝数的变化或基因组 DNA 较大片段的重排、缺失或插入,在许多情况下可能是疾病核心所在,这需要(再次)将焦点从点突变和单个基因转移到整个基因组(Lupski 1998, 2009)。

作为对原始 HGP 的首批后续项目之一,HapMap 项目经常成为讨论 HGP 遗产的话题。这类讨论在草拟基因组序列发表十周年时变得尤为突出。总的来说,在医学领域,人们对 HGP 的成果普遍感到失望。考虑到该项目在上世纪 80 年代启动时以及 2000 年在白宫演示时所做的宏伟承诺,人们对 2010/2011 年之前所取得的成就感到不足为奇。有趣的是,不仅是像 Lewontin(2011)这样的常规批评者,甚至 HGP 本身的主要支持者也对该项目进行了批评,并指出了第一个后 HGP 十年中取得的最小医学进展(Collins 2010;Venter 2010)。

然而,所有批评者,包括上述人士,都同意一点,即使对医学实践的影响微乎其微,HGP 已经改变了生物研究(例如 Wade 2010;Varmus 2010;Hall 2010;Butler 2010;Green 等人 2011)。基因组研究从根本上改变了一个领域的概念和实践,即对基因以及基因表达的理解和调控(Keller 2000;Moss 2003;Dupré 2005;Griffiths&Stotz 2006;Stotz 等人 2006;Check 2010)。Evelyn Fox Keller 在 2000 年已经有远见地指出,HGP 之所以有趣,不仅仅是因为它产生了原始序列,更因为它在我们对“基因”和 DNA 的期望方面带来的转变(Keller 2000)。

3.1.4 HapMap、基因组学和种族

正如上文所提到的,HapMap 利用来自不同人群的样本,将种族概念引入了该项目的讨论中。研究人群之间的基因变异(其中 HapMap 是一个关键代表)是最近几项发展中的一部分(Duster 2015),重新点燃了关于 a)种族生物学现实和 b)种族分类是否应该在生物医学研究中使用的讨论。一些作者已经探讨了 HapMap 项目与对种族关注的新兴关系(参见,例如,Ossorio 2005;Duster 2005;Hamilton 2008)。主导这些讨论的问题是种族分类是否反映了‘生物学现实’。

种族当然长期以来一直是流行病学和临床研究中的重要话题(Witzig 1996;Stolley 1999),但它被广泛认为是一个没有生物学基础的社会构建类别。[22] 许多研究人员认为,随着 HGP 展示了任何两个人在 DNA 水平上是多么相似,种族概念作为严肃的生物概念的任何想法将被一劳永逸地摒弃(参见,例如,Gilbert 1992;Venter 2000)。但是,生物种族概念在基因组学的发展中反而得到了复兴,而不是被搁置(Kaufman & Cooper 2001;Foster & Sharp 2002;Hamilton 2008;Roberts 2011)。这一点的例证是,越来越多的科学家近年来声称我们传统种族概念有生物学基础,他们的主张基于从大量人类 DNA 样本中得出的基因变异数据的复杂统计分析。这些发展导致许多人对 Troy Duster 所说的‘后基因组学惊喜’(Duster 2015)感到惊讶。

在这里的一个重要观点是,将基因组学和种族联系起来并不意味着研究人员在寻找或甚至存在任何“种族基因”,即使我们考虑到这个术语可以被解释的许多不同方式(Dupré 2008)。关于种族可能的遗传基础的讨论现在更加微妙,因为它不仅仅关注特定基因或 DNA 元素的存在与缺失,因此也不涉及某种生物学本质的种族,而是涉及感兴趣人群中等位基因频率的变化(Gannett 2001, 2004)。因此,问题不在于 DNA 元素 X 在一种人群中存在还是不存在,而在于 X 的哪个变体以何种频率存在于人群中(在 HapMap 研究人员将谈论 SNP 频率的背景下)。

人口遗传学的数据显示,人类种群中等位基因频率的全球分布并非不连续(Jorde & Wooding 2004; Feldman & Lewontin 2008),而是呈梯度变化,这意味着人类 DNA 序列在地理空间上以逐渐的方式变化(Livingstone 1962; Serre & Pääbo 2004; Barbujani & Colonna 2010)。此外,无论是遗传特征还是表型特征都显示出所谓的“不一致”的梯度变化,这意味着不同特征不一定与彼此协变;特征 A 在地理空间上的变化模式可能与特征 B 展示的模式大不相同(Livingstone 1962; Goodman 2000; Jorde & Wooding 2004)。

然而,尽管这些被广泛接受的发现,正是在讨论这些分布时,关于我们对种族分类传统理解的生物学基础的观念重新出现。基于对来自全球各地样本中大量基因变异的分析,许多研究人员声称人类基因变异显示出地理聚类(参见,例如,Rosenberg 等人 2002 年;Edwards 2003 年;Burchard 等人 2003 年;Bamshad 等人 2003 年;Leroi 2005 年;Tang 等人 2005 年)。重要的是,这些发现通常也引发了或被解释为支持这种地理分布与我们传统的种族分类相匹配的说法。

这些发现也导致许多作者声称种族在生物医学研究中仍然具有有效的地位:由于这些分类应该描述内部基因上相似但与其他群体基因上不同的群体,它们可以作为有用的替代品,用于估计例如群体成员患某种特定疾病的平均风险(参见,例如,Xie 等人 2001 年;Wood 2001 年;Risch 等人 2002 年;Rosenberg 等人 2002 年;Shiao 等人 2012 年)。一些作者更加谨慎,声称种族只应作为一种宽松和临时的替代品(Foster&Sharp 2002 年;Jorde&Wooding 2004 年),一旦我们了解与特定疾病或特征相关的实际遗传变异,就应该放弃种族(Jorde&Wooding 2004 年;Leroi 2005 年;Dupré 2008 年)。这些批评者可能会指出,这些遗传研究最多只能表明一个人的遗传变异与其地理起源之间存在相关性,仅因为变异起源于特定地点;并且社会构建的种族概念与地理起源之间存在着宽松的关系。但考虑到这种生成的感知或自我识别的种族类别与遗传构成之间的脆弱联系,种族是任何实际上可能与疾病相关的遗传信息的不恰当替代品。

但也有一群研究人员并不相信这些分析,并认为种族概念没有任何生物学基础(参见 Schwartz 2001; Duster 2005, 2006; Krieger 2000; Ossorio 2005)。所有这些作者都批评上述研究以及它们所确定的基因变异的地理聚类,主要是因为样本收集方式存在缺陷(参见 Duster 2015)以及数据最终分析的方式。后一种批评主要集中在“Structure”程序上,该程序被上述大多数研究使用来产生基因变异的聚类(Bolnick 2008; Kalinowski, 2011; Fujimura 等,2014)。一个显著的批评是,虽然 Structure 可以报告存在五个显示出独特等位基因频率并且大致符合传统种族概念(非洲人、亚洲人、欧洲人等)的主要地理聚类,但该程序同样可以设置为报告任意选择的不同基因组数量,因为用户必须在将 Structure 程序应用于任何实际数据集之前指定他们要寻找的聚类数量。

这些讨论中两个有趣的方面是,a)通常只涉及分析种族分类的生物现实的一种方式(作为基因),b)坚持将种族作为生物现实或社会构造之间的明显区别。关于 a),一些生物哲学家提出了关于种族生物学基础的替代思考方式(例如种族作为类群(Andreasen 1998),近交系(Kitcher 1999),或生态型(Pigliucci&Kaplan 2003))。这些概念的扩展带来了分类单一主义与多元主义的问题,即,是否有一种特权的分类种族的方式,以某种方式捕捉种族的“真实本质”(自然种类),或者根据理论或实际兴趣/背景有几种不同的方式(Gannett 2010)。然而,正如 Gannet 所指出的,对单一主义/多元主义辩论和自然种类的关注是有代价的,因为这可能意味着实际意义的问题被系统地忽视了(2010)。关于 b),Gannett 指出,将种族作为社会构造或生物现实之间划清界限不仅在人口遗传学的最新研究中被证明毫无意义,而且可能意味着人类历史和地球上多样性的更加混乱的现实(以及科学和社会种族概念之间的复杂互动)被忽视,导致对手头问题的分析贫乏(Gannett 2010)。

3.2 基因组学和后基因组学

基因组学和后基因组学(也称为“环境”或“群落”基因组学)是一个旨在分析微生物群落的集体基因组的研究领域。这些群落通常来自环境样本,范围从土壤到水甚至空气样本。基因组学和后基因组学的一个主要优势是它不依赖培养微生物的技术。这一点很重要,因为据估计,所有微生物中只有 1%–5%可以被培养(Amann 等人,1995 年),这一问题被称为“大板计数异常”(Staley 和 Konopka,1985 年)。

“基因组学和后基因组学”这个术语最早是在 1998 年提出的(Handelsman 等人,1998 年)。在“基因组学和后基因组学”中,“meta”前缀可以以至少三种不同的方式阅读(O’Malley,2013 年):1)作为指出基因组学和后基因组学超越培养限制的事实。2)作为强调表征基因组学和后基因组学的生物学的聚合级别方法(超越单个实体(细胞或基因组))。3)作为指出创造对微生物领域基因组多样性的全面理解的目标。

基因组学和后基因组学的方法论可以描述为一个包括以下四个步骤的过程:1)收集环境样本,2)从这些样本中分离微生物 DNA,3a)直接分析 DNA 或 3b)通过将采样的 DNA 碎片化并插入适当载体(例如可在实验室细菌菌株中传播的质粒)创建基因组 DNA 文库。然后可以使用这些基因组文库进行 4a)测序或 4b)对采样的基因组 DNA 进行功能筛选。正如步骤 4a)和 4b)之间的区别所暗示的那样,基因组学和后基因组学可以分为基于序列和基于功能的方法(Gabor 2007; Sleator 等,2008)。在前者中,收集的 DNA 被测序,以便识别样本中存在的潜在基因,并且如果可行,可以重建样本中存在的所有微生物的基因组。

基于序列的方法之所以可行,是因为测序成本大大降低,同时计算能力也得到了增强。该方法的目标是了解样本中存在的微生物的多样性和分布,并深入了解它们的功能(例如通过识别与代谢相关的酶,可以提供有关不同微生物中活跃代谢途径的线索)。这可以让我们更全面地了解样本环境中存在的微生物生态系统的运作方式。

在功能方法中,存储在基因库中的 DNA 片段通常被用于所谓的“功能筛选”。为了进行这样的筛选,研究人员将基因库质粒引入特定的细菌菌株,然后读取并表达片段上可能存在的任何编码蛋白质序列,从而产生片段编码的蛋白质。进行功能筛选的关键是创造条件,使只有表达感兴趣功能的蛋白质的细菌能够被单独分离出来(例如,通过确保只有这些细胞存活)。一旦细胞被单独分离出来,它们所含的基因库质粒就可以被回收并测序,从而使研究人员能够识别由该片段编码的蛋白质。功能元基因组学通常用于识别可用于生物技术和制药领域的新型微生物蛋白质,因此元基因组学一直是生物技术领域的一个热点(Streit & Schmitz 2004; Lorenz & Eck 2005; Culligan 等,2014; Ekkers 等,2012)。

第一个实际(基于序列的)元基因组学项目之一又一次由基因组学先驱之一 Craig Venter 执行。Venter 及其团队的目标是从养分贫乏的萨尔加索海表面取样微生物。选择这个特定环境进行这项试点研究是因为预计该微生物群落具有相对较低的多样性。这一假设被证明是错误的,该项目从海水中提取的至少 1800 种不同基因组物种中鉴定出超过一百万个推测的编码蛋白质序列。

另一项早期的基因组学和后基因组学研究包括对加利福尼亚州酸矿废水中低微生物多样性的酸性生物膜进行分析(Tyson 等,2004 年)。分析的生物膜存在于最极端的环境之一,包括极低的 pH 值(即高酸度)、相对较高的温度和高浓度的金属。重要的是,这种特定的生物膜确实显示出低复杂性,因为它仅由三种细菌和两种古菌物种组成。这种简单性极大地促进了分析工作,并使研究人员几乎完全恢复了其中两种基因组,并部分恢复了其他三种。

自那时以来进行了许多其他基因组学和后基因组学研究,这里列举它们没有太多意义,因为名单每个月都在增长。然而,需要指出的正在进行的研究方面之一是,项目变得越来越雄心勃勃。现在的趋势不仅是对基因组进行综合性研究,而且是将基因组学与其他技术结合,如代谢组学(对系统中存在的小分子进行分析)、转录组学(对微生物群落的所有 RNA 转录本进行分析)和病毒组学(对感兴趣系统中存在的所有病毒基因组进行分析)(参见 Turnbaugh 和 Gordon,2008 年;Bikel 等,2015 年)。在某种意义上,该领域正在朝着高度整合的元基因组学方法发展(Dupré 和 O’Malley(2007 年)谈到“元生物体基因组学”)。这也符合生命科学中朝着大数据和基于发现的方法的一般趋势(Ankeny 和 Leonelli,2015 年;Dolinski 和 Troyanskaya,2015 年;Leonelli,2014 年,2016 年)。

基因组学和后基因组学的崛起也与生物科学中的其他变化有关,特别是自 2000 年左右开始兴起的系统生物学(这本身与自上世纪 90 年代以来基因组学的发展密切相关)。O’Malley 和 Dupré(2005)指出,在研究诸如系统生物学之类的领域时需要做出重要区分,因为不仅在认识论上发生了变化,本体论上也发生了变化。因此,他们区分了实用主义生物学家和系统论生物学家。对于前者,‘系统’的概念仅仅是一种认识论工具。对于后者,系统成为新的基本本体单位。Doolittle 和 Zhaxybayeva(2010)声称,在基因组学中也可以看到类似的情况,即将群落或生态系统视为新的基本单位,而不是单一物种(另请参阅 Dupré 和 O’Malley 2007)。

摆脱对单个生物体或单基因组物种的关注,使我们能够更好地理解微生物学中的许多最新发现(其中基因组学发挥了关键作用)。所有这些的核心是可以在不同成员之间水平传播的移动 DNA 元素(包括不同种类的生物之间)。获得这种移动 DNA 元素可能对受体细胞的生存和繁殖能力产生关键影响。移动 DNA 因此可以成为进化过程中的关键元素,因为它成为一种‘共同资源’(McFall-Ngai 等,2013)。获得的抗生素抗性只是已知细胞通过获得 DNA 元素而获得的许多好处之一。

然后,整个社区所包含的功能元素的组成在演化时间内得以保留。社区可以被看作是生化活动的组合,而不是不同微生物谱系的集合(例如参见 Turnbaugh 等人 2009 年以及 Burke 等人 2011 年)。因此,宏基因组变成了‘社区的基因组’而不是‘基因组的社区’(Doolittle 和 Zhaxybayeva 2010)。所有这些也涉及到更一般的、目前非常活跃的关于生物学中个体性问题的讨论(Clarke 2010;Bouchard 和 Huneman 2013;Ereshefsky 和 Pedroso 2013;Guay 和 Pradeu 2015;SEP 关于生物学个体概念的条目)。

除了生物本体论中的这些问题,宏基因组学还引发了认识论问题,即我们在测序 DNA 和解释其之间的能力之间存在的差异。关于 DNA 序列解释挑战的讨论不仅仅是(元)基因组学和其他-组学方法的问题,也是生物医学更普遍以及其朝着真正个性化医学的推进的问题。这一推进的关键问题是获得个人基因组序列的成本(不断降低)与确保数据能够得到适当解释的高成本之间的差异(Bennett 等人 2005 年;Mardis 2006 年;Check 2014a,b)。这个问题与所谓的‘生物信息学瓶颈’有关,处理和解释大量序列数据是阻碍进展的主要障碍(Green 等人 2011 年;Desai 等人 2012 年;Scholz 等人 2012 年;Marx 2013 年)。在下一代测序时代,测序步骤本身不再是速率限制步骤。

4. 展望

基因组学现在已经成为所有生命科学的一个组成部分。并不是每个生命科学家现在都是基因组学家——仍然有研究人员专注于生物化学、发育或人类细胞和其他生物体的分子网络。但是,人类基因组和许多模式生物的 DNA 序列已经进入每个实验室,即使不是每天,至少在每个研究项目的某个阶段。相同的情况也适用于第 3 节讨论的遗传变异图和 ENCODE 项目生成的(有些有争议的)功能性 DNA 元素数据(请参阅附录文档《ENCODE 项目和 ENCODE 争议》)。

现在研究人员处理的数据量和许多新的“-组”不仅改变了科学,还改变了科学。正如我们在几个地方指出的那样,对基因组及其功能的洞察力已经在过去几十年中改变了研究人员对实体和过程的理解。其中一部分也是我们对“做好”科学意味着什么的理解发生了变化。因此,HPG 及其各种分支取得的成就改变了生命科学在认识论、本体论和方法论层面上的水平。

像往常一样,一个有趣甚至紧迫的问题是这一切将走向何方。预测未来可能是不可能的,但可以确定一些趋势,并可以预期在不久的将来会遵循类似的轨迹。其中一个趋势是对大数据的追求。这里的“大”不仅指数量,还指收集的不同类型数据。这种大数据驱动的衍生物是将所有不同的数据整合起来,并将其塑造成可以进一步促进我们对生物系统的理解和行为预测的模型。相对年轻的系统生物学学科,在本条目中无法详细讨论,但肯定将在这一努力中发挥关键作用。

Bibliography

  • Adams, M.D., et al., 2000, “The Genome Sequence of Drosophila melanogaster”, Science, 287(5461): 2185–2195. pmid:10731132

  • Amann, Rudolf I., Wolfgang Ludwig, and Karl-Heinz Schleifer, 1995, “Phylogenetic identification and in situ detection of individual microbial cells without cultivation”, Microbiological Reviews, 59(1): 143–169. pmcid:PMC239358

  • Amundson, Ron and George V. Lauder, 1994, “Function Without Purpose: The Uses of Causal Role Function in Evolutionary Biology”, Biology and Philosophy, 9(4): 443–469. doi:10.1007/BF00850375

  • Andreasen, Robin O., 1998, “A New Perspective on the Race Debate”, The British Journal for the Philosophy of Science, 49(2): 199–225. doi:10.1093/bjps/49.2.199

  • Ankeny, Rachel A., 2001, “Model organisms as models: understanding the ‘Lingua Franca’ of the human genome project”, Philosophy of Science, 68(3): S251–S261.

  • Ankeny, Rachel A. and Sabina Leonelli, 2015, “Valuing Data in Postgenomic Biology: How Data Donation and Curation Practices Challenge the Scientific Publication System”, in Postgenomics*: Perspectives on Biology After the Genome*, S.S. Richardson, and H. Stevens (eds.), Chapel Hill, NC: Duke University Press, pp. 126–149.

  • Arabidopsis Genome Initiative, 2000, “Analysis of the Genome Sequence of the Flowering Plant Arabidopsis thaliana”, Nature, 408(6814): 796–815. doi:10.1038/35048692

  • Baker, Monya, 2013, “Big Biology: The ‘omes Puzzle”, Nature, 494(7438): 416–419. doi:10.1038/494416a

  • Bamshad, Michael J., Stephen Wooding, W. Scott Watkins, Christopher T. Ostler, Mark A. Batzer, and Lynn B. Jorde, 2003, “Human Population Genetic Structure and Inference of Group Membership”, The American Journal of Human Genetics, 72(3): 578–589. doi:10.1086/368061

  • Barbujani, Guido and Vincenza Colonna, 2010, “Human Genome Diversity: Frequently Asked Questions”, Trends in Genetics, 26(7): 285–295. doi:10.1016/j.tig.2010.04.002

  • Barnes, Barry and John Dupré, 2008, Genomes and What to Make of Them, Chicago: University of Chicago Press.

  • Bennett, Simon T., Colin Barnes, Anthony Cox, Lisa Davies, and Clive Brown, 2005, “Toward the $1000 Human Genome”, Pharmacogenomics, 6(4): 373–382. doi:10.1517/14622416.6.4.373

  • Bickmore, Wendy A. and Bas van Steensel, 2013, “Genome Architecture: Domain Organization of Interphase Chromosomes”, Cell, 152(6): 1270–1284. doi:10.1016/j.cell.2013.02.001

  • Bikel, Shirley, Alejandra Valdez-Lara, Fernanda Cornejo-Granados, Karina Rico, Samuel Canizales-Quinteros, Xavier Soberón, Luis Del Pozo-Yauner, and Adrián Ochoa-Leyva, 2015, “Combining Metagenomics, Metatranscriptomics and Viromics to Explore Novel Microbial Interactions: Towards a Systems-level Understanding of Human Microbiome”, Computational and Structural Biotechnology Journal, 13: 390–401. doi:10.1016/j.csbj.2015.06.001

  • Blattner, Frederick R., et al., 1997, “The Complete Genome Sequence of Escherichia coli K-12”, Science, 277(5331): 1453–1462. doi:10.1126/science.277.5331.1453

  • Bolnick, Deborah A., 2008, “Individual Ancestry Inference and the Reification of Race as a Biological Phenomenon”, in Koenig et al. 2008: 70–85.

  • Bouchard, Frédéric and Philippe Huneman (eds.), 2013, From Groups to Individuals: Evolution and Emerging Individuality, Cambridge, MA: MIT Press.

  • Brenner, Sidney, 1990, “The Human Genome: The Nature of the Enterprise”, Human Genetic Information: Science, Law and Ethics, 149: 6–12. doi:10.1002/9780470513903.ch2

  • Burchard, Esteban González, Elad Ziv, Natasha Coyle, Scarlett Lin Gomez, Hua Tang, Andrew J. Karter, Joanna L. Mountain, Eliseo J. Pérez-Stable, Dean Sheppard, and Neil Risch, 2003, “The Importance of Race and Ethnic Background in Biomedical Research and Clinical Practice”, New England Journal of Medicine, 348(12): 1170–1175. doi:10.1056/NEJMsb025007

  • Burian, Richard M., 1997, “Exploratory Experimentation and the Role of Histochemical Techniques in the Work of Jean Brachet, 1938–1952”, History and Philosophy of the Life Sciences, 19(1): 27–45.

  • –––, 2007, “On MicroRNA and the Need for Exploratory Experimentation in Post-Genomic Molecular Biology”, History and Philosophy of the Life Sciences, 29(3): 285–312. pmid:18822659

  • Burke, Catherine, Peter Steinberg, Doug Rusch, Staffan Kjelleberg, and Torsten Thomas, 2011, “Bacterial Community Assembly Based on Functional Genes Rather Than Species”, Proceedings of the National Academy of Sciences, 108(34): 14288–14293.

  • Bustin, Michael and Tom Misteli, 2016, “Nongenetic Functions of the Genome”, Science, 352(6286): 671, aad6933 (7 pages). doi:10.1126/science.aad6933

  • Butler, Declan, 2010, “Human Genome at Ten: Science After the Sequence”, Nature, 465(7301): 1000–1001. doi:10.1038/4651000a

  • C. elegans Sequencing Consortium, 1998, “Genome Sequence of the Nematode C. elegans: A Platform for Investigating Biology”, Science, 282(5396): 2012–2018. doi:10.1126/science.282.5396.2012

  • Cardon, Lon R. and John I. Bell, 2001, “Association Study Designs for Complex Diseases”, Nature Reviews Genetics, 2(2): 91–99. doi:10.1038/35052543

  • Cargill, Michele, et al., 1999, “Characterization of Single-nucleotide Polymorphisms in Coding Regions of Human Genes”, Nature Genetics 22(3): 231–238. doi:10.1038/10290

  • Chakravarti, Aravinda, 1999, “Population Genetics—Making Sense Out of Sequence”, Nature Genetics, 21(1 Suppl): 56–60. doi:10.1038/4482

  • Check Hayden, Erica, 2010, “Human Genome at Ten: Life is Complicated”, Nature, 464(7289): 664–667. doi:10.1038/464664a

  • –––, 2014a, “Is the $1,000 Genome for Real?” Nature News, (15 January 2014) doi:10.1038/nature.2014.14530.

  • –––, 2014b, “The $1,000 Genome”, Nature, 507(7492): 294–5. doi:10.1038/507294a

  • Clark, Michael B., Anupma Choudhary, Martin A. Smith, Ryan J. Taft, and John S. Mattick, 2013, “The Dark Matter Rises: the Expanding World of Regulatory RNAs”, Essays in Biochemistry, 54: 1–16. doi:10.1042/bse0540001

  • Clarke, Ellen, 2010, “The Problem of Biological Individuality”, Biological Theory, 5(4): 312–325. doi:10.1162/BIOT_a_00068

  • Collins, Francis S., 2010, “Has the Revolution Arrived?” Nature, 464(7289): 674–675. doi:10.1038/464674a

  • Collins, Francis S. and Harold Varmus, 2015, “A New Initiative on Precision Medicine”, New England Journal of Medicine, 372(9): 793–795. doi:10.1056/NEJMp1500523

  • Couzin, Jennifer, 2002, “New Mapping Project Splits the Community”, Science, 296(5572): 1391. doi:10.1126/science.296.5572.1391

  • Crollius, Hugues Roest, et al., 2000, “Estimate of Human Gene Number Provided by Genome-wide Analysis Using Tetraodon nigroviridis DNA Sequence”, Nature Genetics, 25(2): 235–238. doi:10.1038/76118

  • Culligan, Earmon P., Roy D. Sleator, Julian R. Marchesi, and Colin Hill, 2014, “Metagenomics and Novel Gene Discovery: Promise and Potential for Novel Therapeutics”, Virulence, 5(3): 399–412. doi:10.4161/viru.27208

  • Cummins, Robert, 1975, “Functional Analysis”, The Journal of Philosophy, 72(20): 741–765. doi:10.2307/2024640

  • Cutter, Amber R. and Jeffrey J. Hayes, 2015, “A Brief Review of Nucleosome Structure”, FEBS Letters, 589(20): 2914–2922. doi:10.1016/j.febslet.2015.05.016

  • Daly, Mark J., John D. Rioux, Stephen F. Schaffner, Thomas J. Hudson, and Eric S. Lander, 2001, “High-resolution Haplotype Structure in the Human Genome”, Nature Genetics, 29(2): 229–232. doi:10.1038/ng1001-229

  • Dawkins, Richard, 1976, The Selfish Gene, Oxford: Oxford University Press.

  • Desai, Narayan, Dion Antonopoulos, Jack A. Gilbert, Elizabeth M. Glass, and Folker Meyer, 2012, “From Genomics to Metagenomics”, Current Opinion in Biotechnology, 23(1): 72–76.

  • Dolinski, Kara and Olga G. Troyanskaya, 2015, “Implications of Big Data for Cell Biology”, Molecular Biology of the Cell, 26(14): 2575–2578. doi:10.1091/mbc.E13-12-0756

  • Doolittle, W. Ford, 2013, “Is Junk DNA Bunk? A Critique of ENCODE”, Proceedings of the National Academy of Sciences, 110(14): 5294–5300. doi:10.1073/pnas.1221376110

  • Doolittle, W. Ford and Carmen Sapienza, 1980, “Selfish Genes, the Phenotype Paradigm and Genome Evolution”, Nature, 284(5757): 601–603. doi:10.1038/284601a0

  • Doolittle, W. Ford and Olga Zhaxybayeva, 2010, “Metagenomics and the Units of Biological Organization”, Bioscience, 60(2): 102–112. doi:10.1525/bio.2010.60.2.5

  • Dulbecco, Renato, 1986, “A Turning Point in Cancer Research: Sequencing the Human Genome”, Science, 231(4742): 1055–1056. doi:10.1126/science.3945817

  • Dupré, John, 2005, “Are There Genes?” Royal Institute of Philosophy Supplement, 56: 193–211. doi:10.1017/S1358246105056092

  • –––, 2008, “What Genes Are, and Why There Are No ‘Genes for Race’”, in Revisiting Race in a Genomic Age, Barbara A. Koenig, Sandra Soo-Jin Lee and Sarah S. Richardson (eds.), New Brunswick, N.J.: Rutgers University Press, 2008 pp. 39–55.

  • –––, 2010, “The Polygenomic Organism”, The Sociological Review, 58(s1): 19–31. doi:10.1111/j.1467-954X.2010.01909.x

  • –––, 2012, Processes of Life: Essays in the Philosophy of Biology, Oxford: Oxford University Press.

  • Dupré, John and Maureen A. O’Malley, 2007, “Metagenomics and Biological Ontology”, Studies in History and Philosophy of Science Part C: Studies in History and Philosophy of Biological and Biomedical Sciences, 38(4): 834–846. doi:10.1016/j.shpsc.2007.09.001

  • Duster, Troy, 2005, “Race and Reification in Science”, Science, 307(5712): 1050–1051. doi:10.1126/science.1110303

  • –––, 2006, “The Molecular Reinscription of Race: Unanticipated Issues in Biotechnology and Forensic Science”, Patterns of Prejudice, 40(4–5): 427–441.

  • –––, 2015, “A Post-genomic Surprise. the Molecular Reinscription of Race in Science, Law and Medicine”, The British Journal of Sociology, 66(1): 1–27. doi:10.1111/1468-4446.12118

  • Ecker, Joseph R., Wendy A. Bickmore, Inês Barroso, Jonathan K. Pritchard, Yoav Gilad, and Eran Segal, 2012, “Genomics: ENCODE Explained”, Nature, 489(7414): 52–55. doi:10.1038/489052a

  • Eddy, Sean R., 2012, “The C-value Paradox, Junk DNA and ENCODE”, Current Biology, 22(21): R898–R899. doi:10.1016/j.cub.2012.10.002

  • –––, 2013, “The ENCODE Project: Missteps Overshadowing a Success”, Current Biology, 23(7): R259–R261.

  • Edwards, A.W.F., 2003, “Human Genetic Diversity: Lewontin’s Fallacy”, BioEssays, 25(8): 798–801. doi:10.1002/bies.10315

  • Ehret, Charles F. and Gérard De Haller, 1963, “Origin, Development, and Maturation of Organelles and Organelle Systems of the Cell Surface in Paramecium”, Journal of Ultrastructure Research, 9(Suppl 6): 1–42. doi:10.1016/S0022-5320(63)80088-X

  • Eichler, E.E., J. Flint, G. Gibson, A. Kong, S.M. Leal, J.H. Moore, and J.H. Nadeau, 2010, “Missing Heritability and Strategies for Finding the Underlying Causes of Complex Disease”, Nature Reviews Genetics, 11(6): 446–450. doi:10.1038/nrg2809

  • Eisen, Jonathan A., 2012, “Badomics Words and the Power and Peril of the ome-meme”, GigaScience, 1(1): 6. doi:10.1186/2047-217X-1-6

  • Ekkers, David Matthias, Mariana Silvia Cretoiu, Anna Maria Kielak, and Jan Dirk van Elsas, 2012, “The Great Screen Anomaly—A New Frontier in Product Discovery Through Functional Metagenomics”, Applied Microbiology and Biotechnology, 93(3): 1005–1020. doi:10.1007/s00253-011-3804-3

  • Elliott, Kevin C., 2007, “Varieties of Exploratory Experimentation in Nanotoxicology”, History and Philosophy of the Life Sciences, 29(3): 313–336.

  • Elliott, Tyler A., Stefan Linquist, and T. Ryan Gregory, 2014, “Conceptual and Empirical Challenges of Ascribing Functions to Transposable Elements”, The American Naturalist, 184(1): 14–24. doi:10.1086/676588

  • ENCODE Project Consortium, 2004, “The ENCODE (ENCyclopedia of DNA elements) Project”, Science, 306(5696): 636–640. doi:10.1126/science.1105136

  • –––, 2007, “Identification and Analysis of Functional Elements in 1% of the Human Genome by the ENCODE Pilot Project”, Nature, 447(7146): 799–816. doi:10.1038/nature05874

  • –––, 2012, “An Integrated Encyclopedia of DNA Elements in the Human Genome”, Nature, 489(7414): 57–74. doi:10.1038/nature11247

  • Ereshefsky, Marc and Makmiller Pedroso, 2013, “Biological Individuality: the Case of Biofilms”, Biology & Philosophy, 28(2): 331–349. doi:10.1007/s10539-012-9340-4

  • Feldman, Marcus W. and Richard C. Lewontin, 2008, “Race, Ancestry, and Medicine”, in Koenig 2008: 89–101.

  • Fields, Stanley and Mark Johnston, 2002, “A Crisis in Postgenomic Nomenclature”, Science, 296(5568): 671–672. doi:10.1126/science.1070208

  • Fleischmann, R.D., et al., 1995, “Whole-genome Random Sequencing and Assembly of Haemophilus influenzae Rd.” Science, 269(5223): 496–512. doi:10.1126/science.7542800

  • Foster, Morris W. and Richard R. Sharp, 2002, “Race, Ethnicity, and Genomics: Social Classifications as Proxies of Biological Heterogeneity”, Genome Research, 12(6): 844–850. doi:10.1101/gr.99202

  • Franklin, L.R., 2005, “Exploratory Experiments”, Philosophy of Science, 72(5): 888–899. doi:10.1086/508117

  • Fujimura, Joan H., D.A. Bolnick, R. Rajagopalan, J.S. Kaufman, R.C. Lewontin, T. Duster, P. Ossorio, and J. Marks, 2014, “Clines Without Classes How to Make Sense of Human Variation”, Sociological Theory, 32(3): 208–227. doi:10.1177/0735275114551611

  • Gabor, Esther, Klaus Liebeton, Frank Niehaus, Juergen Eck, and Patrick Lorenz, 2007, “Updating the Metagenomics Toolbox”, Biotechnology Journal, 2(2): 201–206. doi:10.1002/biot.200600250

  • Gannett, Lisa, 2001, “Racism and Human Genome Diversity Research: the Ethical Limits of ‘Population Thinking’”, Philosophy of Science, 68(3): S479–S492. doi:10.1086/392930

  • –––, 2004, “The Biological Reification of Race”, The British Journal for the Philosophy of Science, 55(2): 323–345. doi:10.1093/bjps/55.2.323

  • –––, 2010, “Questions Asked and Unasked: How by Worrying Less About the ‘Really Real’Philosophers of Science Might Better Contribute to Debates About Genetics and Race”, Synthese, 177(3): 363–385. doi:10.1007/s11229-010-9788-1

  • Germain, Pierre-Luc, Emanuela Ratti, and Frederico Boem, 2014, “Junk or Functional DNA? ENCODE and the Function Controversy”, Biology & Philosophy, 29(6): 807–831. doi:10.1007/s10539-014-9441-3

  • Gilbert, Walter, 1992, “A Vision of the Grail”, in The Code of Codes: Scientific and Social Issues in the Human Genome Project, Daniel Kevles, and Leroy Hood (eds.), Cambridge, MA: Harvard University Press, pp. 83–97.

  • Godfrey-Smith, Peter, 1994, “A Modern History Theory of Functions”, Noûs, 28(3): 344–362. doi:10.2307/2216063

  • Goffeau, A., et al., 1996, “Life with 6000 Genes”, Science, 274(5287): 546–567. doi:10.1126/science.274.5287.546

  • Goodman, Alan H., 2000, “Why Genes Don’t Count (For Racial Differences in Health)”, American Journal of Public Health, 90(11): 1699. pmcid:PMC1446406

  • Graur, Dan, 2013, “The Origin of the Term ‘Junk DNA’: A Historical Whodunnit”, Judge Starling (blog), October 19, 2013, Graur 2013 available online>

  • Graur, D., Y. Zheng, N. Price, R.B. Azevedo, R.A. Zufall, and E. Elhaik, 2013, “On the Immortality of Television Sets: ‘Function’ in the Human Genome According to the Evolution-free Gospel of ENCODE”, Genome Biology and Evolution, 5(3): 578–590. doi:10.1093/gbe/evt028

  • Green, Eric D., Mark S. Guyer, and National Human Genome Research Institute, 2011, “Charting a Course for Genomic Medicine from Base Pairs to Bedside”, Nature 470(7333): 204–213. doi:10.1038/nature09764

  • Gregory, T. Ryan, 2001, “Coincidence, Coevolution, or Causation? DNA Content, Cell Size, and the C-value Enigma”, Biological Reviews, 76(1): 65–101. pmid:11325054

  • –––, 2005, “Synergy Between Sequence and Size in Large-scale Genomics”, Nature Reviews Genetics, 6(9): 699–708. doi:10.1038/nrg1674

  • –––, 2007, “The onion test”, Evolver Zone Genomicron, April 25, 2007, Gregory 2001 available online.

  • Griffiths, Paul E., 1992, “Adaptive Explanation and the Concept of a Vestige”, in Trees of Life. Essays in Philosophy of Biology, Paul E. Griffiths (ed.), Dordrecht: Kluwer Academic Publishers, pp. 111–131. doi:10.1007/978-94-015-8038-0_5

  • –––, 1993, “Functional Analysis and Proper Functions”, British Journal of the Philosophy of Science, 44(3): 409–422. doi:10.1093/bjps/44.3.409

  • –––, 1994, “Cladistic Classification and Functional Explanation”, Philosophy of Science, 61(2): 206–227. doi:10.1086/289796

  • –––, 2006, “Function, Homology, and Character Individuation”, Philosophy of Science, 73(1): 1–25. doi:10.1086/510172

  • Griffiths, Paul E. and Karola Stotz, 2006, “Genes in the Postgenomic Era”, Theoretical Medicine and Bioethics, 27(6): 499–521. doi:10.1007/s11017-006-9020-y

  • Guay, Alexandre and Thomas Pradeu (eds.), 2015, Individuals Across the Sciences, Oxford: Oxford University Press.

  • Hahn, Matthew W. and Gregory A. Wray, 2002, “The g-value Paradox”, Evolution and Development, 4(2): 73–75. doi:10.1046/j.1525-142X.2002.01069.x

  • Hall, Stephen S., 2010, “Revolution Postponed”, Scientific American, 303(4): 60–67. doi:10.1038/scientificamerican1010-60

  • Hamilton, Jennifer A., 2008, “Revitalizing Difference in the HapMap: Race and Contemporary Human Genetic Variation Research”, The Journal of Law, Medicine & Ethics, 36(3): 471–477. doi:10.1111/j.1748-720X.2008.293.x

  • Handelsman, Jo, Michelle R. Rondon, Sean F. Brady, Jon Clardy, and Robert M. Goodman, 1998, “Molecular Biological Access to the Chemistry of Unknown Soil Microbes: A New Frontier for Natural Products”, Chemistry & Biology, 5(10): R245–R249. doi:10.1016/S1074-5521(98)90108-9

  • [HapMap] The International HapMap Consortium, 2003, “The International HapMap Project”, Nature, 426(6968): 789–796. doi:10.1038/02168

  • –––, 2005, “A Haplotype Map of the Human Genome”, Nature, 437(7063): 1299–1320. doi:10.1038/nature04226

  • –––, 2010, “Integrating Common and Rare Genetic Variation in Diverse Human Populations”, Nature, 467(7311): 52–58. doi:10.1038/nature09298

  • Harrow, Jennifer, A. Frankish, J.M. Gonzalez, E. Tapanari, M. Diekhans, F. Kokocinski, B.L. Aken et al., 2012, “GENCODE: The Reference Human Genome Annotation for the ENCODE Project”, Genome Research, 22(9): 1760–1774. doi:10.1101/gr.135350.111

  • Holm-Hansen, Osmund, 1969, “Algae: Amounts of DNA and Organic Carbon in Single Cells”, Science, 163(3862): 87–88. doi:10.1126/science.163.3862.87

  • International Human Genome Sequencing Consortium, 2001, “Initial Sequencing and Analysis of the Human Genome”, Nature, 409(6822): 860–921. doi:10.1038/35057062

  • –––, 2004, “Finishing the Euchromatic Sequence of the Human Genome”, Nature, 431(7011): 931–945. doi:10.1038/nature03001

  • Jones, Peter A., 2012, “Functions of DNA Methylation: Islands, Start Sites, Gene Bodies and Beyond”, Nature Reviews Genetics, 13(7): 484–492. doi:10.1038/nrg3230

  • Jorde, Lynn B. and Stephen P. Wooding, 2004, “Genetic Variation, Classification and ‘Race’”, Nature Genetics, 36: S28–S33. doi:10.1038/ng1435

  • Kalinowski, S.T., 2011, “The Computer Program STRUCTURE Does Not Reliably Identify the Main Genetic Clusters Within Species: Simulations and Implications for Human Population Structure”, Heredity, 106(4): 625–632. doi:10.1038/hdy.2010.95

  • Karaca, Koray, 2013, “The Strong and Weak Senses of Theory-ladenness of Experimentation: Theory-driven Versus Exploratory Experiments in the History of High-energy Particle Physics”, Science in Context, 26(1): 93–136. doi:10.1017/S0269889712000300

  • Kaufman, Jay S. and Richard S. Cooper, 2001, “Commentary: Considerations for Use of Racial/Ethnic Classification in Etiologic Research”, American Journal of Epidemiology, 154(4): 291–298. doi:10.1093/aje/154.4.291

  • Keller, Evelyn Fox, 2000, The Century of the Gene, Cambridge, MA: Harvard University Press.

  • –––, 2011, “Genes, Genomes, and Genomics”, Biological Theory, 6(2): 132–140. doi:10.1007/s13752-012-0014-x

  • Kellis, Manolis, et al., 2014, “Defining Functional DNA Elements in the Human Genome”, Proceedings of the National Academy of Sciences, 111(17): 6131–6138. doi:10.1073/pnas.1318948111

  • Kitcher, Philip, 1994, “Who’s Afraid of the Human Genome Project?”, in PSA: Proceedings of the Biennial Meeting of the Philosophy of Science Association, 2: 313–321. doi:10.1086/psaprocbienmeetp.1994.2.192941

  • –––, 1999, “Race, Ethnicity, Biology, Culture”, in Racism (Key Concepts in Critical Theory), Leonard Harris (ed.), New York: Humanity Books, pp. 87–120.

  • Koenig, Barbara A., Sandra Soo-Jin Lee, and Sharon S. Richardson (eds.), 2008, Revisiting Race in a Genomic Age, New Brunswick: Rutgers University Press.

  • Koshland, Daniel E. Jr, 1989, “Sequences and Consequences of the Human Genome”, Science, 246(4927): 189. doi:10.1126/science.2799380

  • Krieger, Nancy, 2000, “Refiguring ‘Race’: Epidemiology, Racialized Biology, and Biological Expressions of Race Relations”, International Journal of Health Services, 30(1): 211–216. doi:10.2190/672J-1PPF-K6QT-9N7U

  • Kuska, Bob, 1998, “Beer, Bethesda, and Biology: How ‘Genomics’ Came into Being”, Journal of the National Cancer Institute, 90(2): 93–93. doi:10.1093/jnci/90.2.93

  • Lander, Eric S., 1996, “The New Genomics: Global Views of Biology”, Science, 274(5287): 536. doi:10.1126/science.274.5287.536

  • Lederberg, Joshua and Alexa T. McCray, 2001, “’Ome Sweet ’Omics—A Genealogical Treasury of Words”, The Scientist, 15(7): 8.

  • Ledford, Heidi, 2016, “AstraZeneca Launches Project to Sequence 2 Million Genomes”, Nature, 532(7600): 427. doi:10.1038/nature.2016.19797

  • Leonelli, Sabina, 2014, “What Difference Does Quantity Make? on the Epistemology of Big Data in Biology”, Big Data & Society, 1(1), p.2053951714534395. doi:10.1177/2053951714534395

  • –––, 2016, Data-Centric Biology: A Philosophical Study, Chicago, IL: Chicago University Press.

  • Leroi, Armand Marie, 2005, “A Family Tree in Every Gene”, New York Times, March 14, A23.

  • Levy, Samuel, et al., 2007, “The Diploid Genome Sequence of An Individual Human”, PLoS Biology, 5(10): e254. doi:10.1371/journal.pbio.0050254

  • Lewontin, Richard C., 1992, Biology as Ideology, New York: Harper Collins.

  • –––, 2011, “It’s Even Less in Your Genes”, The New York Review of Books, 58(9).

  • Li, W.H. and L.A. Sadler, 1991, “Low Nucleotide Diversity in Man”, Genetics, 129(2): 513–523.

  • Lindblad-Toh, Kerstin, et al., 2011, “A High-resolution Map of Human Evolutionary Constraint Using 29 Mammals”, Nature, 478(7370): 476–482. doi:10.1038/nature10530

  • Livingstone, Frank B., 1962, “On the Non-Existence of Human Races”, Current Anthropology, 3(3): 279–281. doi:10.1086/200290

  • Lorenz, Patrick and Jürgen Eck, 2005, “Metagenomics and Industrial Applications”, Nature Reviews Microbiology, 3(6): 510–516. doi:10.1038/nrmicro1161

  • Lupski, James R., 1998, “Genomic Disorders: Structural Features of the Genome Can Lead to DNA Rearrangements and Human Disease Traits”, Trends in Genetics, 14(10): 417–422. doi:10.1016/S0168-9525(98)01555-8

  • –––, 2009, “Genomic Disorders Ten Years On”, Genome Medicine, 1(4): 42. doi:10.1186/gm42

  • Luria, S.E., Dan M. Cooper, and Ari Berkowitz, 1989, “Human Genome Project”, Science, 246(4932):873–874. doi:10.1126/science.246.4932.873-b doi:10.1126/science.246.4932.873-d doi:10.1126/science.2814503

  • Mardis, Elaine R., 2006, “Anticipating the $1,000 Genome”, Genome Biology, 7(7): 112. doi:10.1186/gb-2006-7-7-112

  • –––, 2011, “A Decade’s Perspective on DNA Sequencing Technology”, Nature, 470(7333): 198–203. doi:10.1038/nature09796

  • Marks, Jonathan, 2008, “Race: Past, Present, and Future”, in Koenig 2008: 21–38.

  • Marx, Vivian, 2013, “Biology: the Big Challenges of Big Data”, Nature, 498(7453): 255–260. doi:10.1038/498255a

  • McClellan, Jon and Mary-Claire King, 2010, “Genetic Heterogeneity in Human Disease”, Cell, 141(2): 210–217. doi:10.1016/j.cell.2010.03.032

  • McFall-Ngai, M., et al., 2013, “Animals in a Bacterial World, a New Imperative for the Life Sciences”, Proceedings of the National Academy of Sciences, 110(9): 3229–3236. doi:10.1073/pnas.1218525110

  • Millikan, Ruth Garrett, 1984, Language, Thought, and Other Biological Categories: New Foundations for Realism, Cambridge, MA: MIT Press.

  • –––, 1989a, “In Defense of Proper Functions”, Philosophy of Science, 56(2): 288–302. doi:10.1086/289488

  • –––, 1989b, “An Ambiguity in the Notion ‘Function’”, Biology and Philosophy, 4(2): 172–176.

  • Mirsky, A.E. and Hans Ris, 1951, “The Desoxyribonucleic Acid Content of Animal Cells and Its Evolutionary Significance”, The Journal of General Physiology, 34(4): 451–462. doi:10.1085/jgp.34.4.451

  • Moss, Lenny, 2003, What Genes Can’t Do, Cambridge, MA: MIT Press.

  • –––, 2006, “Redundancy, Plasticity, and Detachment: the Implications of Comparative Genomics for Evolutionary Thinking”, Philosophy of Science, 73(5): 930–946. doi:10.1086/518778

  • Myers, Eugene W., et al., 2000, “A Whole-Genome Assembly of Drosophila”, Science, 287(5461): 2196–2204. doi:10.1126/science.287.5461.2196

  • National Research Council (Committee on Metagenomics: Challenges and Functional Applications), 2007, The New Science of Metagenomics: Revealing the Secrets of Our Microbial Planet, National Research Council Report 13, Washington DC: National Academies Press. doi:10.17226/11902

  • Neander, Karen, 1991, “Functions as Selected Effects: the Conceptual Analyst’s Defense”, Philosophy of Science, 58(2): 168–184. doi:10.1086/289610

  • Nicholson, D. and John Dupré (eds), forthcoming, Everything Flows: Towards a Processual Philosophy of Biology, Oxford: Oxford University Press.

  • NIH: National Institutes of Health, 2002, “International Consortium Launches Genetic Variation Mapping Project: HapMap Will Help Identify Genetic Contributions to Common Diseases”, NIH News Advisory, October 2002, NIH 2002 available online.

  • –––, 2004, “NHGRI Seeks Next Generation of Sequencing Technologies New Grants Support Development of Faster, Cheaper DNA Sequencing”, NIH News Release, October 14, 2004, NIH 2004 available online.

  • –––, 2015, “NIH Framework Points the Way Forward for Building National, Large-scale Research Cohort, a Key Component of the President’S Precision Medicine Initiative”, NIH News Releases, September 17, 2015. NIH 2015 available online.

  • –––, 2016, “What is a genome?”, Genetics Home Reference: Your Guide to Understanding Genetic Conditions, NIH: U.S. National Library of Medicine, NIH 2016 available online, accessed October 10, 2016.

  • Niu, Deng-Ke and Li Jiang, 2013, “Can ENCODE Tell Us How Much Junk DNA We Carry in Our Genome?” Biochemical and Biophysical Research Communications, 430(4): 1340–1343. doi:10.1016/j.bbrc.2012.12.074

  • Ohno, Susumu, 1972, “So Much ‘Junk’ DNA in Our Genome”, in Brookhaven Symposium on Biology, 23, Routledge, pp. 366–370.

  • O’Malley, Maureen A., 2007, “Exploratory Experimentation and Scientific Practice: Metagenomics and the Proteorhodopsin Case”, History and Philosophy of the Life Sciences, 29(3): 337–358.

  • –––, 2013, “Metagenomics”, in Encyclopedia of Systems Biology, W. Dubitzky, O. Wolkenhauer, H. Yokota, and K.-H. Cho (eds.), Springer, p. 1283.

  • O’Malley, Maureen A. and John Dupré, 2005, “Fundamental Issues in Systems Biology”, BioEssays, 27(12): 1270–1276. doi:10.1002/bies.20323

  • O’Malley, Maureen A. and Orkun S. Soyer, 2012, “The Roles of Integration in Molecular Systems Biology”, Studies in History and Philosophy of Science Part C: Studies in History and Philosophy of Biological and Biomedical Sciences, 43(1): 58–68. doi:10.1016/j.shpsc.2011.10.006

  • O’Malley, Maureen A., Kevein C. Elliott, and Richard M. Burian, 2010, “From Genetic to Genomic Regulation: Iterativity in MicroRNA Research”, Studies in History and Philosophy of Science Part C: Studies in History and Philosophy of Biological and Biomedical Sciences, 41(4): 407–417. doi:10.1016/j.shpsc.2010.10.011

  • Orgel, L.E. and F.H. Crick, 1980, “Selfish DNA: the Ultimate Parasite”, Nature, 284(5757): 604–607. doi:10.1038/284604a0

  • Ossorio, Pilar N., 2005, “Race, Genetic Variation, and the Haplotype Mapping Project”, Louisiana Law Review, 66(5): 131–143.

  • Palca, Joseph, 1986, “The Numbers Game”, Nature, 321(6068): 371. doi:10.1038/321371b0

  • Pennisi, Elizabeth, 2012, “ENCODE Project Writes Eulogy for Junk DNA”, Science, 337(6099): 1159–1161. doi:10.1126/science.337.6099.1159

  • Perini, Laura, 2011, “Sequence Matters: Genomic Research and the Gene Concept”, Philosophy of Science, 78(5): 752–762. doi:10.1086/662565

  • Phillips, Kathryn A., Mark J. Pletcher, and Uri Ladabaum, 2015, “Is the ‘$1000 Genome’ Really $1000? Understanding the Full Benefits and Costs of Genomic Sequencing”, Technology and Health Care: Official Journal of the European Society for Engineering and Medicine, 23(3): 373–379.

  • Pigliucci, Massimo and Jonathan Kaplan, 2003, “On the Concept of Biological Race and Its Applicability to Humans”, Philosophy of Science, 70(5): 1161–1172. doi:10.3233/THC-150900

  • Piotrowska, Monika, 2009, “What Does it Mean to be 75% Pumpkin? The Units of Comparative Genomics”, Philosophy of Science, 76(5): 838–850. doi:10.1086/605813

  • Qu, Hongzhu and Xiangdong Fang, 2013, “A Brief Review on the Human Encyclopedia of DNA Elements (ENCODE) Project”, Genomics, Proteomics & Bioinformatics, 11(3): 135–141. doi:10.1016/j.gpb.2013.05.001

  • Reardon, Sara, 2015, “US Precision-medicine Proposal Sparks Questions”, Nature, 517(7536): 540. doi:10.1038/nature.2015.16774

  • Rechsteiner, Martin C., 1991, “The Human Genome Project: Misguided Science Policy”, Trends in Biochemical Sciences, 16: 455–461. doi:10.1016/0968-0004(91)90178-X

  • Richardson, Sarah S. and Hallam Stevens (eds.), 2015, Postgenomics: Perspectives on Biology After the Genome, Chapel Hill, NC: Duke University Press.

  • Risch, Neil, Esteban Burchard, Elad Ziv, and Hua Tang, 2002, “Categorization of Humans in Biomedical Research: Genes, Race and Disease”, Genome Biology, 3(7): 1–12.

  • Roberts, Dorothy, 2011, Fatal Invention: How Science, Politics, and Big Business Re-create Race in the Twenty-first Century, New York: The New Press.

  • Rosenberg, Alex, 1994, “Subversive Reflections on the Human Genome Project”, in PSA: Proceedings of the Biennial Meeting of the Philosophy of Science Association, 2: 329–335. doi:10.1086/psaprocbienmeetp.1994.2.192943

  • Rosenberg, Noah A., J.K. Pritchard, J.L. Weber, H.M. Cann, K.K. Kidd, L.A. Zhivotovsky, and M.W. Feldman, 2002, “Genetic Structure of Human Populations”, Science, 298(5602): 2381–2385. doi:10.1126/science.1078311

  • Rothfels, Klaus, Elizabeth Sexsmith, Margaret Heimburger, and Margarida O. Krause, 1966, “Chromosome Size and DNA Content of Species of Anemone L. and Related Genera (Ranunculaceae)”, Chromosoma, 20(1): 54–74. doi:10.1007/BF00331898

  • Sanger, F. et al., 1977, “Nucleotide Sequence of Bacteriophage ΦX174 DNA”, Nature, 265(5596): 687–695. doi:10.1038/265687a0

  • Sboner, A., X.J. Mu, D. Greenbaum, R.K. Auerbach, and M.B. Gerstein, 2011, “The Real Cost of Sequencing: Higher Than You Think”, Genome Biology, 12(8): 125. doi: 10.1186/gb-2011-12-8-125.

  • Scholz, Matthew B., Chien-Chi Lo, and Patrick SG Chain, 2012, “Next Generation Sequencing and Bioinformatic Bottlenecks: The Current State of Metagenomic Data Analysis”, Current Opinion in Biotechnology, 23(1): 9–15. doi:10.1016/j.copbio.2011.11.013

  • Schwartz, Robert S., 2001, “Racial Profiling in Medical Research”, New England Journal of Medicine, 344(18): 1392–1393. doi: 10.1056/NEJM200105033441810

  • Serre, David and Svante Pääbo, 2004, “Evidence for Gradients of Human Genetic Diversity Within and Among Continents”, Genome Research, 14(9): 1679–1685. doi:10.1101/gr.2529604

  • Shiao, Jiannbin Lee, Thomas Bode, Amber Beyer, and Daniel Selvig, 2012, “The Genomic Challenge to the Social Construction of Race”, Sociological Theory, 30(2): 67–88. doi:10.1177/0735275112448053

  • Sinsheimer, Robert L., 1989, “The Santa Cruz Workshop—May 1985”, Genomics, 5(4): 954–956. doi:10.1016/0888-7543(89)90142-0

  • Sleator, Roy D., C. Shortall, and C. Hill, 2008, “Metagenomics”, Letters in Applied Microbiology, 47(5): 361–366. doi:10.1111/j.1472-765X.2008.02444.x

  • Staley, James T. and Allan Konopka, 1985, “Measurement of in Situ Activities of Nonphotosynthetic Microorganisms in Aquatic and Terrestrial Habitats”, Annual Reviews in Microbiology, 39(1): 321–346. doi:10.1146/annurev.mi.39.100185.001541

  • Steinle, Friedrich, 1997, “Entering New Fields: Exploratory Uses of Experimentation”, Philosophy of Science, 64(Proceedings): S65–S74. doi:10.1086/392587

  • Stolley, Paul D., 1999, “Race in Epidemiology”, International Journal of Health Services, 29(4): 905–909. doi:10.2190/QAAH-P5DT-WMP8-8HNL

  • Stotz, Karola C., A. Bostanci, and Paul E. Griffiths, 2006, “Tracking the Shift to ‘Postgenomics’”, Public Health Genomics, 9(3): 190–196. doi:10.1159/000092656

  • Streit, Wolfgan R. and Ruth A. Schmitz, 2004, “Metagenomics—The Key to the Uncultured Microbes”, Current Opinion in Microbiology, 7(5): 492–498. doi:10.1016/j.mib.2004.08.002

  • Tang, Hua, et al., 2005, “Genetic Structure, Self-identified Race/Ethnicity, and Confounding in Case-Control Association Studies”, The American Journal of Human Genetics, 76(2): 268–275. doi:10.1086/427888

  • Tauber, Alfred I. and Sahotra Sarkar, 1992, “The Human Genome Project: Has Blind Reductionism Gone Too Far?” Perspectives in Biology and Medicine, 35(2): 220–235. doi:10.1353/pbm.1992.0015

  • Thomas, C.A. Jr., 1971, “The Genetic Organization of Chromosomes”, Annual Review of Genetics, 5(1): 237–256. doi:10.1146/annurev.ge.05.120171.001321

  • Touchman, Jeffrey, 2010, “Comparative Genomics”, Nature Education Knowledge, 3(10): 13.

  • Turnbaugh, Peter J. and Jeffrey I. Gordon, 2008, “An Invitation to the Marriage of Metagenomics and Metabolomics”, Cell, 134(5): 708–713. doi:10.1016/j.cell.2008.08.025

  • Turnbaugh, Peter J., et al., 2009, “A Core Gut Microbiome in Obese and Lean Twins”, Nature, 457(7228): 480–484. doi:10.1038/nature07540

  • Tyson, G.W., J. Chapman, P. Hugenholtz, E.E. Allen, R.J. Ram, P.M. Richardson, V.V. Solovyev, E.M. Rubin, D.S. Rokhsar, and J.F. Banfield, 2004, “Community Structure and Metabolism Through Reconstruction of Microbial Genomes from the Environment”, Nature, 428(6978): 37–43.

  • Varmus, Harold, 2010, “Ten Years On—The Human Genome and Medicine”, New England Journal of Medicine, 362(21): 2028–2029. doi:10.1056/NEJMe0911933

  • Venter, J. Craig, 2000, “Remarks at the Human Genome Announcement”, Functional & Integrative Genomics, 1(3): 154–155. doi: 10.1007/s101420000026

  • –––, 2010, “Multiple Personal Genomes Await”, Nature, 464(7289): 676–677. doi:10.1038/464676a

  • Venter, J. Craig, et al., 2001, “The Sequence of the Human Genome”, Science, 291(5507): 1304–1351. doi:10.1126/science.1058040

  • Venter, J. Craig, et al., 2004, “Environmental Genome Shotgun Sequencing of the Sargasso Sea”, Science, 304(5667): 66–74. doi:10.1126/science.1093857

  • Visscher, Peter M., Matthew A. Brown, Mark I. McCarthy, and Jian Yang, 2012, “Five Years of GWAS Discovery”, The American Journal of Human Genetics, 90(1): 7–24. doi:10.1016/j.ajhg.2011.11.029

  • Wade, Nicholas, 2010, “A Decade Later, Genetic Map Yields Few New Cures”, New York Times, June 13, 2010, page 1.

  • Wang, David G., et al., 1998, “Large-Scale Identification, Mapping, and Genotyping of Single-Nucleotide Polymorphisms in the Human Genome”, Science, 280(5366): 1077–1082. doi:10.1126/science.280.5366.1077

  • Ward, Lucas D. and Manolis Kellis, 2012, “Evidence of Abundant Purifying Selection in Humans for Recently Acquired Regulatory Functions”, Science, 337(6102): 1675–1678. doi:10.1126/science.1225057

  • Waters, C. Kenneth, 2007a, “The Nature and Context of Exploratory Experimentation: An Introduction to Three Case Studies of Exploratory Research”, History and Philosophy of the Life Sciences, 29(3): 275–284.

  • –––, 2007b, “Causes that Make a Difference”, The Journal of Philosophy, 104(11): 551–579. doi:10.5840/jphil2007104111

  • Weinberg, Robert A., 1991, “The Human Genome Initiative. There Are Two Large Questions”, The FASEB Journal, 5(1): 78.

  • –––, 2010, “Point: Hypotheses First”, Nature, 464(7289): 678–678. doi:10.1038/464678a

  • Wheeler, David A., et al., 2008, “The Complete Genome of An Individual by Massively Parallel DNA Sequencing”, Nature, 452(7189): 872–876. doi:10.1038/nature06884

  • White House, 2000, “Remarks Made by the President, Prime Minister Tony Blair of England (via satellite), Dr. Francis Collins, Director of the National Human Genome Research Institute, and Dr. Craig Venter, President and Chief Scientific Officer, Celera Genomics Corporation, on the Completion of the First Survey of the Entire Human Genome Project”, June 26, White House 2000 available online.

  • Whitfield, T.W., J. Wang, P.J. Collins, E.C. Partridge, S.F. Aldred, N.D. Trinklein, R.M. Myers, and Z. Weng, 2012, “Functional Analysis of Transcription Factor Binding Sites in Human Promoters”, Genome Biology, 13(9): R50, doi:10.1186/gb-2012-13-9-r50.

  • Winkler, Hans, 1920, Verbreitung und Ursache der Parthenogenesis im Pflanzen- und Tierreiche, Jena: Fischer Verlag.

  • Witzig, Ritchie, 1996, “The Medicalization of Race: Scientific Legitimization of a Flawed Social Construct”, Annals of Internal Medicine, 125(8): 675–679. doi:10.7326/0003-4819-125-8-199610150-00008

  • Wood, Alastair J., 2001, “Racial Differences in the Response to Drugs—Pointers to Genetic Differences”, New England Journal of Medicine, 344(18): 1394–1396. doi:10.1056/NEJM200105033441811

  • Wright, Larry, 1976, Teleological Explanation: An Etiological Analysis of Goals and Functions, Berkeley: University of California Press.

  • Wright, Mathew W. and Elspeth A. Bruford, 2011, “Naming ‘Junk’: Human Non-protein Coding RNA (NcRNA) Gene Nomenclature”, Human Genomics, 5(2): 90–98. doi:10.1186/1479-7364-5-2-90

  • Xie, Hong-Guang, Richard B. Kim, Alastair J.J. Wood, and C. Michael Stein, 2001, “Molecular Basis of Ethnic Differences in Drug Disposition and Response”, Annual Review of Pharmacology and Toxicology, 41(1): 815–850. doi:10.1146/annurev.pharmtox.41.1.815

  • Yadav, Satya P., 2007, “The Wholeness in Suffix -omics, -omes, and the Word Om”, Journal of Biomolecular Techniques, 18(5): 277. pmcid:PMC2392988

  • Yudell, Michael, 2011, “A Short History of the Race Concept”, in Race and the Genetic Revolution: Science, Myth, and Culture, Sheldon Krimsky and Kathleen Sloan (eds.), New York: Columbia University Press, pp. 13–30.

Academic Tools

Other Internet Resources

biological individuals | gene | genetics: molecular | human genome project | information: biological | molecular biology | race | reduction, scientific: in biology

Copyright © 2016 by Stephan Guttinger <s.m.guttinger@exeter.ac.uk> John Dupré <J.A.Dupre@exeter.ac.uk>

最后更新于

Logo

道长哲学研讨会 2024