先天与语言 and language (Fiona Cowie)

首次发表于 2008 年 1 月 16 日星期三

对于先天观念及其在知识获取中的作用的哲学辩论具有悠久的历史。因此,直到上世纪初,对于语言知识是如何获得以及先天观念在其中可能扮演的角色几乎没有引起多少关注,这是令人惊讶的。

当然,许多理论家认识到语言在我们生活中所起的关键作用,并对语言的(句法和/或语义)特性能够使其发挥这种作用进行了推测。然而,很少有人对我们能够学习和使用自然语言的特性有太多的说法。在 20 世纪之前,哲学家们在处理语言习得问题时往往将其视为我们一般推理能力的产物——这种能力使我们与其他动物不同,但并非专门为语言学习而设计。

例如,在《方法论讲演》的第 5 部分中,笛卡尔将使用语言的能力视为区分人类与“机器”或“野兽”的两个特征之一,并推测即使是最愚蠢的人也能学会一门语言(而最聪明的野兽却无法做到),因为人类拥有“理性的灵魂”,而野兽“根本没有智慧”。(笛卡尔 1984 年:140-1。)与过去的其他伟大哲学家心理学家一样,笛卡尔似乎认为我们对概念和知识(“思想”)的习得是主要的心理学之谜,而将语言习得视为相对微不足道的事情;正如他讽刺地说:“显然,只需要很少的理性就能够说话。”(1984 年:140。)

二十世纪初,语言学家、心理学家和哲学家开始更加密切地研究语言学习和掌握的现象,从而改变了这一切。随着句法和语义的进步,人们意识到,掌握一门语言不仅仅是将单词与概念联系起来的问题,它还关键地涉及到如何将单词组合在一起的知识,因为通常我们用句子来表达我们的思想,而不是孤立的单词。

然而,如果是这样的话,语言掌握就不是一件简单的事情。现代语言学理论表明,人类语言是非常复杂的对象。控制句子构成的句法规则和赋予句子和短语意义的语义规则非常复杂,然而语言使用者每天似乎毫不费力和无意识地应用这些规则数百次或数千次。但是,如果掌握一门语言意味着要了解所有这些晦涩的规则,那么习得一门语言就成了学习所有这些规则的巨大任务。因此,出现了一个问题,这个问题推动了现代语言学理论的很大一部分:仅仅通过接触周围说的语言,普通的孩子们如何学会掌握语言表达和理解的无数复杂规则?

显然,人类大脑有一些非常特殊的东西,使得他们能够掌握一门自然语言,这通常在 8 岁左右完成。本文的第 2.1 节介绍了这个观点,这个观点与麻省理工学院的语言学家诺姆·乔姆斯基的工作最为密切相关,即人类大脑的特殊之处在于它们包含了一个专门的“语言器官”,一种先天的心理“模块”或“能力”,专门用于掌握一门语言。

根据乔姆斯基的观点,语言能力包含了各种语言规则、限制和原则的先天知识;这种先天知识构成了语言能力的“初始状态”。在与儿童时期的语言经验相互作用中,也就是与乔姆斯基所称的“主要语言数据”或“pld”(见 §2.1)的接触中,它产生了一套新的语言知识,即对特定语言(如中文或英文)的知识。这种语言能力的“获得”或“最终”状态构成了一个人的“语言能力”,包括对自己语言的语法知识。乔姆斯基认为,这种知识对我们说和理解一门语言是至关重要的(当然,它并不足以实现这种能力:在“语言表现”中,即实际语言使用中,还需要带来大量额外的知识)[1]。

§§2.2-2.5 讨论了乔姆斯基和其他人支持这种“先天主义”观点的主要论据,即语言习得的可能性在于我们的大部分语言知识是未经学习的;它是先天的或与生俱来的,是语言能力的初始状态的一部分[2]。第 3 节介绍了一些其他研究领域,这些研究被认为与语言的先天性有关,并展示了最近关于语言学习和大脑的实证研究如何挑战先天主义立场。由于这些材料大部分都是非常新的,并且由于我的结论(其中许多是暂定的)非常有争议,因此在百科全书文章中包含了比正常情况下更多的实证文献引用。鼓励读者跟进所引用的研究并评估语言先天主义的可信度:毕竟,语言是否先天是一个实证问题。


1. 乔姆斯基对斯金纳的反驳

行为主义心理学家 B.F.斯金纳是第一个提出完整理论的语言习得理论家,他在他的书《言语行为》(斯金纳 1957)中提出了这个理论。他的学习理论与他对语言行为本身的理论密切相关。他认为人类的语言行为(即我们自己的话语和对他人话语的回应)由两个因素决定:(一)对说话者产生影响的当前环境特征,以及(二)说话者的强化历史(即对先前语言行为给予或不给予奖励和/或惩罚)。斯金纳避免谈论心理活动,认为“知道”一门语言实际上只是具有一定的行为倾向:在世界和他人话语面前说(和做)适当的事情的倾向。因此,了解英语在某种程度上是指在感到因门打开而感到寒冷时,倾向于说“请关上门!”并且在别人说出这个表达式时,倾向于说“好的”并关上门(其他条件相同)。

鉴于他认为掌握一门语言只是具备一定的行为倾向的问题,斯金纳认为学习一门语言只是获取这一系列行为倾向的问题。他认为这是通过他所称之为操作条件化的过程来实现的。(“操作行为”是指与特定环境条件或“引发刺激”之间没有明显的类似法则关系的行为。它们与“反应行为”相对,后者是对特定刺激的可靠或反射性反应。因此,当有人戳你的眼睛时,眨眼是一种反应行为;婴儿咿咿呀呀的表现是操作行为。)斯金纳认为,大多数人类的语言行为都是操作行为:它们起初与任何特定刺激无关。然而,它们可以通过条件化的方式与刺激(或其他行为)建立联系。在条件化中,所讨论的行为在对给定环境提示的反应中更有可能发生(或在某些范式中更不可能发生),这是通过施加适当的“强化计划”来实现的:根据受试者对提示的反应随时间变化而变化,给予或不给予奖励或惩罚。

根据斯金纳的观点,当儿童的语言操作行为在环境条件的“控制”下得到训练者的训练时,他们就会学会语言。他们会因为各种语言产出而受到奖励(例如,父母的认可)或惩罚(例如,理解失败),结果他们对语言行为的倾向逐渐趋于更广泛的语言社区。同样,斯金纳认为,“理解”他人的话语是通过训练来进行适当的行为反应:只有在对该话语做出适当反应时,才能理解“关上门!”。

在他对斯金纳的书的著名评论中,乔姆斯基(1959)有效地摧毁了斯金纳关于语言掌握和语言学习的理论。首先,乔姆斯基认为,掌握一门语言不仅仅是环境中各种因素(包括他人的话语)对口头行为的“控制”。因为语言使用是(i)独立于刺激的,(ii)与历史无关的。语言使用是独立于刺激的:几乎任何词语都可以作为对任何环境刺激的回应而被说出来,这取决于一个人的心理状态。语言使用也是与历史无关的:我们说的话并不取决于我们的强化历史,这一点从我们可以说出我们没有接受过训练的话语可以看出来。

同样的观点也适用于理解。我们可以理解我们以前从未听过的句子,即使它们是在奇怪或意外的情况下说出来的。而我们对他人话语的反应主要取决于我们当时的心理状态,而不是过去的训练历史。当然,有丰富的语言约定,但正如乔姆斯基所指出的,人类的“口头行为”与鸽子的按键盘或老鼠的迷宫奔跑是相当不相似的。掌握语言不是仅仅拥有一堆行为倾向的问题。相反,它涉及丰富的实用、语义和句法知识。我们在特定情况下说什么,以及我们如何回应他人的话语,是我们的历史、我们对当前情况的信念、我们的欲望以及我们对语言运作方式的知识之间复杂互动的结果。斯金纳的第一个大错误是没有意识到语言掌握涉及对语言规则和约定的知识(或者,正如乔姆斯基后来称之为“认知”)。

他的第二个大错误与这个错误有关:他未能意识到掌握一门语言不是被训练说什么的问题。乔姆斯基说,"通过语言社区对强化的仔细安排是语言学习的必要条件" 是错误的。(1959:39)首先,学习语言的孩子似乎根本没有被 "条件化"!明确的训练(比如狗学会按命令叫的训练)根本不是语言习得的特征。父母很少纠正(或明确奖励)孩子的语言尝试;孩子们从观看电视或被动地听成人说话中学到了很多关于语言的知识;移民的孩子在学校操场上学会了第二语言,达到了母语者的流利程度;即使是非常年幼的孩子也能够在语言上创新,说出父母无法想象的话。正如乔姆斯基总结的那样:"孩子只能通过成年人的精心关照和差异化强化来学习语言" 这种说法根本不正确。(1959:42)

其次,乔姆斯基提出了著名的“刺激贫乏”论证,将在下面的 2.2 节中详细讨论。他认为,条件反射原则本身可能无法产生足够丰富的倾向性,以生成一个人的语言行为的全部范围。例如,为了获得关于“汽车”这个词的适当倾向性,一个人必须接受大量包含该词的句子的训练:必须听到“汽车”作为宾语和主语的情况;带有形容词修饰的“汽车”和没有修饰的“汽车”;嵌入在不透明语境中的“汽车”(例如在陈述命题态度中)和透明地使用的“汽车”等等。然而,“主要语言数据”,通常称为“pld”,包括儿童在语言学习过程中接触到的句子集合(以及儿童对这些句子进行的任何分析;见下文),不能假设包含足够多的这些“最小差异句子”,以完全确定一个人对该词的倾向性。相反,乔姆斯基认为,决定一个人使用“汽车”的倾向性的是对该词的句法和语义属性的知识(例如,“汽车”是指汽车的名词),以及对具有这些属性的元素在整个语言中的功能的知识。因此,即使语言掌握在某种程度上是关于对“汽车”具有倾向性,条件反射机制也无法产生这些倾向性。儿童可以接触到的训练集太有限了:它没有足够多的正确类型的范例。

总之:斯金纳在所有方面都犯了错误。语言掌握不仅仅是拥有一套裸露的行为倾向的问题。相反,它涉及对自己语言属性的复杂和详细的知识。而语言学习不是被训练说什么的问题。相反,孩子们只需听到周围有人说话,就能轻松、迅速地学会语言,而且几乎没有明显的指导。

这些观点在接下来的五十年里推动了语言学理论的发展,值得强调的是,它们在当时是多么激进和令人兴奋。首先,解释语言使用涉及将知识归因于说话者的想法违背了当时盛行的行为主义观点,即谈论心理状态是不科学的,因为心理状态是不可观察的。它还引发了几个紧迫的实证问题,语言学家们仍在讨论。例如,说话者对语言的知识的内容是什么?[3] 说话者头脑中代表语言的哪些事实?这种知识在语言产生和理解的心理过程中实际起到了什么作用:语言使用的机制是什么?

其次,孩子们基本上是自己学会语言的这个观点对盛行的行为主义观念提出了激进的挑战,即所有学习都涉及强化。此外,它明确了我们需要更多“认知”或“心理学”的概念来理解语言学习的过程,并生动地提出了这个过程的先决条件的问题,这也是本文的重点。正如我们将在下一节中看到的,乔姆斯基准备好了一套理论来解决这些问题。

2. 语言先天性的论据

2.1 孩子们学习语言时学到了什么?

在心理学中,行为主义者的理论在 Chomsky 和其他人的压力下逐渐衰落的同时,语言学家们也放弃了所谓的“美国结构主义”在句法理论中的应用。与行为主义者一样,结构主义者(例如 Harris,1951)拒绝假设不可约的理论实体;他们坚持认为句法范畴(如“名词短语”(“NP”)或“动词短语”(“VP”)等)应该可以归纳为实际话语的属性(收集在“语料库”中 - 人们说过的事情的列表)。然而,在他的里程碑式著作《句法结构》(1957)中,Chomsky 认为,由于语料库只能包含有限数量的句子,任何归纳的尝试都不会成功。语言学家需要能够捕捉超出实际话语集合的规律性的理论构建,并且使他们能够预测新话语的属性。但是,如果名词短语(NP)的范畴,例如,包括尚未被说出的名词短语,那么名词短语的意义不能仅仅通过语料库中的内容来解释:结构主义者对理论类别的实证主义限制是错误的。

此外,结构主义者试图通过称为“短语结构规则”的简单重写规则来捕捉语言的句法属性。短语结构规则描述了句子类型的内部句法结构;将其解释为重写规则,可以用来生成或构造句子。因此,例如规则 S → NP VP 表示句子符号 S 可以重写为符号 NP 后跟符号 VP,并告诉您句子由名词短语后跟动词短语组成。(这些信息可以通过树状图(如图 1a)或短语标记(或标记括号)(如图 1b)来表示。)

[[ ]NP[ ]VP]S

(a)

(b)

图 1。通过(a)树状图或(b)标记括号表示句子由名词短语和动词短语组成的短语标记。

其他规则(例如 NP → Det N,VP → V NP,Det → a,the,…等等,V → hit,kiss…等等,N → boy,girl,…等等)随后被应用,并且(还有其他未在此处讨论的规则)允许生成诸如“The boy kissed the girl”、“The girl hits the boy”等句子。

Chomsky 争论(基于技术原因;参见 Chomsky 1957 年,第 1 章)语法必须通过第二类规则进行丰富,即“转换”。与短语结构规则不同,转换操作整个句子(或更严格地说,它们的短语标记),它们允许从旧句子(/短语标记)生成新句子(/短语标记)。例如,Chomsky 1957 年第 112 页描述的被动转换指定了如何将主动句子(/短语标记)转换为被动句子。简化一下,你可以将形式为 NP — Aux — V — NP 的主动短语标记(例如 Kate is biting Mark)的元素 x1 — x2 — x3 — x4 重新排列如下:x4 — x2 + be + en — x3 + by — x1,从而得到 Mark bite (+ is + en) by Kate。括号中的+ en 和+ is 调用了进一步的操作,将 bite 转换为 is being bitten,最终 Kate is biting Mark 被“转换”为 Mark is being bitten by Kate。

Chomsky 认为,只有包含短语结构和转换规则的语法才能生成自然语言——“生成”是指通过逐步应用规则,原则上可以从头开始构建出语言中所有且仅有的句子。因此,Chomsky 敦促开发这种类型的生成语法。

句法理论现在已经远远超出了这个早期的愿景——短语结构和转换规则都被 Chomsky 及其学生和同事们在连续的语言学革命中所放弃(参见 Newmeyer 1986 年、1997 年的生成语言学历史)。

但是没有改变的是,对我们来说重要的是,在每个版本的(比如)英语语法中,句子和短语的句法结构的规则都是以高度抽象的句法范畴来表述的,这些范畴与可体验的话语的特性高度抽象。以一个追踪的概念为例。追踪是出现在短语标记中的符号,标记了元素在句子推导的各个阶段中从一个位置移动到另一个位置的路径,如(1)中的 ti 标记了 NP Jacob 在推导的早期阶段的位置。

  1. Jacobi 似乎 [ti 已经消失]

但是,虽然追踪对于许多句法规则和规律的陈述至关重要,但它们是“空范畴”——在口语中听不到它们。(有关追踪和其他空范畴的更多信息,请参见 Chomsky 1981 和 Lasnik 和 Uriagereka 1986。)追踪(以及其他类似抽象的语言特性)因此对语言习得理论提出了一个问题。因为如果,正如 Chomsky 所主张的,掌握语言涉及到以句子的句法特性来表述的规则的知识,而这些特性在数据中所谓的“存在”并不明显,而是相当抽象和“不可观察的”,那么很难看出孩子们如何可能获得关于这些规则的知识。因此,孩子学习语言的成就似乎是神奇的:一个孩子如何仅通过接触周围说的句子就能学会掌握语言表达的无数规则?[4]

对于这个问题,大多数 20 世纪的理论家都追随乔姆斯基的观点,认为语言习得必须具备先天或天生的知识。说话者和听话者对语言(包括语法等方面)的了解与他们在学习过程中接触到的数据之间的差距太大,单靠学习的过程无法弥合这个差距。因此,由于孩子们显然能够学会语言,他们并不是语言的“白板”。相反,乔姆斯基及其追随者认为,人类儿童天生就掌握了“通用语法”或“UG”,这是一种描述所有自然语言最基本特性的理论(例如,元素在移动时会留下痕迹,它们的移动受到各种限制)。因此,学习一种特定的语言只是在这种先天知识的基础上进行进一步的发展,对于年幼的孩子来说,这似乎是一项相对简单的任务。

多年来,关于语言学习中先天贡献及其在学习过程中的阐述,提出了两种观点。在早期的著作中(例如,乔姆斯基 1965 年),乔姆斯基认为学习一门语言基本上是关于其语法的假设的制定和测试 - 当然是无意识的。他认为为了获得正确的语法,孩子必须先天地知道一个“规定可能的人类语言语法形式的语言理论”(1965:25) - 换句话说,她必须知道 UG。他认为这种知识体现在一套先天的语言能力、概念和对学习者可以提出进行测试的语法规则种类的限制上。根据这种观点(1965:30-31),先天的 UG 包括(i)一种分析和表示传入语言数据的方式;(ii)一套用于陈述语法假设的语言概念;(iii)一种判断数据与这些假设的关系的方式(一种“评估标准”);以及(iv)一套非常严格的对可供考虑的假设的限制。(i)到(iv)构成了语言能力的“初始状态”,而孩子通过对其本质进行基本上是一种科学探究的方式,达到最终状态(对自己的语言的知识)。

到了 20 世纪 80 年代,一种较少理性化的语言习得观念开始取代假设测试模型。早期的模型将儿童视为“小科学家”,积极(虽然无意识地)探索语法规则,而新的“参数设定”模型将语言习得看作一种生长或成熟的过程;语言习得是一种发生在你身上的事情,而不是你主动去做的事情。先天的普遍语法不再被视为推理工具的一套工具;相反,它被看作是一套高度详细的实际语法原则的表征。当然,由于不是每个人最终都说同一种语言,这些先天的表征必须允许一定的变化。在这个模型中,通过“参数”的概念来实现这一点:一些先天表征的语法原则包含可以取一定(高度受限)范围内值的变量。这些不同的“参数设定”是由儿童的语言经验决定的,并导致不同语言的习得。因此,乔姆斯基(1988:61-62)将学习者比作一个开关箱:就像开关箱的电路已经就位,只需将某些开关切换到一个位置或另一个位置一样,学习者对语言的知识基本上已经就位,只需通过语言经验来设置一些语言“开关”。

为了说明参数设置的工作原理,考虑一个简化的例子(在 Chomsky 1990:644-45 中更详细地讨论)。所有语言都要求句子有主语,但是一些语言(如英语)要求主语在话语中明确表示,而其他语言(如西班牙语)允许在书写或口语中省略主语。因此,一个想要表达自己会说西班牙语的西班牙语使用者可以说 Hablo español(省略了第一人称代词 yo),而不违反西班牙语的规则,而一个想要表达同样意思的英语使用者不能说*Speak Spanish,因为这样会违反英语的规则:为了语法正确,他必须说 I speak Spanish。参数设置模型通过提出在英语和西班牙语使用者中设置不同的“空主语参数”来适应这种差异:西班牙语使用者将其设置为“主语可选”,而英语使用者将其设置为“主语必须”。如何设置呢?一个提议是将参数默认设置为“主语必须”,而听到无主语句子会导致将其设置为“主语可选”。由于学习西班牙语的儿童经常听到无主语句子,而学习英语的儿童则不会,因此西班牙语学习者的参数设置会发生变化,而英语学习者的参数设置则保持默认设置。(Roeper 和 Williams 1987 是参数设置模型的经典文献;Ayoun 2003 更为更新;Pinker,1997 年第 3 章提供了一个有帮助的非技术概述。)

这两种语言习得方法在对学习过程的本质和学习者在其中的角色的理解上明显存在显著差异,但我们并不关心在此评估它们各自的优点。对我们来说,更重要的是它们都将大量与语言有关的先天信息归因于语言学习者。接下来,我们将更详细地探讨已被用来支持这种“先天主义”语言习得理论的各种论据。我们将重点关注以下问题:

有哪些证据表明儿童在语言学习任务中具备一种特殊的先天语言信息存储,例如语言学家的“普遍语法”理论中所指定的内容?

术语说明:正如乔姆斯基所承认的(例如,1986:28-29),在他的著作中,“普遍语法”一词具有系统的歧义性。有时,该术语指的是学习者被假设具备的与语言有关的先天知识,即语言能力的“初始状态”的内容,无论该知识/内容是什么。其他时候,“普遍语法”用于指称关于我们先天语言知识内容的某些具体提议,例如政府-约束理论家声称我们具备关于结构依赖原则、约束理论、θ 理论、空范畴原则等方面的先天知识。

当评估乔姆斯基主张我们对 UG(通用语法)具有先天知识时,这种歧义是重要的。根据上述第一种解读,“通用语法”只要与语言学习者的任何先天主义相关(即,只要他们具有任何关于语言的先天知识),那么这个主张就是正确的。然而,根据第二种解读,学习者可能具有关于语言的先天知识,但这种知识并不是关于 UG 的知识(如语言学家目前所描述的)。学习者可能对语言有所了解,但并不了解绑定理论、结构依赖原则等等。

在本条目中,“通用语法”将始终以第二种意义使用,指的是关于学习者对语言的先天知识内容的具体理论。如果问题仅涉及他们是否具有某种关于语言的先天知识(而对于该知识的任何特定理论是否正确持中立态度),我将谈论“先天语言信息”。显然,主张说话者具有 UG 的先天知识意味着他们可以利用先天的语言信息。然而,反过来并不成立:有理由认为说话者在先天上对语言有所了解,但这并不构成认为他们所知道的是乔姆斯基语言学家所描述的通用语法的理由;乔姆斯基可能正确地认为我们对语言具有先天知识,但对于该知识的内容他可能是错误的。如有必要,这些问题将在下文中进行澄清。

2.2 乔姆斯基关于语言先天性的“刺激贫乏”论证

正如我们在 §1.1 中所看到的,乔姆斯基从他对斯金纳计划的批评(1959 年)中得出的一个结论是,语言不能仅通过思想的联想(如在条件反射中发生的那样)来学习。由于语言掌握涉及语法知识,并且由于语法规则是定义在不可通过经验获得的话语属性上的,语言学习必须更像是科学中的理论建构。儿童似乎是“小语言学家”,对他们的语言的语法提出高度理论化的假设,并通过他人的言行对这些假设进行测试:

看起来很明显,语言习得是基于儿童从形式观点来看是一个深层次和抽象的理论的发现 - 他的语言的生成语法 - 其中许多概念和原则只与经验通过长而复杂的推理步骤相关联。(乔姆斯基 1965:58)

然而,乔姆斯基认为,正如条件反射对于解释儿童习得语言的能力来说是一种过于弱的学习策略一样,归纳推理或假设测试在科学中也是如此。成功的科学理论建构需要大量的数据,既可以提出合理的假设,也可以排除任何错误的假设。但是儿童在语言学习的几年中可以接触到的数据(“主要语言数据”或“pld”)在两个重要方面都非常贫乏:

  1. 它们构成了自然语言中无限句子中的一个小有限样本

  2. 它们并不可靠地包含学习者需要证伪错误假设的句子类型

第一种不足当然是任何经验研究都普遍存在的问题:即理论受证据不确定性的限制。Cowie 在其他地方曾经论证过,仅仅是因为理论受证据不确定性的限制,并不能作为先天主义的证据:如果是这样的话,我们就必须对人们学习的一切事物都持先天主义的观点(Cowie 1994; 1999)。那么第二种贫乏是什么情况呢?如果儿童所能获得的关于语言的证据不能使他们拒绝错误的假设,但他们仍然能够找到正确的语法,那么语言学习就不可能成为一种科学探究,因为科学探究在一定程度上依赖于能够找到证据来排除错误的理论。而且,这正是乔姆斯基所主张的:由于儿童所接触到的语言证据不足够丰富或多样化,使得学习者无法从中得出关于所学语言语法的正确假设,因此语言不能从这些证据中学习。

考虑到:(i) 事实上,自然语言是无限的,而人类语言是有限的,这表明儿童在学习语法时必须超越数据进行概括:他们必须提出适用于尚未听到的话语的规则。然而,这也为错误留下了空间。为了从特定类型的错误中恢复过来,儿童需要获取特定类型的数据。如果这些数据不存在,如(ii)所断言的那样,那么儿童将无法纠正他们的错误。因此,由于儿童最终会收敛于他们语言的正确语法,他们在第一次就不会犯这些错误:某种东西必须阻止他们从不能根据有限数据纠正的概括中进行。

Chomsky(例如,1965 年:30-31)用约束的需求来表达这个最后一点-对语法概念、假设空间、数据解释的约束,并提出先天的 UG 知识提供了所需的限制。从这个观点来看,学习语言的儿童不是开放心态或天真的理论生成者-他们不是“小科学家”。相反,人类语言学习机制(“语言习得装置”或“LAD”)体现了关于人类语言的内在知识,这种知识阻止学习者接受大多数可能的语法理论。正如 Chomsky 所说:

考虑到…可用数据的退化质量和有限范围…几乎没有希望通过最初对其一般特征一无所知的有机体来学习语言的大部分结构。(1965 年:58)

Chomsky 很少以其一般形式陈述刺激贫困的论点,就像 Cowie 在这里所做的那样。相反,他通常通过一个例子来呈现它。其中之一涉及学习如何形成“极性疑问句”,即通过“助动词前置”这种机制来要求是或否的问题。[5]假设一个孩子听到了以下这样的句子对:

1a.Jacob 今天很开心

1b.

Jacob 今天开心吗?

2a.

女孩们在跳舞

2b.

女孩们在跳舞吗?

她想弄清楚你用来将像(1a)和(2a)这样的陈述句转变为像(1b)和(2b)这样的疑问句的规则。这里有两种可能性:

H1.找到句子中“is”的第一个出现位置,并将其移到句子的前面。

H2.

找到句子中主语名词短语(“NP”)后面的第一个“is”的出现位置,并将其移到句子的前面。

这两个假设都足以解释学习者迄今为止遇到的数据。然而,对于任何没有偏见的科学家来说,H1 显然比 H2 更可取,因为它更简单——首先,它更短,并且不涉及理论属性,如成为一个 NP,而是以“可观察”的属性,如词序来表达。尽管如此,H1 是错误的,当你看到像(3)这样的例子时就会明显。

3a.[在跳跳城堡里的女孩]NP 是凯莉的女儿

3b.

*是 [在跳跳城堡里的女孩]NP 是凯莉的女儿吗?

3c.

是 [在跳跳城堡里的女孩]NP 凯莉的女儿吗?

H1 生成了不符合语法的问题(3b),而 H2 生成了正确的版本(3c)。[6]现在,你、我和其他所有的英语使用者都知道(在某种意义上——见 §3.2.1a),H1 是错误的,而 H2 是正确的。乔姆斯基认为,我们之所以知道这一点,是因为我们都知道(3b)不是说(3c)的正确方式。问题是我们是如何学会这一点的。

例如,假设一个孩子根据她对(1)和(2)的经验采用了 H1。她将如何发现自己的错误?似乎有两种方法可以做到这一点。首先,她可以在自己的言语中使用 H1,说出像(3b)这样的句子,并被父母或照顾者纠正;其次,她可以听到一个能力强的说话者说出像(3c)这样的句子,并意识到那个句子不是由她的假设 H1 生成的。但通常父母不会纠正他们孩子的不规范言语(有关此事的更多信息,请参见 §2.2.1(c)),更糟糕的是,根据乔姆斯基的观点,像(3c)这样的句子——这些句子不是由错误的规则 H1 生成的,因此会证明它是错误的——在 PLD 中出现的次数不足以保证每个以英语为母语的人都能正确理解。

因此,对于问题的回答:我们如何学会 H2 比 H1 更好,乔姆斯基认为我们根本就没有学会这一点!关于我们都知道 H2 是正确的而 H1 是错误的,一个更好的解释是我们生来就知道这个事实。或者更准确地说,我们生来就知道 UG 的某个原则(“结构依赖原则”),它告诉我们像 H1 这样的规则不值得追求,尽管它们表面上“简单”,而我们应该始终偏好像 H2 这样以句子结构属性来表述的规则。总之,我们知道 H2 是比 H1 更好的规则,但我们并没有从我们对语言的经验中学到这一点。相反,这个事实是我们先天对 UG 的知识的结果。

Chomskyans 争论说,在许多其他情况下,说话者-听话者知道语法规则,而这种有利证据在 pld 中缺失。例如,Kimball 1973:73-5 认为,像 might have been 这样的复杂辅助序列在 pld 中“极其罕见”,因此儿童在没有相关经验的情况下就能掌握这些结构(即知道将情态动词、完成时和进行时元素放置的顺序)。(Pullum 和 Scholz 2002 讨论了另外两个众所周知的例子。)先天主义者因此得出结论,UG 的许多其他原则也是先天知识。这些 UG 原则共同对学习者的语言理论进行了严格限制,防止他们犯下没有证伪数据的错误。

根据 Chomskyans 的说法,pld 的贫困现象是如此普遍,以至于整个学习范式似乎不适用于语言。随着越来越多且越来越严格的先天限制需要对学习者的假设空间进行施加,以解释他们在没有相关数据的情况下学习规则,假设生成和测试等概念似乎越来越不重要。这种情况推动了最近从语言习得的假设测试模型转向 2.1 节中讨论的参数设置模型。

2.2.1 对刺激贫乏论的批评

许多现代语言学和认知科学的理论家都接受了乔姆斯基关于 UG 先天性的刺激贫乏论证。因此,在过去的 40 多年里,语言习得的大部分研究都以语言先天论为基础。然而,了解对这一论证提出的批评是很重要的,我将其方便地概括如下:

刺激贫乏论的一般论证形式

  1. 掌握一门语言(部分地)包括了对其语法的了解。

  2. 为了学习某个语法规则,G 儿童必须能够接触到一定类型的数据 D,这些数据可以证伪竞争假设。

  3. 主要的语言数据(pld)中不包含数据 D。

因此,先天的语言能力无法解释 G 儿童如何学习这个规则。

  1. G 无法被学习。

  2. 这种情况非常普遍:许多语法规则无法从先天习得。

所以

  1. UG 先天而知。

2.2.1(a) 前提 1:语法知识

在 20 世纪 70 年代,哲学家们对于乔姆斯基用“知道”一词来描述说话者与语法的关系提出了质疑,他们认为与命题知识的标准情况不同,大多数说话者对于语法规则是完全不知道的(例如,“指代词在其约束域内是受限的,而代词和 R 表达式则是自由的”),即使告诉他们这些规则,他们很可能也不会理解(Stich 1971)。作为回应,乔姆斯基(例如,1980:92)开始使用一个技术术语“认知”来描述说话者与语法的关系,避免使用哲学上具有争议的术语“知识”。

然而,虽然提出说话者和语法之间存在特殊关系是合理的,但关于认知的确切性质仍然存在未解答的问题。它是一种表征关系,像信念一样吗?如果不是,那么“学习语法”意味着什么?如果是,说话者对语法的表征是“显性的”还是“隐性的”或“心照不宣的” - 这些术语究竟意味着什么?(有关这个问题的讨论,请参见收录在 MacDonald 1995 中的论文;有关在语言的产生和理解中说话者是否使用任何语法规则的表征的论据,请参见 Devitt 2006。)相关的是,说话者对语法的认知(在乔姆斯基的术语中称为“能力”)如何在她的语言“表现”中发挥作用 - 即在实际的话语产生或理解中?

这些问题涉及到刺激贫乏论的论证,因为这个论证的可信度取决于对这些问题的回答。例如,如果一个人认为语法是一种类似信念的实体,在我们的头脑中以某种内部编码明确地表示(参见 Stich 1978),那么如何获得和证明这些信念的问题确实是一个紧迫的问题,同样,出于不同的原因,它们在表现中的功能也是一个问题(参见 Harman 1967, 1969)。然而,如果有人否认语法在说话者的头脑中根本没有被表示,就像 Devitt 2006 和 Soames 1984 一样,那么语言是如何学习的以及“证据”等在这个过程中起什么作用的问题就会有很大的不同。或者,如果采用第三种可能性,完全拒绝生成句法,并采用对说话者的语法知识内容有不同构想的方式,比如 Tomasello(2003)的观点,那么这又会影响人们对学习过程的看法。换句话说,一个人对所学内容的观念会影响他对学习所需的观念。对语言习得结果要求较低的观念对其输入(无论是经验性的还是先天的)要求较低;这个问题的最后一种方法在下面的 §2.2.1 中进一步讨论。

2.2.1(b) 前提 2:学习算法

在上面讨论的极性疑问句的例子中,我们看到儿童似乎需要明确的证据来排除看似合理但错误的假设 H1。论证的第二个前提将这个主张推广到了更多情况:学习者在纠正错误时需要特定类型的证伪数据(论证进一步声称这些数据是不可获得的)。关于学习语法所需的数据的这些主张是建立在对他们所采用的学习算法的某些假设之上的。例如,假设只有在数据中明确证伪时才会拒绝错误假设的观点表明,学习者无法采取任何概率或整体的确认和证伪方法。同样,没有先天 UG 知识的学习者很可能会提出错误的假设,这表明他们生成假设的方法对背景信息或过去经验不敏感。(例如,关于在其他情境中哪些概括是有效的信息)

乔姆斯基在刺激贫乏论的原始版本中设想的非先天主义语言学习者,换句话说,局限于一种波普尔式的方法论——涉及列举所有可能的语法假设,每个假设都与数据进行测试,并且只有在明确证伪的情况下才被拒绝。然而,过去半个世纪的科学哲学研究表明,这种方法几乎无法学到任何东西:世界通常无法提供证伪的证据。相反,假设的生成必须是归纳性的,并且(证伪)确认是一个整体性的问题。

因此,对于乔姆斯基的论证来说,出现了两个问题。首先,如果语言学习者采用猜测和反驳的方法,那么从数据中无法学习语言并不令人意外。换句话说,刺激贫乏论证并没有告诉我们太多我们不知道的东西。其次,由于这个原因,这个论证相当薄弱:它指出语言习得不是通过波普尔式的学习策略发生的,但它对这种习得理论没有提出具体的替代方案。特别是,这个论证对于先天主义(UG 理论)和基于统计信息提取的语法假设的理论一样没有更多的支持,而且他们可能因为缺乏明确的确认或者与语法的其他部分不一致等原因而被拒绝。

作为回应,一些乔姆斯基派(例如,马修斯 2001 年)挑战非先天主义者提出这些替代理论并将它们提交给实证测试。他们声称,对于那些只是经验主义者设想中的理论来说,先天主义者试图反驳是毫无意义的,尤其是当乔姆斯基的方法如此成功,并且可能通过最佳解释的强有力推理得到支持。其他人则明确反对特定的非先天主义理论,例如马库斯在 1998 年和 2001 年讨论了连接主义语言习得理论的缺点。

迈克尔·托马塞洛(Tomasello 2003)最近的一本书直接回应了先天论者对替代理论的需求。托马塞洛认为,语言学习者通过使用归纳、类比和统计学习方法,并通过检查更广泛的数据以进行确认和否认,来获得关于句法的知识。他认为,儿童在学习过程中相对较晚(大约在 4 或 5 岁时)才能形成抽象的句法概括,而他们最早的话语受到较不一般的经验法则或“构造”的支配。通过应用模式识别技能(“类比”)和对输入数据和先前获得的构造进行统计分析的方式,逐渐形成更抽象的构造,这些构造以越来越像成年人和“句法”术语的形式呈现,托马塞洛称之为“功能分布分析”。[7]

Tomasello 的理论在三个重要方面与 Chomskyan 方法不同。首先,正如前一节提到的,它采用了一种不同的语言能力概念,即学习过程的最终状态。Tomasello 并不认为能胜任的说话者以生成语言学家设计的最抽象、简单和优雅的语法规则为代表,而是认为他们在各种不同抽象层次上使用规则,并且重要的是,这些规则并非纯粹以句法术语来表述。他采用了一种不同类型的语法,称为“认知功能语法”或“基于使用的语法”,其中规则部分以句法范畴来表述,但也以语义术语来表述,即以其使用模式和交际功能来表述。Tomasello 的方法与 Chomskyan 传统中大多数理论家的方法不同的第二个方面是,它对“主要语言数据”或 pld 有更丰富的概念。对于生成语言学家来说,pld 包括一组句子,可能还经过一些初步的句法分析,而学习语法的孩子被认为具有将该句子集映射到其语言的生成语法的函数。而在 Tomasello 的观点中,pld 不仅包括一组句子,还包括关于说话者如何使用句子来实现其交际意图的事实。在他看来,儿童还会利用语义和语境信息来获取语法知识。

Tomasello 认为,通过采用更加“用户友好”的自然语言语法概念,并通过彻底扩展儿童学习语言可获得的与语言相关的信息的概念,从而在很大程度上消除了从刺激贫乏论中利用的“差距”——即我们对语言的了解与我们从中学习语言的数据之间的差距。这引发了 Tomasello 理论与语言先天主义者理论不同的第三个重要方面。在他的观点中,儿童在学习语言时不需要任何与生俱来的语言信息的帮助:儿童在语言学习任务中所带来的——他们的先天禀赋——并不是特定于语言的。相反,它包括“心智阅读”,以及在其他领域以及语言学习中使用的感知和认知技能。这些技能包括:(i)与他人共享注意力的能力;(ii)辨别他人意图的能力(包括他们的交际意图);(iii)感知能力,将语音流分割为不同抽象层次上的可识别单元;以及(iv)一般推理能力,例如识别世界上各种模式的能力,在某些方面相似的模式之间进行类比,以及对这些模式进行某些类型的统计分析的能力。因此,Tomasello 的理论与先天主义方法形成鲜明对比。

尽管评估 Tomasello 关于语言习得的理论超出了本条目的范围,但可以说这么多:经验主义者未能提供全面可测试的与 Chomskyanism 相对的替代方案的指责已经不再站得住脚,如果语言习得的“什么”和“如何”符合 Tomasello 所描述的方式,那么语言先天主义的动机在很大程度上消失了。

2.2.1(c) 前提 3:pld 包含什么内容?

先天/后天的第三个问题是刺激贫困论的贫乏证据。对于该理论关于儿童语言发展(pld)的内容,很少有系统性的尝试提供实证证据来支持其主张。这是一个旧的抱怨(参见 Sampson 1989),最近被 Pullum 和 Scholz 2002、Scholz 和 Pullum 2002 以及 Sampson 2002 重新提出并得到了一些有力的支持。Pullum 和 Scholz 提供了证据,与 Chomsky 在他对极性疑问句的讨论中所断言的相反,儿童可以期望遇到大量的数据,这些数据会让他们意识到 H1 的错误。Sampson 2002 挖掘了“英国国家语料库/人口统计学”,这是一个包含 1 亿个词的日常英国口语语料库(可在线访问 http://info.ox.ac.uk/bnc/),证明了与 Kimball 所声称的复杂助动词“极其罕见”相反,实际上它们相当频繁地出现(大约每 1 万个词至每 7 万个词一次,或每隔几天至每周一次)。

乔姆斯基派对这样的发现有两种主要反应。首先,他们认为,仅仅展示出一些孩子可以预期听到像“在跳跳城堡里的女孩是凯莉的女儿吗?”这样的句子是不够的。所有的孩子都学会了正确的规则,所以这个主张必须是所有的孩子都能够听到这种形式的句子——尽管刚才讨论的数据不可信,但这个主张仍然不可信。为了进一步探讨这个问题,有必要确定孩子们何时掌握了相关的结构,但在这个问题上几乎没有什么研究工作。Sampson 2002:82ff.在他的英国国家语料库样本中没有找到形式良好的助动词前置疑问句(例如“在跳跳城堡里的女孩是凯莉的女儿吗?”)。他指出,除了支持乔姆斯基关于 pld 贫乏性的主张外,这些数据同时也问题化了他关于儿童对助动词前置规则本身的知识的主张。Sampson 发现,说话者在显然试图产生复杂的助动词前置疑问句时总是犯错误,并经常将他们的话改成标签形式(例如,“在跳跳城堡里的女孩是凯莉的女儿,不是吗?”)。他推测,即使在成人语言中,这种结构也不是惯用的,说话者在接触到书面英语中的这种问题后才学会形成和解读这样的问题。如果是这样的话,那么在 pld 中缺乏复杂的助动词前置疑问句既不足为奇,也不成问题:年幼的孩子听不到这些句子,也不会学习这个规则。据我所知,儿童对助动词前置规则的能力尚未经过实证研究。

其次,乔姆斯基派可能提出刺激贫困论的其他版本。例如,Crain 1991 构建了一个关于儿童对运动约束知识习得的刺激贫困论。然而,虽然 Crain 的论证仔细记录了儿童对相关语法规则的遵循,但其先天主义的结论仍然依赖于对相关形式或证据在先前语言环境中不发生的未经证实的直觉。因此,这个论证是没有定论的。(参见 Crain 1991;Cowie 1999 讨论了 Crain 的实验及其含义;另见 Crain 和 Pietrowski 2001, 2002)。

2.2.1(d) 论证的有效性

从(1)、(2)和(3)到(4)的论证似乎是有效的。然而,正如我在对前提(2)的讨论中隐含的那样,“学习”一词在不同意义上的模棱两可是有问题的。如果(1)-(3)是真实的,它们表明语法 G 不能通过使用“波普尔式”学习策略的学习者从先前语言环境中学习,即一种“大胆猜测”和反驳的策略。然而,(4)的结论是,G 是无法从先前语言环境中学习的,这一点几位作者,特别是连接主义者,对此提出了异议。(详见 Elman 等人 1996 年和 Elman 1998 年对乔姆斯基派先天主义的批评;参见 Marcus 1998 年和 2001 年的回应。)

乔姆斯基派通常接受这一观点,承认刺激贫乏论的论证并非必然的。尽管如此,他们声称这是一个非常好的论证,并且证明的责任应该由他们的批评者承担。毕竟,先天论者已经证明了唯一的非先天论习得理论的虚假性,这些理论已经被充分研究并可进行实证测试,即斯金纳的行为主义和波普尔的猜测与反驳。此外,他们提出了一种替代理论,即乔姆斯基的先天论,这个理论足以解释这些现象。在实证科学中,这已经是他们合理被要求做的一切。可能存在其他可能解释儿童语言习得能力的习得算法并不重要;先天论者并不需要反驳仅仅是可能性的论证。

作为回应,一些非本体论者认为,基于 UG 的语言习得理论实际上并不是好的理论。例如,托马塞洛(2003: 182ff.)指出了 UG 理论的两个主要困难领域,比如原则与参数方法。首先,存在“连接”问题,这源于语言多样性的事实:几乎没有基于 UG 的解释能够说明儿童如何将 UG 的高度抽象的范畴与他们所学习的特定语言中的实例联系起来[10]。他的例子是“头”这个范畴。为了设定“头参数”,一个孩子需要能够确定她听到的噪音流中哪些词实际上是从属于从句的头部。但是头部“在特定语言中没有附带识别标签;它们在不同语言中没有共同的感知特征,因此它们的识别方式无法在[UG]中具体说明”(托马塞洛,2003:183)。其次,还存在发展变化的问题,这也是索科洛夫和斯诺(1991)强调的。很难看出基于 UG 的方法如何解释儿童的语言表现似乎是逐步随时间出现的,而不是像参数设定模型所暗示的那样一次性以成人的形式出现[11]。作为回应,生成主义者提出了“成熟因素”或“表现因素”等概念。但是,托马塞洛认为,在没有详细说明这些成熟或表现因素是什么以及它们如何导致儿童的实际表现的情况下,这些措施是临时的。

至少,这样的反对意见有助于平衡证明的负担:非先天主义者肯定有工作要做,但先天主义者也是如此。仅仅假设先天的普遍语法(UG)和一种“触发”机制,通过这种机制,它会“发展”成为完全发展的语言是不够的。先天主义者需要展示他们的理论如何能够解释已知的语言习得过程。仅仅指出这样的理论可能是真实的,并且如果是真实的,它们将解释在所谓的贫乏刺激面前语言学习如何发生,这只是工作的一部分。

2.2.1(e)前提 5:刺激的贫乏程度有多大?

因为他们在捍卫 UG 全部是先天的观点,所以应该认可乔姆斯基派持有的观点,即原始数据在相当程度上是贫乏的。也就是说,如果先天主义者要通过刺激的贫乏来支持 UG 的先天性,那么这个想法必须是先天主义者详细讨论的案例(极性疑问句,复杂助动词等)只是无法学习的冰山一角。先天主义者合理地不试图通过无休止的列举案例来捍卫这一主张。相反,他们转向另一种类型的论证来支持“全局贫乏”立场。这个论证有时被称为“语言习得的逻辑问题”;在这里,我们将称之为“遗忘问题”。将在第 3 节讨论。

2.2.1(f) 论证的有效性(II):先天是什么?

假设原始语言数据在所有先天主义者声称的方面都很贫乏,并且假设儿童知道一些没有证据支持的事情 - 假设,正如 Hornstein 和 Lightfoot(1981:9)所说的那样,“[p]人们获得了关于他们的语言结构的知识,而这些知识在他们作为儿童接触到的数据中没有证据可用。” 由此得出的结论是学习机制必须受到限制:儿童不会列举所有可能的语法假设并将其与数据进行测试。一些可能的假设必须先验地被排除。但是,批评者声称,由此得出的结论并不意味着对所需约束性质的任何特定观点。 (Cowie 1999:第 8 章。)更不用说,由此得出的结论并不意味着先天存在通用语法的观点(根据上述术语注释 2 的结构属性的共同理论)。

就刺激贫乏论所展示的所有贫乏之处而言,所讨论的限制可能确实是与语言相关且先天的,但其内容与当前 UG 理论中提出的内容完全不同。或者,这些限制可能是先天的,但不是与语言相关的。例如,正如 Tomasello 2003 所认为的,儿童早期的语言理论化似乎受到了他们与他人共享注意力和辨别他人交际意图的先天能力的限制。在他的观点中,儿童早期的语言假设是基于这样的假设:与他交谈的人试图传达关于他们当前共同关注的事物的信息。(关于哺乳动物听觉系统结构的先天但非语言特定的语言学习限制的另一个例子是“范畴感知”,与获得语音知识有关,详见下文第 3.3.4 节)。另一种可能性是这些限制可能是通过过去的经验学习得来的。再次举个例子,来自 Tomasello(2003)。他认为,扎根性,或者说一个语言元素在特定交际功能中被使用的频率,是儿童后期句法知识发展的重要限制。例如,实验证明,一个孩子越经常听到一个元素被用于特定的交际目的,她就越不可能将该元素扩展到新的语境中。(参见 Tomasello 2003:179)。

简而言之,有很多方法可以限制学习者对他们的语言如何运作的假设。由于刺激贫乏论仅仅表明了对限制的需求,它并没有回答这些限制可能是什么样的问题。

针对这种观点,乔姆斯基派指出,UG 的先天性是一种经验假设,得到了完全可敬的最佳解释推理的支持。当然,在某种程度上,我们可以认为某种东西限制了习得机制,并且乔姆斯基派认为这些限制是先天的绑定理论、θ 理论、ECP、贪婪原则或最短路径等的内在表征。但仅仅因为刺激贫乏的论证并不能证明 UG 是先天知识,这并不足以抱怨。毕竟,这是科学,演示性证明既不可能也不需要。刺激贫乏的论证提供的是有充分理由认为学习机制存在强大限制的理由。UG 可以提供这些限制的理论。此外,这个理论在过去 50 年里在许多领域(语言学、心理语言学、发展心理学、第二语言研究、言语病理学等等)产生了很多研究成果。这些成功远远超过了非先天主义学习理论家在他们最疯狂的梦想中能够实现的任何成就,并支持了对乔姆斯基派的最佳解释的有力推理。

2.2.1(g) 谁有证明的责任?

如上所述(§2.2.1(d)),然而,对于乔姆斯基派解释语言习得现象的能力的强度已经受到了质疑,隐含其中的是对她最佳解释的推理的强度的质疑。此外,在科学哲学中存在一个关于最佳解释推理的合理性的普遍辩论:最佳解释是否仅仅因为它是最好的可用解释而给出任何额外的理由(超过了它能够解释其领域内现象的能力)来认为它是真实的?[有关此主题的更多信息,请参阅彼得·阿钦斯坦的百科全书文章“Abduction”。]

在语言学的情况下,有时似乎支撑人们在这些问题上立场的是对于在这场辩论中谁有证明责任的不同直觉。经验主义者或非先天论者认为,乔姆斯基派没有提供足够的数据(或考虑足够的替代假设)来证明他们的观点。乔姆斯基派回应说,他们已经做得足够多了,责任在于他们的批评者要么提供证据来反驳他们的观点,要么提出可测试的替代观点。

这种责任转移在讨论语言先天论时普遍存在(Ritter 2002 年的交流是一个例证),这使我认为在这场辩论中,双方都还没有履行自己的义务。关于语言习得的经验主义者已经能够指出乔姆斯基派观点的一些弱点,但他们才刚刚开始承担起发展非先天论学习理论的艰巨任务,无论是针对语言还是其他任何事物。先天论者满足于关于语言习得和先天知识的假设,这些假设基于看似合理但大部分未经证实的关于 pld 内容以及儿童所知和所说的主张。

如何解决这类争论尚不清楚。虽然有些人可能持不同意见(尤其是一些乔姆斯基派),但似乎仍然需要做大量工作来理解儿童如何学习语言,不仅仅是在确定参数设置的细节方面,还包括重新构思语言能力的内容以及其如何习得。在心理学领域,由于 Elizabeth Bates、Jeffrey Elman、Patricia Kuhl、Michael Tomasello 等研究人员的工作,过去 10 年左右已经开始出现了一种新的、非先天论的关于语言和学习的思考范式。读者可以参考 Elman 等人的 1996 年作品、Tomasello 的 2003 年作品以及下面的第 3 节来了解这种思考方式。

目前,考虑到空间需求,我们需要回到我们的话题,即语言先天论,而不是进一步讨论替代方案。

2.3 “遗忘问题”的论证

我们在前一节中看到,为了支持所有 UG 都是先天知识的观点,关于语言的先天论者不仅需要认为语言学习的数据在一些孤立的情况下是贫乏的,而且需要认为它在整个领域都是贫乏的。也就是说,为了支持先天对语言习得的贡献是像普遍语法的知识一样丰富和详细,先天论者必须认为语言习得的输入在许多广泛的情况下是有缺陷的。(毕竟,如果输入只在一些孤立的情况下是退化的,比如上面讨论的那些情况,学习问题可以简单地通过假设对一些相关的语言提示具有先天知识来解决,而不是 UG 的全部。)

Pullum 和 Scholz(2002:13)有助于对先天主义者提出的这一观点进行了全面调查,包括:

  1. 有限性:pld(主要语言数据)是有限的,而语言包含无限多的句子。

  2. 不确定性:pld 始终与无限多的语法假设相容。

  3. 先天性:pld 包含不符合语法和不完整的句子。

  4. 后天性:学习相同语言的不同儿童接触到不同的句子样本。

  5. 正性:pld 只包含正例(即要学习的语言的句子,也称为“目标语言”)。

  6. 没有反馈:孩子们在做对事情时没有被告知或奖励,并且在犯错误时没有被纠正。

在这一部分中,我将把特征(i)和(ii)放在一边,因为它们是任何经验领域的特征:数据总是有限的,并且它们总是不足以支持一个理论。毫无疑问,对于认识论学家和科学哲学家来说,解释普遍理论如何能够被证实和被相信是一个重要问题。同样,对于心理学家来说,解释个体如何在基于经验的基础上获得关于世界的普遍知识的机制也是一个重要问题。但是,数据的不足和有限性是每个人的问题:如果语言学习情境本身的这些特征支持先天论,那么我们应该接受所有学习,在每个领域都需要先天特定领域的知识。但是,虽然我们知道超越数据的一切都是我们具有特定领域的先天知识的结果并非不可能,但这种观点是如此不可信以至于在这里不值得进一步讨论。

我还放弃了特征(iii)和(iv)。首先,不清楚 pld 有多么退化;根据早期的估计,母亲对孩子的话语中有 99.7%是语法无可挑剔的(Newport, Gleitman 和 Gleitman 1977)。即使数据比这个数字所示的更混乱,假设大部分语法正确的话语会轻易淹没任何残留的噪音也不是不合理的。至于不同儿童数据集的特异性,这不是刺激贫乏的问题,而是刺激差异的问题。因此,只有在假设不同儿童的语言知识状态与他们的经验差异相比较小的情况下,特异性才成为非先天主义者的问题。据我所知,从来没有人认真提出过这个最后的主张。[12]

在本节中,我们将重点关注 pld 的特征(v)和(vi)。因为对数据集的积极性和儿童可获得的反馈的考虑,才引发了我所称的“遗忘问题”,也被误称为“语言习得的逻辑问题”(有关该论点的陈述,请参见,例如,Baker 1979; Lasnik; 1989:89-90; Pinker 1989)。

图 2. 假设(H)生成的语言与目标语法(L)之间的五种可能关系

以一个学习语言 L 语法的孩子为例。图 2 表示她当前假设 H 生成的语言与目标语法 L 生成的语言之间可能存在的 5 种关系。 (v)表示学习过程的终点:学习者已经找到了她的语言的正确语法。处于情况(i),(ii)或(iii)的学习者状态良好,因为她可以轻松地使用 PLD 作为纠正假设的基础,方法如下:每当她遇到一个数据中的句子(即 L 的句子),该句子不是由 H 生成的,她就必须“扩展”她的假设,使其生成该句子。这样,H 将按预期朝着 L 不断前进。然而,假设学习者发现自己处于情况(iv),即她的假设生成了所有目标语言 L 以及更多。 (例如,孩子们经常处于这种情况,他们总是经历一个阶段,过度使用规则的过去时动词结束形式到不规则动词上;他们的语法生成了不正确的_I breaked it 以及正确的 I broke it。)在这种情况下,她陷入了困境,因为她无法使用 PLD 发现自己的错误。毕竟,L 的每个句子已经是 H 的句子。为了“缩小”她的假设-“取消学习”生成_I breaked it 的规则-她需要知道 H 的哪些句子不是 L 的句子-她需要弄清楚*I breaked it 不是英语的句子。但是-这就是问题所在-这种证据,通常称为“负面证据”,被认为对语言学习者不可用。

因为我们已经看到,PLD 主要只是目标语言的一些句子样本,包含很少甚至没有关于非句子词组的信息。例如,孩子们不会被给予不符合语法的词组列表。他们犯错误时通常也不会被纠正。他们也不能简单地假设未出现在样本中的词组是不符合语法的:因为有无数句子不在数据中,只是因为还没有人说过它们。

总之:处于情况(iv)的孩子——语法“过度生成”的孩子——需要负面证据来纠正错误。然而,负面证据似乎并不存在。由于孩子们确实能够学习语言,他们必须从未陷入情况(iv):他们从未需要“忘记”任何语法规则。他们可以通过两种方式做到这一点。一种方式是根本不超越数据进行概括。但显然,孩子们确实会概括,否则他们将永远无法成功学习一门语言。另一种方式是如果有某种机制确保当他们超越数据进行概括时,他们不会过度概括,也就是说,确保孩子们不会犯只能通过负面证据纠正的错误。根据语言先天论者的观点,这种机制是先天的 UG 知识。

2.3.1 “忘记”论的批评

2.3.1 (a) 缺少什么?负数据 vs. 负证据

首先,让我们区分一下:

负数据:明确的信息,表明给定的一串词不是目标语言的句子。(例如,“不,那不是你说的方式”,或者“应该是 I broke it 而不是 I breaked it”,或者“那串词是不符合语法的”,等等)

负证据:能够让学习者判断一个假设(很可能)是错误的信息。(有关示例,请参见下文。)

其次,让我们放弃在许多关于遗忘问题的论证中出现的观点,即学习者的假设必须在数据中明确被证伪才能被拒绝。相反,让我们假设学习者更像实际的科学家一样行事——根据缺乏确认而暂时放弃理论,进行理论推断以将数据与理论联系起来,使用统计信息,并对他们的理论的真实性或错误性进行可推翻的概率性(而不是决定性的、非此即彼的)判断。[13]

直观地看,将学习者视为采用更多随机和概率归纳技术的方式,可以看出遗忘问题可能被夸大了。论点正确地声称,负数据在 PLD 中几乎不存在。然而,学习者为了从过度概括中恢复过来,需要的不是负数据本身,而是负证据,可以说,PLD 中确实包含了大量的负证据。例如:

  1. 理解或沟通的失败:他人对儿童语言表达的理解失败(通过要求重复或沟通失败来证明)是学习者存在问题的证据,她使用的生成话语的规则有问题。这个证据并不决定性(也许奶奶只是听不清楚),但它仍然是负证据。

  2. 结构类型的不出现作为负证据:假设一个孩子的语法预测某个字符串是目标语言的一部分。进一步假设即使在上下文似乎合适的情况下,该字符串从未出现在数据中。遗忘问题的支持者说,不出现不能构成负证据——也许爸爸总是选择说“The girl who is in the jumping castle is Kayley's daughter, isn't she?”而不是助动词前置的版本“Is the girl who is in the jumping castle Kayley's daughter?”如果是这样,孩子根据这个信息得出后者是不符合语法的结论将是错误的。

但假设孩子预测的不是简单地单词串,而是在某种句法描述(或者更可信的是准句法描述)下的单词串(所使用的类别不必与成年人语法中使用的类别相同)。这将使她能够更好地利用非出现作为负证据。未出现的字符串将分为两种广义类型:那些在数据中已经遇到过其结构的字符串,以及那些以前没有听过其结构的字符串。在前一种情况下,孩子有正面证据表明那种类型的字符串是合乎语法的,这种证据使她能够假设那个特定字符串的非出现只是一个偶然事件。(例如,她可以推断,由于她已经多次听到“那个在地板上的混乱是你的吗?”这个字符串,而且该字符串与“那个在跳跃城堡里的女孩是凯莉的女儿吗?”具有相同的基本结构,后者可能是可以接受的,尽管爸爸选择不说。)

然而,在数据中从未遇到过相关形式的情况下,孩子会更好地处理:她从未听过任何具有“那个在跳跃城堡里的女孩是凯莉的女儿吗?”或“那个在地板上的混乱是你的吗?”这样结构的话语,这就说明那种类型的字符串不是句子。同样,这种证据并不是决定性的,孩子应该准备修改她的语法,如果那种类型的字符串开始出现的话。尽管如此,字符串的非出现,结合其他语言信息适当解释,可以构成负证据,并为学习者提供拒绝过度泛化语法的理由。

  1. 先天证据作为后天证据。相关地,学习者还可以利用正面证据来确定在 pld 中出现的字符串作为负面证据的来源 - 再次以试探性和可修订的方式。[15] 假设孩子的语法在特定的语境中生成了两个适当的字符串,但只有一种类型的字符串被周围的人产生。在这种情况下,只有第一种类型的字符串出现是负面证据 - 当然是可推翻的,但仍然是负面证据。

实际上,使用正面证据来反驳假设在科学中是普遍存在的。例如,米利坎使用正面证据来反驳电荷是一种连续变化的量的理论。在他著名的“油滴”实验中,他发现带电油滴所具有的电荷量始终是-(1.6 x 10-19)C 的整数倍。以这种方式发现所有观察到的电荷都以这种方式“量子化”反驳了竞争的“连续电荷”假设,就像正面证据可以反驳语法假设一样。[16]

  1. 反馈“遗忘问题”的论证还指出了儿童学习语言时缺乏的反馈。在一项被论证支持者经常引用的著名研究中,布朗和汉隆(Brown and Hanlon)于 1970 年发现母亲对孩子的句法错误没有明显的不赞成,并且发现照顾者没有困难理解他们所说的不规范的话语。只有语义错误偶尔会被纠正;语法错误则没有被注意到。

然而,更近期的研究发现,有证据表明理解失败是有一定规律的,并且在语言学习环境中有大量关于正确用法的反馈。例如:

  • Hirsh-Pasek、Trieman 和 Schneiderman(1984)研究了 2 岁儿童与父母之间的互动,发现照顾者重复和纠正了 20.8%的错误句子,而只重复(没有纠正)了 12.0%的正确句子。

  • Demetras、Post 和 Snow(1986)发现,一般来说,父母只会逐字重复正确的句子,而不会逐字重复错误的句子,而是会跟随着澄清问题(“什么?”——表示不理解)或者扩展和/或改写,纠正错误。

  • Bohannon 和 Stanowicz(1988)发现 34% 的句法错误和 35% 的音韵错误接受了某种形式的差异反馈(例如,带有更正或明确拒绝话语的重复);超过 90% 的父母的确切重复遵循良好形成的句子;超过 70% 的重组和扩展遵循不良形成的话语。

  • Chouinard 和 Clark(2003)对五个学习语言的儿童进行的纵向研究发现,父母更经常改写错误的话语而不是正确的话语,他们对所有错误类型(音韵,词汇,句法,语义)的回应频率相等,并且他们更频繁地纠正年幼的孩子,因为他们犯更多错误。

  • 或许最有意义的是,Moerk(1991)对 Brown 的“Eve”转录进行了重新分析(其中 1970 年的“无反馈”论断是基于此),并发现了许多 Eve 的语义和句法错误被明确纠正的情况,包括:她对名词标签的使用;动词短语(时态,情态动词,助动词);限定词和介词;词序(这些最后一类错误很少见,但总是被纠正)。

  • Bohannon, MacWhinney 和 Snow(1990)回顾了这一领域的其他研究结果,并回应了先天主义对这些发现及其对遗忘问题的批评。

2.3.1(b)儿童能够并且确实能够从“嘈杂”的数据中学习,并利用统计规律。

Chomsky 承认在 PLD 中存在这种“间接”的负面数据。然而,他得出结论称这些数据太少且含糊不清,对语言学习者没有帮助。上述研究结果似乎表明负面证据在 PLD 中普遍存在。但是,儿童能够从这些统计规律中学习吗?

标准的“遗忘问题”[17]的表述假设它们无法:这种观点似乎是学习只能在理想条件下进行,即世界提供了对语言学习者的语法理论的明确证据。鉴于对学习者的这种理解,刚才讨论的反馈示例似乎与问题无关。因为只有使用相当复杂的数据分析技术和对概率的微小变化敏感的确认措施的学习者才能利用我们刚刚讨论的语言环境中的规律性。然而,越来越多的证据表明,儿童实际上对微妙的反馈非常敏感,无论是在语言还是非语言领域。例如:

  • Bohannon 和 Stanowicz(1988)发现,儿童特别关注父母纠正他们错误的行为:他们模仿成人扩展(说与孩子相同的事情,但提供更多细节)和重述(重复孩子的话语,纠正错误)的比例为 25.6%,而只模仿父母对孩子话语的确切或逐字重复的比例为 3.6%。

  • 相关地,Farrer(1990 1992)发现,如果某个形态素是成人对孩子自己的句子进行重述的一部分,儿童更有可能重复该形态素,而不是成人话语的非重复部分(例如,主题的变化或对话的继续)。她还发现,儿童重复成人话语有助于儿童习得各种语法形态素。

  • Morgan 和 Travis(1989 年)以及 Morgan 等人(1995 年)对这种纠正反馈的长期功效提出了质疑;Bohannonn 等人 1996 年做出了回应。

  • 然而,在儿童自然环境中的纵向研究(Chouinard 和 Clark 2003 年)和实验研究(Saxton 等人 1998 年,Saxton 1997 年,Saxton,Backley 和 Galloway 2003 年)中,反馈的长期功效得到了证明。

此外,越来越明显的是,婴儿、儿童、成人和许多其他哺乳动物不仅对反馈敏感,而且对其经验中的其他非明显统计规律也非常敏感。例如:

  • Saffran, Aslin 和 Newport(1996)发现,8 个月大的婴儿在仅仅 2 分钟的人工语音流暴露后,就能学会识别人工语言中的词边界。这个语音流由连续重复 2 分钟的 3 音节无意义单词(bidaku,padoti,golabu)组成(bidakupadotigolabubidakugolabi … 等)。这个语音流的构造方式是,当两个音 X#Y 组成一个单词时,它们之间的“过渡概率”等于 1,当这两个音跨越一个词边界时,它们之间的“过渡概率”等于 1/3。在两分钟内,婴儿们学会了区分“单词”(如 bidaku)和“非单词”(如 kupado)。另请参见 Chambers,Onishi 和 Fisher 2003。

  • 其他研究进一步扩展了这些结果,表明儿童和婴儿对各种语言线索的模式敏感,例如语言节奏(Nazzi 和 Ramus 2003);韵律重音(Thiessen 和 Saffran 2003)以及声音和音节结构(Saffran 和 Thiessen 2003)。

  • 此外,越来越有说服力的证据表明,统计或“分布”信息不仅可以用于提取词边界,而且可以用于描绘更高层次的句法结构,与 Chomsky 的一个旧论点相反,例如 Redington 和 Chater,1998;Pena 等,2002;Mintz 2002;Saffran 2002;Saffran 和 Wilson 2003;Newport 和 Aslin 2004。(Chater 和 Manning 2006 提供了一份调查。)

  • 最后,为了防止任何关于我们所看到的只是先天主义者的“语言习得装置”在起作用的回应,一些研究表明类似的机制似乎也在非语言领域的学习中起作用(Saffran 2002 研究了非语言声音和形状的学习);在成年人中(Pena 等人,2002 年);以及在其他动物中,如棉顶蛛猴(Hauser 2001;Hauser,Weiss 和 Marcus,2002 年)。

总的来说,这些结果的结合提出了一种可能性,即语言习得中涉及的一些基础学习机制并不特定于语言。如果事实证明婴儿在学习人工语言和学习自然语言时都采用了 Saffran、Redington 和 Chater、Pena 和 Mintz 等人研究的分布分析方法,那么这就是反对语言先天主义的证据。因为这种类型的学习也被人类和其他动物在其他情境中使用:无论语言学习涉及的是先天的还是后天的,它都不是特定于语言的。

2.3.1(c)论证的普遍性

先前对于“遗忘问题论证”的反对意见指出,首先,负面证据确实存在于 pld 中(以他人语言使用的规律和他人对儿童自己表达的反应形式存在),其次,儿童(和其他动物)似乎非常善于利用这种信息来学习他们的世界。鉴于在明确的负面数据不存在的领域中,学习者必须能够学习,并且在没有专门的先天知识的情况下,这似乎是一件好事。因为遗忘问题是一个普遍存在的从经验中学习的问题。也就是说,有许多领域的学习者缺乏明确的证据来说明某些事物不是什么:树不是汽车,爱尔兰炖菜不是咖喱,鸟不是鱼,麦当劳不是 CIA 的分支机构。没有人告诉过你这些事情,但认为你现在知道它们是因为你拥有这些领域的“语言习得装置”的类似物是荒谬的。显然,在至少某些领域,人们能够在主要依据积极数据的基础上学到很多东西,虽然这当然不能证明语言是其中之一,但它确实表明,仅仅依靠“遗忘问题论证”本身并不能成为语言先天论的论证,更不用说基于乔姆斯基(UG-based)版本的立场了。

3. 其他与语言先天性相关的研究:对先天论者的新问题?

在这一部分中,我将提及一些其他被认为与语言的先天性有关的研究领域。我的目标不是对这些问题进行详尽的调查,而是为感兴趣的读者提供进入相关文献的途径。然而,我将尽量提供足够的细节,以便说明当前的实证发现以及在肯定性语言先天论的论证中所发现的缺陷,倾向于反对这一立场。

3.1 语言普遍性

乔姆斯基和其他人(例如,乔姆斯基 1988 年:46-7;平克 1994 年:237-8)指出“语言普遍性”的存在支持了语言是一种独特的心智能力产物的观点。普遍性是指被认为是所有自然语言共有的特征,例如在推导过程中对元素移动的限制存在,或者更不具争议的是名词和动词之间存在句法上的区别。但是,真正的普遍性的存在是一个有争议的问题(参见例如,马拉索斯 1989 年:111),而且假设它们存在的正确解释尚不清楚。

一个解释当然是乔姆斯基的解释,即它们是说话者先天知识的结果。另一个解释是它们源于认知的其他非语言特定特征,比如记忆或处理限制(例如,Berwick 和 Weinberg 1983 追溯了某些移动限制到人类记忆结构所施加的解析限制)。还有一个解释是它们源于交际情境的普遍需求(例如,Sapir 1921 认为名词和动词的区别源于语言用于传达命题的事实,因此需要一种将对象主题带入意识的方式和一种对其进行陈述的方式)。最后,正如 Putnam 1971 所推测的,普遍性可能是一个祖先乌尔语的遗迹,所有其他语言都从这种语言演变而来。这个最后的假设通常被认为缺乏实证支持而被拒绝。然而,基因学和历史语言学的最新发现趋于表明,所有人类群体都是从最近过去的一个从非洲迁徙的小群体进化而来的,并且所有人类语言可能都是由该群体所讲的语言演变而来的。(Cavalli-Sforza 1997 年。)

先天语言假设当然与语言先天主义并不矛盾。然而,如果真实,它会削弱从普遍存在性到语言知识的先天性的任何论证。因为如果语言有一个共同的祖先,那么就有可能解释普遍存在性——即使从功能角度看似乎奇怪的普遍存在性——是由于我们的祖先在语言协调问题上采取了某种解决方案的结果。就像在道路右侧行驶一样,一旦确立了一种解决方案,它可能会变得根深蒂固,因为每个人遵守同一规则的好处超过了改变到不同规则的成本,即使新规则在某种意义上更加“合理”。因此,即使语言的任意或奇怪的特征也可以在历史上得到解释,而不需要假设强制性的功能考虑或先天的语言限制。[18]

相反,如果语言在多个地区独立出现,普遍存在性的存在将成为先天主义的有力论证。因为在这种情况下,维持每个祖先群体“碰巧”选择了各种协调问题的相同解决方案是不可信的。更有可能的是,不同群体选择规则的假设是由说话者内部的某种因素驱动的,比如可能是 UG 的先天表征。简而言之:如果语言有一个共同的祖先,那么从最初任意的语言约定的共同衍生是解释语言普遍存在性的可能解释,包括那些似乎没有任何真正功能意义的“奇怪”或“任意”的特征。如果没有这样的共同祖先,那么这样的普遍存在性似乎只能通过说话者内部的特征来解释。

3.2 语言本地化

图 3. 布洛卡区和沃尼克区

从 19 世纪布洛卡和沃尼克的研究开始,一种流行观点认为语言是局限于大脑的某些区域(见图 3),几乎总是左半球[19],并且它受到特定的破坏模式的影响,称为“失语症”(参见 Saffran 2000 对各种失语症的调查)。例如,布洛卡区在语音产生中起着重要作用,对该区域的损伤可能导致一种特征性的无法流利地说话(“布洛卡失语症”或“语法缺失”),尤其是复杂的语法结构和语法形态素。一些人认为,语法知识可以被布洛卡区的损伤有选择地干扰,这被认为支持了该区域存在特殊的生物先天基础的观点(Lenneberg 1964, 1967 是这一论点的最初提出者,这一观点在近期的讨论中也有所呼应,如 Pinker 1994:297-314)。

然而,为什么这种推论似乎令人信服尚不清楚。首先,正如 Elman 等人在 1996 年所争论的,功能的神经定位可以是几乎任何发展轨迹的结果:某些功能的定位与其先天性无关。

其次,现在已经知道,语言的神经定位很大程度上是相对的,而不是非此即彼的问题(Dronkers 等人,2000 年,Dick 等人,2001 年,Martin,2003 年)。语言处理不仅广泛分布在大脑中(见图 4),而且传统上与语言相关的大脑皮层区域也参与了各种非语言任务。例如,布洛卡区(Broca's area)在 MEG 扫描(一种测量大脑电活动引起的磁性变化的方法)中“亮起来”,当受试者听到不和谐的音乐序列时,它的反应方式与听到不符合语法的话语时相似(Maess 等人,2001 年;Nature Neuroscience,6(7),2003 年 7 月的一个专题探讨了这一发现的含义)。

最后,对大脑皮层可塑性的最新研究表明,即使是最有可能具有先天规定的候选者,如视觉皮层用于视觉或听觉皮层用于听觉,也表现出高度依赖经验的可塑性。例如,在先天性失明的受试者中,通常用于视觉的大脑区域被用于处理盲文(Sadato 等人,1996 年;Hamilton 和 Pascual-Leone,1998 年),即使在后天失明的人中,视觉皮层也明显地被“重塑”用于其他知觉任务(Kujala 等人,1997 年)。同样,在先天性聋的人中,听觉皮层被用于处理手语(Nishimura 等人,1999 年;von Melchner,Pallas 和 Sur,2000 年)(有关综述,请参阅 Shimojo 和 Shams,2001 年)。

图 4. PET 扫描显示参与各种语言任务的大脑区域。来自 Posner 和 Raichle(1997 年,15 页)。经 M. Raichle 许可使用。

正如马库斯(2004 年:40-45)对埃尔曼等人 1996 年的回应所指出的那样,大脑在特殊情况下“重连”自身的能力与其基因通过“先天预设”或不同方式设置有关。然而,这些数据表明,涉及处理手语的复杂功能可以在大脑的“先天预设”区域(如果存在的话)中完成(如果它们存在的话),这些区域本来是用于执行完全不同的任务。这表明,这些能力在任务特定的先天预设方面要求很少,并且主要是通过经验学习(以及为整个皮层提供的任何类型的“先天预设”)来完成。也就是说,如果手语处理任务可以由大脑皮层中可能天生倾向于进行听觉处理的区域来完成,那么前者的能力必须在没有与该任务特定的先天限制或知识相关的情况下进行学习。当然,这些是病理情况,目前尚不清楚这些实验对象是否接受了特殊训练,以使他们的大脑以这种方式“重连”。尽管如此,这些例子提供了大脑在完全没有先天、特定领域信息的情况下获得复杂处理能力的存在证明,确实是与语言相关的处理能力。因此,它们提出了语言处理的其他方面在没有任务特定限制的情况下可能也是通过类似方式获得的可能性。

总的来说,目前可用的神经科学证据并不支持语言先天论。认为功能定位表明存在相当程度的先天预设的观点已经站不住脚了:功能定位可以通过多种不同的方式产生。此外,语言功能似乎并不特别局限:语言使用和理解是复杂的任务,涉及许多不同的脑区 - 这些脑区在至少某些情况下也与其他任务有关。很难看出如何将这些事实与乔姆斯基的“语言器官”假设相协调,这个器官的发展或“成长”在很大程度上受基因的控制。最后,复杂的功能可以通过天生“预装”(如果有的话)进行学习和执行,这些功能可以在没有任何先天的、任务特定的指导的情况下被获得和实现。当然,这并不意味着语言是以这种方式获得的能力之一。根据目前的所有证据,语言发展的大脑皮层中可能确实存在为该任务“预装”的区域:语言先天论仍然与现有的知识相一致。然而,这也意味着虽然可能有其他原因支持语言先天论,但目前对大脑组织或发展的一般考虑并没有特别支持这一立场。

3.3 语言习得的关键期

Lenneberg(1964,1967)还认为,尽管语言习得非常强大,即所有正常(和许多异常)的儿童都能做到,但它只能在一个“关键期”内无问题地发生——大致在晚童年或早青春期之前。根据其他被认为是先天确定的过程(如印记或视觉发展),Lenneberg 使用关键期的存在作为语言在生物学上具有专有基础的进一步证据。

为了支持关于语言的关键期假设,Lenneberg 引用了以下事实:(i)智力低下(例如唐氏综合症)的儿童的语言发展在青春期左右停止;(ii)虽然非常年幼的儿童能够在大脑左半球严重创伤(包括半脑切除术)引起的失语症后(重新)学习语言,但年龄较大的儿童和成年人的失语症通常是不可逆转的;以及(iii)所谓的“野生儿童”,即那些在没有或很少接触人类语言的情况下长大的儿童,其语言能力严重受损。(Lenneberg,1957:142-55;参见 Curtiss 1977,关于来自洛杉矶郊区的现代“野生儿童”Genie 的(臭名昭著的)案例,她在一个孤独的房间里被锁住,绑在她的便椅或床上度过了一个悲惨而无言的童年,无法获得除最基本的语法能力之外的任何语言能力。)

作为对关键期假设的进一步支持,其他人还观察到,尽管儿童能够迅速学习第二语言并达到母语者的流利程度,但成年人学习第二语言通常不能做到:学习第二语言的能力在青春期后逐渐减弱,无论接触该语言的程度如何。(Newport 1990)。因此,有人推测,语言学习的先天知识基础(例如 UG 的知识)在青春期后对正常习得不再可用,成年学习者必须依赖效率较低的学习方法。(Johnson and Newport 1989.)

作为讨论这些论点的初步(其中许多在 Stromswold 2000 中更详细地呈现),值得区分两个常常在“关键期”这个名称下混淆的概念:

关键期:发育过程中的一个关键时期;相关的能力在该时期内要么无法发展,要么将永久丧失,除非在此期间接受特定的输入。

敏感期:发育过程中的一个时间段,在此期间能够“正常”、“容易”或“自然”地获得某种能力。能力可以在敏感期外获得,但可能不那么容易和自然,或者可能成功程度较低。

先天/后天的典型例子是由 Hubel 和 Wiesel 的诺贝尔奖获奖工作引起的。通过在不同发育阶段和不同时间段内缝合小猫的一只眼睛,Hubel 和 Wiesel(1970)发现,除非小猫在生命的第 4 至第 12 周接受有模式的视觉刺激,否则支持双眼视觉的某些皮层和丘脑区域(具体来说,是眼优势柱[20]和侧脑室体中的细胞)将无法正常发育。他们发现,虽然损伤有时在一定程度上是可逆的,取决于遮盖的确切持续时间和时间,但在生命的前三个月完全遮盖会导致被剥夺的眼睛产生不可逆的失明[21]。

然而,语言不是这样的。正如我们将看到的,几乎没有证据表明语言习得存在关键期,尽管有相当多的证据表明在某个敏感期内更容易习得语言。关于语言先天性的主张的含义将在 §3.3.4 中讨论。

创伤后的语言恢复

Lenneberg 引用了儿童在左脑损伤后重新学习语言的优越能力,以支持关键期假说。但是,虽然年幼儿童和年长儿童以及成年人在从左脑损伤中恢复的能力上确实存在差异,但恢复过程和结果的对比并不像通常所认为的那样明显。

首先,即使是那些之前未成功学习语言的年长儿童,在所谓的“敏感”或“关键”期结束后,也能够从左半球创伤中大幅度恢复;实际上,他们在青少年时期重新学习语言。例如,Vargha-Khadem 等人在 1997 年报告了 Alex 的案例,他在童年期根本不会说话,9 岁时的接受语言水平相当于 3-4 岁。在他 9 岁时,左半球被切除后,Alex 突然开始热衷于学习语言,到 15 岁时,他的语言能力相当于 8-10 岁的水平。

其次,大多数成年人在左半球语言区域发生梗死后,实际上至少恢复了一定程度的语言能力,许多人在治疗后甚至恢复了基本正常的能力(Holland 等人,1996 年)。这被认为是由于受损语言区域的再生以及其他区域的代偿性发展,尤其是右半球(Karbe 等人,1998 年)。类似的过程似乎也在年幼儿童的左半球损伤中起作用。例如,Muller 等人在 1999 年记录了儿童(<10 岁)和成年人(> 20 岁)左半球损伤后语言的显著重新学习,以及在语言任务中右半球参与度的增加。

最后,即使是非常年幼的儿童也不能保证在严重的损伤后恢复语言能力,无论是左半球还是右半球。正如 Bates 和 Roe(2001)在他们对儿童失语症文献的调查中所指出的,案例之间的结果差异很大,并且报告的研究存在许多方法学上的混淆因素(例如,无法定位损伤或了解其原因,语言能力的不同测量方法,不同的测试时间框架,统计异常以及未能控制其他已知影响语言的因素,如癫痫病史),这些因素对 Lenneberg 在这个案例中所提出的经验支持程度产生了怀疑。

3.3.2 "野生儿童"

长期以来,人们已经认识到解读“野生儿童”文献(在 Skuse 1993 中进行了有益的调查)受到了这些“自然实验”的幸运罕见性、对其的普遍报道不足以及通常伴随着极度语言剥夺的其他环境因素(虐待、营养不良、忽视等)的干扰。然而,在 Goldin Meadow 和同事们的开创性工作中(例如,Goldin Meadow 和 Mylander 1983、1990),开始研究了一群新的个体,他们在语言上受到剥夺,但在其他方面没有。这些个体是听力正常的聋人父母的聋哑但正常的孩子,他们既不接受手语教育,也不被送到聋人特殊学校,因此无法习得语言,尽管他们通常会与家人使用自己的简单手语系统,称为“家庭手语”。对这些孩子在不同年龄接触自然语言(手语或口语)后发生的情况的研究有望为关键期和敏感期假设提供新的见解。

然而,目前文献中仍然很少有病例报告,而这些研究迄今所得到的数据在敏感期和关键期假设方面存在矛盾。尽管早期语言剥夺,一些青少年似乎能够习得语言,而其他人则不能。目前尚不清楚这些不同结果的解释是什么,但一个重要因素似乎是新语言是手语(例如 ASL)还是口语。也许是因为他们童年时的感知缺陷阻碍了正常的听觉和发音发展,所以在后来恢复听力的聋儿似乎不能够习得太多口语。(Grimshaw 等,1998 年。)

3.3.3 儿童和成人的第二语言习得

第二语言习得(“SLA”)的问题被认为与语言的先天性有关,支持关键(或敏感)期假设。例如,Johnson 和 Newport(1989 年)发现,在青春期前移民到美国的移民中,英语成人表现越早,他们在生活中越早,但对于在青春期后到达的人,到达年龄对语言表现没有影响。第二语言的暴露量对说话者的影响只有在青春期前发生才有意义,而在青春期后则没有意义,这被认为证实了关键期假设。

然而,这些结果未能被复制(Birdsong 和 Molis 2001),虽然它仍然有支持者,但关于第二语言习得的“关键期”假设越来越受到批评(Hakuta,Bialystok 和 Wiley 2003;Nikolov 和 Djugunovich 2006)。较新的研究争论,例如,第二语言的熟练程度与学习者在该语言中的教育水平、在新国家的居住时间以及第一语言和第二语言之间的语法相似性和/或在新国家的居住时间等因素更相关(Flege,Yeni-Komshian 和 Liu 1999;Bialystok,1997)[ 22]

许多成年人和较大的儿童能够学习第一语言和第二语言,并达到高度熟练的事实表明,与 Hubel 和 Wiesel 研究的小猫视觉系统不同,人类的语言习得系统并不受到严格意义上的关键期的限制。这一发现与新兴观点一致,即皮层在整个生命过程中仍然高度可塑,并且与常识相反,即即使是老狗也可以很擅长学习新技巧(参见 Buonomano 和 Merzenich 1998;Cowen 和 Gavazzi 1998;Quartz 和 Sejnowski 1997;以及 Stiles 2000)。这也与比关键期假设更有说服力的观点一致,即在语言习得方面存在一个敏感期——从出生约 1 岁到 6 或 7 岁的时间段,语言最容易、最自然地习得,并且几乎可以保证达到类似母语的结果(参见 Mayberry 和 Eichen 1991)。本节将探讨这一结论对语言先天论的影响。

3.3.4 敏感期和先天性:语音学习

语言掌握的敏感期存在告诉我们关于语言的先天性的什么?在本节中,我们将看一个案例,即语音学习,其中敏感期的存在受到了广泛关注,并且从敏感性到语言特定的先天信息的推断已经明确提出(参见 Eimas 1975)。可以说,即使在这种情况下,对语言先天论的推断也是薄弱的。

与掌握第二语言的形态和句法相比,掌握类似母语口音的能力要少得多,这是儿童在童年时期自动获得的[23]。儿童感知特定语言的声音的能力始于子宫内,例如,新生儿对母亲的声音和父母的语言的偏好,以及他们能够区分在最后三个月听到的散文段落和新颖段落。在出生后的几个月里,婴儿能够可靠地区分许多不同的自然语言音素,无论这些音素是否出现在他们即将学习的语言中。然而,到了 6 个月到 1 岁的年龄,对未听过的音素的敏感性大部分消失,到 1 岁时,儿童倾向于只区分他们周围所听到的语言中的音位差异。例如,日本儿童失去了区分英语/r/和/l/的能力(Kuhl et al., 1997b)。作为成年人,人们仍然无法感知一些语言中没有标记的语音对比,并且许多人无法学会发出他们可以区分的第二语言的声音[24]。例如,许多英语为母语的人在发出法语/y/(如 tu)和喉咙后部的/r/时遇到很大困难。

因此,在语音学习的情况下,似乎存在着先天的倾向,将语音分割成与语言相关的单位,即音位[25]。然而,也有证据表明学习在塑造音韵知识方面起到了作用,不仅仅是通过“修剪掉”不需要的“音韵表示”,如 Eimas(1975)所假设的那样,还通过塑造成年人音位类别的精确界限。例如,照顾者可靠地对婴儿说一种特殊的“语言”(“母语”或“父语”),提高音调,缩短句子,强调重音形态素和词边界,最重要的是夸大某些关键元音之间的声学差异(在英语中是/i/,/a/和/u/)。这种元音之间的“拉伸”(由 Kuhl 等人在 1997 年的研究中在芬兰语、俄语和英语中证明)有助于婴儿对清晰可辨的元音原型的表示。Kuhl(2000)认为,这些原型随后作为“磁铁”起到作用,围绕它们组织后续的语言经验,并形成在第一年结束时出现的特定语言的音韵“地图”的设定点。

如果这确实是语音学习的工作方式,很明显,虽然经验在其中起到了一定作用,但先天对这个过程的贡献是相当大的。对于辨别音素来说,无论这些辨别是如何被后续经验塑造的,都不是一件简单的事情。它涉及到所谓的“范畴感知”,即将在多个物理维度上连续变化的信号(例如声音起始时间和共振峰频率)分割成离散的类别,使得同一类别内的信号被视为相同,即使在声学上它们可能比不同类别中的两个信号之间的差异更大(参见图 5)。(Harnad 1987 是关于范畴感知的有用研究集合,涵盖了上世纪 80 年代中期的工作。)

但是这种先天对语音学习的贡献是否与语言有关,也就是说,它是否支持(语言的这个方面)是先天的结论?对于这个问题,答案似乎是否定的。首先,将连续变化的刺激划分为离散类别的“分块”不仅是语音知觉的特征,也是人类知觉的一般特征。例如,已经证明在非语言声音的知觉中存在这种特征,比如音高、音调和旋律,以及无意义的鸣叫声(Pastore 和 Layer 1990)。它还在处理面部刺激(Beale 和 Keil 1995)、面部表情(Etcoff 和 Magee 1992;Kotsoni、de Haan 和 Johnson 2001)、面部性别(Campanella、Chrysochoos 和 Bruyer 2001)和熟悉的物体(Newell 和 Bulthoff 2002)方面得到证明。其次,已知其他动物也具有类别感知能力。例如,蟋蟀根据频率分割同种鸣叫声(Wyttenbach、May 和 Hoy 1996),沼泽麻雀将不同持续时间的音符“分块”(Nelson 和 Marler 1989),恒河猴在升高或降低一个或两个八度的旋律时能够识别,但在升高或降低 1.5 或 2.5 个八度时不能识别,这表明它们对音乐的调性有一定的理解(Wright 等,2000)。最后,其他物种对人类的语音也有类别性的反应!栗色仓鼠(Kuhl 和 Miller 1975)和棉顶蛛猴(Ramus 等,2000)对人类婴儿所做的语音区分也是相似的。

一起来看,正如 Kuhl 1994 年、2000 年所争论的那样,这些发现对构成人类音韵学习基础的先天感知和分类能力的语言特异性产生了怀疑。因为人类(和动物)的感知普遍是分类的,可以说语言已经进化出来以利用人类能够做出的感知区别,而不是人类进化出了只能在人类语言中做出的区别,这正如 Eimas 的观点所暗示的那样。

图 5。请注意,用蓝色圈出的这对声音在 F2 起始频率上的差异小于用红色圈出的那对声音,然而前者都可可靠地被视为/b/的实例,而后者则可可靠地被分类为不同的声音,/d/和/g/。这种模式,连同从一种分类突然转变为另一种分类(例如从/b/到/g/),是分类感知的特征。

在非语音学领域中也可能存在相同情况。关于至少一些负责句法学习的能力是非语言特定的这一观点,可以从关于递归规则学习和泛化的非物种特异性的类似结果中得出,递归规则学习和泛化是乔姆斯基最近提出的构成人类语言能力核心的能力(Hauser,Chomsky 和 Fitch 2002;有关进一步讨论,请参见下文 3.4)。其他物种,尤其是棉顶蛛猴,似乎能够学习简单的递归规则(Hauser,Weiss 和 Marcus 2002)。此外,Hauser 和 McDermott 2003 认为,音乐和句法处理涉及相似的能力,这些能力在其他物种中也能看到。这些发现表明,人类的“语言能力”中既不是任务特定的,也不是物种特定的。相反,语言学习和语言处理利用了在语言的谱系进化之前就存在的能力,这些能力在人类和动物中用于其他类型的任务。(例如,有关棉顶蛛猴规则学习的最新研究,请参见 Hauser,Weiss 和 Marcus 2002 的论述;有关音乐和句法处理涉及相似能力的建议,请参见 Hauser 和 McDermott 2003)。与其将人类思维视为天生专门用于语言学习,不如将语言视为专门设计成可被人类思维学习和使用的;关于此,请参见下文 §3.4 的更多内容。

3.4 语言演化

这使我们引出了语言演化的问题:如果语言知识(比如 UG 的原则)真的是人类语言能力先天具备的,那么这种先天知识是如何演化的呢?多年来,乔姆斯基本人拒绝对这个问题进行推测,他表示:“[]进化理论……目前对这类问题几乎没有什么可说的”(1988:167)。其他理论家则没有那么保守,已经出现了大量文献,其中阐述了拥有语言的选择性优势。例如,与同类成员交流时很有用,可以弄清楚他们在做什么(Pinker 和 Bloom,1990; Dunbar 1996)。它是一种类似于灵长类动物梳理的群体凝聚机制(Dunbar 1996)。它是一种非遗传的表型可塑性机制,使有机体能够在非进化时间内适应环境(Brandon 和 Hornstein 1986; Sterelny 2003)。它是一种我们可以使他人顺从我们意愿的机制(Dawkins 和 Krebs 1979; Catania 1990),或者制定社会契约(Skyrms 1996)。语言使我们更聪明,也许是通过内化并作为“思维语言”来发挥作用(Bickerton 1995, 2000)。等等。

无疑,会说和理解一种语言无疑为我们提供了许多这些好处。因此(并且假设成本不会太大-显然它们不会太大),可以肯定的是,一旦这种能力开始在我们的物种中出现,任何使人类能够学习和使用语言的特质都会受到强烈的正向选择压力。

但是这些都没有直接涉及到语言先天性的问题。自然界会偏爱具有语言能力的个体或群体这一事实并没有告诉我们她选择了什么方式来构建语言表型。也就是说,它并没有告诉我们为了让人类能够学习和使用一门自然语言,所招募的心理机制是什么样的。

先天主义当然是一种可能性。自然选择可能构建了一个专门的语言能力,其中包含关于语言的先天知识(例如,UG 的知识),随后由于它帮助人类儿童获得语言能力,并且具备语言能力增强了我们祖先的适应性而被选择。然而,这个假设的一个问题是不清楚一个包含 UG 的先天表征的语言能力如何在人类思维中产生。一种观点是,语言能力是通过自然选择逐步建立起来的。这种方法是 Pinker 和 Bloom(1990)以及 Jackendoff(1999)关于各种语法特征和设备的适应功能的提议的基础。然而,其他先天主义者则拒绝适应主义框架。例如,Berwick(1998)认为,在我们物种中解释语言普遍性知识的逐步发展可能是不必要的,因为有了新的极简句法概念(参见 Chomsky 1995)。在这种观点下,所有参数约束和句法规则都是一种称为 Merge 的基本句法过程的结果:一旦 Merge 到位,Berwick 认为,UG 的其余部分就会自动跟随。采取另一种方法的 Chomsky 则提出,语言是一种“拱顶”,是其他非语言导向的选择过程(如“大脑大小和复杂性的增加”)的副产品(1982:23)。最后,Bickerton(1998)采取了另一种方法,假设出现了一次大规模的突变事件,其中大块的句法同时出现,尽管这个假设在 Calvin 和 Bickerton(2000)中被隐含地撤回了。

关于语言演化的文献太多,无法在本文中进行概述(但请参阅 Botha 2003 以获得出色的概述和评论)。值得注意的是,迄今为止,关于 UG 的先天知识如何从我们祖先的任何预适应中演化出来还没有形成共识。当然,这本身对于语言先天主义者来说并不是一个问题:制定和测试关于人类认知演化的假设是一项非常困难的任务,主要是因为很难找到与自己假设相关的证据。(参见 Lewontin 1998 和 Sterelny 2003:95-116。)

然而,值得注意的是,语言先天论只是自然如何启动语言的可能性之一。就像可能存在一种包含 UG 知识的语言能力,以某种方式编码在人类基因组中一样,我们学习语言的能力也可能基于一系列现有的能力,其中没有一个是(或最初是)专门用于语言学习的。托马塞洛在上面讨论的语言习得理论(§2.2.1.b)引出了这种替代的进化观点。在他看来,获得语言能力的基本技能最初是用于不同的非语言功能,而现在仍然继续发挥这些功能。例如,他认为儿童早期的词汇和短语学习部分依赖于他们与他人共享注意力的能力,辨别他人的交际意图,并模仿他们行为的方面。有理由认为,这些能力最初是独立于语言进化的:模仿学习使得学到的技能能够快速高效地在世代间传递(参见托马塞洛 1999 年,2000 年),而对他人心理状态形成信念的能力(“心智阅读”或“心智理论”)使得高智商的动物,如我们的古人类祖先,能够在由同样聪明的同类组成的复杂社会环境中进行协商(参见 Sterelny 2003 年)。根据这种观点,学习语言的能力是依附于其他能力的,这些能力最初是为其他原因而进化的,并且除了语言功能之外,仍然继续发挥其他功能。

然而,你可能会想知道,这种后一种解释是否真的在实质上与先天主义者有所不同。假设她并不完全否定适应主义,那么先天主义者很可能会坚持这样一个观点:先天的语言器官或包含 UG 知识的能力是从既无功能又非语言功能的现有结构演化而来的。这些结构随后通过被选择为语言的原因而获得了语言功能:它们成为了语言的适应性特征。但托马塞洛所假设的各种能力也是如此。也就是说,一旦它们开始被用于语言学习,它们就会因为这个功能而被选择(除了可能还有其他功能,并且始终假设语言能力总体上是有益的)。因此,它们也会随着时间的推移成为语言的适应性特征。换句话说,在托马塞洛和先天主义者的观点中,负责语言习得的先天结构将会获得使语言习得成为可能的生物学功能:它们将专门用于这个目的。那么,托马塞洛是先天主义者吗?

No. 首先,尽管 Tomasello 提出的心理能力和机制已经被选择用于语言功能,但这些能力和机制继续被用于非语言目的,比如面部识别、心智理论、非语言知觉等。因此,尽管语言先天论的一个核心观点是其坚持语言学习的结构是任务特定的,Tomasello 认为这些结构更具有通用性。此外,这也是不将 Tomasello 视为先天论者的第二个原因,他提出的先天结构不可能被解释为包含任何语言特定的信息或表征。然而,对于先天论的另一个标志性特征,即对先天、语言特定信息(如 UG 知识)的承诺,Tomasello 并不持有。

一些理论家(例如 Clark 1996,Tomasello 1999 和 Sterelny 2003)强调,除了直接影响人类语言能力的基因组部分的变化外,自然选择还可以通过确保我们的思维嵌入在某种特定环境中来间接引起这些变化。各种各样的动物都会为自己创造环境,这被称为“生态位建构”(该术语归功于 Odling-Smee,Laland 和 Feldman 1996)。许多动物也会为他们的后代创造环境。正如 Odling-Smee 等人在 1996 年,Avital 和 Jablonka 在 2000 年以及 Sterelny 在 2003 年强调的那样,动物改变自己和后代环境的倾向与他们的其他特征一样,同样可能成为选择的对象。

假设一个生物 O 具有先天编码的倾向 N 来建造一种特殊类型的巢穴;进一步假设在这种巢穴中成长会导致 O 型后代具有特征 C;最后假设具有特征 C 的 O 比没有特征 C 的 O 具有更大的繁殖成功率。那么,假设种群中存在 N 的变异,自然选择可以作用于增加具有 N 的 O 的比例,从而也增加具有特征 C 的 O 的比例。在这个过程中,O 具有特征 C 并不是因为获得了一种特殊的先天编码的 C 的倾向,而是因为他们的父母具有先天编码的倾向 N,而具有 N 的 O 的后代会‘自动’发展出特征 C。

这个玩具例子说明了语言可能在人类中进化的另一种途径。除了在个体中创造先天语言学习机制外,自然选择还可能在他们的父母中创造了构建特定类型的语言学习环境的倾向。例如,正如 Clark(1996)和 Sterelny(2003)都推测的那样,大自然可能在我们使用‘母语’与孩子交流的倾向以及我们倾向于谈论孩子感知注意力的当前对象方面进行了调整,以创造有利于语言习得的学习环境。

原则上,所有参与先天论争的各方都可以接受这种‘生态位建构’的存在。也就是说,Tomasello 和 Chomsky 都可以同意,构建‘语言生态位’的倾向——即使得人类后代学习语言更容易的环境——可能在我们物种中被选择出来。然而,生态位建构的概念对先天论者产生了不利影响,特别是当考虑到‘累积下游生态位建构’的相关概念时。

Sterelny(2003: 149ff)所称的“累积下游生态位建构”的案例发生在一代动物修改了已经被前几代动物修改过的环境的情况下。山刺嘴鸟的巢是下游生态位建构的一个例子(因为它的后代受到刺嘴鸟努力的影响)。然而,这种建构并不是累积的,因为巢每年都会重新建造。相比之下,兔子的地洞在几代动物的延伸和发展下是累积建构的一个例子:后代代代相传,继承了一个越来越复杂的生态位,并且它们的其他行为也以越来越复杂的方式进行调整。Tomasello(1999)和 Sterelny(2003)强调,包括下游生态位建构在内的生态位建构不仅限于物理世界:动物们也对他们的社会和认知世界进行改变。例如,黑猩猩生活在群体中(=社会生态位的建构),狗标记它们的领地(=改变它们的认知生态位,使它们不必记住领地的边界在哪里)。Sterelny 说,人类是“狂热的”生态位建构者(2003:149),他们对他们的物理、社会和认知环境所做的许多改变在许多代人中累积起来(想想一个城市、一个民主国家、现代科学、一种自然语言)。这种累积性的改变允许 Tomasello 所说的“棘轮效应”:一种“循环,其中进行了改进,成为群体的标准,然后成为进一步创新的基础。”(Sterelny 2003: 150-1)

累积的生态位建构理念在语言的情况中有明显的应用。如果父母塑造了他们后代的语言环境,如果我们通过与同类交谈来塑造我们所有人的语言环境(仅仅是通过与他们交谈!),那么“语言棘轮效应”的可能性显然是存在的。一代人对群体语言进行的微小改变——这些改变可能使其更容易学习、理解或产生——将传递给后代,后代可能进一步进行旨在增加语言可学性和使用便利性的改变。这种情况引发了一个可能性,即语言可能进化成为我们可以学习和使用的,除了相反的情况(在语言进化的许多工作中强调),即我们必须以许多复杂的方式改变才能学习和使用语言。因此,我们可以推测,语言的语音系统进化成为适合我们的动物耳朵的;它们的表达资源(特别是词汇)进化成为适应我们的交际需求;也许,正如 Clark 1997 年所建议的,以及 Tomasello 2003 年隐含地认为的,自然语言的句法进化成为适应我们先天的认知和处理能力。确实,我们头脑中编码的语言对于试图构建关于它们的理论的语言学家、心理学家和哲学家来说看起来复杂而奇怪。但是,如果语言和人类思维是同时进化的,正如它们肯定是的,那么从实施和使用它们的大脑的角度来看,语言可能一点也不奇怪。

所有这些过程很可能在我们学习和使用自然语言的能力的演化中起到了作用。先天的心理、知觉和运动能力可能已经被招募来学习和使用语言。这些能力可能会通过自然选择进一步磨练和专门化,以执行语言任务。其中一些能力的功能可能已经专门化为与语言相关的任务,以至于它们完全停止执行任何非语言功能-在这种程度上,也许可以证明语言先天论的正确性。然而,与此同时,语言本身也会演化,以更好地适应我们的认知和知觉能力,以及我们的交流需求。鉴于许多不同的知觉、运动和认知系统都与语言使用和学习有关,并且考虑到我们的思维和语言的共同演化,当关于语言演化的真相浮出水面时,它不太可能是简单的。因此,它不太可能证明先天主义者关于我们语言能力根源的专门化和统一的“语言器官”或“能力”的观点是正确的。

在离开语言演化问题之前,有必要提到哈瑟、乔姆斯基和菲奇(Hauser, Chomsky and Fitch)2002 年关于这个主题的一篇最新论文。首先,他们区分了所谓的“狭义语言能力”或“FLN”和“广义语言能力”或“FLB”(2002:1571)。FLN 是“仅仅抽象的语言计算系统...它通过语音系统将内部表示生成并映射到感觉-运动界面,通过(形式)语义系统将其映射到概念-意图界面。”(同上)FLB 包括 FLN 以及所有其他系统(运动系统、概念系统、知觉系统和学习技能),它们对语言习得和使用起到贡献。

接下来,Hauser 等人推测,人类 FLB 唯一特殊的地方就是 FLN。也就是说,除了 FLN 之外,FLB 包括的系统与其他动物的系统是共享的(或者只是轻微的修改)。因此,关于这些与语言相关的能力是如何进化的,没有什么神秘之处(或者说比平常更神秘)。另一方面,FLN 是人类独特的,它的特殊之处在于其递归能力,也就是将语言对象分类为层次化组织的类别,并且(在行为方面)能够从有限的词汇中生成无限多的句子。根据 Hauser 等人的观点,关于语言的唯一真正的进化之谜就是这种递归能力是如何进化的,而这个问题可以通过正常的生物学方法来解决(例如,比较研究以确定可能的前体机制等)。

然而,这种情况存在两个困难。首先,有证据表明,Hauser 等人所提出的递归能力被认为是人类 FLN 的独特特征,实际上并不仅限于人类,因为它不是物种特定的。(参见 Esser 等人,1997 年和 McGonigle,Chalmers 和 Dickinson,2003 年。)其次,递归性也不仅仅是语言特定的,而是人类认知和努力的其他领域的特征。例如,我们的概念空间似乎是按层次排序的(贵宾犬是一种狗,狗是一种四足动物,四足动物是一种动物,等等)。同样,非语言行为的规划和执行似乎经常涉及将较小的行为单元序列和组合成较大的整体。递归可能是人类语言能力的重要组成部分,但显然不仅仅是我们或该能力的特定特征。或者更直接地说:如果认为递归是语言能力的关键特征,并且递归也是人类认知和行为的特征,那么乔姆斯基是否仍然是语言先天论者就不清楚了。[26]

3.5 洋泾浜语和克里奥尔语

有人认为(例如,Bickerton 1981 和 Pinker,1994:32-9),洋泾浜语转变为克里奥尔语的过程直接证明了先天语言能力的运作。洋泾浜语是当说不同语言的人们聚集在一起(通常是在商业环境中或者当一个民族征服并剥削另一个民族时),需要就实际问题进行交流时发展起来的基本沟通系统。当洋泾浜语在句法和语义上得到发展,并具备真正的自然语言的特征时,就形成了克里奥尔语。

Bickerton 和随后的 Pinker 认为,当儿童将一种洋泾浜作为他们第一次语言学习的输入时,克里奥尔化就会发生,并强调克里奥尔语的复杂性反映了儿童先天语言能力的运作。此外,他们认为,由于克里奥尔语言都倾向于以相同的方式进行扩展,并且都遵守 UG 的约束条件,克里奥尔化现象也支持了先天对语言习得的贡献不仅仅是为了有效的沟通系统,而是对语言普遍规律的知识的观点。

这种“语言生物程序假设”在克里奥尔化文献中被称为存在两个问题。第一个问题涉及到这样的主张(例如,Bickerton 1981:43-70),即即使是在世界上完全不同的地区和彼此完全隔离的情况下发展的克里奥尔语,它们之间也存在“惊人的相似之处”(Pinker 1994:25),不仅在尊重 UG 的约束条件方面,而且更令人惊讶的是,在使用根本相同的方式来扩展它们的根本洋泾浜时(例如,使用相同的句法手段来标记时态、体态和语气)。Bickerton 提出的更强的主张——克里奥尔语使用相同的手段来达到相同的语法目的——是不正确的。例如,正如 Myhill(1991)所论证的那样,牙买加克里奥尔语、路易斯安那克里奥尔语、毛里求斯克里奥尔语和圭亚那克里奥尔语在标记时态、体态和语气方面与 Bickerton(1981)所提出的普遍规律有很大不同。(然而,Mufwene 1999 提供了一个证实 Bickerton 预测的案例。)较弱的主张——克里奥尔语尊重 UG 所施加的约束条件——在我所知道的范围内尚未受到质疑。因此,我们将假设,与其他自然语言一样,克里奥尔语尊重 UG。对于我们的目的来说,重要的问题是:这是如何发生的?

生物程序假说声称,克里奥尔化是语言能力的作用结果:从退化输入(例如洋泾浜语)学习语言的儿童被他们先天的语法知识所驱使,产生一个完整的自然语言(克里奥尔语)作为输出。作为从退化输入中学习语言的儿童如何添加受 UG 限制的结构的例子,平克引用了纽波特及其同事研究的聋儿西蒙学习美国手语(ASL)的案例。西蒙的父母直到十几岁才接触到 ASL,尽管他们将 ASL 作为主要语言,但平克说他们在很多方面都像洋泾浜说话者。例如,他们不一致地使用屈折标记,并经常不遵守该语言中控制置前的规则的结构依赖性。但是,平克说,“令人惊讶的是,尽管西蒙只看到了他父母的有缺陷版本的 ASL,他自己的手语比他们的好得多……西蒙一定以某种方式屏蔽了他父母的非语法‘噪音’。他一定抓住了他父母不一致使用的屈折标记,并将其解释为强制性的。”平克将此视为“单个活生生的孩子的克里奥尔化”案例,并解释西蒙在习得期间遵循 ASL 语法的原因是他先天的语言能力的作用。

在最近对过去 10 年左右的西蒙数据的综述中,纽波特(Newport 2001)强调了一些平克的演讲所掩盖或淡化的事实。首先,西蒙的表现并不像一个先天的手语使用者,尽管他确实发展出了“自己的 ASL 版本,其结构更像其他自然语言[而不是他父母的 ASL]”(纽波特 2001:168)。例如,西蒙的形态学稳定在一个“不像先天 ASL 那样复杂”的水平上,如果他的父母不使用标准的分类器形态素,他也不会习得(同上)。其次,西蒙在学习某个规则时的成功似乎与他父母的手语表达能力有关。例如,西蒙的父母在大部分动作动词的正确屈折形态使用上的准确率为 60-75%,在这种情况下,西蒙自己使用这种形态的准确率为 90%。然而,某些分类器形态素的使用在父母中只有 40%的准确率,而在这种情况下,尽管西蒙的表现比他的父母好,但还不达到先天手语使用者的水平。

Newport 认为,Simon 似乎在“整理”他父母的语言,也就是“在他的学习中严重依赖输入,但重新组织这些输入,形成一个比他所接触到的更干净、更受规则控制的系统。”(2001:168)她同意这个结果可能是由先天语言能力施加的限制造成的,但她认为这也与儿童中存在的一些更普遍的倾向一致,即从嘈杂的输入中生成系统规则,她正确地指出,在经验测试之前不能排除后一种假设。(在这个背景下,她指出(p.170)一些初步研究表明,从混乱的数据中推断出系统规则可能确实是儿童学习的一个更普遍的特征(尽管有趣的是,成年人没有),因为他们在非语言模式学习的情境中也表现出这种倾向。)Newport 得出结论:“Simon 与他的父母之间的对比在某些方面不那么极端,更多的是重新组织,而不是语言生物程序假设所暗示的那样……他似乎并没有创造出一种全新的语言,而是遵循了他所接收到的输入的主导趋势,但他对其进行了加强、扩展,并迫使它们在内部保持一致。”(2001:173)

如果 Newport 等人是正确的,Simon 的案例似乎并不支持先天论的假设。此外,从混合语的角度来看,存在一些额外的缺陷。首先,Bickerton-Pinker 观点将儿童语言学习者在混合语创造中的作用定为主导,但这只是目前在混合语文献中探讨的三种竞争假设之一。根据“超层假设”,混合语的形成并不是儿童从洋泾浜语中习得语言时发生的,而是当连续的成年说话者尝试学习主导文化的语言作为第二语言时发生的。(例如,Chaudenson 1992 为法语混合语的起源辩护了这一观点。)根据这种观点,混合语中看到的额外设备是主导语言中看到的设备的堕落。根据“底层假设”,混合语再次是由第二语言学习者而不是儿童创造的,只是增加的结构的来源是学习者的第一语言。(Lumsden 1999 认为海地克里奥尔语中多种非洲语言的痕迹支持这一假设。)为了看到这些竞争性的混合语解释如何削弱 Bickerton 和 Pinker 的“生物程序”假设,不需要对这些观点中的哪一个是正确的立场。如果混合语是成年学习者试图学习(并随后传授给他们的孩子)另一种非母语的语言的努力的结果,那么可以称之为“刺激的污染”,而不是学习者内在的普遍语法对混合语的影响,解释了混合语中遵守普遍语法的方式。

然而,有一种克里奥尔化的情况,其他假设似乎无法解释,正如平克(1994:37ff.)所强调的。这就是尼加拉瓜手语(ISN,Nicaraguan Sign Language)的发展案例,这是一种全新的自然手语,大约 30 年前首次在马那瓜及其周边的聋人学校中出现。这些学校最早设立于 1970 年代,ISN 是从当时进入学校的学生使用的各种家庭手语系统中演变而来的。ISN 是生物程序假设的一个有趣的测试案例,有两个原因。首先,家庭手语系统是独特的,几乎没有句法结构:因此,ISN 类似于自然语言的句法不能从底层影响中派生出来。而且,西班牙语,作为唯一可能的上层影响候选语,据说对手语使用者来说是无法接触的,因为它是一种听觉模态语言。平克声称 ISN 提供了克里奥尔化和先天语言能力运作的另一个例子:当年轻的孩子接触到年长孩子的洋泾浜时,它是“一跃而生的...”(1994:36-7)

然而,在他们对 ISN 发展的讨论中,Kegl、Senghas 和 Coppola(1999)表明事情并不像这么简单。ISN 并非从个别聋生使用的非常基础的家庭手语或 "Mimicas" 中一蹴而就地发展起来。相反,它的演变更为渐进,并在此之前出现了 Kegl 等人所称的 "尼加拉瓜手语"(LSN),一种 "皮钦语或行话"(181),"从这些家庭手语使用者在学校聚集并开始彼此分享家庭手语的时候开始发展,迅速导致了越来越多的共享手势和语法结构"(180)。此外,手语使用者可以使用西班牙语词典,并且他们的语言也受到了学校里使用手语的西班牙语为母语的非聋教师的影响——这种手语很可能包含了教师语言中可转化为非口语媒介的语法结构。(K. Stromswold,私人通信。)

尽管 Kegl 等人支持语言生物规划假说,即 ISN 在接触退化的 Mimica 或 LSN 输入的儿童的思维中“一蹴而就”,但他们的数据同样支持 ISN 是通过一系列的发展和创新逐渐形成的观点,这是在一个高度积极(因为缺乏语言)的年轻用户群体中进行的。事实上,正如 Kegl 等人自己描述的历史(第 187 页),这正是发生的情况。首先,一群手语使用者,每个人都有自己独特的 Mimicas 形式,进入学校。这个群体的成员通过从其他人的家庭手语系统中借用丰富了他们个人的 Mimicas,从而在表达能力上有所提高。然后,一批新的 Mimicas 手语使用者进入学校。他们的手语系统既受到了与同龄人的 Mimicas 接触的影响,也受益于早期群体发展的更丰富系统的影响。通过这种方式的连续发展,LSN 得以发展,然后通过类似的一系列步骤,ISN 得以发展。目前,在尼加拉瓜仍然使用这三种手语系统,这可能反映了人们接触语言的不同年龄和接收到的输入类型(ISN 或 LSN 与普通学校中的手语和书面西班牙语或唇读)的差异。此外,ISN 和 LSN 在不断变化中,尤其是 ISN,这是符合预期的,因为 ISN 是一个整个社区共同努力的成果,而不是个体儿童思维的成品。

3.6 发展性语言障碍和“语言基因”的寻找

成年后获得的语言障碍(例如布洛卡氏失语症和韦尼克氏失语症)的解离可能会告诉我们成熟大脑中语言的组织方式,但不能告诉我们语言是如何习得的或先天知识在这个过程中的作用——这是语言先天论者普遍承认的事实。相比之下,儿童期发生的语言解离有时被认为对语言是否先天具有强烈影响。平克(1994:297-314)阐述了这种思路,认为在威廉姆斯综合症(WS)和特定语言障碍(SLI)这两种发育障碍中,智力和语言之间存在双重解离。患有 WS 的人的智商远低于正常范围(50-60),但能够流利而引人入胜地谈论许多话题。相比之下,患有 SLI 的人非语言智力正常(≈90),但说话吃力且缓慢,经常在句子和单词的产生和理解中出错。平克认为这里存在双重解离,并且支持这样一种观点:存在一种特殊的“语言习得装置”,它可以与儿童可能具备的任何一般学习能力分离开来。此外,他还根据 Gopnik 1990a,b 和 Gopnik and Crago 1991 的研究,主张这种解离似乎涉及特定的句法方面,这表明所讨论的语言能力是语法能力。最后,再次根据 Gopnik 的观点,他认为由于 SLI 似乎在家族中遗传,并且至少有一种情况显示出孟德尔遗传模式,所以我们在这里看到的不仅仅是“语法能力”的证据,而是“语法基因”的证据。

3.6.1 威廉姆斯综合症

WS 是一种罕见的遗传性疾病,具有复杂的表型。在身体方面,WS 患者表现出畸形的面部特征、异常的生长模式、胃肠问题、早期青春期、神经异常(包括低肌张力、高反射性、过敏和小脑功能障碍)、视力和眼睛发育缺陷、牙齿问题、结缔组织异常和心脏问题。在心理方面,除了他们较低的非语言智商和相对保留的语言能力外,他们在音视觉记忆方面表现相对良好,但在视觉空间能力方面受损严重,导致日常生活困难(例如穿衣)。他们性格外向,极具社交能力,但也表现出许多行为和情绪问题(尤其是儿童期的多动症和注意力困难,以及后期的焦虑症)。 (Morris 和 Mervis 2000; Mervis 等 2000 年。)

至于他们的语言能力,目前文献中存在关于其正常性的争议。根据一种观点,WS 患者的语言能力相当正常,尤其是与智力相似的智力低下者(如唐氏综合症患者)相比(Pinker 1994, 1997; Clahsen 和 Almazan 1998; Bello 等 2004; Bellugi 等 1998)。尽管他们在选择词汇方面相当不寻常(例如,在词汇流畅性测试中除了常见的动物词汇外,还会产生吉娃娃、朱鹭和秃鹰等词汇),并且尽管过度使用陈词滥调和社交惯用语,但他们使用语言的能力,尤其是在对话环境中,基本上是完好的。例如,他们在社交互动中可能显得相对正常,并且他们对条件问题的处理和重复具有复杂句法的句子的能力更接近于正常对照组,而不是匹配的唐氏综合症对照组(Bellugi 等 2000 年:13, 15)。

然而,根据另一种观点,威廉姆斯综合症(WS)患者的语言能力可能比唐氏综合症患者更接近正常,并且与其在其他领域明显的残疾形成鲜明对比,但进一步的调查发现,在多个方面仍然显示出一些异常特征。WS 语言表现出“严重延迟”的早期习得,特别是词汇(Bellugi 等,2000 年:11)和语法形态(Caprirci 等,1996 年);对于规则复数和过去时态的过度规范化,以及对于不规则名词和动词的能力缺陷(Clahsen 和 Almazan,2001 年);“形态句法方面的困难”(Morris 和 Mervis,2000 年:467;另见 Volterra 等,1996 年;Karmiloff-Smith 等,1997 年;Levy 和 Hermon,2003 年);以及对于关系从句结构(Grant 等,2002 年)、嵌入句和(在法语中)语法性别的掌握能力受损(Karmiloff-Smith 等,1997 年)。事实上,Bellugi 等人(2000 年)发现,WS 儿童在句子重复任务上的表现与被诊断为特定语言障碍(SLI)的匹配对照组无法区分(见下文第 3.6.2 节)。这些发现导致像 Annette Karmilloff-Smith 这样的专家敦促“推翻 WS‘完好’句法能力的神话”(Karmiloff-Smith 等,2003 年),并使 Ursula Bellugi(曾是“保留语言”观点的支持者)警告说,“因为他们的语言能力通常高于他们的整体认知能力,WS 患者可能被认为比他们实际上更有能力。”(Bellugi 等,1999 年)

与其认知特点相反,先天性心脏病的遗传基础是已知的。它是由于 7q11.23 染色体上弹性蛋白基因 ELN 的 ≈1.5 Mb 缺失引起的;大多数病例似乎是由于新突变引起的。ELN 在合成弹性蛋白方面起着关键作用,这是一种在全身结缔组织中发现的弹性纤维中将细胞粘在一起的蛋白质,在软骨、韧带和动脉壁中尤其高浓度存在。无法合成这种蛋白质会在从第一孕期开始的各个方面中破坏发育,并通过尚不完全了解的过程引起与该综合症相关的一系列症状。(Morris 和 Mervis 2000;Mervis 等,2000 年。)

3.6.2 特定语言障碍

与威廉姆斯综合症相反,在轻度至中度智力低下和众多身体缺陷的情况下,特定语言障碍(“SLI”)表现出相对保留的语言能力,当(i)通过标准智商测试测得的非语言智力正常;(ii)语言智商远低于正常水平;以及(iii)可以排除语言障碍的明显原因(例如失聪,明显的神经损伤)。根据这些诊断标准,SLI 的诊断涵盖了一系列高度异质的与语言相关的缺陷,不是每个语言障碍病例都同时出现。(Bishop,1994 年;Bishop 等,2000 年。)其中包括:

  • 先天和后天的语音缺陷(例如,难以发出辅音聚类,如 spectacle 中的辅音聚类,以及无法表现出根据发音位置(/ba/ vs. /ga/)和发声(/ba/ vs. /pa/)区分的音素的分类知觉);

  • 形态缺陷(例如,使用词缀生成过去时或复数形式);

  • 先天和后天的句法缺陷(例如,分析“可逆”被动句(Katie kissed Jacob vs. Jacob was kissed by Katie),复杂的间接宾语结构(例如,Katie gave Jacob the book)和指代(例如,Katie said that Sarah scratched her vs. Katie said that Sarah scratched herself)。

由于这种异质性,SLI 研究人员引入了一些亚型,包括“语言听觉失认症”、“词汇-句法缺陷综合征”和“音韵编程综合征”(Bishop 1994)。同样由于这种异质性,而且部分原因是因为研究并不总是区分不同的亚型,因此 SLI 的病因并不被很好地理解(O'Brien 等,2003),尽管最近的研究表明至少有两个不同的遗传位点参与了至少某些亚型的疾病(Bishop 2006)。有些人认为存在着“语法模块”的潜在缺陷。例如,Rice 和 Wexler(1996)将 SLI 个体的形态学缺陷归因于缺少 UG 原则,即屈折原则,Van der Laly 和 Stollwerk(1997)将一些 SLI 儿童的指代难题归因于他们未能习得约束理论。其他人则认为存在非语言缺陷,如听觉、记忆或处理缺陷是根本问题。例如,Tallal(1980,1985)认为许多 SLI 病例是由于对快速听觉刺激的处理缺陷导致无法正确区分音素,进而导致无法习得语法的其他方面。其他人,如 Norbury、Bishop 和 Briscoe(2002)认为这些儿童的处理能力有限是罪魁祸首。

虽然 SLI 的多样症状表明其病因可能不会有统一的理论,但在一个亚型的情况下,这种疾病的原因相对而言是比较清楚的,该亚型涉及到形态句法(即从较小的语义单位或词素形成单词的规则)的严重破坏。这种亚型在一个大型的三代英国家庭 KE 和另一个无关的个体中都有出现,已经追溯到一种特定的基因突变,其功能正在积极调查中。

自从 1990 年代初以来,KE 家族就受到了很多媒体的关注,当时 Gopnik 1990a,b 和 Gopnik 和 Crago 1991(另见 Gopnik 1997)提出,他们的形态句法缺陷是由一个单一显性基因突变引起的,该基因通常负责编码语法特征,如功能词和用于标记数量、时态、体貌等的屈折变化。根据 Gopnik 的说法,受影响的 KE 家族成员由于这个突变而“特征盲”,而根据 Pinker(1994)的说法,他们的家谱(图 6)和特别是形态句法缺陷构成了“语法基因的暗示性证据...对于语法部分发展最具特异性的基因”(Pinker 1994:325)。

图 6. KE 家族家谱 (图片经 Simon E. Fisher 许可使用)

Vargha-Khadem 和同事对 KE 家族进行了其他深入研究(例如,Vargha-Khadem 等人 1995 年,1998 年; Watkins 等人,2002 年),他们坚决反驳了 KE 的语言障碍的根本原因是句法缺陷的假设。相反,他们认为,KE 表型比 Gopnik 的说法所暗示的要广泛得多,他们的“特征盲目”只是潜在发音问题的众多影响之一。根据 Vargha-Khadem 团队的描述,受影响的 KE 的言语表达费力,“有时语法错误,经常难以理解”(Watkins 等人,2002 年:453),不仅在形态句法(例如,规则复数和过去时的词尾)方面存在障碍,而且在形成不规则过去时(正确使用是由词汇决定而不是规则决定)和句子级句法,特别是词序方面也存在障碍。理解能力也在句法和词汇层面上受损,他们对单词和非单词的阅读也是如此。这些结果表明,KE 的问题超出了形态句法的范围,而受影响的 KE 的非语言智商显著较低(低 18-19 分;Vargha-Khadem 等人,1995 年),这表明他们的缺陷可能更为广泛。最后,受影响的 KE 在非语言相关的面部、口腔和舌头运动的排序和执行方面存在困难,并且在 fMRI 扫描中不仅表现出言语区域的异常激活,还表现出运动区域的异常激活(Liegeois 等人,2003 年);这种“口面运动能力”的缺陷支持 Vargha-Khadem 的假设,即 KE 的根本问题是发音问题。

正如 Gopnik 所指出的,KE 家族的遗传模式表明一个单一的显性基因负责这种疾病。(见图 6)在 20 世纪 90 年代初,Fisher 和他的同事开始致力于分离这个基因。首先,它被定位在染色体 7q31 区域,该区域含有约 100 个基因(Fisher 等人,1997 年,1998 年;O'Brien 等人,2003 年)。后来,它被确定为 FOXP2 基因(Lai 等人,2001 年;Fisher 等人,2003 年),该基因编码一种调节蛋白或“转录因子”(即一种帮助调节基因组中其他基因转录速率的蛋白质——在 FOXP2 的情况下,该蛋白质起到抑制下游基因转录的作用)。在受影响的家族成员中,编码这种调节蛋白的基因发生了单个碱基对的替换,导致氨基酸精氨酸(而不是正常的组胺)插入到蛋白质的一个关键区域(即“叉头结合结构域”),该区域对于其调节下游 DNA 转录的能力至关重要。因此,FOXP2 在受影响的 KE 家族成员中无法执行其正常的调节作用。

FOXP2 的功能失常导致受影响的 KE 个体的异常脑发育。对其他动物和人类的研究(例如 Lai 等人,2003 年; Takahashi 等人,2003 年; Ferland 等人,2003 年; Teramitsu 等人,2004 年)表明,FOXP2 在两个不同的脑回路中通常在发育和成年期间高度表达。其中一个是皮质纹状体回路,其中来自前额叶和前运动皮层的输入受基底神经节和丘脑调节,然后返回前额叶和前运动皮层区域; 另一个是橄榄小脑回路,其中感觉输入通过脊髓发送到延髓,小脑和丘脑进行处理,然后传递给前额叶皮层。(见图 7。)已知基底神经节参与运动行为的顺序和基于奖励的学习(Graybiel,1995 年,1998 年),而小脑回路虽然了解较少,但被认为是与运动调节和协调有关的本体感知回路(Lieberman,2002 年)。FOXP2 在其他物种(例如金丝雀,斑马雀,大鼠)的这些区域的同源物中表达,并且在所有研究的物种中,这些区域都参与运动顺序和协调(Sharff 和 White,2004 年)。

图 7. FOXP2 表达的两个回路。(根据 Diana Weedman Molavi 的图,华盛顿大学医学院神经科学教程)。

所以,情况似乎是这样的,受影响的 KE 家族成员的语言困难是由 FOXP2 基因突变引起的,这导致了与口腔、舌头和可能的喉咙语音运动的顺序和协调所必需的纹状体、小脑和皮层区域的异常发育;受影响家族成员的 MRI 扫描显示这些区域的灰质密度降低,支持这一假设,fMRI 扫描显示在接受和主动语言处理过程中纹状体和皮层激活异常(Belton 等,2003 年;Liegeois 等,2003 年)。

Vargha-Khadem 推测(参见 Watkins 等,2002 年:463),KE 的那些似乎与运动无关的缺陷(例如,他们的理解和阅读问题,他们在词序和句法方面的困难)是由于学习障碍造成的,而这种学习障碍本身是由于他们的运动缺陷引起的。例如,语音表达障碍可能导致语音学表示贫乏,进而影响形态和形态句法知识的习得,这将构成进一步句法学习的不良基础。在所有这些层面上的受损表示将在接受语言和阅读以及口语领域表现出来。KE 的非语音表达缺陷的另一个可能解释,并不一定与前一个解释相竞争,是基底神经节也被认为与工作记忆(Bosnan,2004 年)和基于奖励的学习(例如,经典条件反射)有关,后者通过与基底结构相互作用的多巴胺神经回路介导(Lieberman,2002 年)。如果 KE 的奖励性学习和工作记忆受损,那么这不仅可以解释他们的高级句法缺陷,还可以解释他们整体的较低智商(Lieberman,2002 年)。

这两种对于语言先天主义者来说,对于知识元的解释似乎都不太合适。因为它们都默认语言学习,包括句法学习,并不是(或者并不完全是)通过特殊机制来支持的,而是通过更一般的运动回路(根据 Vargha-Khadem 假说)或者基于奖励的学习和工作记忆能力(根据 Lieberman)来介导的,这些能力也参与其他学习任务。

另一方面,有证据表明 FOXP2 基因在声音学习和表达中起着特别重要的作用。首先,它在修改其先天声音库的鸣禽中高度表达:在金丝雀中,它在成年鸟修改其歌声时季节性表达(Teramitsu 等,2004 年),在斑胸草雀中,它在年轻鸟学习歌声时更多地表达(Haessler 等,2004 年)。此外,有证据表明 FOXP2 基因在人类中的变异经历了强烈的正选择(Enard 等,2002 年;Zhang 等,2002 年)。人类 FOXP2 产生的蛋白质与小鼠的蛋白质仅在其 715 个氨基酸中的三个上有差异,最近的一项分析(Zhang 等,2003 年)表明其中两个差异是人类谱系独有的。根据 Enard 等,这两个差异在人类基因组中固定,而在我们最近的亲属黑猩猩的谱系中没有发生固定的替代,这表明这些变化在我们的谱系中受到了强烈的选择;Enard 等将这些变化在人类群体中固定的日期定为大约 20 万年前。这个日期与至少一些现代人类语言出现的估计相吻合,这表明由 FOXP2 支持的语音能力——并且在缺乏该基因的人中受损——对于语言能力至关重要。

3.6.3 语法模块和语言的遗传学

在这一点上,出现了两个问题。首先,在比较威廉姆斯综合症和特殊语言障碍时,是否存在语言能力和一般认知能力之间的双重解离?其次,我们对 FOXP2 在语言发展中的作用的当前认识告诉我们关于语言先天主义的什么?

至于第一个问题,似乎不存在双重解离。首先,威廉姆斯综合症患者的语言,虽然与他们的智力低下形成鲜明对比,但并不正常;事实上,正如我们所见,它在某些测试中与语言障碍患者的语言无法区分。此外,正如 Thomas 和 Karmiloff-Smith 在 2002 年所警告的那样,在像威廉姆斯综合症这样的广泛发展障碍中,不能完全确定在表面上“完好”的能力是由神经和心理结构正常发展所致。也就是说,鉴于大脑已知能够通过在另一个领域拼凑解决方案来弥补缺陷,不能假设 WS 患者中存在一个“语言模块”,该模块在其他认知系统严重受损的情况下发展得更多或更少正常。Thomas 和 Karmiloff-Smith 认为,WS 语言发展与正常儿童的许多差异表明,在这种情况下,“残余的正常性”假设是错误的,从而削弱了 WS 中“语言(或语法)模块”得以保留的主张。

移动到分离的另一侧,由于很难准确说出在特殊语言障碍(SLI)病例中语言的哪个方面受到了干扰,因此很难确定这种干扰是否仅限于语言,更不用说语法了。尽管像 Van der Lely 和 Christian 2000 以及 van der Lely 和 Ullman 2001 这样的研究人员认为存在一种纯粹的语法缺陷形式,这支持了语法模块的假设,但正如我们上面所看到的,这是有争议的。当然,对于先天性语言障碍(KE)的考虑并不支持这样的假设。他们的根本缺陷似乎涉及口面运动技能,而不仅仅是语言;此外,他们的“智力”,根据非语言智力测试测得的“正常”水平,似乎也受到了他们的神经和/或语言异常的影响——可以看到他们的分数比亲属低 18-19 分。换句话说,目前尚不清楚在这种情况下语言和智力是否存在任何分离。可以得出结论,就目前的情况而言,SLI 似乎是一种如此多样化的障碍,以至于无法进行清晰的描述,并且对这种障碍的考虑并不支持存在一个独立于其他认知过程的语言或语法模块的观点。

上述提出的第二个问题是:从考虑 KE 和 FOXP2 可以了解到语言的先天基础有哪些。在最近的一篇文章中,Marcus 和 Fisher(2003)认为上述讨论的结果为我们了解语言在大脑中的实现方式以及基因对其控制(在某种程度上)提供了有价值的见解。然而,他们正确地避免了得出 FOXP2 是“语言基因”甚至是“语音表达基因”的道德教训。FOXP2 的影响范围更广(除了大脑外,它还在发育中的心脏和肺部中表达--参考文献),而其活跃的神经回路的功能目前还不够理解,只能对 FOXP2 参与构建人类语言表型的方式进行粗略的描述。

§3 中涵盖的所有主题都值得一本书来详细讨论。我在这里的目标是勾勒出现代对心智的理解揭示了人类具有 UG 的先天表征负责其语言习得的主张的不足和不可信之处。语言能力的习得可能涉及许多过程,其中许多过程可能是通过自然选择专门用于语言任务的,但其中许多过程也保留了它们的其他和更古老的功能。语言先验论者的理论将我们对语法能力的习得视为一件简单的事情-可以用一个层次的解释来描述,并且可以用一种单一的过程来解释。这种情况非常不可能发生。在语言知识的习得中,多个系统和多个过程同时起作用,当我们对语言习得有了更深入的理解时,可能涉及到多种类型和多个不同层次的理论,并且在很少或没有方面类似于乔姆斯基的先验论理论。[29]

Bibliography

  • Adolphs, R. (1999). Social Cognition and the Human Brain. Trends in Cognitive Science, 3(12), 469-479.

  • Avital, E. and Jablonka, E. (2000). Animal Traditions: Behavioural Inheritance in Evolution, Cambridge: Cambridge University Press,

  • Ayoun, D. (2003). Parameter Setting in Language Acquisition, London: Continuum International Publishing Group, Incorporated.

  • Baker, C.L. (1979). “Syntactic Theory and the Projection Problem”, Linguistic Inquiry, 10: 533-81.

  • Bates, E. and Roe, K. (2001). “Language development in children with unilateral brain injury”, in Handbook of Developmental Cognitive Neuroscience, C.A. Nelson and M. Luciana,(eds.), Cambridge: MIT Press, pp. 281-307.

  • Beale, J.M. and Keil, F.C. (1995). “Categorical Effects in the Perception of Faces”, Cognition, 57: 217-239.

  • Bello, A., Capirci, O., & Volterra, V. (2004). Lexical production in children with Williams syndrome: spontaneous use of gesture in a naming task. Neuropsychologia, 42(2), 201-213.

  • Bellugi, U., & Lai, Z. (1998). Neuropathological and cognitive alterations in Williams syndrome and Down syndrome. Faseb Journal, 12(4), A355-A355.

  • Bellugi, U., Lichtenberger, L., Mills, D., Galaburda, A., & Korenberg, J. R. (1999). Bridging cognition, the brain and molecular genetics: evidence from Williams syndrome. Trends in Neurosciences, 22(5), 197-207.

  • Bellugi, U., L. Lichtenberger, et al. (2000). “The neurocognitive profile of Williams syndrome: A complex pattern of strengths and weaknesses.” Journal of Cognitive Neuroscience 12: 7-29.

  • Belton, E., C. H. Salmond, et al. (2003). “Bilateral brain abnormalities associated with dominantly inherited verbal and orofacial dyspraxia.” Human Brain Mapping 18(3): 194-200.

  • Berwick, R.C. and Weinberg, A.S. (1983). The Grammatical Basis of Linguistic Performance: Language Use and Acquisition, Cambridge, MA: MIT Press.

  • Berwick, R. C. (1998). Language evolution and the Minimalist Program: the origins of syntax. In J. R. Hurford, M. Studdert-Kennedy & C. Knight (Eds.), Approaches to the Evolution of Language (pp. 320-340). Cambridge: Cambridge University Press.

  • Bickerton, D. (1981). Roots of Language: Karomer Publishers, Inc.

  • ––– (1998). Catastrophic evolution: the case for a single step from protolanguage to full human language. In J. R. Hurford, M. Studdert-Kennedy & C. Knight (Eds.), Approaches to the Evolution of Language (pp. 341-358). Cambridge: Cambridge University Press.

  • ––– (2000). Language and Species, Chicago : University of Chicago Press.

  • Birdsong, D. and Molis, M. (2001). “On the evidence for maturational constraints in second-language acquisition”, Journal of Memory and Language, 44: 235-49.

  • Bishop, D. V. M. (1994). “Is Specific Language Impairment A Valid Diagnostic Category - Genetic And Psycholinguistic Evidence.” Philosophical Transactions Of The Royal Society Of London Series B-Biological Sciences 346(1315): 105-111.

  • –––, P. Bright, et al. (2000). “Grammatical SLI: A distinct subtype of developmental language impairment?” Applied Psycholinguistics 21(2): 159-181.

  • Bohannon, J.N. and Stanowicz, L. (1988). “The issue of negative evidence: Adult responses to children's language errors”, Developmental Psychology, 24: 684-89.

  • Bohannon, J.N., MacWhinney, B. and Snow, C. (1990). “No negative evidence revisited: Beyond learnability or who has to prove what to whom”, Developmental Psychology, 26: 221-26.

  • Bohannon, J. N., Padgett, R. J., Nelson, K. E., & Mark, M. (1996). Useful evidence on negative evidence. Developmental Psychology, 32(3), 551-555.

  • Bosman, C., R. Garcia, et al. (2004). “FOXP2 and the language working-memory system.” Trends In Cognitive Sciences 8(6): 251-252.

  • Botha, R. P. (2003). Unravelling the Evolution of Language. U.S.: Elsevier Science.

  • Bradlow, A.R., Pisoni, D.B., Akahane-Yamada, R., and Tohkura, Y. (1997). “Training Japanese listeners to identify English /r/ and /l/: IV. Some effects of perceptual learning on speech production”, Journal of the Acoustical Society of America, 101: 2299-2310.

  • Brandon, R.N. and Hornstein, N. (1986a). “From Icons to Symbols: Some Speculations on the Origins of Language”, Biology and Philosophy, 1 :169-89.

  • Brown, R. (1973). A first language: The early stages, Cambridge, MA: Harvard University Press.

  • Brown, R., Cazden, C. and Bellugi, U. (1969). “The Child's Grammar from I to III”, in Minnesota Symposium on Child Psychology, Vol. II, J. Hill (ed.), Minneapolis: University of Minnesota Press.

  • Brown, R. and Hanlon, C. (1970). “Derivational Complexity and Order of Acquisition in Child Speech”, in Cognition and the Development of Language, J. R. Hayes (ed.), New York: John Wiley and Sons.

  • Buonomano, D.V. and Merzenich, M.M. (1998). “Cortical plasticity: From synapses to maps”, Annual Review of Neuroscience, 21: 149-186.

  • Campanella,. S., Chrysochoos, A., Bruyer, R. (2001). “Categorical perception of facial gender information: Behavioural evidence and the face-space metaphor”, Visual Cognition, 8 (2): 237-262.

  • Capirci, O., L. Sabbadini, et al. (1996). “Language development in Williams syndrome: A case study.” Cognitive Neuropsychology 13(7): 1017-1039.

  • Catania, A.C. (1990). “What good is 5 percent of a language competence”, Behavioral and Brain Sciences, 13 : 729-730.

  • Cavalli-Sforza, L.L. (1997). “Genes, peoples, and languages”, PNAS: 94: 7719-772

  • Chambers, K.E., Onishi, K.H., and Fisher, C. (2003). “Infants learn phonotactic regularities from brief auditory experience”, Cognition, 87: 69-77.

  • Chater, N., & Manning, C. D. (2006). Probabilistic models of language processing and acquisition. Trends in Cognitive Sciences, 10(7), 335-344.

  • Chaudenson, R. (1992). Des îles, des hommes, des langues. Paris: L'Harmattan.

  • Chomsky, N. (1957). Syntactic Structures, The Hague : Mouton.

  • ––– (1959). Review of Skinner's Verbal Behavior, Language, 35: 26-58.

  • ––– (1965). Aspects of the Theory of Syntax, Cambridge, MA: MIT Press.

  • ––– (1975). Reflections on Language, London : Fontana.

  • ––– (1980). Rules and Representations. New York: Columbia University Press.

  • ––– (1981). Lectures on Government and Binding, Hawthorne, NY: Walter De Gruyter Incorporated.

  • ––– (1982). The Generative Enterprise, Dordrecht: Foris Publications.

  • ––– (1986). Knowledge of Language, Its Nature, Origin and Use, NY: Praeger.

  • ––– (1988). Language and Problems of Knowledge, The Managua Lectures, Cambridge, MA: MIT Press.

  • ––– (1975a). The Logical Structure of Linguistic Theory, NY: Plenum.

  • ––– (1980). Rules and Representations, NY: Columbia University Press.

  • ––– (1990). “On the nature, acquisition and use of language”, in Mind and Cognition: A Reader, W.G. Lycan (ed.), Cambridge MA and London UK: Blackwells, pp.627-45.

  • ––– (1995). The Minimalist Program, Cambridge: MIT Press.

  • Chouinard, M.M. and Clark, E.V. (2003) “Adult reformulations of child errors as negative evidence,” Journal of Child Language, 30:637-69.

  • Clahsen, H. and Muysken, P. (1986). “The availability of universal grammar to adult and child learners”, Second Language Research, 2: 93-119.

  • ––– and M. Almazan (1998). “Syntax and morphology in Williams syndrome.” Cognition 68(3): 167-198.

  • ––– (2001). Compounding and inflection in language impairment: Evidence from Williams Syndrome (and SLI). Lingua, 111(10), 729-757.

  • Clark, A. (1997). Being There: Putting Brain, Body, and World Together Again, Cambridge, MA: MIT Press.

  • Clark, A. (1997). Being There: Putting Brain, Body and World Together Again. Cambridge, Ma: Bradford Books/MIT Press.

  • Cowen T. and Gavazzi, I. (1998). “Plasticity in adult and ageing sympathetic neurons”, Progress in Neurobiology, 54:249-88.

  • Cowie, F. (1997). The Logical Problem of Language Acquisition. Synthese, 111, 17-51.

  • ––– (1999). What's Within: Nativism Reconsidered, New York: Oxford University Press.

  • Crain, S. and Pietroski, P.M. (2001). “Nature, Nurture, and Universal Grammar”, Linguistics and Philosophy, 24: 139-86.

  • ––– (2002). “Why language acquisition is a snap”, Linguistic Review, 19 (1-2): 163-183.

  • Crain, S. (1991). “Language acquisition in the absence of experience”, The Behavioral and Brain Sciences, 4: 597-650.

  • Curtiss, S. (1977). Genie: a Psycholinguistic Study of a Modern-day “Wild Child”. New York: Academic Press.

  • Dawkins, R. and Krebs, J.R. (1979). “Arms races between and within species”, Proceedings of the Royal Society of London, Series B — Biological Sciences, 205: 489-511.

  • DeCaspar, A.J. and Spence, M.J. (1986). “Prenatal maternal speech influences newborns' perception of speech sounds”, Infant Behavior and Development, 9:133-150.

  • DeGraff, D. (1999a). Creolization, Language Change, and Language Acquisition. In M. Degraff (Ed.), Language Creation and Language Change: Creolization, diachrony, and development. (pp. 1-46). Cambridge, MA: MIT Press.

  • DeGraff, D. (Ed.). (1999b). Language Creation and Language Change: Creolization, Diachrony and Development. Cambridge, Ma.: MIT Press.

  • Demetras, M.J., Post, K.N. and Snow, C.E. (1986). “Feedback to first language learners: The role of repetitions and clarification questions”, Journal of Child Language, 13: 275-92.

  • Descartes, R. (1984), “Discourse on the Method”, in The Philosophical Writings of Descartes, Vol. II, J. Cottingham, R. Stoothoff and D. Murdoch (eds.), and trans. (1984), Cambridge: Cambridge University Press.

  • Devitt M. (2006). Ignorance of Language, Oxford: Oxford University Press.

  • Dick F., Bates E., Wulfeck B., Utman J.A., Dronkers N. and Gernsbacher M.A. (2001). “Language deficits, localization, and grammar: Evidence for a distributive model of language breakdown in aphasic patients and neurologically intact individuals”, Psychological Review, 108: 759-788.

  • Dronkers, N.F., Redfern, B.B. and Knight, R.T. (2000). “The Neural Architecture of Language Disorders”, in The New Cognitive Neurosciences, 2**nd Ed., M.S. Gazzaniga (ed.), Cambridge: MIT Press, pp. 949-58.

  • Dunbar, R. (1996). Grooming, Gossip and the Evolution of Language, Cambridge, Ma.: Harvard University Press.

  • Eimas, P.D. (1975). “Speech perception in early infancy”, in Infant Perception, Vol.2. From sensation to cognition, L. Cohen and P. Aalapatel (Eds.), New York: Academic Press. Pp.193-231.

  • Elbert, T., Heim, S. and Rockstroh, B. (2001). In Handbook of Developmental Cognitive Neuroscience, C.A. Nelson and M. Luciana, Cambridge: MIT Press, pp. 191-202.

  • Elman, J.L., Bates, E.A., Johnson, M.H., Karmiloff-Smith, A., Parisi, D. and Plunkett, K. (1996). Rethinking Innateness: A Connectionist Perspective on Development, Cambridge: Bradford Books/MIT Press.

  • Elman, J.L. (1998). “Generalization, simple recurrent networks, and the emergence of structure”, in Proceedings of the Twentieth Annual Conference of the Cognitive Science Society, M.A. Gernsbacher and S.J. Derry (eds.), Mahwah, NJ: Lawrence Erlbaum Associates.

  • Enard, W., Przeworski, M., Fisher, S., Lai, C., Wiebe, V., Kitano, T., et al. (2002). “Molecular evolution of FOXP2, a gene involved in speech and language”,. Nature, 418, 869-872.

  • Epstein, S., Flynn, S., and Martohardjono, G. (1996). “Second language acquisition: theoretical and experimental issues in contemporary research,” Brain and Behavioral Sciences, 19:677-758.

  • ––– (1998). “The strong continuity hypothesis: some evidence concerning functional categories in adult L2 acquisition”. In The generative study of second language acquisition, S. Flynn, G. Martohardjono and W. O'Neil (eds.), Mahwah, NJ: Lawrence Erlbaum, pp.61-77.

  • Esser, K-H., Condon, C.J., Suga, N., and Kanwal, J.S. (1997). “Syntax processing by auditory cortical neurons in the FM—FM area of the mustached bat Pteronotus parnellii”, Proc. Natl. Acad. Sci. USA. 94: 14019—14024.

  • Etcoff, N.L., Magee, J.J. (1992). “Categorical Perception of Facial Expressions”, Cognition 44: 227-240.

  • Farrar M.J. (1990). “Discourse and the acquisition of grammatical morphemes”, Journal of Child Language, 17: 607-24.

  • ––– (1992). “Negative Evidence and Grammatical Morpheme Acquisition”, Developmental Psychology, 28: 90-98.

  • Feldman, J. (1972). “Some decidability results on grammatical inference and complexity”, Information and Control, 20: 244-62.

  • Ferland, R. J., T. J. Cherry, et al. (2003). “Characterization of Foxp2 and Foxp1 mRNA and protein in the developing and mature brain.” Journal Of Comparative Neurology 460(2): 266-279.

  • Fisher, S. E., F. Vargha-Khadem, et al. (1997). “Localisation of a gene implicated in a severe speech and language disorder.” American Journal Of Human Genetics 61(4): A28-A28.

  • –––, F. Vargha-Khadem, et al. (1998). “Localisation of a gene implicated in a severe speech and language disorder,” Nature Genetics 18(3): 298-298.

  • –––, C. S. L. Lai, et al. (2003). “Deciphering the genetic basis of speech and language disorders.” Annual Review of Neuroscience 26: 57-80.

  • Flege, J.E., Yeni-Komshian, G.H. and Liu, S. (1999). “Age constraints on second language acquisition”, Journal of Memory and Language, 41: 78-104.

  • Fodor, J.A. (1981). “The Present Status of the Innateness Controversy”, in RePresentations: Philosophical Essays on the Foundations of Cognitive Science, Cambridge: MIT Press/Bradford Books, pp. 257-316.

  • Fodor, J.A. (1998). Concepts: Where Cognitive Science went Wrong, New York: Oxford University Press.

  • Gold, E.M. (1967). “Language Identification in the Limit”, Information and Control, 10: 447-74.

  • Goldin-Meadow, S., and Mylander, C. (1983). “Gestural communication in deaf children: noneffect of parental input on language development”, Science, 221: 372-4.

  • Goldin-Meadow, S., and Mylander, C. (1990). “The role of parental input in the development of a morphological system”, Journal of Child Language, 17(3): 527-63.

  • Goldin-Meadow, S., and Mylander, C. (1998). “Spontaneous sign systems created by deaf children in two cultures”, Nature, 391:279-81.

  • Gopnik, M. (1997). “Language deficits and genetic factors”, Trends in Cognitive Science, 1: 5-9

  • ––– (1990a) “Feature-blind grammar and dysphasia”, Nature, 344:715.

  • ––– (1990b) “Genetic basis of a grammar defect”, Nature, 347: 26.

  • –––, and Crago, M. (1991). “Familial aggregation of a developmental language disorder”, Cognition, 39: 1-50.

  • Grant, J., V. Valian, et al. (2002). “A study of relative clauses in Williams syndrome.” Journal Of Child Language 29(2): 403-416.

  • Graybiel, A. M. (1995). “Building action repertoires: Memory and learning functions of the basal ganglia.” Current Opinion In Neurobiology 5(6): 733-741.

  • Graybiel, A. M. (1998). “The basal ganglia and chunking of action repertoires.” Neurobiology Of Learning And Memory 70(1-2): 119-136.

  • Griffiths, P. (2002). “What is innateness?”, Monist, 85: 70-85.

  • Grimshaw, G.M., Adelstein, A., Bryden, M.P., and MacKinnon, G.E., 1998, “First language acquisition in adolescence: Evidence for a critical period for verbal language development”, Brain and Language, 63: 237-55.

  • Haesler, S., K. Wada, et al. (2004). “FoxP2 expression in avian vocal learners and non-learners.” Journal of Neuroscience 24(13): 3164-3175.

  • Hakuta, K., Bialystok, E., and Wiley, E. (2003). “Critical evidence: a test of the critical-period hypothesis for second-language acquisition”, Psycholigical Science, 141: 31-8.

  • Hamilton, R.H. and Pascual-Leone, A. (1998). “Cortical plasticity associated with Braille learning”, Trends in Cognitive Science, 2: 168-174.

  • Harman, G.H. (1967). “Psychological Aspects of the Theory of Syntax”, Journal of Philosophy, 64: 75-87.

  • Harman, G. (1969). Comments on Linguistic Competence and Nativism. Synthese, 19, 410-424.

  • Harnad, S.R., ed. (1987). Categorical Perception : The Groundwork of Cognition, Cambridge: Cambridge University Press.

  • Harris, Z.S. (1951). Structural Linguistics, Chicago: University of Chicago Press.

  • Hauser, M.D., Chomsky, N., and Fitch, W.Y. (2002). “The Faculty of Language: What Is It, Who Has It, and How Did It Evolve?”, Science, 298: 1569-1579.

  • Hauser, M. D. and McDermott, J. (2003). “The evolution of the music faculty: a comparative perspective”, Nature Neuroscience, 6: 663-668.

  • Hauser, M.D., Weiss, D., and Marcus, G. (2002). “Rule learning by cotton-top tamarins”, Cognition, 86: 15-22.

  • Hirsh-Pasek, K., Trieman, R. and Schneidermann, M. (1984). “Brown and Hanlon Revisited: Mothers' sensitivity to ungrammatical forms”, Journal of Child Language, 11: 81-88.

  • Holland, A.L., Fromm, D.S., DeRuyter, F. and Stein, M. (1996). “Treatment efficacy: aphasia”, Journal of Speech and Hearing Research, 39: S27-36.

  • Hornstein, N. and Lightfoot, D., (eds.) (1981). Explanation in Linguistics: The Logical Problem of Language Acquisition, London: Longman.

  • Hubel, D.H. and Wiesel, T.N. (1970). “The period of susceptibility to the physiological effects of unilateral eye closure in kittens”, Journal of Physiology, 206: 419-436.

  • Jackendoff, R. (1999). “Possible stages in the evolution of the language capacity,” Trends in Cognitive Sciences, 3:272-279.

  • Jain, S., Osherson, D., Royer, J.S. and Sharma, A. (1999). Systems that Learn, 2nd Ed., Cambridge, MA: MIT Press.

  • Johnson, J. S., & Newport, E. L. (1989). “Critical period effects in 2nd language-learning - the influence of maturational state on the acquisition of english as a 2nd language.” Cognitive Psychology, 21(1), 60-99.

  • Johnson, J.S. and Newport, E.L. (1991). “Critical Period Effects on universal properties of language: the status of subjacency in the acquisition of a second language”, Cognition, 39: 215-58.

  • Karbe, H., Thiel, A., Weber-Luxemberger, G., Herholz, K., Kessler, J. and Heiss, W. (1998). “Brain Plasticity in Poststroke Aphasia: What Is the Contribution of the Right Hemisphere?”, Brain and Language, 64: 215-230.

  • Karmiloff-Smith, A., Grant, J., Berthoud, I., Davies, M., Howlin, P., and Udwin, O. (1997). “Language and Williams Syndrome: How intact is intact?”, Child Development, 68(2): 246-62.

  • –––, J. H. Brown, et al. (2003). “Dethroning the myth: Cognitive dissociations and innate modularity in Williams syndrome.” Developmental Neuropsychology 23(1-2): 227-242.

  • Katz, L.C., Weliky, M., and Crowley, J.C. (2000). “Activity and the development of the visual cortex: new perpsectives”, in The New Cognitive Neurosciences, 2**nd Ed., M.S. Gazzaniga (ed.), Cambridge: MIT Press, pp. 199-212.

  • Kegl J., Senghas A., Coppola M. (1999). “Creation through contact: Sign language emergence and sign language change in Nicaragua.” In M. DeGraff (ed), Comparative Grammatical Change: The Intersection of Language Acquisition, Creole Genesis and Diachronic Syntax, Cambridge MA: MIT Press, pp.179-237.

  • Kellerman, E., van Ijzendorn, J., and Takashima, H. (1999). “Retesting a universal: the Empty Category Principle and learners of (pseudo)Japanese”, in The acquisition of Japanese as a second language, K. Kanno (ed.), Amsterdam: John Benjamins, pp. 71-87.

  • Kellerman, E. and Yoshioka, K. (1999). “Inter- and intra-population consistency: a comment on Kanno (1998)”, Second Language Research, 15: 101-9.

  • Kotsoni E., de Haan, M. and Johnson, M.H. (2001). “Categorical perception of facial expressions by 7-month-old infants”, Perception, 30 (9): 1115-1125.

  • Kuhl, P.K. (1994). “Learning and Representation in Speech and Language”, Current Opinion in Neurobiology, 4: 812-822.

  • ––– (2000). “A new view of language acquisition”, PNAS, 97 (22): 11850-11857.

  • –––, and Miller, J.D. (1975). “Speech Perception by the Chinchilla: Voiced-Voiceless Distinction in Alveolar Plosive Consonants”, Science, 190: 69-72.

  • –––, Andruski, J.E., Chistovich, I.A., Chistovich, L.A., Kozhevnikova, E.V., Ryskina, V.L., Stolyarova, E.I., Sundberg, U., Lacerda, F. (1997a). “Cross-Language Analysis of Phonetic Units in Language Addressed to Infants”, Science, 277: 684-686.

  • –––, Kiritani, S., Degughi, T., Hayashi, A., Stevens, E.B., Dugger, C.D. and Iverson, P. (1997b). “Effects of language experience on speech perception: American and Japanese infants' perception of /ra/ and /la/”, Journal of the Acoustical Society of America, 100: 2425-38.

  • Kujala, T., Alho, K., Huotilainen, M., Ilmoniemi, R.J., Lehtoski, A., Leionen, A., Rinne, T., Salonen, O., Sinkkonen, J., Standertskjold-Nordenstam, C.G., and Naatanen, R. (1997). “Electrophysiological evidence for cross-modal plasticity in humans with early- and late-onset blindness”, Psychophysiology, 34: 213-6.

  • Jones, P. (1995). Contradictions and unanswered questions in the Genie case: A fresh look at the linguistic evidence. Language and Communication, 15(3), 261-280.

  • Lai CSL, Fisher SE, Hurst JA, Vargha-Khadem F, Monaco AP (2001). “A forkhead-domain gene is mutated in a severe speech and language disorder”, Nature, 413 (6855): 519-523.

  • –––, D. Gerrelli, et al. (2003). “FOXP2 expression during brain development coincides with adult sites of pathology in a severe speech and language disorder.” Brain 126: 2455-2462.

  • Lasnik, H. (1989). “On Certain Substitutes for Negative Data”, Demopoulos and Marras (1989:89-105).

  • Lasnik, H. and Uriagereka, J. (1986). A Course in GB Syntax: Lectures on Binding and Empty Categories (Current Studies in Linguistics), Cambridge: MIT Press.

  • Lenneberg, E.H. (1964). “A biological perspective of language”, in E.H. Lenneberg, ed., New Directions in the Study of Language, Cambridge: MIT Press. Pp.65-88

  • ––– (1967). Biological Foundations of Language, New York: Wiley.

  • Levy, Y. and Hermon (2003). “Morphological abilities of Hebrew-speaking adolescents with Williams syndrome,” Developmental Neuropsychology, 23(1-2):59-83

  • Lewontin, R. (1998). “The Evolution of Cognition: Questions we will Never Answer,” In R. Sternberg and D. Scarborough (eds.), An Invitation to Cognitive Science, Vol. 4: Methods, Models and Conceptual Issues, Cambridge, MIT Press, pp.107-32.

  • Lenneberg, E.H. (1964). “A biological perspective of language”, in E.H. Lenneberg, ed., New Directions in the Study of Language, Cambridge: MIT Press. Pp.65-88

  • ––– (1967). Biological Foundations of Language, New York: Wiley.

  • Lieberman, P. (2002). “On the nature and evolution of the neural bases of human language,” American Journal of Physical Anthropology, 119, pp. 36-62.Liegeois, F., T. Baldeweg, et al. (2003). “Language fMRI abnormalities associated with FOXP2 gene mutation.” Nature Neuroscience 6(11): 1230-1237.

  • Lumsden, J.S. (1999). “Language acquisition and creolization”, Language Creation and Language Change: Creolization, Diachrony and Development, M. DeGraff (ed.), Cambridge: MIT Press, pp.129-57.

  • Maratsos, M.P. (1989). “Innateness and plasticity in language acquisition,” in M.L. Rice and R.L. Schiefelbusch, eds., The Teachability of Language, Baltimore, Paul H. Brooks, 105-25.

  • Markson, L. (2006). Core mechanisms of word learning. In Processes of Change in Brain and Cognitive Development: Attention and Performance Xxi (pp. 111-128). New York: Oxford Univ Press.

  • Martin, R.C. (2003). “Language Processing: Functional Organization and Neuroanatomical Basis”, Annual Review of Psychology, 54:55-89.

  • Mayberry R.I., Eichen, E.B. (1991). “The Long-Lasting Advantage of Learning Sign Language in Childhood - Another Look at the Critical Period for Language-Acquisition”, J Mem Lang, 30 (4): 486-512.

  • Macdonald, C., (ed) (1995). “Tacit Knowledge” in Philosophy of Psychology: Debates on Psychological Explanation, Cambridge: Blackwell.

  • McGonigle, B., Chalmers, M., and Dickinson, A. (2003). “Concurrent disjoint and reciprocal classification by Cebus apella in seriation tasks: evidence for hierarchical organization”, Animal Cognition Vol. 6, No. 3: 185-197.

  • Maess, B., Koelsch, S., Gunter, T. C. & Friederici, A. D., 2001, “Musical Syntax is processed in Broca's area: an MEG study”, Nature Neuroscience, 4: 540-545.

  • Marcus, G. F. (1998). “Can connectionism save constructivism?” Cognition, 66: 153-182.

  • ––– (2001). The Algebraic Mind: Integrating Connectionism and Cognitive Science, Cambridge, MA: MIT Press.

  • ––– (2004). The Birth of the Mind: How a Tiny Number of Genes Creates the Complexity of Human Thought, Basic Books, New York.

  • Margolis, E. (1998). “How to Acquire a Concept”, Mind and Language, 13(3): 347-369.

  • Matthews, R.J. (2001). “Cowie's Anti-Nativism”, Mind and Language, 16: 215-230.

  • von Melchner, L., Pallas, S.L. and Sur, M. (2000). “Visual behaviour mediated by retunal projections directed to the auditory pathway”, Nature, 404: 871-76.

  • Mervis, C. B., B. F. Robinson, et al. (2000). “The Williams syndrome cognitive profile.” Brain and Cognition, 44(3): 604-628.

  • Mintz T.H. (2002). “Category induction from distributional cues in an artificial language”, Memory and Cognition, 30: 678-686.

  • Moerk, E. (1991). “Positive evidence for negative evidence”, First Language, 11: 219-51.

  • Mohr, J.P., Pessin, M.S., Finkelstein, S., Funkenstein, H.H., Duncan, G.W. and Davis, K.R. (1978). “Broca aphasia: pathological and clinical”, Neurology, 28: 311-24.

  • Morgan, J. L., Meier, R. P., & Newport, E. L. (1987). “Structural packaging in the input to language-learning - contributions of prosodic and morphological marking of phrases to the acquisition of language.” Cognitive Psychology, 19(4), 498-550.

  • Morgan, J.L. and Travis, L.L. (1989). “Limits on negative information in language input”, Journal of Child Language, 16: 531-552.

  • Morgan, J.L., Bonamo, K.M. and Travis, L.L. (1995). “Negative Evidence on Negative Evidence”, Developmental Psychology, 31: 180-197.

  • Morris, C. A. and C. B. Mervis (2000). “Williams syndrome and related disorders.” Annual Review of Genomics and Human Genetics 1: 461-484.

  • Mufwene, S.S. (1999). “On the language bioprogram hypothesis: hints from Tarzie”, Language Creation and Language Change: Creolization, Diachrony and Development, M. DeGraff (ed.), Cambridge: MIT Press, pp.95-127.

  • Muller R.A., Rothermel R.D., Behen M.E., Muzik O., Chakraborty P.K., and Chugani H.T. (1999). “Language organization in patients with early and late left-hemisphere lesion: a PET study”, Neuropsychologia, 37: 545-557.

  • Myhill, J. (1991). “Typological test analysis: tense and aspecte in creoles and second languages”, in Crosscurrents in Second Language Acquisition and Linguistic Theories, T. Huebner and C.A. Ferguson (eds.), Amsterdam: John Benjamins, pp. 93-121.

  • Nazzi, T. and Ramus, F. (2003). “Perception and acquisition of linguistic rhythm by infants”, Journal of Speech Communication, 41: 233-43.

  • Nelson D.A., Marler P. (1989). “Categorical perception of a natural stimulus continuum: birdsong”, Science, 244: 976-8.

  • Newell, F.N., Bulthoff, H.H. (2002). “Categorical perception of familiar objects”, Cognition 85 (2): 113-143

  • Newmeyer, F.J. (1986). Linguistic Theory in America, 2nd Ed., New York: Academic Press.

  • ––– (1997). Generative Linguistics: A Historical Perspective, London and New York: Routledge.

  • Newport, E.L. (1990). “Maturational constraints on language learning”, Cognitive Science, 14: 11-28.

  • ––– (2001). “Reduced input in the acquisition of signed languages: contributions to the study of creolization”, Language Creation and Language Change: Creolization, Diachrony and Development, M. DeGraff (ed.), Cambridge: MIT Press, pp.161-78.

  • Newport, E., Gleitman, H. and Gleitman, L. (1977). “Mother, please, I'd rather do it myself: some effects and non-effects of maternal speech style”, in Talking to Children: Language Input and Acquisition, Snow, C. and Ferguson, C. (eds.), New York: Cambridge University Press, pp.109-50.

  • Newport, E. L., & Aslin, R. N. (2004). Learning at a distance I. Statistical learning of non-adjacent dependencies. Cognitive Psychology, 48(2), 127-162.

  • Nishimura, H., Hashikawa, K., Doi, K., Iwaki, T., Watanabe, Y., Kusuoka, H., Nishimura, T. and Kubo, T. (1999). Nature, 397: 116.

  • Norbury, C. F., D. V. M. Bishop, and Briscoe, J. (2002). “Does impaired grammatical comprehension provide evidence for an innate grammar module?” Applied Psycholinguistics 23(2): 247-268.

  • O'Brien E.K., Zhang X.Y., Nishimura C., Tomblin J.B., Murray J.C. (2003). “Association of specific language impairment (SLI) to the region of 7q31”, American Journal Of Human Genetics 72 (6): 1536-1543

  • Odling-Smee, J., Laland, K. and Feldman, M. 1996, “Niche Construction,” American Naturalist, 147:641-8.

  • Pastore, R.E., Li, X.F. and Layer, J.K. (1990). “Categorical perception of nonspeech chirps and bleats”, Percept Psychophys, 48(2):151-6.

  • Pena, M., Bonatti, L.L., Nespor, M., and Mehler, J. (2002). “Signal-driven computations in speech processing”, Science, 298: 604-7.

  • Pinker, S. (1989). Learnability and Cognition: The Acquisition of Argument Structure, Cambridge, MA: Bradford/MIT Press.

  • ––– (1991). “Rules of Language.” Science, 253:530-35.

  • ––– (1994). The Language Instinct, New York: Harper Collins.

  • ––– (1997). How the Mind Works, New York, Norton.

  • ––– and Bloom, P. (1990). “Natural Language and Natural Selection,” Behavioral and Brain Sciences, 13, pp.707-84.

  • Posner, M.I. and Raichle, M.E. (1994). Images of Mind. 2nd Ed., New York: W H Freeman & Co.

  • Prinz, J.J. (2002). Furnishing the Mind: Concepts and their Perceptual Basis, Bradford Books/MIT Press.

  • Pullum G.K. and Scholz, B.C. (2002). “Empirical assessment of stimulus poverty arguments”, The Linguistic Review, 19 9-50.(Special issue, nos. 1-2: ‘A Review of “The Poverty of Stimulus Argument”,’ ed. N. Ritter).

  • Putnam, H. (1971). “The ‘Innateness Hypothesis’ and explanatory models in linguistics”, in The Philosophy of Language, J. Searle (ed.), London: Oxford University Press, pp.130-9.

  • Quartz, S.R. and Sejnowski, T.J. (1997). “The Neural Basis of Cognitive Development: A Constructivist Manifesto,” Brain and Behavioral Sciences, 20:537-596.

  • Ramus, F., Hauser, M.D., Miller, C., Morris, D., Mehler, J. (2000). “Language Discrimination by Human Newborns and by Cotton-Top Tamarin Monkeys”, Science, 288: 349-351.

  • Redington, M. and Chater, N. (1998). “Connectionist and statistical approaches to language acquisition: A distributional perspective”, Language and Cognitive Processes, 13: 129-191.

  • Rice, M. L. and K. Wexler (1996). “Toward tense as a clinical marker of specific language impairment in English-speaking children.” Journal of Speech and Hearing Research 39(6): 1239-1257.

  • Ritter, N.A. (2002). ‘A Review of “The Poverty of Stimulus Argument”,’ The Linguistic Review (Special Issue), 19:1-2.

  • Roeper, T. and Williams, E., (eds.) (1987). Parameter Setting: Studies in Theoretical Psycholinguistics, Vol. 4, Dordrecht: Kluwer.

  • Sadato, N. Pascual-Leone, A., Grafman, J., Ibanez, V., Deiber, M.P., Dold, G. and Hallett, M. (1996). “Activation of the primary visual cortex by Braille reading in blind subjects”, Nature, 380: 526-8.

  • Saffran, E.M. (2000). “Aphasias and the relationship of language and brain”, Seminars in Neurology, 20: 409-418.

  • Saffran, J.R., Aslin, R.N. and Newport, E.L. (1996). “Statistical Learning by 8-Month-Old Infants”, Science, 274: 1926-28.

  • Saffran, J.R. (2002). “Constraints on statistical language learning”, Journal of Memory and Language, 47: 172-96.

  • Saffran, J.R. and Thiessen, E.D. (2003). “Pattern induction by infant language learners”, Developmental Psychology, 40: 484-94.

  • Saffran, J. R., & Wilson, D. P. (2003). From syllables to syntax: Multilevel statistical learning by 12-month-old infants. Infancy, 4(2), 273-284.

  • Samet, J. (1986). “Troubles with Fodor's Nativism”, Midwest Studies in Philosophy, X. Boston: Blackwells. 575-594.

  • Sampson, G. (1989). “Language Acquisition: Growth or Learning?”, Philosophical Papers, XVIII: 203-40.

  • ––– (2002). “Exploring the richness of the stimulus”, The Linguistic Review, 19: 73-104. (Special issue, nos. 1-2: ‘A Review of “The Poverty of Stimulus Argument”’, N. Ritter (ed.)).

  • Sapir, E. (1921). Language: An Introduction to the Study of Speech, Hillsdale, NJ: Erlbaum.

  • Saxton M. (1997). “The contrast theory of negative input”, Journal of Child Language, 24:139-61.

  • –––, Kulcsar B., Marshall G., and Rupra M.J., 1988, “Longer-term effects of corrective input: an experimental approach”, Child Language, 25: 701-21.

  • Scharff, C. and S. A. White (2004). Genetic components of vocal learning. Behavioral Neurobiology of Birdsong. 1016: 325-347.

  • Scholz, B.C. and Pullum, G.K. (2002). “Searching for arguments to support linguistic nativism”, The Linguistic Review, 19: 185-224. (Special issue, nos. 1-2: ‘A Review of “The Poverty of Stimulus Argument”,’ N. Ritter(ed.))

  • Schulte, O. (2006). “Formal Learning Theory”, The Stanford Encyclopedia of Philosophy (Spring 2006 Edition), Edward N. Zalta (ed.), URL = <Formal Learning Theory (Stanford Encyclopedia of Philosophy/Spring 2006 Edition)>.

  • Sharwood Smith, M. (1994). Second Language Learning: Theoretical Foundations, London and New York: Longman.

  • Shimojo, S. and Shams, L. (2001). “Sensory modalities are not separate modalities: plasticity and interactions”, Current Opinion in Neurobiology, 11: 505-9.

  • Shinohara, T. (1994). “Rich classes inferable from positive data: length-bounded elementary formal systems”, Information and Computation, 108: 175-186.

  • Singleton, J. L., & Newport, E. L. (2004). When learners surpass their models: The acquisition of American Sign Language from inconsistent input. Cognitive Psychology, 49(4), 370-407.

  • Skinner, B.F. (1957). Verbal Behavior, NY: Prentice Hall.

  • Skuse, D.H. (1993). “Extreme deprivation in early childhood”, in Language development in exceptional circumstances, D. Bishop and K. Mogford (eds.), Hillsdale, NJ: Erlbaum, pp. 29-46.

  • Skyrms, B. (1996). The Evolution of the Social Contract, Cambridge, Cambridge University Press.

  • ––– (2002). The Stag Hunt and the Evolution of Social Structure, Cambridge, Cambridge University Press.

  • Smith, E.E. and Medin, D.L. (1981). Categories and Concepts, Cambridge, MA: Harvard University Press.

  • Smolensky, P. (1991). “Connectionism, Constituency and the Language of Thought”, in Meaning in Mind: Fodor and His Critics, B. Loewer and G. Rey, (eds.), Cambridge MA: Blackwells, 201-227.

  • Soames, S. (1984). “Linguistics and Psychology”, Linguistics and Philosophy, 7: 155-79.

  • Sokolov, J.L. and Snow, C.E. (1991). “The Premature Retreat to Nativism,” Behavioral and Brain Sciences, 14:635-6.

  • Sterelny, K. (1989). “Fodor's Nativism”, Philosophical Studies, 55: 119-141.

  • ––– 2003, Thought in a Hostile World: The Evolution of Human Cognition, London, Blackwells.

  • Stich, S.P. (1971). “What every speaker knows”, Philosophical Review, 80: 476-96.

  • ––– (1978). “Beliefs and Subdoxastic States,” Philosophy of Science, 45, pp.499-518.

  • Stiles, J. (2000). “Neural plasticity and cognitive development”, Developmental Neuroscience, 18 (2): 237-272.

  • Stromswold, K. (2000). “The cognitive neuroscience of language acquisition”, in The New Cognitive Neurosciences, 2**nd Ed M.S. Gazzaniga (ed.), Cambridge: MIT Press, pp.269-80.

  • Takahashi K., Liu, F.C., Hirokawa, K., and Takahashi, H. (2003). “Expression of Foxp2, a gene involved in speech and language, in the developing and adult striatum”, Journal of Neuroscience Research, 73 (1): 61-72.

  • Tallal, P. (1980). “Auditory Temporal Perception, Phonics, And Reading Disabilities In Children.” Brain And Language 9(2): 182-198.

  • Tallal, P., R. E. Stark, et al. (1985). “Identification Of Language-Impaired Children On The Basis Of Rapid Perception And Production Skills.” Brain and Language 25(2): 314-322.

  • Teramitsu, I., L. C. Kudo, et al. (2004). “Parallel FoxP1 and FoxP2 expression in songbird and human brain predicts functional interaction.” Journal of Neuroscience 24(13): 3152-3163.

  • Thiessen, E.D. and Saffran, J.R. (2003). “When cues collide: Use of stress and statistical cues to word boundaries by 7-to 9-month-old infants”, Developmental Psychology, 39: 706-16.

  • Thomas, M. and Karmiloff-Smith, A. (2002): “Are developmental disorders like cases of adult brain damage? Implications from connectionist modeling.” Behavioral and Brain Sciences, 25: 727—788

  • Tomasello, M. (1999). The Cultural Origins of Human Cognition, Cambridge, MA, Harvard University Press.

  • ––– (2000). “Two Hypotheses about Primate Cognition,” in C. Heyes and L. Huber (Eds.), Evolution of Cognition, Cambridge, MIT Press, pp.165-84.

  • ––– (2003). Constructing a Language: A Usage-Based Theory of Language Acquisition. Harvard University Press.

  • vanderLely, H. K. J. and L. Stollwerck (1997). “Binding theory and grammatical specific language impairment in children.” Cognition 62(3): 245-290.

  • van der Lely, H. K. J. and V. Christian (2000). “Lexical word formation in children with grammatical SLI: a grammar-specific versus an input-processing deficit?” Cognition 75(1): 33-63.

  • van der Lely, H. K. J. and M. T. Ullman (2001). “Past tense morphology in specifically language impaired and normally developing children.” Language and Cognitive Processes 16(2-3): 177-217.

  • Vargha-Khadem, F., Carr, L.J., Isaacs, E., Brett, E., Adams, C. and Mishkin, M. (1997). “Onset of speech after left hemipsherectomy in a nine-year-old boy”, Brain, 120: 159-82.

  • –––, Watkins, K., Alcock, K., Fletcher, P. and Passingham, R., 1995, “Praxic and nonverbal cognitive deficits in a large family with a genetically transmitted speech and language disorder,” Proc. Natl. Acad. Sci. USA, 92:930-33.

  • Volterra, V., O. Capirci, et al. (1996). “Linguistic abilities in Italian children with Williams syndrome.” Cortex 32(4): 663-677.

  • Watkins, Dronkers & Vargha-Khadem, ‘Behavioral analysis of an inherited speech and language disorder: comparison with acquired aphasia.’ Brain (2002), 125, 452-464.

  • White, L. (2003). Second Language Acquisition and Universal Grammar, Cambridge Textbooks in Linguistics, Cambridge: Cambridge University Press.

  • Wimsatt, W.C. (1999). “Generativity, Entrenchment, Evolution and Innateness: Philosophy, evolutionary biology, and conceptual foundations of science”, in Where Biology Meets Psychology: Philosophical Essays, V. Hardcastle (ed.), Cambridge: Bradford Books/MIT Press, pp.139-179.

  • Wright, A.A, Rivera, J.J., Hulse, S.H., Shyan, M. and Neiworth, J.J. (2000). “Music perception and octave generalization in rhesus monkeys”, Journal of Experimental Psychology: General, 129 (3): 291-307.

  • van Gelder, T. (1995). “What Might Cognition Be, If Not Computation?”, Journal of Philosophy, 92: 345-381.

  • Vargha-Khadem F., Watkins, K.E., Price, C.J., Ashburner, J., Alcock, K.J., Connelly, A., Frackowiak, R.S., Friston, K.J., Pembrey, M.E., Mishkin, M., Gadian, D.G., and Passingham, R.E. (1998). “Neural basis of an inherited speech and language disorder”, Proceedings of the National Academy of Sciences, USA, 95 (21): 12695-12700.

  • Watkins, K.E., Dronkers, N.F., and Vargha-Khadem, F. (2002). “Behavioural analysis of an inherited speech and language disorder: comparison with acquired aphasia”, Brain, 125: 452-464.

  • Zhang J.Z., Webb, D.M., and Podlaha, O. (2002). “Accelerated protein evolution and origins of human-specific features: FOXP2 as an example”, Genetics, 162 (4): 1825-1835.

Academic Tools

Other Internet Resources

behaviorism | idiolects | innateness: and contemporary theories of cognition | learning theory, formal | rationalism vs. empiricism

Acknowledgments

First, I thank two anonymous reviewers for the Stanford Encyclopedia of Philosophy, whose pungent criticisms contributed to the clarity, breadth and depth (and also the length) of this article. I thank my friends, adversaries and colleagues (you know who you are) for their criticism and encouragement. Finally, and most fervently, I thank the editor of the Encyclopedia, Ed Zalta, for patience and understanding that go way beyond the saintly.

Copyright © 2008 by Fiona Cowie

最后更新于

Logo

道长哲学研讨会 2024