代数 algebra (Vaughan Pratt)

首次发表于 2007 年 5 月 29 日;实质性修订于 2022 年 11 月 3 日

代数是数学的一个分支,与几何学、分析(微积分)、数论、组合学等同级。虽然代数的根源可以追溯到实数和复数等数值域,但在其完整的普遍性中,它与其他数学领域不同,不仅仅服务于特定的数学领域。几何学处理空间实体,分析处理连续变化,数论处理整数算术,组合学处理离散结构,而代数同样适用于所有这些以及其他数学领域。

初等代数是几个世纪以来一直在中学教育中使用的,它是关于不定量或变量 x,y 等的算术。而明确的和 3+4 的求和结果是明确的数量 7,不定和 x+y 没有明确的值,但我们仍然可以说它总是等于 y+x,或者当且仅当 x 是-y 或 y+1 时等于 x2-y2。

初等代数提供了有限的方法来处理无限。例如,半径为 r 的圆的面积的公式 πr2 描述了无限多个可能的计算,每个变量的可能赋值都有一个计算结果。一个普遍真实的定律表达了无限多个情况,例如单一的方程 x+y=y+x 总结了无限多个事实 1+2=2+1,3+7=7+3 等。方程 2x=4 从无限的可能性中选择一个数字。而 y=2x+3 用一个有限的方程表达了通过(0,3)且斜率为 2 的直线的无限多个点,其解恰好是这些点。

初等代数通常使用实数或复数值。然而,它的一般方法,即使不总是具体的操作和规律,同样适用于其他数值域,如自然数、整数、模某个整数 n 的整数、有理数、四元数、高斯整数、p-进制数等等。它们也适用于许多非数值域,如给定集合下的并集和交集运算的子集,给定字母表上的连接和反转运算的单词,给定集合上的组合和逆运算的排列等等。每个这样的代数结构,或者简称为代数,由其元素的集合和在该域中遵守的操作组成,例如整数操作 x+y(加法)、xy(乘法)和 −x(取反)下的整数集合 Z={0,±1,±2,…},或者集合操作 X∪Y(并集)、X∩Y(交集)和 X′(相对于 X 的补集)下的集合 X 的子集 2X。

这些规律通常相似但并非完全相同。例如,整数乘法在加法上分配,x(y+z)=xy+xz,但反过来则不成立,例如 2+(3×5)=17,但(2+3)×(2+5)=35。在使交集成为集合论中乘法的对应物,联合成为加法的对应物的类比中,交集在并集上分配,

X∩(Y∪Z)=(X∩Y)∪(X∩Z),

至于整数,但与整数不同,联合运算也可分配到交集上:

X∪(Y∩Z)=(X∪Y)∩(X∪Z)。

然而,初等代数是在一个固定的代数中进行的,抽象代数或现代代数则处理具有某些共同属性的代数类,通常是可表达为方程的类。这个学科在 19 世纪出现,通常通过群、环和域的类别来引入。例如,任何数系统在加法和减法运算下形成一个阿贝尔(交换)群;然后通过引入乘法转向环,再进一步转向域与除法。常见的四则运算计算器提供了实数域的四个运算。

在完全一般性中,群的抽象概念并非以一组数字的形式定义,而是作为一个任意集合,配备有二元运算 xy,该运算的一元逆元 x−1,以及满足群特征方程的单位元 e。群与日常初等代数中不同的一个显著新颖之处在于,它们的乘法不一定是交换的:xy 和 yx 可以不同!例如,三个事物的六种可能排列的群 S3 就不是交换群,可以通过交换单词 dan 中相邻的字母来看出。如果你先交换左边的两个字母,然后再交换右边的两个字母,你得到 adn 然后是 and,但是如果你按照相反的顺序进行这些交换,你得到 dna 然后是 nda,而不是 and。同样,魔方的 43,252,003,274,489,856,000 个操作的群和球面旋转的无限群 SO(3)也不是交换群,尽管圆的旋转的无限群 SO(2)是交换群。四元数乘法和矩阵乘法也是非交换的。交换群通常被称为加法群,它们的群运算被称为加法 x+y,而不是乘法 xy。

群、环和域只是抽象代数的冰山一角。向量空间和更一般地模是环的受限形式,其中乘法的操作数要求是一个标量和一个向量。幺半群通过去除逆元来推广群;例如,自然数形成一个幺半群,但由于缺乏取反,不是一个群。布尔代数抽象了集合的代数。格推广了布尔代数,去除了补和分配律。

数学的许多分支发现代数是一种非常有效的工具,以至于它们衍生出了代数的子分支。代数逻辑、代数数论和代数拓扑都受到了广泛的研究,而代数几何和代数组合学则有专门的期刊致力于它们。

代数出于至少两个哲学原因引起了兴趣。从数学基础的角度来看,代数在其领域独立性和与形式逻辑的密切关联方面与其他数学分支截然不同。此外,初等代数和抽象代数之间的二分法反映了笛卡尔二元论的某种推理二元性,笛卡尔是笛卡尔二元论的创始人,其中前者处理推理过程,后者处理推理对象,分别对应于数学的心智和身体。

代数还在澄清和突出逻辑概念方面发挥了重要作用,这是准确哲学核心的基础。从亚里士多德的三段论逻辑向更具代数形式的逻辑的第一步是由布尔在 1847 年的小册子中迈出的,随后在 1854 年的一部更详细的论著《思维的法则》中。初等代数和现代代数之间的二分法随后开始在逻辑的发展中出现,逻辑学家在形式主义方法(如弗雷格、皮亚诺和罗素所倡导的)和代数方法(如皮尔斯、施罗德和塔斯基所遵循的)之间存在着强烈的分歧。


1. 初等代数

初等代数处理数字项,即常数 0、1、1.5、π,变量 x、y 等,以及使用+、-、×、÷、√ 等运算符组合而成的项,如 x+1、x×y(标准缩写为 xy)、x+3y 和 √x。

项可以单独用于公式,如 πr2,或用于作为定律的方程,如 x+y=y+x,或作为约束条件,如 2x2−x+3=5x+1 或 x2+y2=1。

法律总是真实的;虽然它们与约束的形式相同,但它们只是空洞地约束,因为变量的每个赋值都是一个解。约束条件 x2+y2=1 有一个连续的解集,形成一个形状,例如半径为 1 的圆。约束条件 2x2−x+3=5x−1 有两个解,x=1 或 2,并且可能在解决词问题或确定两条曲线的交点(例如抛物线 y=2x2−x+3 和直线 y=5x−1)的过程中遇到。

1.1 公式

公式是手工或机器计算值时使用的术语。虽然一些物体的属性可以直接测量,例如长度和质量,但其他属性,例如面积、体积和密度,则需要根据更容易观察到的值以及适当的公式进行计算。例如,矩形的面积为 L 英寸乘以 W 英寸,单位为平方英寸,半径为 r 的球体积为 4πr3/3,质量为 M、体积为 V 的固体的密度由 M/V 给出。

公式可以组合成更多的公式。例如,质量为 M,半径为 r 的球的密度可以通过将球的体积的公式替换为密度的公式中的 V 来获得。得到的公式 M/(4πr3/3)就是所需的密度公式。

1.2 法则

法则或等式适用于其变量的所有适用值。例如,交换律法则

x+y=y+x

对于所有实数 x 和 y 都成立。同样,结合律

x+(y+z)=(x+y)+z

对于所有实数 x、y 和 z 都成立。另一方面,当法则 x/(y/z)=zx/y 对于所有数值 x 成立时,为了避免除以零的非法操作,它仅对非零的 y 和 z 成立。

当一个法则对其变量的所有数值都成立时,它也对这些变量的所有表达式值成立。在前一段的最后一个法则中设置 x=M,y=4πr3 和 z=3,得到 M/(4πr3/3)=3M/(4πr3)。左边是我们在前一节中的密度公式,根据上述法则的这个实例,可以得出右边是一个等价的密度公式,因为它给出与左边相同的答案。这个新的密度公式用乘法替代了两个除法之一。

1.3 词问题

如果泽维尔在四年后的年龄是他现在的三倍,那么他现在多大?我们可以使用代数来解决这个文字问题,将其形式化为方程式 3x=x+4,其中 x 是泽维尔现在的年龄。左边表示泽维尔现在的年龄的三倍,而右边表示他四年后的年龄。

解决这类方程的一般规则是,对方程的任何解也是通过对两边应用某种操作得到的方程的解。在这种情况下,我们可以通过从两边减去 x 来简化方程,得到 2x=4,然后将两边都除以 2,得到 x=2。所以泽维尔现在两岁。

如果泽维尔的年龄是伊冯娜的年龄的两倍,并且是她年龄的平方的一半,那么他们各自多大?这个问题比前面的例子更复杂,有三个方面的不同:它有更多的未知数,更多的方程,以及更高次的项。我们可以用 x 表示泽维尔的年龄,用 y 表示伊冯娜的年龄。这两个限制条件可以形式化为方程 x=2y 和 x=y2/2,后者是二次方程。

由于两个等式的右边都等于 x,我们可以推断出 2y=y2/2。诱人的是将两边都除以 y,但如果 y=0 呢?实际上,y=0 是一个解,对应于 Xavier 和 Yvonne 都是新生儿的情况下,x=2y=0。将这个解放在一边,我们现在可以寻找 y 不为零的解,将两边都除以 y。这样得到 y=4,此时 x=2y=8。所以现在我们有了第二个解,其中 Xavier 八岁,Yvonne 四岁。

在没有其他信息的情况下,这两个解都是合法的。如果问题进一步指定 Yvonne 是一个蹒跚学步的孩子,或者 Xavier 比 Yvonne 年长,我们可以排除第一个解。

1.4 笛卡尔几何

平面上的直线、圆和其他曲线可以用笛卡尔坐标代数表达,以其发明者勒内·笛卡尔命名。这些坐标是相对于平面上的一个特殊点,称为原点 O,来定义的。每个点都由离 O 点的右侧和上方的距离来指定,用一对数字表示。例如,一对数字(2.1, 3.56)指定了点在 O 点的右侧 2.1 个单位,水平测量,以及在 O 点的上方 3.56 个单位,垂直测量;我们称 2.1 为该点的 x 坐标,3.56 为该点的 y 坐标。任何一个坐标都可以是负数:一对数字(−5,−1)对应于离 O 点左侧 5 个单位,下方 1 个单位的点。O 点本身的坐标是(0, 0)。

直线。给定一个关于变量 x 和 y 的方程,例如 y=3x+5,当将 x 设为 2,y 设为 7 时,点(2, 7)被称为该方程的解,因为这样使得方程成立。例如,方程 y=3x+5 的解包括点(0, 5),(1, 8),(2, 11),等等。其他解包括(.5, 6.5),(1.5, 9.5),等等。所有解的集合构成了通过点(0, 5)和(1, 8)的唯一直线。我们称 y=3x+5 为该直线的方程。

圆。根据勾股定理,两点(x,y)和(x′,y′)之间的距离的平方由(x′−x)2+(y′−y)2 给出。作为特例,点(x,y)到原点的距离的平方是 x2+y2。由此可知,到原点距离为 r 的点是方程 x2+y2=r2 在 x 和 y 上的解。但这些点恰好构成以 O 为中心、半径为 r 的圆。我们将这个方程与这个圆等同起来。

变量 任何关于 x 和 y 的多项式的根形成了平面上的一条曲线,称为多项式的一维变量,其次数与多项式相同。因此,直线的次数为 1,可以表示为多项式 ax+by+c,而以(x′,y′)为中心的圆的次数为 2,可以表示为多项式(x−x′)2+(y−y′)2−r2。有些变量可能不包含任何点,例如 x2+y2+1,而其他变量可能包含一个点,例如 x2+y2,其原点为其一个根。然而,一般来说,二维变量将是一条曲线。这样的曲线可能会交叉,或者有一个尖点,甚至分裂成两个或更多不相连的部分。

空间 通过将变量 x 和 y 添加第三个变量 z 来将二维平面推广为三维空间,该变量对应于第三个维度。传统的方向取第一维从西到东,第二维从南到北,第三维从下到上。然后,点是三元组,例如点(2,5,−3)位于原点的东侧 2 个单位,北侧 5 个单位,下方 3 个单位。

平面和球体。这些是空间中直线和平面的对应物。例如 z=3x+2y 这样的方程定义的不是一条直线,而是一个平面,即通过点(0, 1, 2),(1, 0, 3)和(1, 1, 5)的唯一平面。以原点为中心的半径为 r 的球体由方程 x2+y2+z2=r2 给出。关于 x、y 和 z 的多项式的根形成了空间中的一个曲面,称为二维变量,其次数与多项式相同,就像一维变量一样。因此,平面的次数为 1,球体的次数为 2。

这些方法通过添加更多的变量可以推广到更高的维度。虽然我们在物理上所经历的几何空间仅限于三维,但在概念上,抽象数学空间的维度数量是没有限制的。就像一条线是二维平面的一维子空间,一个平面是三维空间的二维子空间一样,每个子空间都可以用一个方程来确定,所以一个超平面是四维空间的三维子空间,也可以用一个方程(例如 w=2x−7y+z)来确定。

2. 抽象代数

初等代数固定了某个域,通常是实数或复数,并处理在该域内成立的方程。抽象代数或现代代数则颠倒了这个观点,它固定了一些方程集合 A,并研究那些使得这些方程成为恒等式的域。例如,如果我们取所有可用加法、减法、乘法和常数 0 和 1 进行表达的恒等式集合,并且这些恒等式对整数成立,那么这些方程恒等成立的代数结构正好是带单位元的交换环。

从历史上看,现代代数这个术语来自于范德瓦尔登的经典著作的前三版标题,第四版于 1955 年改名为简单的“代数”。第 1 卷涉及群、环、一般域、向量空间、良序、实数域,而第 2 卷主要考虑线性代数、代数(作为具有兼容乘法的向量空间)、表示论、理想论、整数代数元、代数函数和拓扑代数。一方面,现代代数已经远远超出了这个课程,另一方面,这一大量的材料已经超出了数学博士研究生所能掌握的常识范围,因为他们的典型课程时间太短,无法在专注于自己的专业领域的同时掌握所有这些材料。

抽象代数的核心特点是存在着违背熟知定律的域。一个引人注目的例子是乘法的交换律,在介绍中我们注意到,即使是三个字母的六个排列的乘法,也不一定满足交换律。

2.1 半群

我们从集合 X 上的二元运算的概念开始,即一个函数 f:X2→X,使得对于 X 中的所有元素 x,y,f(x,y)是 X 的一个元素。当这样的运算满足对于 X 中的所有 x,y,z,f(f(x,y),z)=f(x,f(y,z))时,称其为可结合的。

半群是一个带有可结合运算的集合,称为半群的乘法,用 xy 表示,而不是 f(x,y)。

元素与自身的乘积 xx 用 x2 表示。同样,xxx 用 x3 表示,依此类推。

  • 示例*

  • 在给定字母表上,通过连接操作得到的所有非空单词的集合。

  • 在集合 X 上,通过函数复合操作得到的所有函数 f:X→X 的集合。

  • 整数 n×n 矩阵的集合,在矩阵乘法下,对于一个固定的正整数 n。

单词 u 和 v 的连接 uv 是可结合的,因为当一个单词被切成两部分时,无论切割点在哪里,两部分的连接都是原始单词。al 和 gebra 的连接与 algeb 和 ra 的连接相同,说明连接的结合性对于 x= al,y= geb,z= ra 的情况成立。

两个函数 f 和 g 的复合 f⋅g 是可结合的,通过推理可以证明。

(f⋅(g⋅h))(x)=f((g⋅h)(x))=f(g(h(x)))=(f⋅g)(h(x))=((f⋅g)⋅h)(x)

对于 X 中的所有 x,有 f⋅(g⋅h)=(f⋅g)⋅h。

当 H 是 G 的子半群时,H 是 G 的子半群,当 H 是 G 的子集且 G 的乘法限制在 H 上与 H 的乘法相同。等价地,G 的子半群是 G 的子集 H,使得对于 H 中的所有 x,y,xy 在 H 中。

  • 示例*

  • 给定字母表上的所有非空单词的半群具有偶数长度的单词作为子半群;然而,奇数长度的单词不构成子半群,因为两个奇数长度的单词的连接不是奇数长度。

  • 在函数合成下,所有函数 f:X→X 的半群在集合 X 上具有单射函数、满射函数和双射函数或置换的子半群。

当一个二元运算满足对于 X 中的所有 x 和 y,f(x,y)=f(y,x)时,它被称为可交换的。可交换半群是一个运算可交换的半群。到目前为止,所有的例子都是非可交换半群的。以下是可交换情况的示例。

  • 示例*

  • 正整数集合在加法下。

  • 所有整数的集合,使用加法运算。

  • 在一个字母字母表下,使用连接操作的单词集合。

  • 在任何 AND、OR、XOR 操作下,使用位(二进制数字)的集合{0,1}。

  • 固定集合 X 的子集的集合 2X,在任何集合论操作(交集、并集、对称差)下。

  • 平面上右上象限中的向量的集合,通过向量加法。

  • 相同,但省略原点。

  • 在向量加法下的所有三维向量的集合。

  • 在多项式加法下的一元多项式 x 的整数系数的集合。

  • 在矩阵加法下的固定正整数 m、n 的整数 m×n 矩阵的集合。

X 的元素 x 是 f 的左单位元,当对于所有的 y∈X,f(x,y)=y 时;是 f 的右单位元,当对于所有的 y∈X,f(y,x)=y 时。f 的单位元是既是左单位元又是右单位元的元素。因为当 x 和 y 都是单位元时,它们都等于 f(x,y),所以操作 f 只能有一个单位元。

一个幺半群是一个包含幺半群乘法单位元的半群,记作 1。

  • 例子*

  • 连接的身份是空字。因此,在允许空字的情况下,连接的词形成一个幺半群。

  • 加法的身份是零,或者在向量加法的情况下是原点。因此,如果上述任何一个半群的操作是加法,并且只有包含零时,它才形成一个幺半群。

  • 组合的身份是作为所有函数的恒等函数 1X:X→X,定义为对于 X 中的所有 x,1X(x)=x,因此在集合 X 上的所有函数的半群形成一个幺半群。

半群 H 是群 G 的子群,当它是 G 的子半群且包含 G 的单位元。

2.2 群

当半群的两个元素 x、y 满足 xy=1 时,我们称 x 是 y 的左逆元,y 是 x 的右逆元。同时是 x 的左逆元和右逆元的元素 y 被简称为 x 的逆元。

一个群是一个幺半群,其每个元素都有一个逆元。

一个群的基数通常被称为它的阶。当 n 是最小的正整数,使得 gn=1 时,群元素 g 被称为阶为 n 的元素。

  • 例子*

  • 整数的幺半群在加法下,因为每个整数 x 都有逆元-x。

  • 位(二进制数字)的集合{0,1}在 XOR 运算下,因为每个位都是它自己的逆元:0XOR0=1XOR1=0。这只是整数模 n(例如 3+4=2(mod 5))的幺半群{0,1,2,...,n-1}在模 n 下的加法的特例,其中 0 是它自己的逆元,非零数 m 的逆元是 n-m。

  • 双射或置换 f:X→X 的幺半群 SX 在复合运算下,因为每个置换都有逆元 f-1。当 X 有 n 个元素时,Sn 的阶为 n!。当且仅当 n≤2 时,Sn 是交换的。

  • 平面关于一个点的旋转的幺半群在合成下的群,因为每个旋转都可以被逆转。这个群被称为圆群,表示为 SO(2)。

  • 三维空间关于一个点的旋转的幺半群在合成下的群,同样因为每个旋转都可以被逆转。这个群表示为 SO(3)。

  • 正 n 边形关于其中心的对称(旋转和反射)的幺半群,将 n 边形带到自身,同样通过可逆性。这个群被称为二面角群 Dn,阶数为 2n。像 Sn 一样,当且仅当 n≤2 时,Dn 是可交换的;特别地,D3=S3。

G 的一个子群是 G 的一个子幺半群,闭合于逆运算。自然数和偶数整数的幺半群都是整数加法下的子幺半群,但只有后者是一个子群,因为它闭合于取反运算,而自然数不是。

交换群是一个群,其运算是可交换的。交换群的运算通常被称为加法而不是乘法,有时也称为加法群。

循环群是一个具有元素 g 的群 G,使得 G 的每个元素都可以写成 gi 的形式,其中 i 是正整数。循环群是交换群,因为 gigj=gi+j=gjgi。整数加法群和模 n 的整数群(其中 n 是正整数)都是循环群,每种情况下都以 1 为生成元。所有循环群都同构于其中之一。当群的阶数大于等于 3 时,总是存在其他生成元,例如-1,对于素数阶的群,每个非零元素都是生成元。

2.3 环

环是一个阿贝尔群,通过具有第二个操作的乘法也是一个幺半群。零是零元,意味着 0x=x0=0。此外,乘法在两个参数上分配于加法(群操作)。也就是说,x(y+z)=xy+xz 和(x+y)z=xz+yz。

  • 示例*

  • 整数的加法群,加上整数乘法运算。

  • 一元多项式的加法群,系数为整数,加上多项式乘法运算。

  • 固定正整数 n 的 n×n 整数矩阵的加法群,加上矩阵乘法运算。

  • 形式为 a+b√2 的数字组合,其中 a 和 b 是整数,因为(a+b√2)(c+d√2)=ac+2bd+(bc+ad)√2。

  • 形式为 x+an 的整数模 n,其中 n≥2,因为(x+an)(y+bn)=xy+(xb+ya+abn)n。

除了最后一个例子外,整数(除了给出矩阵大小的整数 n)可以被任何有理数、实数或复数替换。当用实数替换整数时,第四个例子变成了实数环,因为即使 b 为零,a 可以是任何实数。然而,当用有理数替换时,环包括有理数,但不仅限于此,因为 √2 是无理数,但它不包含例如 √3。

2.4 字段

一个字段是一个环,其中非零环元素的乘法幺半群是一个阿贝尔群。也就是说,乘法必须是可交换的,并且每个非零元素 x 必须有一个倒数 1/x。

  • 例子*

  • 有理数环,因为有理数乘法是可交换的,每个非零有理数 m/n 都有倒数 n/m。

  • 实数环和复数环,出于类似的原因。

  • 形如 a+b√2 的数环,其中 a 和 b 是有理数,因为只有当 a=b=0 时 a+b√2 才为零,否则它的倒数为 (a−b√2)/(a2−2b2);称为二次无理数域。

  • 整数模素数 p 的环 Zp,因为非零数的乘法幺半群包含一个数 g,使得 gp−1=1,并且每个非零数都可以表示为 gi 的形式,因此具有逆元,即 gp−1−i。

最后一个例子不能直接推广到其他模数。然而,对于任何幂 pn 为素数的模数,可以证明存在一种唯一的乘法,使得群 Zpn 成为一个环,使得环的非零元素在乘法下成为一个循环(因此是可交换的)群,从而使环成为一个域。以这种方式构造的域是唯一的有限域。

2.5 应用

为什么要研究整个类别?嗯,以整数集合 Z 为例,加法 x+y 的二元运算,取反-x 的一元运算和常数 0。这些运算和常数满足各种定律,如 x+(y+z)=(x+y)+z,x+y=y+x,x+0=x 和 x+(−x)=0。现在考虑任何其他代数,其运算不仅具有相同的名称,而且满足相同的定律(可能还有更多),称为这些定律的模型。这样的代数可以用于以下任何目的。

(i) 它可以告诉我们整数的等式定律在多大程度上表征了整数。由于模 2 下的整数集合{0,1}在加法和取反下满足整数的所有定律,我们立即可以看出没有单个整数的等式属性告诉我们整数有无限多个。另一方面,整数的等式理论的任何有限模型必然满足一些整数不满足的定律,特别是当左边的 x 的数量是模型的大小时,满足定律 x+x+…+x=0。由于整数的等式理论不包含这样的定律,我们可以从整体上知道整数必须是一个无限集合。另一方面,有理数在加法和取反下与整数完全满足相同的等式属性,因此这个理论不能以足够精确的方式表征整数的加法和减法代数,以将其与有理数区分开来。

(ii) 它可以为我们提供一个有用的新领域,可以替代任何仅依赖于整数的等式属性的应用程序,但在其他(必然非等式的)有用方面与整数不同。例如,有理数满足我们刚才提到的相同法则,但不同之处在于它具有密度属性,即在任意两个有理数之间存在另一个有理数。另一个区别是它支持除法:而两个整数的比率通常不是整数,两个有理数的比率总是有理数。实数也满足相同的等式,与有理数一样是密集的并支持除法。然而,与有理数不同的是,实数具有完备性属性,即任何非空实数集的所有上界集合要么为空,要么具有最小成员,这对于收敛序列具有收敛极限是必需的。

这个想法可以扩展到其他运算,如乘法和除法,就像域一样。这种概括的一个特别有用的情况是在笛卡尔几何中使用复数。当 x 和 y 在实数域上变化时,x2+y2=1 描述了二维欧几里德圆,但当变量在复数上变化时,这个方程描述了圆的复数对应物,可视化为嵌入在四个实维度中的二维表面(将复平面视为具有两个实维度)。或者,如果变量在模 7 下的整数范围内变化,这些整数在通常的算术运算模 7 下形成一个域,那么圆由八个点组成,即(±1,0),(0,±1)和(±2,±2)。关于欧几里德圆的某些定理在纯代数上仍然可证明,因为证明所依赖的所有方程在这些其他域中仍然成立,例如线与圆相交的定理至多有两个交点。

(iii) 它可以帮助我们决定一些旨在公理化整数的等式法则列表是否完备,即任何在整数中成立的等式是否可以从该列表中的法则推导出来。如果某个结构满足列表中的所有公理,但不满足整数的某个其他等式,那么我们就有一个证明该公理化不完备的证人。另一方面,如果我们可以展示如何从整数的代数中仅限于某些代数构造来构建满足公理的任何代数,那么根据 Birkhoff 定理适用于这些构造,我们可以推断该公理化是完备的。

(iv) 它可以提供除列举公理的标准方式之外的另一种定义类的方式。在这种情况下,具有常数、一元运算和二元运算,并满足整数满足的所有法则的所有代数的类,恰好是阿贝尔群的类。

3. 通用代数

通用代数是抽象代数之后的下一个抽象层次。而初等代数处理特定代数(如实数域或复数域)中的方程推理,抽象代数研究特定类别的代数(如群、环或域),通用代数研究代数的类别的类别。就像抽象代数将群、环和域作为其基本类别之一一样,通用代数也将变种、准变种和初等类别计算为其基本类别的类别。

理论的模型是满足该理论的所有方程式的等式的结构。术语是使用理论的操作从变量和常数构建的。方程式是一对术语;当两个术语在术语中出现的 n 个变量的所有赋值下相等时,它被代数满足,等效地,当它们表示相同的 n 元操作时。准方程是由一组方程式(称为前提或前件)和另一个方程式(结论)组成的一对;当满足前提的术语中出现的 n 个变量的所有赋值下,结论的两个术语相等时,它被代数满足。一阶公式是关系术语的量化布尔组合。

变种是一组方程的所有模型的类别。准变种是一组准方程的所有模型的类别。初等类别是一组一阶公式的所有模型的类别。

拟变种比变种或基本类别受到的关注要少得多,因此我们在这里对它们的介绍很少。基本类别在本百科全书的其他地方已经得到了充分的深入讨论,所以我们不需要在这里考虑它们。因此,我们在本节中重点讨论变种。

阿贝尔群、群、环以及给定域上的向量空间都构成了变种。

在这个领域中的一个核心结果是,如果一个格是某个代数的子代数格,那么它也是某个代数的同余格,反之亦然。这种类型的格被称为代数格。当一个代数的同余关系互换时,它的同余格是模块化的,这是一种有助于特定有限代数分析的强条件。

3.1 概念

代数形式中出现了数论的熟悉定理。当代数 A 的同余格是由 A 和单元代数组成的二元格时,代数 A 被称为直接不可约或简单的,这与素数 p 的概念相似,素数 p 是一个其除数格具有两个元素 p 和 1 的数。然而,算术基本定理的对应物,即每个正整数都可以唯一地分解为素数的乘积,需要比直积更精细的乘积。Birkhoff 的子直积概念使他能够证明子直积表示定理,即每个代数都可以作为其子直积不可约商的子直积。虽然有许多子直积不可约群,但唯一的子直积不可约布尔代数是初始的或二元的,而满足 xn=x(其中 n>1)的子直积不可约环正好是有限域。

另一个核心主题是对偶性:布尔代数对偶于 Stone 空间,完全原子布尔代数对偶于集合,带有顶部和底部的分配格对偶于偏序集,代数格对偶于半格,等等。对偶性提供了两种观察代数的方式,其中一种可能在应用中更具洞察力或更易于处理。

各种类作为某些等式理论的所有模型的类的结构也非常有趣。这个领域最早的结果是 Birkhoff 的定理,即如果一个代数类在商(同态像)、子代数和任意(包括空和无限)直积的形成下是封闭的,则它是一个种类。这个“现代代数”结果构成了等式逻辑的模型的完备性定理。它的基本对应物是关于自由代数 F(V)上的等式理论的定理,F(V)被定义为使用来自 V 的变量的推导闭合的等式集,它们恰好是它的替代等价关系。

局部有限的种类是其有限生成的自由代数是有限的种类,例如指向集合、图(无论是有向的还是无向的)和分配格。可置换等价的种类是其所有代数都是可置换等价的种类。Maltsev 通过对它们的理论提出了一个必要且充分的条件来刻画这些种类,即 F(3)包含一个操作 t(x,y,z),使得 t(x,x,y)=t(y,x,x)=y 在该理论中。类似的概念还有等价分配性和等价模块性,对于这些性质的代数种类存在类似的句法刻画。这个领域最近发展起来的一个有力工具是 McKenzie 关于温顺等价关系的概念,有助于研究有限代数的结构。

在代数学派中,已经定义了变量,理解为一个签名的操作形成一个集合。范畴论的见解,特别是将变量表达为一个单子,定义为范畴 C 的自函子 CC 中的幺半群对象(在普通普遍代数的情况下为集合 Set),表明当操作可以形成一个适当的类时,可以获得更清晰和更一般的变量概念。例如,完全半格(CSLat)和完全原子布尔代数(CABA)这两个重要类别只有在这个更广泛的签名概念下才形成变量。在狭义的代数意义上,变量的对偶永远不可能是一个变量,而在更广泛的单子变量概念中,集合变量 Set 是 CABA 的对偶,而 CSLat 是自对偶的。

3.2 等式逻辑

公理系统。等式也可以用于将方程转化为等价方程。当这些方程本身是某个域的等式时,它们转化成的方程仍然是该域的等式。因此,可以从一些有限的等式集合开始,并从中制造出无限数量的新等式。

例如,如果我们从仅有的两个恒等式 (x+y)+z=x+(y+z) 和 x+y=y+x 开始,我们可以通过以下一系列变换得到恒等式 (w+x)+(y+z)=(w+y)+(x+z)。

(w+x)+(y+z)=((w+x)+y)+z=(w+(x+y))+z=(w+(y+x))+z=((w+y)+x)+z=(w+y)+(x+z)

从旧的恒等式中制造新的恒等式的过程称为演绎。任何可以通过从给定的恒等式集合 A 开始进行演绎而生成的恒等式都被称为 A 的推论。A 的所有推论的集合被称为 A 的演绎闭包。我们将 A 称为其演绎闭包的公理化。一个集合如果是其自身的演绎闭包,则被称为演绎闭合。很容易证明,一个集合是演绎闭合的当且仅当它是某个集合的演绎闭包。

等式理论是一组由推理封闭的等式组成,等价于某个等式集合 A 的所有推论。每个理论总是将自身作为自己的公理化,但通常也会有更小的公理化。具有有限公理化的理论被称为有限基础或有限公理化的。

有效性。有限基础的理论可以被有效地枚举。也就是说,给定一个有限的等式集合 A,可以编写一个计算机程序,以这样的方式打印 A 的推论,使得 A 的每个推论都会在无限的所有推论列表的某个有限位置出现。当我们将 A 的要求从有限弱化为仅仅可以有效地枚举时,得出的结论是相同的。也就是说,如果公理化可以有效地枚举,那么它的演绎闭包也可以有效地枚举。

(在调和有限与无限的过程中,请记住,如果我们按顺序列出所有自然数 0、1、2、…,我们得到一个无限的列表,其中每个成员只有有限远离开头,并且还有一个明确定义的前驱(除了 0)和后继。只有当我们试图在“末尾”用无限数填充这个列表时,这个原则才会崩溃。

一种将“结束”视为可能有更多元素的方式是考虑形式为 1/n 的有理数,其中 n 为非零整数,按递增顺序排列。这个列表从-1/1,-1/2,-1/3,...开始,并在列出无穷多个这种形式的负有理数后,没有最大值,切换到正有理数,没有第一个这样的数,最后以 1/3,1/2,1/1 结束。整个列表是离散的,因为除了端点-1/1 和 1/1 之外的每个有理数在这个有理数子集中都有一个明确定义的前驱和后继,与-1/1 和 1/1 之间的所有有理数的情况不同。如果我们在中间引入有理数 0,情况将不再如此,它既没有前驱也没有后继。

等式逻辑。我们对推理的非正式解释可以用五条规则来形式化,用于从旧的等式中产生新的等式。在下面的公式中,s 和 t 表示任意项。

(R 1)

从无到有推断出 t=t。

(R 2)

从 s=t 推断出 t=s。

(R 3)

从 s=t 和 t=u 推断出 s=u。

(R 4)

从 s1=t1,s2=t2,…,sn=tn 推断出 f(s1,s2,…,sn)=f(t1,t2,…,tn),其中 f 是一个 n 元运算。

(R 5)

从 s=t 推断出 s′=t′,其中 s′ 和 t′ 是通过一致地替换 s 和 t 中的变量而得到的术语。

在这个上下文中,“一致地”意味着如果一个术语替换了给定变量的一个出现,则在 s 和 t 中该变量的所有出现都必须替换为相同的术语。例如,我们不能仅仅依靠 R5 来证明在 x+y=y+x 的左边用 u+v 替换 x,在右边用 v+u 替换 x,尽管其他一些规则可能允许这样做。

作为一组术语对的等式理论等于对所有术语的二元关系。规则 R1-R3 分别对应于这个二元关系的自反性、对称性和传递性,即这三个规则断言等式理论是一个等价关系。规则 R4 表达了这个二元关系是一个合同关系的进一步属性。规则 R5 进一步断言这个关系是一个替代合同关系。可以证明,如果一个术语集合 A 的二元关系是一个等式理论,那么它也是一个替代合同关系。因此,这五个规则完全公理化了等式逻辑,即通过有限次应用这五个规则可以从等式集合 A 中推导出每个推论。

3.3 比尔赫夫定理

根据定义,一个变种是某个等式理论的模型类。1935 年,伯克霍夫提供了一个等价的变种特征,即任何在商(同态像)、直积和子代数下封闭的类。这些概念的定义如下。

给定两个代数(X,f1,...,fk)和(Y,g1,...,gk),一个同态 h:(X,f1,...,fk)→(Y,g1,...,gk)是一个函数 h:X→Y,满足对于每个 i 从 1 到 k,其中 ni 是 fi 和 gi 的元数,h(fi(x0,...,xni−1))=gi(h(x0),...,h(xni−1))。

代数的子代数是代数的元素集合,闭合于代数的运算。

让 I 是一个任意的集合,可以是空集、有限集或无限集。一个由 I 索引的代数族 ⟨Ai⟩i∈I((Xi,fi1,…,fik))由每个元素 i 的代数 Ai 组成。我们如下定义这样一个族的直积 ΠAi(或完整写作 Πi∈IAi)。

ΠAi 的底层集合是底层集合 Xi 的笛卡尔积 ΠXi,由那些 I 元组组成,其中第 i 个元素是 Xi 的某个元素。(I 甚至可以是不可数的,但在这种情况下,ΠXi 的非空性作为各个 Xi 的非空性的结果等价于选择公理。这对于 Birkhoff 定理的任何构造性应用都应该牢记。)

ΠAi 的第 j 个操作,具有 arity nj,接受 ΠXi 的一个元组 t,并产生 I 元组 ⟨fij(ti1,…tinj)⟩i∈I,其中 tik 是 t 的第 k 个分量的第 i 个分量,k 从 1 到 nj。

给定两个代数 A,B 和一个同态映射 h:A→B,同态像 h(A)是由形如 h(a)的元素组成的 B 的子代数,其中 a 属于 A。

给定一个代数类 C,我们用 P(C)表示由 C 的代数族的直积形成的所有代数的类,用 S(C)表示 C 的代数的所有子代数的类,用 H(C)表示 C 的代数的所有同态像的类。

相对而言,很容易证明所有属于 C 的成员满足的任何方程也被所有属于 P(C),S(C)和 H(C)的成员满足。因此对于一个变种 V,P(V)=S(V)=H(V)。

Birkhoff 的定理是其逆命题:对于任何满足 P(C)=S(C)=H(C)的类 C,C 是一个变种。实际上,该定理稍微更强:对于任何类 C,HSP(C)都是一个变种。也就是说,为了构建 C 的所有模型,只需首先在直积下封闭 C,然后在子代数下封闭 C,最后在同态像下封闭 C;也就是说,后续的封闭不会损害先前的封闭,前提是按照 P、S 和 H 的顺序执行。

Birkhoff 的定理的一个基本应用是证明对于类 C 的一个拟公理化的完备性。给定公理的任意模型,只需证明该模型可以构建为 C 的代数的直积的子代数的同态像。

这种完备性技术补充了前一节中对等式逻辑规则的完备性。

4. 线性代数

4.1 向量空间

向量空间是群、环和域的兄弟类,构成了线性代数的宇宙。向量空间适用于两种相反的方法:公理化或抽象方法,以及合成或具体方法。公理化方法将域(从而环,从而群)作为先决条件;它首先将 R-模的概念定义为具有给定环 R 上的标量乘法的阿贝尔群,然后将向量空间定义为 R 是一个域的 R-模。合成方法通过将实数上的向量空间表示为实数的 n 元组,以及从 m 维向量空间到 n 维向量空间的线性变换表示为实数的 m×n 矩阵来进行。对于包括无限维的向量空间的完全普遍性,n 不需要限制为有限数,而可以是任意基数。

抽象方法,如 Mac Lane 和 Birkhoff 等经典文本所采用的方法,具有一定的纯粹主义吸引力,并且非常适合数学专业的学生。具体方法的好处是可以将微积分或其他较低级的课程替代为群-环-域的先修课程,适用于科学家和工程师的服务课程,只需要有限维矩阵代数,这在实际应用中非常广泛。线性代数在其他领域,特别是有限域中的应用,如编码理论、量子计算等,更适合采用抽象方法。

对于任何域 F,对于给定的有限维度,存在且仅存在一个关于 F 的向量空间,它们同构。这是抽象方法中的一个定理,但是在具体方法中,这是一个直接的推论(该定理用于关联这两种方法)。

具体方法的另一个直接推论是有限维向量空间在 F 上的对偶性。对于任意维度的向量空间 V,对应于 V 的对偶空间 V∗,由 V 上的泛函组成,泛函定义为线性变换 f:V→F,将域 F 视为一维向量空间。泛函在坐标上的加法(f+g)(u)=f(u)+g(u)和乘法(xf)(u)=x(f(u)),其中 x 是 F 中的任意标量,我们将 V∗ 定义为这个空间。向量空间上的这种运算扩展到线性变换 f:U→V,定义为 f∗:V∗→U∗,使得 f 将每个泛函 g:V→F 映射到 g⋅f:U→F。重复这个运算会产生一个向量空间,在有限维情况下,它与 V 同构,即 V≅V∗∗,使得这个运算成为一个对合运算。有限维向量空间的对偶性的本质在于它的对合性质以及线性变换的反转。

这种二元性在具体方法中很容易通过将从 U 到 V 的线性变换视为 m×n 矩阵来进行可视化。这种二元性简单地转置矩阵,同时保持矩阵乘法机制本身不变。因此,很明显,这个操作是一个逆运算,它可以反转映射——将将一个将 n 维空间 U 线性变换为 m 维空间 V 的 m×n 矩阵转置为将 m 维空间 V∗ 线性变换为 n 维空间 U∗ 的 n×m 矩阵。

4.2 结合代数

在向量空间 V 上的线性变换 f:V→V 可以进行加法、减法和标量乘法,每种情况下都是逐点进行的,因此形成一个向量空间。当空间具有有限维度 n 时,线性变换可以表示为 n×n 矩阵。

此外,它们可以组合在一起,从而形成一个配备有双线性结合操作(即组合)的向量空间。在有限维情况下,组合就是通常的矩阵乘积。配备这种乘积的向量空间构成了结合代数。所有结合代数都可以通过这种方式得到,无论是有限维还是无限维,这为该概念提供了一个令人满意且有洞察力的特征描述,而不是在此处给出的公理描述。

众所周知,结合代数的著名例子包括实数、复数和四元数。与向量空间不同,任何给定维度大于一的非同构结合代数都是可能的。

物理学家感兴趣的一类关联代数是克利福德代数。克利福德代数在实数上(作为向量空间是欧几里得空间)推广了复数和四元数,允许任意数量的形式量 e(类似于 i=√−1)附加到实数域上。这些量的共同特点是每个量满足 e2=−1 或 e2=1。虽然低维度有很多关联代数,但只有少数代数是克利福德代数。实数形成唯一的一维克利福德代数,而由 e2=1 定义的双曲平面和由 e2=−1 定义的复平面是两个二维克利福德代数。双曲平面只是实数域的直积,意味着它的乘积是按坐标进行的,(a,b)(c,d)=(ac,bd),而复平面的乘积由(a,b)(c,d)=(ac−bd,ad+bc)定义。两个四维克利福德代数是 2×2 矩阵和四元数。2×2 矩阵包含零除数(乘积为零的非零矩阵),因此只形成一个环,而四元数不包含零除数,因此形成一个除环。然而,与复数不同,四元数不形成一个域,因为它们的乘法不可交换。然而,复数乘法使复平面成为一个可交换的除环,即一个域。

5. 数学的代数化

数学的许多分支受益于代数的视角。代数几何和代数组合学都有专门的期刊,而代数拓扑学、代数逻辑学和代数数论都有强大的追随者。许多其他更专业的数学领域也同样受益。

5.1 代数几何

代数几何始于我们在介绍中提到的形状,例如直线 y=ax+b,圆 x2+y2=r2,球体 x2+y2+z2=r2,二次曲线 f(x,y)=0(其中 f 是 x 和 y 的二次多项式),二次曲面 f(x,y,z)=0(其中 f 再次是二次的),等等。

为了方便起见,我们将这些方程的两边收集到左边,使得右边始终为零。然后,我们可以定义一个形状或者变量,由多项式的根或者零点组成,或者更一般地说,由一组多项式的公共零点组成。

普通的解析几何或笛卡尔几何是在实数上进行的。代数几何更常在复数上进行,或者更一般地在任何代数闭域上进行。以这种方式可定义的变量称为仿射变量。

然而,有时不希望代数闭包,例如在代数几何和数论边界工作时,域可能是有限的,或者是有理数。

许多种对象的特征是由它们的映射保持不变的结构所决定的。偏序集通过单调函数进行转换,保持顺序不变。代数通过同态进行转换,保持代数结构不变。在代数几何中,变量通过正则的 n 元函数 f:An→A 进行转换,这些函数被定义为在 n 个变量上局部是有理多项式的函数。局部有理意味着在 f 的定义域的每个点上都存在一个邻域,在该邻域中 f 是两个多项式的比值,其中分母在该邻域中非零。

这个概念推广到正则函数 f:An→Am,定义为正则 n 元函数的 m 元组。

给定两个在 An 和 Am 中的变量 V 和 V',从 An 到 Am 的正则函数,其在 V 上的限制是从 V 到 V'的函数,被称为变量的正则函数。仿射变量的范畴的对象是所有仿射变量,其态射是所有正则函数。

多项式是连续的,人们期望变量之间的正则函数也是连续的。在变量的形状中存在尖点、交叉和其他奇点的症状,这里需要一个适当的拓扑来判断连续性。

诀窍在于不在仿射空间中工作,而是在其射影空间中工作。以欧几里得三维空间为例,其关联的射影空间是单位球体,其中对径点被认为是同一点,形成一个二维流形。等价地,这是所有(无定向的)通过原点的直线的空间。对于任意的仿射空间,其关联的射影空间是所有这样的直线的空间,被理解为一个流形。

代数几何中适用的射影空间拓扑是 Zariski 拓扑,它不是通过其开集定义的,而是通过其闭集定义的,闭集被认为是代数集,即由一组齐次多项式的公共零点构成的集合。关键定理是仿射代数簇之间的正则映射在 Zariski 拓扑下是连续的。

5.2 代数数论

代数数论已经采纳了代数几何的这些推广。在数论中,一个特别重要的变体类别是椭圆曲线。

代数数论的一个著名成功是安德鲁·怀尔斯证明了费马所谓的“最后定理”。这个问题在三个半世纪里一直是一个悬而未决的问题。

5.3 代数拓扑学

代数拓扑分析连通拓扑空间中的孔洞和障碍。拓扑学家是那些将所有物体想象成不可破坏但非常柔软的橡皮泥的人,因此他们不认为有必要区分咖啡杯和甜甜圈,因为两者都可以转化为另一种形状。拓扑学关注咖啡杯带有 n 个手柄的相似性和差异,以及带有 n 个孔洞和更复杂形状的表面。代数拓扑通过同伦群和同调群来表达这些形状的不变量。

5.4 代数逻辑

代数逻辑在 1847 年的小册子中,布尔引入了布尔代数,从而早早地开始了。现代代数的方法开始应用于布尔代数在 20 世纪。代数逻辑随后将其兴趣扩展到一阶逻辑和模态逻辑。一阶逻辑中的中心代数概念是超限积、元等价性以及元和伪元变种。塔斯基的圆柱代数构成了一阶逻辑的特定抽象形式,其中对角线关系编码相等性,替换关系编码变量。模态逻辑作为一阶逻辑的一个片段,通过布尔模块使其具有代数性质。

6. 自由代数

对于任何系统,如整数算术或实数算术,我们可以用 T 表示由常量构建的所有确定术语的集合,构成确定语言,并用 T [V] 表示允许变量从集合 V 中取代一些常量符号的更大的不确定语言,其中包括诸如 x+(2/y)之类的术语。当 V 只包含一个变量“x”时,T [{"x"}] 通常缩写为 T ["x"] 或 T [x],这通常是明确的。这个约定扩展到了术语 Φ 的代数,它是由 T 的术语和其被视为组合术语的操作符号列表组成的;我们将其写为 Φ [V],并称之为 V 上的术语代数。

这个术语代数的概念是一个纯粹的句法概念,只涉及某种语言的操作符号、常量和变量。术语 2+3 和 3+2 是不同的;同样,术语 x+y 和 y+x 也是不同的术语。因此,它们可以被视为具体的术语。

现在在一个像整数这样的宇宙中,某些具体术语在某种意义上是等价的,无论它们的变量的值如何,它们始终评估为宇宙的相同元素,例如 x+y 和 y+x。将等价的具体术语收集到等价类中是方便的,每个等价类都被视为一个抽象术语。

作为抽象术语的一个简单例子,考虑形式为 ax+by 的线性多项式,其中 a 和 b 是非负整数,例如 7x+3y。所有这样的多项式的集合包括 0,并且在多项式加法下是封闭的,这是一种结合和交换的运算。因此,这个集合连同加法和零多项式构成了一个交换幺半群。

这个幺半群是自由代数的一个例子,即两个生成元 x 和 y 上的自由交换幺半群。它之所以是自由的,是因为它除了满足交换幺半群的法则之外,没有其他法则。然而,它不是自由幺半群,因为它满足交换律。而两个生成元 x 和 y 上的自由幺半群实际上是由两个字母{x,y}组成的所有有限字符串的集合。

当可交换性被引入为一条法则时,它将之前不同的字符串 xy 和 yx 标识为一个多项式;更一般地,任何具有相同数量的 x 和 y 的两个字符串都被标识为相同的。

自由幺半群和自由交换幺半群是自由 C-代数的例子,其中 C 是一个代数类。在这两个例子中,类 C 分别是幺半群和交换幺半群。

自由 C-代数是一种存在于语法和语义边界的代数。在语义方面,它是 C 的成员。在语法方面,它的元素表现得像符合 C 的法则的项,但没有其他可以用其生成元表达的法则。可交换性 xy=yx 可以用两个生成元表达,因此具有两个或更多生成元的自由幺半群不能是可交换的,尽管具有一个生成元的自由幺半群,即由一个字母字母表上的所有有限字符串组成的集合,确实形成了一个具有一个生成元的可交换幺半群。

在句法方面,自由 C-代数 B 在集合 X 上产生,作为从 X(视为变量集合)使用 C 的代数的操作符和常量的术语代数形成的商代数。商代数将那些在 C 的所有代数 A 和将 X 的变量赋值为 A 中的值时具有相同值的术语进行标识。这仅执行足够的标识以满足 C 的每个定律(从而使该商代数成为 C-代数),同时仍保留原始术语代数的句法本质,这一点在下一段更加明确地说明。

(由于术语代数的概念在某些地方似乎有点循环,更详细的解释可能会澄清这个概念。给定 C 的语言,即 C 的代数中常见的操作符和常量符号,以及变量集合 X,我们首先形成代数的基础集合,然后将语言的符号解释为该集合中的操作和值。集合本身由使用操作符从这些变量和常量符号按照通常的方式构建的术语组成;从这个意义上说,这些元素是句法的。但现在我们改变了观点,将这些元素视为语义的,并且我们将语言的常量符号和操作符视为需要在这个语义域(术语的域)中解释的句法实体,以将这个术语集合转化为术语的代数。我们将每个常量符号解释为它本身。我们将每个 n 元操作符 f 解释为将任意 n 个术语 t1,...,tn 作为其 n 个参数并返回单个术语 f(t1,...,tn)的 n 元操作。请注意,f 的这种解释仅返回一个术语,而不是实际构建它。所有的术语构建都是在我们生成代数的基础集合时完成的。)

从语义角度来看,一个 C-代数 B 和 B 的一个子集 X 被视为变量,被称为 X 上的自由 C-代数,或者是由 X 自由生成的,当给定任何 C-代数 A 时,X 中的变量的任何估值(即任何函数 f:X→A)唯一地扩展为一个同态 h:B→A。(我们说 h:B→A 扩展了 f:X→A,当 h 限制在 X 上的值为 f。)

作为一种方便的简写,没有生成器的自由 C-代数也可以称为初始 C-代数。初始 C-代数对每个 C-代数都有唯一的同态。

在继续介绍示例之前,值得指出自由代数从语义角度的一个重要基本属性。

具有相同基数的两个自由代数 B 和 B'上的生成集 X 和 Y 是同构的。

作为证明,选择任意的双射 f:X→Y。它的逆 f':Y→X 以及分别作用在 X 和 Y 上的两个恒等函数,构成了一个由四个函数组成的系统,这四个函数在复合下是封闭的。每个函数都是从一个生成集到一个代数的映射,因此它们都有唯一的扩展到同态的映射。这四个同态映射也在复合下是封闭的。从 B 到自身的同态映射扩展了 X 上的恒等函数,因此必须是 B 上的恒等同态映射(因为后者存在且其在 X 上的限制是 X 上的恒等函数)。同样,从 G 到 G 的同态映射是一个恒等函数。因此,B 和 G 之间的同态映射可以以任意顺序组合成恒等映射,这使它们成为同构。但这就是 B 和 B'同构的意义所在。

这个事实使我们能够说,对于给定集合上的自由代数,将同构的代数视为“道义上”相同。如果不是这样,我们的商构造将是不完整的,因为它产生了一个唯一的自由代数,而上述自由代数的定义允许将任何同构于商构造所产生的代数视为自由代数。由于 X 上的所有自由代数都是同构的,商构造和任何其他构造一样好,并且还是证明它们存在的一种方式。它还确立了变量集的选择除了基数外是无关紧要的,正如直觉所暗示的那样。

6.1 自由幺半群和群

将 C 视为幺半群的类。由二元操作符和表示恒等的常数符号确定的代数术语可以看作是带有变量和常数符号副本的二叉树。根据结合性将树进行标识,将树展平为忽略操作应用顺序的单词(但不会颠倒任何参数的顺序)。这样就产生了由字母表 X 和恒等元素组成的单词。恒等律会消除恒等元素,除非单词只由恒等符号组成,我们将其视为空单词。

因此,字母表 X 上的有限单词的幺半群是 X 上的自由幺半群。

另一种对于 n 个生成元的自由幺半群的表示是作为一个无限树,其中每个顶点都有 n 个后代,每个字母对应一个边,每条边都标有相应的字母。每个顶点 v 表示由从根到 v 的路径上遇到的字母组成的单词。u 和 v 的连接是通过取以顶点 u 为根的子树到达的顶点,注意到这棵树与完全树同构,并将 v 定位在这棵子树中,就好像它是完全树一样。

如果我们忽略树中边的方向和标签,我们仍然可以确定根:它是唯一一个有 n 条边与之关联的顶点,所有其他顶点都有 n+1 条边,即一条入边和 n 条出边。

对于一个集合的自由交换幺半群是那个幺半群,其生成元的行为就像自由幺半群中的字母一样(特别是它们仍然是原子),但满足额外的法则 uv=vu。我们进行进一步的等同,例如“dog”和“dgo”。单词中字母的顺序现在不重要,重要的是每个字母有多少个副本。这个信息可以表示为一个自然数的 n 元组,其中 n 是字母表的大小。因此,n 个生成元的自由交换幺半群是 Nn,即自然数的 n 元组在加法下的代数。

它也可以从自由幺半群的树表示中获得,通过识别顶点。考虑两个字母的情况 n=2。由于识别不改变单词长度,所有的识别都是来自根节点深度相同的顶点。我们同时进行所有的识别,如下所示。在每个顶点 v 处,识别 v01 和 v10 及其子树。在深度为 n 的情况下,之前有 2n 个顶点,现在有 n+1 个顶点。此外,我们不再有一棵树,而是有平面的右上象限,即 N2,顺时针旋转 135 度,每个顶点 v 都位于一个菱形的顶部,其其他顶点 v0 和 v1 位于下一层,并且识别的对 v01=v10 位于两者之下。

要形成 n 个生成元的自由群,首先形成 2n 个生成元的自由幺半群,其中生成元组织成互补对,每个生成元都是另一个的逆,然后从所有单词中删除所有相邻的互补对。

这种观点并不特别有洞察力。树表示的群对应物更好地呈现了一个自由群。考虑 n=2 个生成元 A 和 B 的自由群。我们从 4 个生成元 A、B、a、b 的自由幺半群开始,其中 a 是 A 的逆,b 是 B 的逆。这棵树的每个顶点都有 4 个后代。因此,根节点的度数为 4,其余的顶点的度数为 5:除了根节点外的每个顶点都有一个边进入,比如生成元 a,和四个出去。考虑任意非根节点 v。删除相邻的互补对的效果是将 v 的直接祖先与 v 的四个后代之一识别为互补对,即使从祖先到后代的路径是互补对。对于每个非根节点 v,这些识别将 v 的度数从 5 降低到 4。根节点的度数保持为 4。

所以现在我们有一个无限图,每个顶点的度数都是 4。与自由幺半群的树不同,其中根节点在拓扑上与其他顶点不同,自由群的树完全是均匀的。因此,如果我们丢弃顶点标签,仅依靠边标签进行导航,任何顶点都可以被视为群的单位元。

这种均匀性也适用于由 2 个生成元组成的自由阿贝尔群,其顶点仍然具有度数 4。然而,额外的等同将其从树(没有循环的图)转变为一个网格,其顶点是平面上的格点。也就是说,由 2 个生成元组成的自由阿贝尔群是 Z2,由 n 个生成元组成的自由阿贝尔群是 Zn。边是连接相邻格点的线段。

6.2 自由环

没有生成器的自由幺半群、自由群和自由环都是只包含加法单位元 0 的单元素代数。具有单位元的环意味着具有乘法单位元,即一个词 ε。但这使得 ε 成为环的加法群的一个生成器,而一个生成器的自由阿贝尔群是整数。因此,没有生成器的带单位元的自由环是整数,包括加法和现在的乘法。

一个生成器 x 的自由环必须包括 x2、x3 等通过乘法得到的项,但这些项可以相加和相减,得到多项式,例如 7x3−3x2+2x,但没有常数项,除了 0 本身。环的分配律意味着一个项,例如(7x+x2)(2x3+x),可以展开为 7x2+x3+14x4+2x5。现在应该清楚,这些只是没有常数项的普通多项式;特别是我们缺少零次多项式 1,因此这个环没有乘法单位元。然而,即使我们没有指定,它也是一个可交换的环。带单位元的一个生成器的自由环引入了 1 作为乘法单位元,并成为普通的一元多项式,因为现在我们可以形成所有的整数。就像幺半群一样,带单位元的两个生成器的自由环是不可交换的,多项式 xy 和 yx 是不同的。然而,带单位元的两个生成器的自由可交换环由整数上的普通的二元多项式组成。

6.3 自由组合结构

从迄今为止的例子可以得出结论,所有一个或多个生成元的自由代数都是无限的。这绝不总是这样的;作为反例,我们可以指出一些类别:集合、指向集合、双指向集合、图、无向图、布尔代数、分配格等。每个类别都形成了早期定义的局部有限的变种。

指向集合是一个带有一个常数的代数,比如 c。自由指向集合上的 x 和 y 有三个元素,x、y 和 c。双指向集合是一个带有两个常数 c 和 d 的代数,然后自由双指向集合上的 x 和 y 有四个元素,x、y、c 和 d。

图,以自动机理论中出现的有向图为例,其中多条边可以连接相同的两个顶点,可以组织为具有两个一元运算 s 和 t 的代数,满足 s(s(x))=t(s(x))=s(x) 和 t(t(x))=s(t(x))=t(x)。一个生成元 x 上的自由图有三个元素,x、s(x) 和 t(x),分别构成一条边及其两个端点或顶点。在这个框架中,顶点是满足 s(x)=x(因此 t(x)=x,因为 x=s(x)=t(s(x))=t(x))的元素;所有其他元素构成边。n 个生成元的自由图由 n 条这样的边组成,全部是独立的。通过标识元素可以得到其他图。将一条边与另一条边或一个顶点标识是没有意义的,因为这只是将第一条边吸收到第二个实体中。这样只剩下顶点;将两个顶点标识为一个共同的顶点,它属于两条边,或者在标识 s(x)=t(x) 中创建一个自环。

“定向”一词比“有向”更可取,因为在组合数学中理解的有向图是具有附加属性的定向图,即如果 s(x)=s(y)且 t(x)=t(y),则 x=y;也就是说,在给定方向上两个顶点之间只允许一条边。

无向图的定义与具有附加一元操作 g 的图相同,满足 g(g(x))=x 和 s(g(x))=t(x)(因此 s(x)=s(g(g(x)))=t(g(x)))。自由无向图上的 x 由 x、s(x)、t(x)和 g(x)组成,其中对 x,g(x)构成了两条单行道的双车道,连接了 s(x)=t(g(x))和 t(x)=s(g(x))之间。无向图元素的识别与其定向对应物相同:只有识别顶点才有意义。然而,这里有一个有趣的变化:顶点可以分为两种类型,满足 x=g(x)和不满足 x=g(x)的。后一种类型的顶点现在是非对称的:双向边的一个方向与其顶点相对应,而另一个方向形成了定向环,其另一个方向是一个顶点。对于满足“如果 s(x)=s(y)且 t(x)=t(y)则 x=y”的无向图,不会出现这种现象。

6.4 自由逻辑结构

布尔代数在传统上被公理地定义为互补分配格,这有助于显示它们形成一个种类,而且是一个有限公理化的种类。然而,布尔代数在其自身中是如此基础,以至于与其为此目的定义格、分配和互补,不如从初始布尔代数中获得它们更容易且更有洞察力。只需将其定义为两个元素的集合{0,1},常数(零元操作)0 和 1,以及 222=16 个二元操作。然后,布尔代数是满足初始布尔代数满足的方程的任何代数,具有这 16 个操作和两个常数。

布尔代数类的一个几乎确定的特性是,它们在初始布尔代数中的多项式是该代数上的所有操作。问题在于,只包含一个元素或不一致代数的不一致类也具有这个特性。然而,通过添加布尔代数是一致的这一条件,可以轻松排除这个类。但是,只是勉强地——在不引入新操作的情况下,向布尔代数添加任何新方程都会使不一致代数公理化。

Sheffer 已经证明,常数和 16 个操作可以作为多项式生成,只需要一个常数(可以是 0 或 1)和一个二元操作(可以是 NAND,¬(x∧y),或 NOR,¬(x∨y))。任何这样的充分集合都被称为基础。沿着同样的线路,Stone 已经证明,合取、异或和常数 1 构成了一个基础。Stone 基础的重要性在于,用这些操作组织的布尔代数满足了作为乘法的合取和作为加法的异或的交换环的所有公理,以及 x²=1 的定律。满足这个最后条件的环被称为布尔环。布尔环与布尔代数等价,因为它们具有相同的多项式。

布尔代数的原子是一个元素 x,对于所有的 y,x∧y 要么是 x,要么是 0。无原子的布尔代数是没有原子的布尔代数。

每个有限 2 的幂的基数都有一个布尔代数,它与基数为 X 的幂集 2X 的布尔代数同构,其中的集合操作是并集、交集和相对于 X 的补集。因此,所有有限布尔代数的基数都是 2 的幂。这种情况在无限布尔代数中发生了变化;特别是存在可数的布尔代数。其中一个是可数个生成元的自由布尔代数,它是唯一的可数无原子布尔代数。自然数集 N 的有限和余有限(有限集的补集)子集构成了幂集布尔代数 2N 的一个子代数,它与自由布尔代数不同构,但它有原子,即单元素集合。

自由布尔代数 F(n)由所有二元布尔代数上的 22n 个 n 元运算组成。因此,布尔代数形成了一个局部有限的变种。

分配格的等式理论是通过从布尔代数中选择仅为两元代数上的单调二元运算作为操作来获得的,省略了常数。这些操作具有以下特性:如果其中一个参数从 0 变为 1,结果不会从 1 变为 0。分配格是那些仅由单调二元运算构建的项之间的布尔等式的任何模型。因此,每个布尔代数都是一个分配格。

分配格可以是任意“薄”的。在极端情况下,任何链(线性或全序,例如实数的标准排序)在最大和最小操作下形成一个分配格。由于我们省略了常数,这包括了空格,我们在这里没有将其排除作为一个代数。因此,存在各种可能基数的分配格。

每个有限维向量空间都是自由的,可以由任意选择的基来生成。只要我们接受选择公理,这个结论也适用于无限维向量空间。因此,当标量乘法被组织为每个域元素的一元操作时,有限域上的向量空间形成了一个局部有限的变种。

6.5 范畴论中的自由代数

现在我们从范畴论的角度来考虑自由代数的组织方式。我们定义由集合 X 生成的自由代数 B 具有以下性质:对于每个代数 A 和每个估值 f:X→A,存在唯一的同态映射 h:B→A。现在,每个同态映射 h:B→A 都必然以这种方式产生,因为它在 X 上的限制作为从 X 到 A 的函数是一个估值。此外,每个函数 f:X→A 都可以作为其扩展到同态映射的限制在 X 上的结果。因此,我们在从 X 到 A 的函数和从 B 到 A 的同态映射之间建立了一个双射关系。

现在这里的输入有点随意,让我们整理一下。由于 X 是一个集合,而 A 是一个代数,所以 f 最好被输入为 f:X→U(A),其中 U(A)表示 A 的底层集合。而 X 与 B 的关系最好用符号 B=F(X)来理解,表示由集合 X 生成的自由代数。因此,U 将代数映射到集合,而 F 将集合映射到代数。F 和 U 一般来说不是彼此的逆映射,但它们在某种程度上是相关的,我们现在来具体说明一下。

对于任何范畴 C,通常使用符号 C(A,B)来表示范畴 C 中从对象 A 到对象 B 的所有态射的集合。而从集合 X 到集合 Y 的所有函数的集合可以理解为这个约定的特殊情况 Set(X,Y),其中 C 被取为所有集合的类 Set,我们可以将其看作是离散代数,即没有结构的代数。一类代数以及其成员之间的指定的同态映射集合是范畴的一个实例。该类的成员被称为范畴的对象,而同态映射被称为态射。

我们刚刚观察到的双射现在可以表述为

C(F(X),A)≅Set(X,U(A))

这样的双射被称为 Set 和 C 之间的伴随。这里 F:Set→C 和 U:C→Set 分别是这个伴随的左伴随和右伴随;我们说 F 是 U 的左伴随(或者说 F 是 U 的伴随)而 U 是 F 的右伴随。

我们只描述了 F 如何将集合映射到代数,以及 U 如何将代数映射到集合。然而,F 还将函数映射到同态,将每个函数 f 映射到其唯一的扩展作为同态,而 U 将同态映射到函数,即将同态本身作为函数。这样的映射在范畴之间被称为函子的实例。

一般来说,一个范畴 C 由对象 a、b、c 和态射 f:a→b 组成,还有一个关于“可组合”态射 f:b→c、g:a→b 的结合性组合法则,得到态射 fg:a→c。此外,每个对象 a 都有一个恒等元素 1a:a→a,当与一个态射 f(在一侧或另一侧)可组合时,与之组合得到 f。一个函子 F:C→D 将 C 的对象映射到 D 的对象,将 C 的态射映射到 D 的态射,使得 F(fg)=F(f)F(g)和 F(1a)=1F(a)。也就是说,函子是“范畴的同态”,保持组合和恒等性质。

没有进一步的限定,这样的范畴被认为是一个抽象范畴。我们一直在使用的范畴是具体范畴,因为它们带有给定的底层集合或遗忘函子 U:C→Set。也就是说,代数是基于集合的,同态是这些集合之间的某些函数,而 U 只是“忘记”了代数结构。这样的遗忘函子是忠实的,因为对于 C 中的任意两个态射 f,g:a→b,如果 U(f)=U(g),则 f=g,即 U 不会将不同的同态识别为相同的。一般来说,具体范畴被定义为一个范畴 C 和一个忠实的遗忘函子 U:C→Set。

类别本身可以进一步概括为二范畴,作为二维图形上的代数结构,其中一维胞的结合性组合被推广为二维胞的二维结合。进一步简化自由代数机制,即通过抽象伴随来获得,作为范畴中同构的自然二维对应物,而范畴又是集合中元素相等的自然一维对应物,即两个点可以变成一个点的零维概念。这导致了抽象单子的概念,它只是由一对伴随的一维胞组成的组合,其中一个胞是抽象化函子 F,它从 V 中制造出自由代数 F(V)的一维胞。普通或具体的单子是作为范畴的具体一维胞的函子组合而产生的,这些范畴是一个二范畴的具体一维胞。

Bibliography

  • Harold R. Jacobs, Elementary Algebra, 876pp, W.H. Freeman, 1979.

  • Bartel Leendert van der Waerden, Moderne Algebra (2 volumes), Springer, Vol. 1 1930, Vol. 2 1931.

  • I.N. Herstein, Topics in Algebra, 2nd ed, 400pp, Wiley, 1975.

  • Saunders Mac Lane, Categories for the Working Mathematician, Springer-Verlag, 1978.

Academic Tools

Other Internet Resources

Boolean algebra: the mathematics of | category theory

Copyright © 2022 by Vaughan Pratt <pratt@cs.stanford.edu>

最后更新于

Logo

道长哲学研讨会 2024