矩阵
矩阵就是由方程组的系数及常数所构成的方阵。把用在解线性方程组上既方便,又直观。例如对于方程组:
a1x+b1y+c1z=d1
a2x+b2y+c2z=d2
a3x+b3y+c3z=d3
来说,我们可以构成两个矩阵:
a1b1c1a1b1c1d1
a2b2c2a2b2c2d2
a3b3c3a3b3c3d3
因为这些数字是有规则地排列在一起,形状像矩形,所以数学家们称之为矩阵,通过矩阵的变化,就可以得出方程组的解来。
矩阵这一具体概念是由19世纪英国数学家凯利首先提出并形成矩阵代数这一系统理论的。
但是追根溯源,矩阵最早出现在我国的<九章算术>中,在<九章算术>方程一章中,就提出了解线性方程各项的系数、常数按顺序排列成一个长方形的形状。随后移动处筹,就可以求出这个方程的解。在欧洲,运用这种方法来解线性方程组,比我国要晚2000多年。
数学上,一个m×n矩阵乃一m行n列的矩形阵列。矩阵由数组成,或更一般的,由某环中元素组成。
矩阵常见于线性代数、线性规划、统计分析,以及组合数学等。请参考矩阵理论。
历史
矩阵的研究历史悠久,拉丁方阵和幻方在史前年代已有人研究。
作为解决线性方程的工具,矩阵也有不短的历史。1693年,微积分的发现者之一戈特弗里德·威廉·莱布尼茨建立了行列式论(theory of determinants)。1750年,加布里尔·克拉默其后又定下了克拉默法则。1800年代,高斯和威廉·若尔当建立了高斯—若尔当消去法。
1848年詹姆斯·约瑟夫·西尔维斯特首先创出matrix一词。研究过矩阵论的著名数学家有凯莱、威廉·卢云·哈密顿、格拉斯曼、弗罗贝尼乌斯和冯·诺伊曼。
定义和相关符号
以下是一个 4 × 3 矩阵:
某矩阵 A 的第 i 行第 j 列,或 i,j位,通常记为 A[i,j] 或 Ai,j。在上述例子中 A[2,3]=7。
在C语言中,亦以 A[i][j] 表达。(值得注意的是,与一般矩阵的算法不同,在C中,"行"和"列"都是从0开始算起的)
此外 A = (aij),意为 A[i,j] = aij 对于所有 i 及 j,常见于数学著作中。
一般环上构作的矩阵
给出一环 R,M(m,n, R) 是所有由 R 中元素排成的 m× n 矩阵的集合。若 m=n,则通常记以 M(n,R)。这些矩阵可加可乘 (请看下面),故 M(n,R) 本身是一个环,而此环与左 R 模 Rn 的自同态环同构。
若 R 可置换, 则 M(n, R) 为一带单位元的 R-代数。其上可以莱布尼茨公式定义 行列式:一个矩阵可逆当且仅当其行列式在 R 内可逆。
在维基百科内,除特别指出,一个矩阵多是实数矩阵或虚数矩阵。
分块矩阵
分块矩阵 是指一个大矩阵分割成“矩阵的矩阵”。举例,以下的矩阵可分割成 4 个 2×2 的矩阵。
此法可用于简化运算,简化数学证明,以及一些电脑应用如VLSI芯片设计等。
对称矩阵
对称矩阵是相对其主对角线(由左上至右下)对称, 即是 ai,j=aj,i。
埃尔米特矩阵(或自共轭矩阵)是相对其主对角线以复共轭方式对称, 即是 ai,j=a*j,i。
特普利茨矩阵在任意对角线上所有元素相对, 是 ai,j=ai+1,j+1。
随机矩阵所有列都是概率向量, 用于马尔可夫链。
矩阵运算
给出 m×n 矩阵 A 和 B,可定义它们的和 A + B 为一 m×n 矩阵,等 i,j 项为 (A + B)[i, j] = A[i, j] + B[i, j]。举例:
另类加法可见于矩阵加法.
若给出一矩阵 A 及一数字 c,可定义标量积 cA,其中 (cA)[i, j] = cA[i, j]。 例如
这两种运算令 M(m, n, R) 成为一实数线性空间,维数是mn.
若一矩阵的列数与另一矩阵的行数相等,则可定义这两个矩阵的乘积。如 A 是 m×n 矩阵和 B 是 n×p矩阵,它们是乘积 AB 是一个 m×p 矩阵,其中
(AB)[i, j] = A[i, 1] * B[1, j] + A[i, 2] * B[2, j] + ... + A[i, n] * B[n, j] 对所有 i 及 j。
例如
此乘法有如下性质:
(AB)C = A(BC) 对所有 k×m 矩阵 A, m×n 矩阵 B 及 n×p 矩阵 C ("结合律").
(A + B)C = AC + BC 对所有 m×n 矩阵 A 及 B 和 n×k 矩阵 C ("分配律")。
C(A + B) = CA + CB 对所有 m×n 矩阵 A 及 B 和 k×m 矩阵 C ("分配律")。
要注意的是:可置换性不一定成立,即有矩阵 A 及 B 使得 AB ≠ BA。
对其他特殊乘法,见矩阵乘法。
线性变换,秩,转置
矩阵是线性变换的便利表达法,皆因矩阵乘法与及线性变换的合成有以下的连系:
以 Rn 表示 n×1 矩阵(即长度为n的矢量)。对每个线性变换 f : Rn -> Rm 都存在唯一 m×n 矩阵 A 使得 f(x) = Ax 对所有 x ∈ Rn。 这矩阵 A "代表了" 线性变换 f。 今另有 k×m 矩阵 B 代表线性变换 g : Rm -> Rk,则矩阵积 BA 代表了线性变换 g o f。
矩阵 A 代表的线性代数的映像的维数称为 A 的矩阵秩。矩阵秩亦是 A 的行(或列)生成空间的维数。
m×n矩阵 A 的转置是由行列交换角式生成的 n×m 矩阵 Atr (亦纪作 AT 或 tA),即 Atr[i, j] = A[j, i] 对所有 i and j。若 A 代表某一线性变换则 Atr 表示其对偶算子。转置有以下特性:
(A + B)tr = Atr + Btr,(AB)tr = BtrAtr。