3.1 矩阵乘法与单位矩阵

矩阵乘法是第一个真正把“行”与“列”结合起来的矩阵运算。它也是矩阵之所以能表达复合、线性方程组与逆矩阵的核心原因。所以这条规则不能只靠死记；你要明白每一步的大小条件到底在做什么。

为什么矩阵乘法比加法微妙

矩阵加法与数乘都是逐项进行。矩阵乘法则不同：输出中的一个元素，是由左边矩阵的一整行与右边矩阵的一整列共同决定。

定义

矩阵乘积何时有定义

若 $A$ 是 $m \times n$ 矩阵， $B$ 是 $n \times p$ 矩阵，则乘积 AB 有定义，且结果是 $m \times p$ 矩阵。

若 $A$ 的列数不等于 $B$ 的行数，则 AB 未定义。

内侧大小必须配对；外侧大小则给出结果矩阵的大小。

行乘列规则

定义

矩阵乘法

设 $A = [a_{ij}]$ 是 $m \times n$ 矩阵， $B = [b_{jk}]$ 是 $n \times p$ 矩阵。

则 AB 的 (i,k) 元素为

(AB)_{ik} = a_{i1}b_{1k} + a_{i2}b_{2k} + \cdots + a_{in}b_{nk}.

也就是说，输出中的一个元素，是 $A$ 的第 i 行与 $B$ 的第 k 列按位相乘后再相加。

这个定义同时说明三件事：

矩阵乘法不是逐项相乘；
内侧大小必须吻合；
一个输出元素会用到整行与整列中所有对应位置。

例题

细算一个矩阵乘积

令

A = \begin{bmatrix} 1 & 2 \\ 3 & -1 \end{bmatrix}, \qquad B = \begin{bmatrix} 4 & 0 \\ 5 & 1 \end{bmatrix}.

由于两者都是 $2 \times 2$ ，所以 AB 有定义。其元素为

(AB)_{11} = 1 \cdot 4 + 2 \cdot 5 = 14,

(AB)_{12} = 1 \cdot 0 + 2 \cdot 1 = 2,

(AB)_{21} = 3 \cdot 4 + (-1) \cdot 5 = 7,

(AB)_{22} = 3 \cdot 0 + (-1) \cdot 1 = -1.

因此

AB = \begin{bmatrix} 14 & 2 \\ 7 & -1 \end{bmatrix}.

矩阵乘向量就是方程组语言

若 x 是列向量，那么 Ax 只是矩阵乘法的特例，但它刚好把线性方程组的左边全部打包起来。

对

A = \begin{bmatrix} 1 & 2 & -1 \\ 3 & -1 & 5 \end{bmatrix}, \qquad x = \begin{bmatrix} x_1 \\ x_2 \\ x_3 \end{bmatrix},

有

Ax = \begin{bmatrix} x_1 + 2x_2 - x_3 \\ 3x_1 - x_2 + 5x_3 \end{bmatrix}.

所以 $Ax = b$ 并不是纯粹缩写，而是把整个方程组写成一个矩阵乘积。

单位矩阵是刻意“什么也不改变”的矩阵

定义

单位矩阵

对每个正整数 n， $I_n$ 表示 $n \times n$ 单位矩阵：主对角线上全是 1，其余位置全是 0。

例如

I_2 = \begin{bmatrix} 1 & 0 \\ 0 & 1 \end{bmatrix}, \qquad I_3 = \begin{bmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{bmatrix}.

单位矩阵之所以重要，是因为它对任何大小相容的矩阵都不起改变作用：

AI_n = A, \qquad I_m A = A.

例题

为什么乘上单位矩阵不会改变矩阵

若

A = \begin{bmatrix} 2 & -1 \\ 4 & 3 \end{bmatrix},

则

AI_2 = \begin{bmatrix} 2 & -1 \\ 4 & 3 \end{bmatrix} \begin{bmatrix} 1 & 0 \\ 0 & 1 \end{bmatrix} = \begin{bmatrix} 2 & -1 \\ 4 & 3 \end{bmatrix}.

因为 $I_2$ 的第一列会抽出 $A$ 的第一列，第二列会抽出 $A$ 的第二列。

这正是往后定义逆矩阵的原因：若 $A^{-1}$ 存在，就要求 $AA^{-1} = I$ 。

乘法一般不交换

线性代数最早令学生不习惯的地方之一，就是

AB \ne BA

一般并不成立。

有时两个乘积都定义，但结果不同；有时其中一个有定义，另一个根本未定义。所以次序同时影响“能不能做”与“做出来是什么”。

下面的图可以帮你直接看到：一个输出元素，是如何由一行与一列构成的。

边读边试

跟着看一格矩阵乘法

互动工具会在你改变 A 与 B 的元素时，即时更新 AB 的每一格。

结果

8	9
3	4

8 = 1×2 + 2×3

用列的观点去读乘积

除了逐格计算之外，矩阵乘法还有另一种非常重要的读法。

如果把 $B$ 的列写成

B = [b_1\ b_2\ \cdots\ b_p],

那么就有

AB = [Ab_1\ Ab_2\ \cdots\ Ab_p].

也就是说，乘积的每一列，都可以理解成 $A$ 乘上 $B$ 的对应列向量。

矩阵乘法其实表示复合

矩阵乘法不是随手规定出来的公式，而是用来表达线性映射复合的规则。

如果向量 x 先被送到 Bx，再将结果送到 A(Bx)，那么整体作用就是

(AB)x.

所以内侧大小一定要匹配，因为第一个变换的输出，必须是第二个变换可以接收的输入。

定理

结合律对应重复复合

只要相关乘积有定义，就有

A(BC) = (AB)C.

所以一串矩阵乘积可以改变分组方式，而不改变最后的线性变换。

标准基向量解释为什么列的观点这么自然

在 $R^n$ 中， $e_k$ 是第 k 个位置等于 1、其余位置都为 0 的向量。如果 $A$ 是 $m \times n$ 矩阵，那么 $Ae_k$ 就恰好是 $A$ 的第 k 列。

因此单位矩阵一点都不神秘。 $I_n$ 的各列就是 $e_1, e_2, \ldots, e_n$ ，所以右乘 $I_n$ ，其实就是逐列把 $A$ 自己原封不动地重建出来。

同一个 sanity check 也适用于零矩阵。如果右边矩阵每一列都是零向量，那么乘积的每一列也都会变成零向量，所以任何大小相容的 A0 都一定是零矩阵。

最先要记住的代数法则

当乘法有定义之后，下一步就要问：它和你已经熟悉的其他矩阵运算如何配合。

只要大小相容，矩阵乘法满足

A(B + C) = AB + AC, \qquad (A + B)C = AC + BC,

而纯量也可以移进移出：

(cA)B = c(AB) = A(cB).

零矩阵是最简单的 sanity check。若 0 是大小相容的零矩阵，就有

A0 = 0, \qquad 0A = 0.

原因是：行乘列时只要其中一边全是零，所有输出元素都只能是零。

这些法则虽然基础，但后面谈逆矩阵、block 计算和更长乘积推理时都会默认使用。如果不把它们明确掌握，后面的长计算会很难核对。

从练习题看出主要陷阱

矩阵代数的 assignment 题通常不只是测试算术。当乘积里面出现未知元素时，题目往往同时要求你读懂大小、知道哪一行和哪一列决定某个输出元素，并记得矩阵因子通常不能互相调换。

例题

由部分已知乘积反推出未知数

令

A = \begin{bmatrix} 1 & 2 & 1 & 3 \\ 1 & 0 & 2 & 1 \end{bmatrix}, \qquad B = \begin{bmatrix} a & b \\ 1 & 1 \\ b & a \\ 1 & 2 \end{bmatrix}.

假设

AB = \begin{bmatrix} 1 & c \\ 3 & d \end{bmatrix}.

乘积有定义，因为 $A$ 是 $2 \times 4$ ， $B$ 是 $4 \times 2$ ，所以 AB 必定是 $2 \times 2$ 。只计算需要比较的元素，可得

AB = \begin{bmatrix} a+b+5 & a+b+8 \\ a+2b+1 & 2a+b+2 \end{bmatrix}.

把第一列与已知矩阵比较，得到

a+b+5=1, \qquad a+2b+1=3.

因此

a+b=-4, \qquad a+2b=2.

第二条减第一条得到 $b=6$ ，再代入得到 $a=-10$ 。余下元素是

c=a+b+8=4, \qquad d=2a+b+2=-12.

这类题目的重点，不是把所有元素都盲目乘出来，而是抽出已知乘积元素所强制的少数方程。

例题

展开乘积时不要假设矩阵可交换

令 $A$ 与 $B$ 是同大小方阵。则

(5A-B)(2A+3B) = 5A(2A+3B)-B(2A+3B).

继续分配右边因子：

5A(2A+3B)-B(2A+3B) =10A^2+15AB-2BA-3B^2.

中间两项是 15AB 与 $-2BA$ 。除非已知 $AB=BA$ ，否则不能把它们合并成 13AB。

同一个警告也解释了常见错误：

(A+B)(A-B) =A^2-AB+BA-B^2.

只有在额外知道 $AB=BA$ 时，这才等于 $A^2-B^2$ 。实数代数会遮住这个问题，因为实数乘法可交换；矩阵代数不会。

定理

下三角矩阵在乘法下封闭

一个 $3 \times 3$ 下三角矩阵具有以下形状：

\begin{bmatrix} * & 0 & 0 \\ * & * & 0 \\ * & * & * \end{bmatrix}.

若 $A$ 与 $B$ 都是 $3 \times 3$ 下三角矩阵，则 AB 仍然是下三角矩阵。

可以用一次明确计算看出原因。写

A = \begin{bmatrix} a_1 & 0 & 0 \\ b_1 & c_1 & 0 \\ d_1 & e_1 & f_1 \end{bmatrix}, \qquad B = \begin{bmatrix} a_2 & 0 & 0 \\ b_2 & c_2 & 0 \\ d_2 & e_2 & f_2 \end{bmatrix}.

则

AB = \begin{bmatrix} a_1a_2 & 0 & 0 \\ b_1a_2+c_1b_2 & c_1c_2 & 0 \\ d_1a_2+e_1b_2+f_1d_2 & e_1c_2+f_1e_2 & f_1f_2 \end{bmatrix}.

对角线上方的元素保持为零，因为那些行乘列的和式中，每一项都会被左边或右边其中一个上方零项杀掉。这是一个“形状性质”被矩阵乘法保留的好例子。

例题

零乘积不代表其中一个因子必定为零

令

A = \begin{bmatrix} 1 & -1 \end{bmatrix}, \qquad B = \begin{bmatrix} 1 \\ 1 \end{bmatrix}.

两个矩阵都不是零矩阵，但

AB = \begin{bmatrix} 1 \cdot 1 + (-1) \cdot 1 \end{bmatrix} = \begin{bmatrix} 0 \end{bmatrix}.

所以矩阵乘法与实数乘法不同： $AB = 0$ 并不推出 $A = 0$ 或 $B = 0$ 。

定理

单位矩阵是唯一的

如果 $E$ 是一个 $n \times n$ 矩阵，而且对每个相容的 $n \times n$ 矩阵 $A$ 都满足

EA = A \qquad \text{and} \qquad AE = A,

那么就一定有 $E = I_n$ 。

证明

为什么不可能存在第二个单位矩阵

常见错误

矩阵乘法不是逐项相乘

$(AB)_{ik}$ 不是 $a_{ik}b_{ik}$ 。它来自 $A$ 的第 i 行与 $B$ 的第 k 列。

常见错误

一个方向可乘，不代表反方向也可乘

若 $A$ 是 $2 \times 3$ 、 $B$ 是 $3 \times 4$ ，则 AB 有定义，但 BA 没有。不要自动把顺序反过来。

常见错误

列的观点是看右边因子的列

如果 $B=[b_1\ b_2]$ ，则 $AB=[Ab_1\ Ab_2]$ 。乘积的各列是 $A$ 的列的线性组合，而权重来自 $B$ 的对应列。不要写成 $AB=[a_1b_1\ a_2b_2]$ ；这并不符合矩阵乘法的定义。

常见错误

二项式公式需要可交换假设

公式 $(A+B)^2=A^2+2AB+B^2$ 对矩阵不是自动成立。真正展开是

(A+B)^2=A^2+AB+BA+B^2.

只有在 $AB=BA$ 时，才可以把中间两项合并。

快速检查

若 $A$ 是 $2 × 3$ 、 $B$ 是 $3 × 5$ ，那么 `AB` 的大小是什么？

先检查内侧大小，再读外侧大小。

解答

答案

快速检查

把一个大小相容的矩阵乘上 $I_n$ ，会发生什么？

用一句话回答。

解答

答案

快速检查

如果 $B$ 的列向量是 $b_1$ 和 $b_2$ ，怎样读 `AB` 的各列？

请用列的观点回答。

解答

答案

快速检查

展开 $(5A-B)(2A+3B)$ 时，`BA` 的系数是多少？

请把 AB 与 BA 当作不同项处理。

解答

答案

练习

快速检查

为什么 $Ax = 0$ 不论 $A$ 是什么，都至少有一个解？

把 x 看成列向量来回答。

解答

引导解答

快速检查

为什么有时 `AB` 有定义，但 `BA` 却没有定义？

请用内侧大小条件作答。

解答

引导解答

快速检查

令 $A$ 、 $B$ 为上面含未知数的 worked example 中的矩阵。若 `AB` 的第一列是 $[1,3]^T$ ，求 `a` 和 `b`。

只使用第一列给出的方程。

解答

引导解答

快速检查

为什么两个 $3 × 3$ 下三角矩阵的乘积仍是下三角矩阵？

不需要把所有元素乘出来；请解释对角线上方的元素为何保持为零。

解答

3.1 矩阵乘法与单位矩阵

MATH1030：线性代数 I

为什么矩阵乘法比加法微妙

矩阵乘积何时有定义

行乘列规则

矩阵乘法

细算一个矩阵乘积

矩阵乘向量就是方程组语言

单位矩阵是刻意“什么也不改变”的矩阵

单位矩阵

为什么乘上单位矩阵不会改变矩阵

乘法一般不交换

跟着看一格矩阵乘法

用列的观点去读乘积

矩阵乘法其实表示复合

结合律对应重复复合

标准基向量解释为什么列的观点这么自然

最先要记住的代数法则

从练习题看出主要陷阱

由部分已知乘积反推出未知数

展开乘积时不要假设矩阵可交换

下三角矩阵在乘法下封闭

零乘积不代表其中一个因子必定为零

单位矩阵是唯一的

为什么不可能存在第二个单位矩阵

常见错误

矩阵乘法不是逐项相乘

一个方向可乘，不代表反方向也可乘

列的观点是看右边因子的列

二项式公式需要可交换假设

快速检查

若 AAA 是 2×32 × 32×3、BBB 是 3×53 × 53×5，那么 AB 的大小是什么？

答案

把一个大小相容的矩阵乘上 InI_nIn​，会发生什么？

答案

如果 BBB 的列向量是 b1b_1b1​ 和 b2b_2b2​，怎样读 AB 的各列？

答案

展开 (5A−B)(2A+3B)(5A-B)(2A+3B)(5A−B)(2A+3B) 时，BA 的系数是多少？

答案

练习

为什么 Ax=0Ax = 0Ax=0 不论 AAA 是什么，都至少有一个解？

引导解答

为什么有时 AB 有定义，但 BA 却没有定义？

引导解答

令 AAA、BBB 为上面含未知数的 worked example 中的矩阵。若 AB 的第一列是 [1,3]T[1,3]^T[1,3]T，求 a 和 b。

引导解答

为什么两个 3×33 × 33×3 下三角矩阵的乘积仍是下三角矩阵？

引导解答

相关笔记

本节掌握 checkpoint

先备知识

本单元重点词汇

Premium learning add-ons

本系列更多笔记

若 $A$ 是 $2 × 3$ 、 $B$ 是 $3 × 5$ ，那么 `AB` 的大小是什么？

把一个大小相容的矩阵乘上 $I_n$ ，会发生什么？

如果 $B$ 的列向量是 $b_1$ 和 $b_2$ ，怎样读 `AB` 的各列？

展开 $(5A-B)(2A+3B)$ 时，`BA` 的系数是多少？

为什么 $Ax = 0$ 不论 $A$ 是什么，都至少有一个解？

为什么有时 `AB` 有定义，但 `BA` 却没有定义？

令 $A$ 、 $B$ 为上面含未知数的 worked example 中的矩阵。若 `AB` 的第一列是 $[1,3]^T$ ，求 `a` 和 `b`。

为什么两个 $3 × 3$ 下三角矩阵的乘积仍是下三角矩阵？