Evanalysis
3.5预计阅读时间: 5 分钟

3.5 分块矩阵

把大矩阵切成较小区块,然后以区块为单位做熟悉的运算。

课程目录

MATH1030:线性代数 I

线性代数笔记。

37

当矩阵变大时,若你仍然逐个元素去看,主线很容易被淹没。分块矩阵的作 用,就是让你把一个大矩阵视为由几个较小子矩阵组成的结构。

这并没有改变数学内容,只是把你观察结构的层次提升了一级。

先有直觉:一个大矩阵,几个小部分

分块矩阵首先来自“分割”。你在矩阵中画出水平线与垂直线,把原矩阵切成 几个较小的子矩阵,这些子矩阵便称为区块。

关键是:这些区块不是随便画出来的。它们之所以有用,是因为大小之间配 合得好。

当分割固定之后,你很多时候可以把加法、标量乘法,甚至乘法,都改用 “整块对整块”的方式去写。

定义

定义

分块矩阵

分块矩阵是把一个矩阵切分成几个较小长方形子矩阵后得到的表示方式。

只有当两个分块矩阵拥有相同的分割方式时,才可以逐块相加或逐块相减。

而分块乘法之所以可行,是因为各个区块的大小仍然满足普通矩阵乘法所要 求的内侧配对条件。

为什么分割方式本身很重要

初学者常会以为:只要两个大矩阵整体大小相同,就一定能逐块相加。这是 不对的。

除了整体大小之外,分割方式也一定要一致。若一个矩阵把行分成 2+32 + 3, 另一个则分成 1+41 + 4,即使它们同样都是 5×55 × 5,那些区块也不会一一 对应。

所以处理分块矩阵时,你要同时检查两层:

  1. 整体矩阵的大小;
  2. 每一个区块的大小与排列。

例子

例题

读懂 2 × 2 分块乘法公式

A=[A11A12A21A22],B=[B11B12B21B22].A = \begin{bmatrix} A_{11} & A_{12} \\ A_{21} & A_{22} \end{bmatrix}, \qquad B = \begin{bmatrix} B_{11} & B_{12} \\ B_{21} & B_{22} \end{bmatrix}.

若区块大小相容,则

AB=[A11B11+A12B21A11B12+A12B22A21B11+A22B21A21B12+A22B22].AB = \begin{bmatrix} A_{11}B_{11} + A_{12}B_{21} & A_{11}B_{12} + A_{12}B_{22} \\ A_{21}B_{11} + A_{22}B_{21} & A_{21}B_{12} + A_{22}B_{22} \end{bmatrix}.

这个公式看起来和普通 2×22 × 2 矩阵乘法完全一样,只不过这里每一个“元 素”都变成了一整个子矩阵。

为什么分块乘法有用

分块乘法不是一个新的代数世界。它其实只是把普通矩阵乘法写得更有组织。

它之所以有价值,是因为它能帮你:

  • 把变量分成几组;
  • 把相关的行与列留在一起;
  • 在较大的计算中重用熟悉的小结构。

之后你会常见到这种情况:某个大矩阵自然分成系数块、单位块,或不同部 分的变换块。若不用分块语言,式子会变得很乱。

常见错误

常见错误

以为任何分割都可以

分块公式只有在区块大小相容时才成立。分割方式不是装饰,而是公式能否 成立的前提。

常见错误

忘记分块运算仍然服从普通大小规则

A12B21A_{12}B_{21} 这样的区块乘积,仍然要满足普通矩阵乘法的内侧大小 配对要求。分块视角并不会取消原本的规则。

快速检查

快速检查

为什么两个分块矩阵要有相同分割方式,才能逐块相加?

请在答案中使用“对应区块”四个字。

解答

答案

快速检查

2 × 2 分块乘法公式的核心想法是什么?

不要计算,只要描述它的模式。

解答

答案

练习

快速检查

请解释:为什么分块乘法本质上仍然是普通矩阵乘法?

答案中请用到“同一条规则”。

解答

引导解答

快速检查

若两个 4×44 × 4 矩阵的分割方式不同,可以逐块相加吗?为什么?

请用一至两句回答。

解答

引导解答

相关笔记

若普通矩阵乘法的模式仍未稳固,可先回看 3.2 矩阵乘法与线性方程组

若你准备好把矩阵结构连到可逆性,可接着读 5.1 可逆矩阵

本单元重点词汇

Premium learning add-ons

Core notes stay free. Advanced exercises, video explanations, and premium exports are available through paid plans.