【科普】行列式为什么表示N维体积?

  1. 2月前
    2月前桃李 重新编辑

    行列式的定义,和它的几何意义之间的联系并不是很明显.
    本文将讲解说明,为什么把 N 维空间中由 N 个向量张成的图形的 N 维体积定义为行列式的值是合理的.
    传统线性代数课程是从行列式开始讲的, 而行列式这个定义就好似天上掉下来一般地莫名其妙. 如果去查为什么会有这样的定义, 网上各路科普就会拿出2维, 3维欧氏空间来证明, 行列式的绝对值为什么同体积相等, blahblahblah, ...
    可是这样的解释并不能令人满意, 问题有以下三点:
    (1) 证明行列式和体积相等的方法往往是硬算, 毫无启发性
    (2) 这样的解释都局限在低维空间中, 无法向高维推广
    (3) 这样的解释都局限在欧式空间中, 而行列式与内积无关
    我们可以循序渐进地先来考虑一下 (1)(2) 要如何解决, 暂时先不管 (3). 如果想要让行列式的定义和它在欧氏空间中的几何意义联结地更加清楚明暸, 应该怎样做?
    首先考虑二阶行列式. 设欧氏空间中有向量 \(\mathbf{v} = (a,b)\), \(\mathbf{w} = (c,d)\), 问 \(\mathbf{v}\) 和 \(\mathbf{w}\) 所张成的平行四边形的面积有多大? 是否等于行列式 \(\mathrm{det}(\mathbf{v},\mathbf{w})\) 的值?
    李尚志《线性代数》给出了这样一种做法:
    把 \(\mathbf{v}\) 和 \(\mathbf{w}\) 的起点都移到平面上某个点 \(A\) 上, 设它们的终点分别为 \(B, C\). 此时有 \(\overrightarrow{AB}=\mathbf{v}=(a,b)\), \(\overrightarrow{AC}=\mathbf{w}=(c,d)\).
    couple-product.png
    将 \(\overrightarrow{AB}\) 逆时针旋转 \(90^{\circ}\), 得到 \(\overrightarrow{AB'}=(-b,a)\).
    于是有
    \[
                  \begin{aligned}
                  & 两个向量所张平行四边形的面积 \\
                  =\; & 底AB \times 底AB上的高 \\
                  =\; & |AB| \times AC在AB'上的投影 \\
                  =\; & |AB'| \times AC在AB'上的投影 \\
                  =\; & |\overrightarrow{AB'} \cdot \overrightarrow{AC}| \\
                  =\; & |(-b,a) \cdot (c, d)| \\
                  =\; & |-bc+ad| \\
                  =\; & |ad-bc|
                  \end{aligned}
    \]
    可见, 所求面积与行列式的绝对值相等.
    上面这个做法给我们一个提示: 在欧氏空间中, 可利用内积来构建行列式.
    两个向量张成的一个平行四边形的体积, 可以通过最基本的体积公式 \(底 \times 高\) 来求出. 具体的操作是, 先取出一个向量作为(斜)高, 剩下的向量作为底. 构造出一个与底垂直的向量, 它的长正好与底边的长相等, 再用它去同斜高做内积, 就得到了面积.
    顺着这个思路继续思考, 假如维数要上升, 怎么办? 现在换成了三个向量张成的一个平行六面体, 要求它的体积, 怎么做?
    triple-product.png
    我们也先取一个向量做为斜高, 剩下的向量作为底. 类比一下就知道, 现在需要构造一个与底面垂直的向量, 并且它的长正好等于底面积. 拿这个向量同斜高做内积就可以得到体积. 于是很自然地想到, 这个需要构造的向量, 正是底边两个向量的外积(叉积). 这样算得的体积应该会等于这三个向量拼成的三阶行列式的绝对值. 计算过程这里就不细说了.
    三维的问题解决了. 顺着这个思路, 能不能把任意维数都解决呢? 假使现在有 \(N\) 个 \(N\) 维向量张成了一个平行???面体, 要求它的 \(N\) 维体积, 怎么做? 如果按照之前的思路, 取高再取底的话, 那么怎样构造一个向量, 使之垂直于给定的 \(N-1\) 个向量, 大小又要等于这 \(N-1\) 个向量张成的 \(N-1\) 维体积? 换句话说就是要怎样推广外积, 把外积的定义扩展到一般的 \(N\) 维欧氏空间中? 如果成功的话, 我们就能用 \(N-1\) 维体积定义 \(N\) 维体积, 即用 \(N-1\) 阶行列式定义 \(N\) 阶行列式. 如果你真的去这样尝试了, 就会发现这个定义其实和 Laplace 展开完全是一回事.
    然而, 推广外积并非那么容易, 即便费九牛二虎之力推广成功了, 得到的结果也只能局限在欧氏空间中, 所以并不是很划算.
    现在我们来转换一下思路, 从欧氏空间的小圈子里跳出来, 考虑一下一般的向量空间. 如果我们能在一般的空间中解决问题 (1), 问题 (2)(3) 也就被自然地解决了.
    那么要解决问题 (1), 另一个新问题马上迎面而来: 一般的向量空间中的体积到底是什么东西? 没有几何背景, 如何讨论体积?
    其实并不是非要有几何背景才能讨论体积. 如果某个抽象的东西能够满足体积应有的一切性质, 我们也可以把它称为体积. 于是我们接下来要做的就是, 找到体积应该满足的性质, 然后证明行列式满足这些性质, 并且满足这些性质的概念也只有行列式.
    我们把 \(N\) 维向量空间中的 \(N\) 个向量 \(\mathbf{v}_1, \mathbf{v}_2, \cdots, \mathbf{v}_n\) 所张成 \(N\) 维形体的 \(N\) 维有向体积记作 \(\mathrm{vol}(\mathbf{v}_1, \mathbf{v}_2, \cdots, \mathbf{v}_N)\), 并把 \(\mathrm{vol}\) 这个函数称为体积函数. 如果这个函数名副其实的话, 它必须满足以下性质:
    (1) \(\mathrm{vol}(\cdots, k \mathbf{v}_i,\cdots) = k\;\cdot\mathrm{vol}(\cdots, \mathbf{v}_i,\cdots)\)
    (2) \(\mathrm{vol}(\cdots, \mathbf{v}_i+\mathbf{u}, \cdots) = \mathrm{vol}(\cdots, \mathbf{v}_i,\cdots) + \mathrm{vol}(\cdots, \mathbf{u},\cdots)\)
    (3) 若 \(i \neq j\), \(\mathbf{v}_i=\mathbf{v}_j\), 则必有 \(\mathrm{vol}(\cdots, \mathbf{v}_i, \cdots, \mathbf{v}_j,\cdots) = 0\)
    解释:
    (1) 在这 \(N\) 个向量中, 任何一个向量都可做斜高(同时让其余向量做底). 把斜高伸展 \(k\) 倍, 体积必伸展 \(k\) 倍, 否则就很难把这个函数称为体积函数. 此时 \(k\) 可以是任意标量, 它不一定是正数, 因为在一般的域中没办法定义什么是正数. 同理, 体积也不一定是正数, 于是在实数域上这里所定义的体积就变成了有向体积.
    (2) 在这 \(N\) 个向量中, 任何一个向量都可做斜高(同时让其余向量做底). 我们知道, 面积等于高乘以底, 其中高是斜高在某个方向的投影, 并且投影是可加的, 即两个向量之和的投影等于两个向量的投影之和. 设向量 \(\mathbf{x}\) 在高上的投影为 \(\mathrm{p}(\mathbf{x})\), 则有:
    \[
                        \begin{aligned}
                        & \mathrm{vol}(\cdots, \mathbf{v}_i+\mathbf{u}, \cdots) \\
                        =\; & \mathrm{p}(\mathbf{v}_i+\mathbf{u}) \times 底 \\
                        =\; & \left ( \mathrm{p}(\mathbf{v}_i) + \mathrm{p}(\mathbf{u}) \right ) \times 底 \\
                        =\; & \mathrm{p}(\mathbf{v}_i) \times 底 + \mathrm{p}(\mathbf{u}) \times 底 \\
                        =\; & \mathrm{vol}(\cdots, \mathbf{v}_i,\cdots) + \mathrm{vol}(\cdots, \mathbf{u}, \cdots)
                        \end{aligned}
    \]
    简单地说就是「高相加则体积相加」. 如果这条性质不成立, 也是很难把这个函数称为体积函数的.
    (3) 如果这 \(N\) 个向量中有两个向量是相等的, 那么这 \(N\) 个向量就线性相关了, 它们最多张成一个 \(N-1\) 维形体, 而绝不可能张成一个 \(N\) 维形体. 因此, 它们所张成的形体的 \(N\) 维体积必然为零, 就好比点和线段都没有面积, 平面图形没有(3维)体积一样. 否则, 体积函数就名不副实了.
    此外, 从以上三条性质还可推出另一条关键性质:
    \[
                \forall\;i,j,\; \mathrm{vol}(\cdots, \mathbf{v}_i, \cdots, \mathbf{v}_j, \cdots) + \mathrm{vol}(\cdots, \mathbf{v}_j, \cdots, \mathbf{v}_i, \cdots) = 0
    \]
    即: 交换两个向量的位置得到的新体积是原体积的相反数(加法负元). 这是不是跟行列式很接近了? 我们来看看这个性质为何会成立:
    \[
                \begin{aligned}
                & \mathrm{vol}(\cdots, {\color{{Red}}\mathbf{{v}}_i}, \cdots, {\color{{Blue}}\mathbf{{v}}_j}, \cdots) + \mathrm{vol}(\cdots, {\color{{Blue}}\mathbf{{v}}_j}, \cdots, {\color{{Red}}\mathbf{{v}}_i}, \cdots) \\
                =\;& +\mathrm{vol}(\cdots, {\color{{Red}}\mathbf{{v}}_i}, \cdots, {\color{{Blue}}\mathbf{{v}}_j}, \cdots) + 0 \\
                & + \mathrm{vol}(\cdots, {\color{{Blue}}\mathbf{{v}}_j}, \cdots, {\color{{Red}}\mathbf{{v}}_i}, \cdots) + 0 \\
                =\;& +\mathrm{vol}(\cdots, {\color{{Red}}\mathbf{{v}}_i}, \cdots, {\color{{Blue}}\mathbf{{v}}_j}, \cdots) + \mathrm{vol}(\cdots, {\color{{Red}}\mathbf{{v}}_i}, \cdots, {\color{{Red}}\mathbf{{v}}_i}, \cdots) \\
                & + \mathrm{vol}(\cdots, {\color{{Blue}}\mathbf{{v}}_j}, \cdots, {\color{{Red}}\mathbf{{v}}_i}, \cdots) + \mathrm{vol}(\cdots, {\color{{Blue}}\mathbf{{v}}_j}, \cdots, {\color{{Blue}}\mathbf{{v}}_j}, \cdots) \\
                =\;& +\mathrm{vol}(\cdots, {\color{{Red}}\mathbf{{v}}_i}, \cdots, {\color{{Blue}}\mathbf{{v}}_j}+{\color{{Red}}\mathbf{{v}}_i}, \cdots) \\
                & + \mathrm{vol}(\cdots, {\color{{Blue}}\mathbf{{v}}_j}, \cdots, {\color{{Red}}\mathbf{{v}}_i}+{\color{{Blue}}\mathbf{{v}}_j}, \cdots) \\
                =\;& \mathrm{vol}(\cdots, {\color{{Red}}\mathbf{{v}}_i}+{\color{{Blue}}\mathbf{{v}}_j}, \cdots, {\color{{Blue}}\mathbf{{v}}_j}+{\color{{Red}}\mathbf{{v}}_i}, \cdots) \\
                =\;& 0
                \end{aligned}
    \]
    可以看出, 这条性质是性质 (2) 和性质 (3) 的一个推论. 现在我们就来证明, 行列式是唯一一个满足上述所有性质的函数. 怎么证明呢? 其实我们可以通过上述性质, 直接写出体积函数的具体表达式. 如此一来体积函数当然也就唯一确定了.
    简单起见我们先从2维向量空间入手. 设二维向量空间有一组基底 \((\mathbf{x}, \mathbf{y})\), 那么这个向量空间中的任何向量都可以写成 \(\mathbf{x}\) 和 \(\mathbf{y}\) 的线性组合. 因为讨论体积总要有个单位, 我们这里就假定 \(\mathrm{vol}(\mathbf{x}, \mathbf{y}) = 1\). 设
    \[
                \begin{aligned}
                \mathbf{v} &= (a,b) = a \mathbf{x} + b \mathbf{y} \\
                \mathbf{w} &= (c,d) = c \mathbf{x} + d \mathbf{y}
                \end{aligned}
    \]
    则有
    \[
                \begin{aligned}
                & \mathrm{vol}(\mathbf{v},\mathbf{w}) \\
                =\;& \mathrm{vol}(a \mathbf{x} + b \mathbf{y}, c \mathbf{x} + d \mathbf{y}) \\
                =\;& \mathrm{vol}(a \mathbf{x}, c \mathbf{x} + d \mathbf{y}) + \mathrm{vol}(b \mathbf{y}, c \mathbf{x} + d \mathbf{y}) \\
                =\;& \mathrm{vol}(a \mathbf{x}, d \mathbf{y}) + \mathrm{vol}(b \mathbf{y}, c \mathbf{x}) \\
                =\;& ad\cdot\mathrm{vol}(\mathbf{x}, \mathbf{y}) + bc\cdot\mathrm{vol}(\mathbf{y}, \mathbf{x}) \\
                =\;& ad\cdot\mathrm{vol}(\mathbf{x}, \mathbf{y}) - bc\cdot\mathrm{vol}(\mathbf{x}, \mathbf{y}) \\
                =\;& (ad-bc)\cdot\mathrm{vol}(\mathbf{x}, \mathbf{y}) \\
                =\;& ad-bc
                \end{aligned}
    \]

    \[
                \mathrm{vol}\left(
                \begin{bmatrix}a\\b\end{bmatrix},
                \begin{bmatrix}c\\d\end{bmatrix}
                \right)
                = \begin{vmatrix}
                a & c\\
                b & d
                \end{vmatrix}
    \]
    其实无非就是把体积函数根据性质 (1)(2) 展开, 然后再根据交换变号的性质, 把逆序的 \(\mathrm{vol}(\mathbf{y}, \mathbf{x})\) 转换成了自然顺序的 \(\mathrm{vol}(\mathbf{x}, \mathbf{y})\)(已知), 从而求出结果.
    再看一般的3维向量空间. 设三维向量空间中有基底 \((\mathbf{x},\mathbf{y},\mathbf{z})\), 并且 \(\mathrm{vol}(\mathbf{x},\mathbf{y},\mathbf{z})=1\). 设有向量
    \[
                \begin{aligned}
                \mathbf{u} &= (a,b,c) = a \mathbf{x} + b \mathbf{y} + c \mathbf{z} \\
                \mathbf{v} &= (d,e,f) = d \mathbf{x} + e \mathbf{y} + f \mathbf{z} \\
                \mathbf{w} &= (g,h,i) = g \mathbf{x} + h \mathbf{y} + i \mathbf{z}
                \end{aligned}
    \]
    则有
    \[
                \begin{aligned}
                & \mathrm{vol}(\mathbf{u},\mathbf{v},\mathbf{w}) \\
                =\;& \mathrm{vol}(a\mathbf{x}+b\mathbf{y}+c\mathbf{z},d\mathbf{x}+e\mathbf{y}+f\mathbf{z},g\mathbf{x}+h\mathbf{y}+i\mathbf{z}) \\
                =\;& + \mathrm{vol}(a\mathbf{x},e\mathbf{y}+f\mathbf{z},h\mathbf{y}+i\mathbf{z}) \\
                & + \mathrm{vol}(b\mathbf{y},d\mathbf{x}+f\mathbf{z},g\mathbf{x}+i\mathbf{z}) \\
                & + \mathrm{vol}(c\mathbf{z},d\mathbf{x}+e\mathbf{y},g\mathbf{x}+h\mathbf{y}) \\
                =\;& + a\cdot\mathrm{vol}(\mathbf{x},e\mathbf{y}+f\mathbf{z},h\mathbf{y}+i\mathbf{z}) \\
                & + b\cdot\mathrm{vol}(\mathbf{y},d\mathbf{x}+f\mathbf{z},g\mathbf{x}+i\mathbf{z}) \\
                & + c\cdot\mathrm{vol}(\mathbf{z},d\mathbf{x}+e\mathbf{y},g\mathbf{x}+h\mathbf{y}) \\
                =\;& + a \cdot (
                \mathrm{vol}(\mathbf{x},e\mathbf{y},i\mathbf{z})
                + \mathrm{vol}(\mathbf{x},f\mathbf{z},h\mathbf{y})
                ) \\
                & + b \cdot (
                \mathrm{vol}(\mathbf{y},d\mathbf{x}+i\mathbf{z})
                + \mathrm{vol}(\mathbf{y},f\mathbf{z},g\mathbf{x})
                ) \\
                & + c \cdot (
                \mathrm{vol}(\mathbf{z},d\mathbf{x},h\mathbf{y})
                + \mathrm{vol}(\mathbf{z},e\mathbf{y},g\mathbf{x})
                ) \\
                =\;& + a \cdot (
                ei \cdot \mathrm{vol}(\mathbf{x},\mathbf{y},\mathbf{z})
                + fh \cdot \mathrm{vol}(\mathbf{x},\mathbf{z},\mathbf{y})
                ) \\
                & + b \cdot (
                di \cdot \mathrm{vol}(\mathbf{y},\mathbf{x},\mathbf{z})
                + fg \cdot \mathrm{vol}(\mathbf{y},\mathbf{z},\mathbf{x})
                ) \\
                & + c \cdot (
                dh \cdot \mathrm{vol}(\mathbf{z},\mathbf{x},\mathbf{y})
                + eg \cdot \mathrm{vol}(\mathbf{z},\mathbf{y},\mathbf{x})
                ) \\
                =\;& + a \cdot (
                ei \cdot \mathrm{vol}(\mathbf{x},\mathbf{y},\mathbf{z})
                - fh \cdot \mathrm{vol}(\mathbf{x},\mathbf{y},\mathbf{z})
                ) \\
                & + b \cdot (
                di \cdot \mathrm{vol}(\mathbf{y},\mathbf{x},\mathbf{z})
                - fg \cdot \mathrm{vol}(\mathbf{y},\mathbf{x},\mathbf{z})
                ) \\
                & + c \cdot (
                dh \cdot \mathrm{vol}(\mathbf{z},\mathbf{x},\mathbf{y})
                - eg \cdot \mathrm{vol}(\mathbf{z},\mathbf{x},\mathbf{y})
                ) \\
                =\;&
                + aei \cdot \mathrm{vol}(\mathbf{x},\mathbf{y},\mathbf{z})
                - afh \cdot \mathrm{vol}(\mathbf{x},\mathbf{y},\mathbf{z})
                \\
                &
                - bdi \cdot \mathrm{vol}(\mathbf{x},\mathbf{y},\mathbf{z})
                + bfg \cdot \mathrm{vol}(\mathbf{x},\mathbf{y},\mathbf{z})
                \\
                &
                + cdh \cdot \mathrm{vol}(\mathbf{x},\mathbf{y},\mathbf{z})
                - ceg \cdot \mathrm{vol}(\mathbf{x},\mathbf{y},\mathbf{z})
                \\
                =\;&
                + aei - afh
                \\
                &
                - bdi + bfg
                \\
                &
                + cdh - ceg
                \\
                \end{aligned}
    \]

    \[
                \mathrm{vol}\left(
                \begin{bmatrix} a\\b\\c \end{bmatrix},
                \begin{bmatrix} d\\e\\f \end{bmatrix},
                \begin{bmatrix} g\\h\\i \end{bmatrix}
                \right)
                =
                \begin{vmatrix}
                a & d & g \\
                b & e & h \\
                c & f & i
                \end{vmatrix}
    \]
    三维的情况复杂了许多, 但规律是可以掌握的. 展开体积函数之后我们得到了 \(\mathrm{vol}(?,?,?)\) 的线性组合, 其中 \(?,?,?\) 是基向量 \(\mathbf{x},\mathbf{y},\mathbf{z}\) 的各种全排列. 自然顺序的 \(\mathrm{vol}(\mathbf{x},\mathbf{y},\mathbf{z})\) 是已知的, 所以要求值就只需要把每个排列通过一步一步的元素交换排回自然顺序就可以了. 如果所需的交换次数是奇数, 这一个排列所在那一项就会变号, 那一项最终的值是 \(-1\); 如果所需的交换次数是偶数次, 那么就不会变号, 那一项最终的值是 \(1\). 最终的结果就是这些 \(-1\) 和 \(1\) 的线性组合.
    有了2维和3维空间中的体积, \(n\) 维空间中体积的定义也就呼之欲出了:
    \[
                \mathrm{vol}(\mathbf{v}_1,\cdots,\mathbf{v}_n)
                =
                \left (
                \sum_{i=1}^{n!} \mathrm{sgn}(\sigma_i)\prod_{j=1}^{n} \left ( \mathbf{v}_{j} \right )_{\sigma_i(j)}
                \right) \cdot
                \mathrm{vol}(\mathbf{e}_1,\cdots,\mathbf{e}_n)
    \]
    其中
    (1) \(\sigma_i\) 是指 \(1,2,3,\cdots,n\) 的第 \(i\) 种排列(一共有 \(n!\) 种排列)
    (2) \(\mathrm{sgn}(\sigma_i)\) 取值 \(\pm 1\), 把 \(\sigma_i\) 调换回自然顺序时, 若需要奇数次元素交换, 则取值 \(-1\), 否则取值 \(+1\)
    (3) \(\sigma_i(j)\) 是指在第 \(i\) 个排列中处在第 \(j\) 个位置上的数
    (4) \((\mathbf{v}_j)_{\sigma_i(j)}\) 是指 \(\mathbf{v}_j\) 在基底 \((\mathbf{e}_1,\cdots,\mathbf{e}_n)\) 下的第 \(\sigma_i(j)\) 个座标
    如果设 \(\mathrm{vol}(\mathbf{e}_1,\cdots,\mathbf{e}_n)=1\), 那么就可以求出具体值
    \[
                \mathrm{vol}(\mathbf{v}_1,\cdots,\mathbf{v}_n)
                =
                \sum_{i=1}^{n!} \mathrm{sgn}(\sigma_i)\prod_{j=1}^{n} \left ( \mathbf{v}_{j} \right )_{\sigma_i(j)}
    \]
    可以看到, 这个定义同教科书上对 \(n\) 阶行列式的定义是全完一致的, 只是有一个细节要说明一下. 教科书上一般会用逆序对的个数的奇偶性来定义排列 \(\sigma_i\) 的符号 \(\mathrm{sgn}(\sigma_i)\), 这个定义和本文中的定义是等价的, 详情可参考维基百科 Parity_of_a_permutation#Proof_4, 此处不再赘述. 总之, 排列的符号、系数的排列组合, 这些在行列式的定义中出现的东西并非空穴来风, 它们都可以从体积应该满足的几何性质中推导出来, 没什么好奇怪的.

  2. 很久没上论坛了, 顶一下

  3. 总结一下,这个解法讲了两件事:
    1、什么是体积函数<=>它的基本性质是什么。所谓性质即定义的元思维。
    2、为什么行列式即是体积函数<=>行列式的代数性质满足上述所有几何性质的代数解释。注:即使不是唯一一个,那么也是同构的。


    这个思想(同构)也被用于罗巴切夫斯基几何的圆内模型。

  4. 原帖地址: 如何证明行列式值能表示一个平行六面体的体积?DTSIo Shao 的回答

          首先我们要说清楚什么是"体积"? 直观说来, 我们自然希望在$\mathbb{R}^n$中的一个长方体$[a_1,b_1]\times ...\times[a_n,b_n]$的体积是$(b_1-a_1)(...)(b_n-a_n)$. 这引出的就是$\mathbb{R}^n$上的标准 Lebesgue 测度. 所以要证明的说穿了是这样一件事:

          设$E$是一个由向量$v_1,...v_n$张成的平行六面体, 则其 Lebesgue 测度$|E|$恰好等于行列式$|\det(v_1,...,v_n)|$. 回忆一下, 可测集的 Lebesgue 测度定义为其外测度和内测度的公共值 (或者按照抽象测度的语言, 是长方体生成的$\sigma$代数的完备化上自然扩张出来的那个测度), 所以这个结论的证明其实并不那么直接. 注意, 我们固然可以从直观上得出"平行四边形的面积=底乘高"这种结论的推广, 但是这种纯解析几何的证明会非常复杂, 和测度论的联系表述起来也会比较繁琐. 所以这里给一个不那么解析几何的证明.

          相应地, 这个结论非常重要: 它是积分换元公式的基础. 有了这个结论, 才能够证明积分换元公式.

          我们很容易把问题归结到这n个向量线性无关的情形. 为了方便说话, 选定$\mathbb{R}^n$的一组基底$\{e_1,...e_n\}$, 并且规定 Euclidean 内积$\langle e_i,e_j\rangle=\delta_{ij}$. 下文中也不区分线性算子和它在这组基底下的矩阵. 把向量组$v_1,...v_n$记成列向量. 这样, 矩阵$A=(v_1,...v_n)$就相应于一个线性算子$A:\mathbb{R}^n\rightarrow\mathbb{R}^n$. Lebesgue 测度关于平移变换的不变性是很容易证明的, 所以我们不妨就假设平行六面体E的一个顶点(所有边的起点)都在原点处. 把取定的标准正交基底$\{e_1,...e_n\}$张成的正方体记作$I$. 这样, 有$E=A(I)$(集合论的意义下). 由于线性变换都是 Lipchitz 连续的, 所以它把可测集变到可测集.

          下面就来证明核心的结论.

          我们先来说明两件在直观上很显明的事:

          1)对于对角化算子$D=\mathrm{diag}(\lambda_1,...,\lambda_n)$, 有$|D(I)|=|\det D|$.

          2)对于正交算子$\Omega$, 有$|\Omega(E)|=|E|$, 也就是说正交算子保持测度不变.

          第一个结论容易证明, 因为算子$D=\mathrm{diag}(\lambda_1,...,\lambda_n)$代表的是伸缩 (加上反射) 变换, 因而正方体I的像实际上就是一个各边平行于坐标轴的长方体.

          第二个结论稍微困难一些. 我们回忆一下正交群可以由 (关于超平面的) 对称变换生成, 所以只需要对对称变换证明这个结论 (注意到$\det(AB)=\det A\cdot\det B$). 从测度论的标准构造, 又可以归结为对各边平行于坐标轴的正方形进行证明. 但归结到这里就很明显了.

          现在可以完成对命题本身的证明了.

          回忆一下线性算子的奇异值分解: 存在正交变换$\Omega_1,\Omega_2$和一组正数$\lambda_1,...,\lambda_n$, 使得$$
    A=\Omega_1\cdot\mathrm{diag}(\lambda_1,...,\lambda_n)\cdot\Omega_2.$$
    即线性变换可以通过找到合适的正交基底而"化归"成"伸缩". 这样, 根据行列式的性质$\det(AB)=\det A\cdot\det B$和前面证明过的两个结论, 立刻可以得到要证明的结论.

          这个证明的想法是将线性算子一步步拆分成简单算子的复合. 也许结论本身的直观意义是很明显的, 但是真正严格地证明起来还是需要用到行列式的重要性质$\det(AB)=\det A\cdot\det B$(当然, 有了这种直观意义之后, 这个式子也有了很明显的几何意义), 和正交几何以及奇异值分解的相关结论. 这也许就是数学证明和直观推演不同的地方. 当然, 几何直观为我们提供了极其重要的导引和启发.

          最后提一句纯解析几何的证明. 它也依赖于线性算子的分解, 关键的步骤是分解成准上三角方阵和正交方阵的乘积(对应着找到"底"和"高").

  5. 6周前

    artin代数和布尔巴基的代数学都是这个路子来做的,不过这篇图是最多的233~一个像体积的n元函数理应满足这几个性质,但这几个性质就已经足够决定这个函数了:只要是交换环上的有限生成自由模,把基送到幺元的n重交错线性函数就这一个~这个构造还能推出交换环都是IBN环
    关于重积分变量代换的话,梅加强的数分写的和4L的顺序一样

 

后才能发言