曲率是相邻测地线之间的作用力
本章要介绍对曲率的一个全新解释,
它在爱因斯坦关于弯曲时空的引力理论中至关重要.
这个解释的思路是观察质点以单位速率运动的两条相邻测地线轨迹的间隔,
并研究它们之间的相对加速度:
它们可能朝向彼此 (吸引), 也可能远离彼此 (排斥).
我们将会看到, 基本的结论是:
如果两条相邻的测地线轨迹穿过一个正曲率的区域, 它们就会相互吸引.
如果这两条测地线从同一个原点 o 出发, 方向略微不同,
由正曲率产生的吸引力会迫使它们重新相交于第二个交点, 这个点称为 o 的共轭点.
另外, 穿过一个负曲率区域的两条相邻测地线轨迹会相互排斥, 并加速分离.
在这两种情况下, 吸引力和排斥力都是与两条测地线的间隔成比例的,
而且这个 (局部的) 比例"常数"等于曲面在质点所在位置的曲率!
本章关注的重点不是相对速度, 而是相对加速度.
相邻测地线之间的相对加速度为 0 是平面上零曲率的一个新的表现形式.
- 雅可比方程. 在一个半径为
\(R\)
的球面上, 两个质点以单位速率从北极
\(N\)
出发, 分开它们的微小角度为
\(δ θ\).
在时刻
\(t\),
它们之间的间隔为
\(ξ = R δ θ \sin (t / R)\).
- 所以它们之间的相对加速度由雅可比方程 \(\ddot{ξ} = - \mathcal{K} ξ\) 决定.
- 在一般情况下, 就要将 \(\mathcal{K}\) 记为 \(\mathcal{K} (p)\), 即当质点沿测地线穿过曲面时, 它所在位置的曲面曲率.
- 由牛顿第二运动定律得到的运动方程与雅可比方程完全相同,
只是用弹簧的弹性系数代替了曲面的曲率:
- \(\ddot{ξ} = -kξ\), 其解为 \(ξ = ξ_0 \sin(\sqrt{k} t)\),
- 其中 \(ξ_0\) 表示最大拉伸长度, 发生在弹簧停止向下运动并开始拉回重物的时刻.
谐振子
尽管质点在曲面上自由移动, 但随着它们的间隔增加,
曲率有效地产生了一种吸引力, 就像弹簧一样.
这种神秘的曲率"力"开始减缓它们的分离速度.
随着质点的分离, 引力也成正比增加, 因此分离的速度降低得更快,
直到最后, 当质点在赤道处达到最大间隔时, 相对速度降至 0.
(这对应于弹簧被拉到最长时, 重物在最低的位置.)
这时引力最大, 开始把两条测地线往回拉, 直到它们最终相聚在南极 S,
这是它们的第二个交点, 称为 N 的共轭点.
当两个质点聚拢并相交于点 S (ξ = 0) 时, 它们达到了最大相对速度,
就像我们的弹簧振荡模型中重物在经过平衡点 ξ = 0 时达到最大速度一样.
从 N 到 S 的过程只完成了 ξ 振荡的一半,
剩下的一半在球面的背面完成, ξ 的方向现在颠倒了.
一旦质点回到 N, ξ 振荡就会重新开始, 并永远重复.
- 高斯引理.
如果从一般曲面上的一点沿所有的方向发射出质点,
让它们沿测地线走过距离
\(σ\),
它们将形成一个内蕴半径为
\(σ\)
的测地圆周
\(K(σ)\).
- 这个测地圆周 \(K(σ)\) 与它的测地线半径交于直角.
- 相对加速度 = 速度的和乐性
测地线的相对加速度可由速度向量的旋转
\(δ ψ\)
来量度, 而这正是速度向量绕
\(L\)
平行移动的
和乐性.- 简而言之, \(δ ψ = \mathcal{R} (L)\)!
黎曼曲率
- 正如我们的二维曲面局部地由它们的切平面来描述,
每个切平面都具有
\(\mathbb{R}^2\)
的结构一样,
\(n\)
维流形中紧邻一个点的局部类似于
\(\mathbb{R}^n\),
但相邻点之间的距离是用一个非欧几里得度量来量度的.
- 第一, 我们最初对二维曲面的内蕴曲率 \(\mathcal{K}(p)\) 的定义是, 当一个小测地线三角形收缩到点 \(p\) 时, 其单位面积的局部角盈:
- \(\mathcal{K}(p) = \lim_{△ \to p} \frac{\mathcal{E}(△)}{\mathcal{A}(△)}\).
- 现在我们要把这个定义扩展到 \(n\) 流形 (\(n\) 维流形的简称).
- 第二, 事实将证明, 对于
\(n\)
流形来说, 角盈是一种笨拙的工具, 无法直接察觉
\(n\)
流形更微妙的曲率. 然而,
向量绕一个收缩的小环平行移动所产生的
和乐性, 能够以一种非常直接的方式完全揭示这种更复杂的曲率结构. 显然, 定义 \(n\) 流形的曲率就必须理解这种空间中的平行移动. - 第三, 我们使用平行移动来定义在
\(n\)
流形内的内蕴 (又名
协变) 导数. 好消息是, 当用内蕴项表示时, 从 \(2\) 曲面到 \(n\) 流形的过渡不需要改变最初的定义, 只要改变记号, 把 \(D_v\) 写成 \(\nabla_v\) 就行了. - 第四是本章的核心内容: 我们利用平行移动将和乐性从二维曲面推广到 \(n\) 流形.
- 第五, 我们将弄清如何将雅可比方程推广到 \(n\) 流形.
- 第六, 我们将讨论黎曼曲率的
平均, 称为里奇曲率张量, 这是一个具有几何意义的, 特别重要的概念. 在爱因斯坦的四维弯曲时空中, 里奇张量恰有曲率的完整信息的一半 (全部 20 个分量中的 10 个).
全书正篇, 正式开始~
- \(n\)
流形的广义内蕴曲率具有
\(\frac{1}{12} n^2 (n^2 - 1)\)
个不同的分量, 需要用一个数组来表示.
- 这个用数组列阵表示的几何对象称为
黎曼张量.
- 这个用数组列阵表示的几何对象称为
在物理学家眼里, 张量就是一个可以用数组表示的物理量,
例如速度 (一阶张量) 和刚体的应变 (二阶张量).
所谓物理量就是与坐标系无关的量, 其分量
(即数组中的每个数) 在坐标变换中具有相应的规律.
在数学家眼里, 张量就是一个与坐标系无关的多重线性映射.
-- 译者注
- 我们不再假设 \(3\) 流形是欧几里得的 \(\mathbb{R}^3\); 相反, 它被赋予了一个一般的非欧几里得度量.
平行移动: 三种构作方法
-
定角锥上的最近向量 假设 \(\mathbf{w}(p)\) 与测地线 \(G\) 的夹角为 \(a\). 将 \(\mathbf{w}(p)\) 沿着 \(G\) 平行移动距离 \(ϵ\) 到达点 \(q\), 用在点 \(q\) 与 \(G\) 的夹角为 \(a\) 的向量构成锥面 \(\mathcal{C}\), 然后从中挑出端点最接近 \(\mathbf{w}(p)\) 的端点的那一个.
- 在平行移动平面内的定角 在
\(\mathbb{R}^3\)
内, 取从点
\(p\)
出发, 方向为
\(\mathbf{v}(p)\)
和
\(\mathbf{w}(p)\)
的线性组合的所有直线组成的平面
\(Π(p)\).
类似地, 在弯曲的
\(3\)
流形内, 设
\(Π(p)\)
是从点
\(p\)
出发, 方向为
\(\mathbf{v}(p)\)
和
\(\mathbf{w}(p)\)
的线性组合的所有
测地线组成的”平面”.- 当然, 该”平面”事实上是一个弯曲的 \(2\) 曲面. 注意, 因为 \(G\) 方向为 \(\mathbf{v}(p)\) 的测地线, 所以它肯定包含在这个曲面 \(Π(p)\) 内.
- 如前面的构作方法一样, 设 \(q\) 是 \(G\) 上距离点 \(p\) 为 \(ϵ\) 的点. 由构作方法决定, \(Π(p)\) 当然包含点 \(q\) 以及 \(G\) 在点 \(q\) 处的新方向, 即 \(\mathbf{v}(q)\).
- 如果我们将镜头拉近到 \(Π(p)\) 上包围 \(q\) 的小区域上, 它看起来就像一个欧几里得平面. 我们就可以通过从点 \(q\) 沿在 \(Π(p)\) 上包围 \(q\) 的小区域上的所有方向发射出测地线, 构作一个新的曲面 \(Π_{\parallel} (p \rightsquigarrow q)\), 即将 \(Π(p)\) 平行移动到点 \(q\) 生成的曲面.
- 沿测地线 \(G\) 平行移动 \(\mathbf{w}(p)\), 我们保持其长度以及它与 \(G\) 的夹角 \(a\) 都不变, 同时保持它与平行移动生成的 \(2\) 曲面 \(Π_{\parallel}\) 相切.
- 在
\(2\)
曲面上, 考虑非常短的切向量 (事实上是曲面在切平面
\(\mathbb{R}^2\)
内的向量), 而不是在曲面内的向量, 这样常常是有益的. 同样, 在
\(n\)
流形内, 可以想象在切空间
\(\mathbb{R}^n\)
内非常短的向量是位于流形
内的.- 如果要平行移动一个在点
\(p\)
处的长切向量, 因为平行移动 (由定义决定)
是保持长度不变的, 我们可以在点
\(p\)
处的切空间
\(\mathbb{R}^n\)
内用某个大因子
\(N\)
将它收缩, 就可以想象收缩后它是在流形
内的, - 然后再将它平行移动, 最后在终点的切空间 \(\mathbb{R}^n\) 内再用同样的大因子 \(N\) 将它放大, 这样就保留了它最初的长度.
- 如果要平行移动一个在点
\(p\)
处的长切向量, 因为平行移动 (由定义决定)
是保持长度不变的, 我们可以在点
\(p\)
处的切空间
\(\mathbb{R}^n\)
内用某个大因子
\(N\)
将它收缩, 就可以想象收缩后它是在流形
- 希尔德的梯子.
- (a) 沿测地线
\(G\)
移动距离
\(ϵ\),
画出点
\(q\).
用测地线段连接
\(\mathbf{w}(p)\)
的端点和
\(q\),
并标记其
中点为 \(m\). - (b) 用另一条测地线连接点 \(p\) 和 \(m\), 再延长相同的距离, 构作到终点 \(r\) 的测地线段.
- (c) 连接 \(q\) 和 \(r\) 就生成了希尔德梯子的第一级横档 \(\asymp \mathbf{w}_{\shortparallel} (p \rightsquigarrow q)\).
- (d) 重复这个构作, 为希尔德梯子增加更多横档. 最后, 令 \(ϵ \to 0\) 就得到了沿 \(G\) 的平行移动 \(\mathbf{w}_{\shortparallel}\).
- (a) 沿测地线
\(G\)
移动距离
\(ϵ\),
画出点
\(q\).
用测地线段连接
\(\mathbf{w}(p)\)
的端点和
\(q\),
并标记其
内蕴 (协变) 导数
- 我们的任务是求向量场
\(\mathbf{w}\)
在从点
\(p\)
沿单位向量
\(\mathbf{v}\)
的方向移动时的变化率. 我们从点
\(p\)
沿
\(ϵ \mathbf{v}\)
移动一段很短 (最终为
\(0\))
的距离
\(ϵ\),
到达点
\(q\).
- 为了求出新的向量 \(\mathbf{w}(q)\) 从其初始的 \(\mathbf{w}(p)\) 变化了多少, 我们将它从点 \(q\) 平行移动回到点 \(p\), 成为 \(\mathbf{w}_{\shortparallel}(q \rightsquigarrow p)\). 然后, 先求出改变 \([\mathbf{w}_{\shortparallel} (q \rightsquigarrow p) - \mathbf{w}(p)]\), 再除以 \(ϵ\) 求出变化率.
- 接下来采用标准的记号, 用哈密顿算子
\(\nabla\)
来表示
内蕴导数:- \[\nabla_v \mathbf{w} \asymp \frac{ \mathbf{w}_{\shortparallel} (q \rightsquigarrow p) - \mathbf{w}(p) }{ϵ}\]
- 在接下来的讨论中, 我们将证明, 用实际的变化本身,
而不是变化率来考虑内蕴导数会更有用:
- \(\mathbf{w}_{\shortparallel} (q \rightsquigarrow p) - \mathbf{w}(p) \asymp ϵ \nabla_v \mathbf{w} = \nabla_{ϵv} \mathbf{w}\).
- 令
\(δ_{pq} \mathbf{w}\)
为
\(\mathbf{w}\)
沿向量
\(\mathbf{ϵ} ≡ ϵ \mathbf{v}\)
从点
\(p\)
到点
\(q\)
微小的内蕴变化, 则
\(δ_{pq} \mathbf{w} = \mathbf{w}\)
从
\(\mathbf{ϵ} \asymp \nabla_{ϵ} \mathbf{w}\)
的尾端到顶端的内蕴变化.
- 从这个定义, 立即可得 \(\nabla_v \mathbf{w}_{\shortparallel} = 0 \Longleftrightarrow \mathbf{w}_{\shortparallel}\) 沿着 \(\mathbf{v}\) 的平行移动.
- 如果
\(\mathbf{v}\)
是测地线的速度向量, 则它沿自身的平行移动就是它自己,
因此
测地线方程现在具有形式: \(\nabla_v \mathbf{v} = 0\). - 应该指出, 如果我们允许质点沿测地线运动的速率可以加快或减慢,
则得到测地线方程更一般的形式, 即
\(\nabla_v \mathbf{v} \varpropto \mathbf{v}\).
也就是说,
\(\mathbf{v}\)
的
方向是内蕴不变的, 但其大小是可以变化的.
黎曼曲率张量
- 正如在
\(2\)
流形 (曲面) 上做的一样,
我们可以通过沿一个小的回路
\(L\)
平行移动单位向量
\(\mathbf{w}_{\shortparallel}\)
来研究
\(n\)
流形的曲率.
- 具体地说, 我们将尝试构作一个以两个 (单位) 向量场 \(\mathbf{u}\) 和 \(\mathbf{v}\) 为边的平行四边形作为 \(L\).
- 在
\(2\)
曲面内, 将初始向量
\(\mathbf{w}_o\)
平行移动后只能成为
\(\mathbf{u}\)
和
\(\mathbf{v}\)
所在平面内的向量. 而
\(3\)
流形 (或更一般的
\(n\)
流形) 的基础性新特征是
\(\mathbf{w}\)
可以伸出它平行移动的小回路所在的平面.
- \(2\) 流形 (即曲面) 的切空间 (即切平面) 是唯一的. 而 \(3\) 流形的切空间是一个 \(\mathbb{R}^3\), 有无穷多个切平面, 所以 \(3\) 流形的切向量一般不是只在一个平面内的. 更有甚者, 小回路都可能不在一个平面内. 这就与曲面有根本性的差别了. (译者注)
- 黎曼曲率的几何平均. 从点
\(o\)
开始, 用两个向量场
\(\mathbf{u}\)
和
\(\mathbf{v}\)
创建一个很小的平行四边形
\(L\),
然后, 绕
\(L\)
平行移动初始向量
\(\mathbf{w}_o\)
生成
\(\mathbf{w}_{\shortparallel}\).
- 当它返回到点
\(o\)
时生成
\(\mathbf{w}_{\shortparallel}(o)\),
它的改变量就是
向量和乐性\(δ \mathbf{w}_{\shortparallel} = - \mathcal{R} (\mathbf{u} δu, \mathbf{v} δv) \mathbf{w}\), 其中 \(\mathcal{R}\) 是黎曼曲率算子.
- 当它返回到点
\(o\)
时生成
\(\mathbf{w}_{\shortparallel}(o)\),
它的改变量就是
注: 其实此时的平行四边形一般无法闭合~ 暂时可以先忽略这一点.
- 我们绕
\(L\)
平行移动
\(\mathbf{w}_o\),
生成
\(\mathbf{w}_{\shortparallel}\),
返回到点
\(o\)
成为
\(\mathbf{w}_{\shortparallel} (o)\).
于是我们可以定义
向量和乐性为由曲率引起的 \(\mathbf{w}_{\shortparallel}\) 的净变化量:- \(δ \mathbf{w}_{\shortparallel} ≡ \mathbf{w}_{\shortparallel} (\mbox{在返回点 } o \mbox{ 时}) - \mathbf{w}(\mbox{从点 } o \mbox{ 出发时})\).
- 在
\(2\)
曲面内, 我们引入了和乐性算子
\(\mathcal{R} (L)\),
(当它作用于
\(\mathbf{w}\)
时) 给出了
\(\mathbf{w}\)
沿
\(L\)
平行移动后的净旋转 (和乐性). 在
\(3\)
流形或者
\(n\)
流形中,
\(L\)
可以位于无穷多个不同的平面中.
- 此外, 对于 \(2\) 曲面, 因为在平行移动其中的切向量时, 整个切平面刚性地旋转, 所以我们不需要注意是哪个向量 \(\mathbf{w}\) 正在被移动: 它们都旋转相同的量 \(\mathcal{R} (L)\).
- 但在 \(3\) 流形中, \(\mathbf{w}\) 可能会伸出 \(L\) 所在的平面, 而在 \(n\) 流形中, 它可以有很多独立的指向方式. 至关重要的是, 向量的和乐性现在确实取决于哪个向量在回路上平行移动.
- 出于这两个原因, 我们必须完善和推广之前的符号, 并引入与平行四边形
\(L\)
的边相关的
黎曼曲率算子\(\mathcal{R}\), 然后作用于平行移动的向量, 产生向量和乐性:- \(-δ \mathbf{w}_{\shortparallel} ≡ \mathcal{R} (\mathbf{u} δu, \mathbf{v} δv) \mathbf{w}\).
- 正如我们所知,
\(2\)
曲面的曲率
\(\mathcal{K}\)
完全由单位面积上的和乐性所决定. 在
\(n\)
流形中, 我们同样可以看到初始向量
\(\mathbf{w}_o\)
和平行移动返回到起点
\(o\)
时的向量
\(\mathbf{w}_{\shortparallel} (o)\)
之间产生了夹角
\(δ Θ\).
- 由于 \(\mathbf{w}\) 是单位向量, 其顶端旋转的距离 \(\mid δ \mathbf{w} \mid\) 最终等于旋转角度 \(δ Θ\).
- 为了简单起见, 假设
\(\mathbf{u}\)
和
\(\mathbf{v}\)
是正交的, 所以我们的平行四边形是一个面积为
\(δ \mathcal{A} = δu δv\)
的矩形. 然后可以将
\(\mathcal{K}\)
推广为一个标量曲率
\(\mathcal{K} (\mathbf{u}, \mathbf{v}; \mathbf{w})\),
同样定义为单位面积的旋转量:
- \[\mathcal{K} (\mathbf{u}, \mathbf{v}; \mathbf{w}) \asymp \frac{δ Θ}{δ \mathcal{A}} \asymp \frac {\mid δ \mathbf{w}_{\shortparallel} \mid} {δ \mathcal{A}} \asymp \mid \mathcal{R} (\mathbf{u}, \mathbf{v}) \mathbf{w} \mid\]
- 然而, 这显然不再是一个令人满意的曲率度量,
因为我们已经完全丢失了关于向量和乐性
\(δ \mathbf{w}_{\shortparallel}\)
的
方向这个关键信息. - 正如我们将要看到的, 黎曼张量是包含所有曲率信息的几何对象: 既包含
\(\mathbf{w}_{\shortparallel}\)
偏离
\(\mathbf{w}_o\)
的角度
\(δ Θ\),
也包含它沿哪个方向的回路平行移动产生了这个偏离.
本文后续很多
矢量/算子字符没有加粗 (黑体), 嫌麻烦~ 可以通过上下文或者字符习惯来区分.
用来闭合平行四边形的向量 c 非常小,
即使在最坏的情况下也不过是 δuδv 阶的,
所以忽略它仍然会得到一个非常接近曲率的近似.
但是为了给黎曼张量一个数学上完美的描述,
必须绕一个封闭的环路平行移动我们的向量,
因此我们只能用 c 封闭这个"有毛病的平行四边形".
对于绑定在坐标网格上的向量场
(即平行于坐标向量的向量场 -- 译者注), 间隙完全消失.
- 这个填补平行四边形间隙的短向量可以表示为其边的
换位子:- \(\mathbf{c} \asymp [\mathbf{v} δv, \mathbf{u} δu] = [\mathbf{v}, \mathbf{u}] δu δv\),
- 其中 \([\mathbf{v}, \mathbf{u}] ≡ \nabla_v \mathbf{u} - \nabla_u \mathbf{v}\).
- 我们注意到一个很快就会用到的简单事实,
那就是这个换位子是
反对称的: - \([\mathbf{v}, \mathbf{u}] = - [\mathbf{u}, \mathbf{v}]\).
因为当我们在 2 曲面上移动时, 曲面的整个切平面随之做刚体旋转,
所以我们不需要指定对特定的向量 w 做平行移动.
(这在 3 流形上就不对了:
w 初始方向的选择会影响它绕闭合回路的向量和乐性.)
-
黎曼曲率张量. 为了计算向量和乐性, 任意引入一个基准向量场 \(\mathbf{w}\), 仅要求 \(\mathbf{w}(o) = \mathbf{w}_o\), 将所有五条边上的变化都加起来, 则 \(\mathbf{w}\) 相对于 \(\mathbf{w}_{\shortparallel}\) 的变化就生成了回路的向量和乐性的负值.
- 我们已经到了这出数学剧的一个重要情节,
用
黎曼曲率表示的向量和乐性:- \(-\frac{δ \mathbf{w}_{\shortparallel}}{δu δv} \asymp \mathcal{R} (\mathbf{u}, \mathbf{v}) \mathbf{w} = \{ [\nabla_u, \nabla_v] - \nabla_{[u, v]} \} \mathbf{w}\).
- 现在我们就知道了,
黎曼曲率算子事实上是 \(\mathcal{R} (\mathbf{u}, \mathbf{v}) = [\nabla_u, \nabla_v] - \nabla_{[u, v]}\).- \(-\frac{δ \mathbf{w}_{\shortparallel}}{δu δv}\) 的负号是非常重要的, 所以要提醒读者注意它的起源和几何意义.
- \(\{ [\nabla_u, \nabla_v] - \nabla_{[u, v]} \} \mathbf{w}\) 说的是, 当我们走过闭合回路时, (任意) 基准向量场 \(\mathbf{w}\) (相对于 \(\mathbf{w}_{\shortparallel}\)) 的净变化.
- 但是, 我们要求的几何量是向量和乐性
\(δ \mathbf{w}_{\shortparallel}\),
它是
相反的, 是 \(\mathbf{w}_{\shortparallel}\) 相对于 \(\mathbf{w}\) 的变化.
- 注意
\(\mathcal{R}\)
是
反对称的:- \(\mathcal{R}(\mathbf{u}, \mathbf{v}) = - \mathcal{R}(\mathbf{v}, \mathbf{u}) \Longrightarrow \mathcal{R}(\mathbf{u}, \mathbf{u}) = 0\).
- 第一个等式在几何上是显然的, 因为它就是说, 如果我们用相反的方向走过平行四边形, 则向量和乐性也被反转方向了.
- 同样, 可以认为第二个等式是说, 沿着任意向量 \(\mathbf{u}\) 的一小段, 来回平行移动任意一个向量, 则它会回到原样.
- 现在只需要稍微改变一下符号, 就能最终得到著名的
黎曼曲率张量\(R\) 的标准定义, 它是一个输入三个向量, 输出一个向量值的映射 \(R(\mathbf{u}, \mathbf{v}; \mathbf{w})\):- \(R(\mathbf{u}, \mathbf{v}; \mathbf{w}) ≡ \mathcal{R} (\mathbf{u}, \mathbf{v}) \mathbf{w} = \{ [\nabla_u, \nabla_v] - \nabla_{[u, v]} \} \mathbf{w}\).
- 当三个输入向量中的任意两个保持不变时, \(R(\mathbf{u}, \mathbf{v}; \mathbf{w})\) 是第三个输入向量的线性函数.
- 为了给出几何对象的数值描述, 我们对
\(n\)
流形的每个点的切空间
\(\mathbb{R}^n\)
引入一组
标准正交基向量 \(\{ \mathbf{e}_i \}\).- 于是, 几何向量 \(\mathbf{u}\) 可由其数值分量 \(\{ u^i \}\) 表示, 其中 \(\mathbf{u} = \sum_{i} u^i \mathbf{e}_i\).
对于更复杂的几何对象, 例如黎曼张量,
就要求多重不同的指标来表示它的分量, 从而会导致多重求和.
我们总是可以把求和指标中的一个安排成上标, 一个安排成下标.
因此, 爱因斯坦引人了一个不易混淆的简单约定, 称为爱因斯坦求和约定.
还有一个爱因斯坦指标约定 (或称爱因斯坦第一约定):
用作下标或上标的拉丁字母取遍从 1 到空间维数 (例如 n) 的正整数值.
本书已经采用了这个约定. 指标约定和求和约定统称为爱因斯坦约定.
译者注
- 通过爱因斯坦求和约定, 可以省略求和号,
将成对出现的上标和下标理解为求和. 例如
- \(\mathbf{u} = \sum_{i = 1}^{n} u^i \mathbf{e}_i \Longleftrightarrow\) 爱因斯坦求和约定: \(\mathbf{u} = u^i \mathbf{e}_i\).
- 为了求出黎曼张量的分量, 我们将其三个输入向量分解成分量形式:
- \(\mathbf{u} = u^i \mathbf{e}_i\), \(\mathbf{v} = v^j \mathbf{e}_j\), \(\mathbf{w} = w^k \mathbf{e}_k\).
- 于是, \(R(\mathbf{u}, \mathbf{v}; \mathbf{w}) = R(u^i \mathbf{e}_i, v^j \mathbf{e}_j; w^k \mathbf{e}_k) = R(\mathbf{e}_i, \mathbf{e}_j; \mathbf{e}_k) u^i v^j w^k\).
- 我们现在可以定义
黎曼张量的分量\(R_{ijk}^{l}\) 为当黎曼张量作用于三个基向量时得到的相应系数: \(R(\mathbf{e}_i, \mathbf{e}_j; \mathbf{e}_k) ≡ R_{ijk}^{l} \mathbf{e}_l\).- 这样, \(R\) 对于一般向量的作用就可以方便地用这些系数表示为: \(R(\mathbf{u}, \mathbf{v}; \mathbf{w}) = [R_{ijk}^{l} u^i v^j w^k] \mathbf{e}_l\).
- 为了后面的应用, 我们还定义, \(R_{ijkm} ≡ R(\mathbf{e}_i, \mathbf{e}_j; \mathbf{e}_k) \cdot \mathbf{e}_m\).
- 因为我们选择正交基, 若 \(l ≠ m\) 则 \(\mathbf{e}_l \cdot \mathbf{e}_m = 0\), 若 \(l = m\) 则 \(\mathbf{e}_l \cdot \mathbf{e}_m = 1\), 所以 \(R_{ijkm} = R_{ijk}^{m}\).
- 在
\(2\)
曲面内, 一个小回路
\(L\)
的和乐性
\(\mathcal{R}(L) \asymp \mathcal{K} δ \mathcal{A}\)
只依赖于
\(L\)
的面积
\(δ \mathcal{A}\),
与其形状无关. 而在
\(n\)
流形内,
\(L\)
所在的平面有很多相互独立的选择. 所以我们定义,
\(Π(\mathbf{u}, \mathbf{v}) ≡\)
由
\(\mathbf{u}\)
和
\(\mathbf{v}\)
张成的平面.
- 对
\(Π(\mathbf{u}, \mathbf{v})\)
的选择当然会影响向量和乐性. 对于给定的
\(\mathbf{w}_o\),
向量和乐性
仅依赖于 \(Π\) 本身, 以及回路的面积: - 如果绕平面
\(Π\)
上的小面积 (最终为
\(0\)
的) 平行四边形平行移动
\(\mathbf{w}_o\),
则向量和乐性正比于平行四边形的
面积\(δ \mathcal{A}\), 且独立于其形状.
- 对
\(Π(\mathbf{u}, \mathbf{v})\)
的选择当然会影响向量和乐性. 对于给定的
\(\mathbf{w}_o\),
向量和乐性
- \(R(\mathbf{u}, \mathbf{v}; \mathbf{w})\)
关于括号中的前两项是反对称的, 这就意味着
- \(R_{jikm} = -R_{ijkm}\).
- 现在我们证明了另一种不那么明显的对称性, 即 \(R_{ijkm}\) 关于最后两个指标也是反对称的:
- \(R_{ijmk} = -R_{ijkm}\).
- 首先,
代数比安基恒等式表明, 如果前三个向量循环排列, 则它们的和为 \(0\):- \(\mathcal{R}(u, v)w + \mathcal{R}(v, w)u + \mathcal{R}(w, u)v = 0 \Longleftrightarrow R_{ijkm} + R_{jkim} + R_{kijm} = 0\).
- 其次, 黎曼张量关于交换第一对和第二对向量也是对称的:
- \([\mathcal{R}(u, v)x] \cdot y = [\mathcal{R}(x, y)u] \cdot v \Longleftrightarrow R_{ijkm} = R_{kmij}\).
- 最后, 在以上四种对称性之外, 还有第五种不同的对称性
(对爱因斯坦引力理论至关重要), 称为
微分比安基恒等式:- \(\nabla_x \mathcal{R} (u, v)w + \nabla_u \mathcal{R} (v, x)w + \nabla_v \mathcal{R} (x, u)w = 0\),
- 也就是说, 它是 \(e_2\) 绕 \(\{ e_1, e_2 \}\) 回路平行移动的和乐性在 \(e_1\) 上的投影. 于是
- \(\mathcal{P} [δ \mathbf{w}_{\shortparallel}] = \begin{bmatrix} δ \mathbf{w}_{\shortparallel}^1 \\ δ \mathbf{w}_{\shortparallel}^2 \end{bmatrix} \asymp \begin{bmatrix} -\mathbf{w}_o^2 \\ \mathbf{w}_o^1 \end{bmatrix} \mathcal{K} (Π) δ \mathcal{A} = \mathbf{w}_{⊥} \mathcal{K} (Π) δ \mathcal{A}\),
- 其中的 \(\mathbf{w}_{⊥}\) 就是 \(\mathbf{w}_o\) 在 \(Π\) 内旋转一个直角.
- 因此,
投影\(\mathcal{P} [\mathbf{w}_{\shortparallel}]\) 绕面积为 \(δ \mathcal{A}\) 的回路平行移动后被旋转的角度 \(δ Θ\) 满足 \(δ Θ \asymp \mathcal{K} (Π) δ \mathcal{A}\), 与 \(\mathbf{w}_o\) 无关. 我们绕了一圈, 回到了最初的观点, 即曲率是指 \(2\) 曲面内单位面积的和乐性:- \(\frac{δ Θ}{δ \mathcal{A}} \asymp \mathcal{K} (Π) = R_{1221}\).
- 只是现在有很多这样的截面曲率, 取决于我们在哪个平面 \(Π\) 内平行移动.
n 维流形的雅可比方程
-
之前我们用牛顿上标点来表示沿测地线的导数, 现在则用更标准的 \(\nabla_v\) 记法. 所以, 现在的相对速度记为 \(\nabla_v ξ\), 相对加速度记为 \(\nabla_v \nabla_v ξ\).
- 总之, 相对加速度
\(\nabla_v \nabla_v ξ\)
有一个分量在
\(Π\)
内, 其作用是将两条测地线拉近 (或推开); 还有一个分量正交于
\(Π\),
它对于两条测地线的间隔没有影响, 而是引起它们相互
旋转.- 我们现在关注的是在平面 \(Π\) 内产生吸引力或排斥力的分量, 记为 \(\mathcal{P} [\nabla_v \nabla_v ξ]\).
- 如我们先前看到的那样, 如果将平行移动生成的向量投影到
\(Π\)
内, 则和乐性还是由曲率乘以矩形的面积决定的, 只是这次用的是
截面曲率\(\mathcal{K} (Π)\).
- 截面雅可比方程:
\(\mathcal{P} [\nabla_v \nabla_v ξ] = - \mathcal{K} (Π) ξ\).
- 对于 \(n\) 流形, 有 \(n - 2\) 个分量正交于 \(Π\).
- 这样, 我们就得到了
测地线偏离方程, 也就是雅可比方程: \(\nabla_v \nabla_v ξ = - \mathcal{R} (ξ, v) v\).- 这就是在所有教科书中都能看到的雅可比方程的标准形式.
- 将投影算子
\(\mathcal{P}\)
作用于雅可比方程的两边, 就得到了
截面雅可比方程: - \(\mathcal{P} [\nabla_v \nabla_v ξ] = -\mathcal{P} [\mathcal{R} (ξ, v) v] = -\mathcal{K} (Π) ξ\).
里奇张量
- 如果将排列成一个小圆周的一组质点以垂直于圆周所在平面的速度
\(v\)
发射出去, 圆周所围面积
\(δ \mathcal{A}\)
的加速度由所有包含向量
\(v\)
的平面的截面曲率的平均值的 2 倍决定, 这个平均值的 2 倍也就是包含
\(v\)
的任意两个相互正交平面的截面曲率之和:
- \((\ddot{δ \mathcal{A}}) (0) = - [\mathcal{K} (0) + \mathcal{K} (π / 2)] δ \mathcal{A} (0)\),
- 因此 \(δ \mathcal{A} (t) - δ \mathcal{A} (0) \asymp - \frac{1}{2} [\mathcal{K} (0) + \mathcal{K} (π / 2)] δ \mathcal{A} (0) t^2\).
-
注意, 有四个下标的 \(R\) 是
黎曼张量的一个分量, 而有两个下标的 \(R\) 是里奇张量的一个分量. 里奇曲率张量定义为- \(\mbox{Ricci} (v, w) ≡ \sum_{m = 1}^{n} R(e_m, v; w) \cdot e_m \Longleftrightarrow R_{jk} = \mbox{Ricci} (e_j, e_k) = R_{mjk}^{m}\).
- 关于记号习惯的注释: 许多作者定义 \(R_{jk} ≡ R_{jmk}^{m} = -R_{mjk}^{m}\), 即我们定义的负值.
- Ricci 确实是一个张量的事实, 与
\(R\)
是一个张量的事实紧密相关. 从
\(R\)
的对称性也可以得出 Ricci 是
对称的:- \(\mbox{Ricci} (w, v) = \mbox{Ricci} (v, w) \Longleftrightarrow R_{kj} = R_{jk}\).
- 利用黎曼张量的对称性, 首先交换黎曼张量定义中的第一对向量和第二对向量, 然后交换每一对中的两个向量, 就得到了里奇张量的这种对称性.
- 现在我们就可以看到
- \(\mathcal{K} (0) + \mathcal{K} (π / 2) = R_{m33}^m = \mbox{Ricci} (v, v) = R_{jk} v^j v^k\),
- 因此得到了一个非常简单的雅可比式方程, 它支配以速度 \(v\) 发射的测地线束围的面积的加速度:
- \(\ddot{δ \mathcal{A}} = - \mbox{Ricci} (v, v) δ \mathcal{A}\).
- 高斯曲率在
\(2\)
曲面 (或截面曲率在
\(n\)
流形) 的雅可比方程中的作用在这里被里奇曲率所取代.
我们强调,
正的里奇曲率引起吸引力, 导致面积收缩, 因为它使得测地线聚拢.
- 虽然我们不去计较细节, 但前面的分析是不变的,
具体来说, 里奇曲率现在控制着以速度
\(v\)
同时发射的质点形成的小球面围成的
体积的加速度:- \(\ddot{δ \mathcal{V}} = - \mbox{Ricci} (v, v) δ \mathcal{V}\).
- 为了将来的使用, 我们强调
正的里奇曲率会引起吸引力, 导致测地线相互靠拢, 所以它们所包围的体积就会收缩. - 和前面一样, 这意味着 (最初) 体积的变化与时间的平方成比例, 比例系数由里奇曲率决定:
- \(δ \mathcal{V} (t) - δ \mathcal{V} (0) \asymp - \frac{1}{2} \mbox{Ricci} (v, v) δ \mathcal{V} (0) t^2\).
爱因斯坦的弯曲时空
"空间告诉物质如何移动, 物质告诉空间如何弯曲."
说得更详细一些, 自由落体沿弯曲空间的测地线运动:
这些测地线仍旧是最直的路径,
但是它们使得用时空度量测量的"距离"最大化 (而不是最小化).
- 平方反比潮汐力的几何意义:
由且仅由平方反比定律生成的潮汐力是保持体积不变的,
确切地说, 体积的加速度为零, 因此体积保持在
\(t^2\)
阶不变:
- \(\ddot{δ \mathcal{V}} = 0\).
- 平方反比吸引力的几何意义: 考虑一个球体, 其体积为
\(δ \mathcal{V}\),
内部充满了密度为
\(ρ\)
的物质. 在球面外有一层测试粒子, 从静止状态解除约束,
它们就马上向中心加速飞行. 平方反比规律引起它们包围的体积向内坍缩,
向内坍缩的加速度由如下几何规律决定:
- \(\ddot{δ \mathcal{V}} = -4 π G ρ δ \mathcal{V}\).
如果我们现在想象这个物质球体 (及其表面的测试粒子)
在地球重力场中以任意速度被发射, 就得到了这两种效应的叠加:
地球的潮汐力开始把球体变形成一个等体积的"蛋",
而球体内物质的吸引力也发挥了使其体积缩小的作用.
最终的结果是, 最初的球体演变成一个"蛋",
但其体积的收缩正比于里面物质的质量, 也正比于时间的平方.
时空中的零锥 (光锥).
时间由竖直方向表示, (三个中的) 两个空间方向用正交的水平方向表示.
一束光线从时空中的一个事件发射出来,
它在时刻 t 扩张成的光球面用它的圆周截线表示.
所以, 这束光线的整个未来用一个锥面表示, 光子的世界线是这个锥面的空母线.
物质粒子在这个锥面内沿类时世界线运动, 运动的速率低于光速.
一个粒子的世界线的切向量称为这个粒子的 4 速度.
一个静止的粒子有一个非零的 4 速度: 它直指时间轴!
注意, 大质量粒子的 4 速度是可以规范化的,
就像我们总是假设粒子在二维曲面内以单位速率运动一样.
但这对于光子的 4 速度而言是不可能的, 因为光子的 4 速度的"长度"总是为零.
在真空中, 为了使潮汐力保持体积不变,
正截面曲率必须正好与负截面曲率抵消, 以便达到完全平衡.
虽然里奇曲率在真空中恒为零,
但这只是正截面曲率和负截面曲率导致体积缩小效果的平均值.
黎曼张量本身一般不会为零.
一般来说, 可以将黎曼曲率分割成体积缩小的里奇部分,
加上一个纯潮汐的, 保持体积不变的部分, 称为外尔曲率.
- 黑洞的诞生: 超新星核的引力坍缩.
爱因斯坦的场方程告诉我们, 一个质量足够大的核的坍缩将达到一种不可逆转的情况:
引力将无情地将整个核挤压成一个密度无穷大, 潮汐力无穷大的点
(\(r = 0\)),
称为
时空奇点; 剩下的是一个纯净的真空引力场.- 如果从正在坍缩的核的中心足够早地发射出一束闪光, 它就能逃离引力场. 然后, 会出现一个关键时刻: 从中心发出的闪光光球起初膨胀, 然后速度变慢, 最终悬停在施瓦氏半径 \(r_S = 2GM / c^2\) 上.
- 这个悬停的光球面就是
事件视界, 它的内部是一个黑洞: 一旦形成, 任何物质或信息都不可能逃离这个区域. 零锥与视界相切, 因此它们允许物质和光向内通过, 但从不向外通过, 因为物质总是在零锥内部传播.
1-形式
形式是埃利·嘉当在 1900 年前后发现的.
嘉当思想异常深邃, 见解独到, 涉猎广泛.
为了完全发挥形式的威力, 他甚至又花费了 40 年时间.
1-形式是输入一个向量的线性实值函数.
"1-" 表示输入一个向量; 稍后我们会遇到以两个向量作为输入的 2-形式,
以三个向量作为输入的 3-形式, 等等.
因此 1-形式是一种特别简单的张量.
较早的文献称这个概念为协变向量, 或者余向量.
较早的文献: 外尔, 彭罗斯~
- 更明确地说, 如果
\(k_1\)
和
\(k_2\)
是任意常数,
\(v_1\)
和
\(v_2\)
是任意向量, 那么
- \(ω\)
是
1-形式\(\Longleftrightarrow ω(k_1 v_1 + k_2 v_2) = k_1 ω(v_1) + k_2 ω(v_2)\). - 在验证一个特定的
\(ω\)
是否是
1-形式时, 从概念上讲, 将这个单一的条件分解为两个更简单的条件会更方便一些: - \(ω(v_1 + v_2) = ω(v_1) + ω(v_2)\), 和 \(ω(kv) = kω(v)\).
- \(ω\)
是
所有 1-形式的集合对于加法和数乘运算是封闭的, 因此构成了所谓的向量空间.
这个 1-形式的向量空间被认为是它所作用的向量空间的对偶.
使用这个术语的原因是, 这两个空间之间存在一种对称关系:
我们也可以把向量空间看作 1-形式空间的"对偶".
- 为了了解这种对称性, 让我们把向量
\(v\)
看成一个作用于
1-形式\(ω\) 的函数, 这个作用的定义为- \(v(ω) ≡ ω(v)\).
- 向量和
1-形式这种对称的彼此作用通常也称为向量和1-形式的缩并, 有时也表示为 \(\langle ω, v \rangle\), 以强调两种对象的平等地位. - 由此可以得出向量
\(v\)
是
1-形式的线性函数: - \[\begin{align} v(ω + φ) & = (ω + φ)(v) \\ & = ω(v) + φ(v) \\ & = v(ω) + v(φ) \end{align}\]
- 且 \(v(kω) = kω(v) = kv(ω)\).
例子: 引力做功, 沿某一方向穿过引力等势面 (平面堆积)
- 在点
\(p\)
处,
\(ω\)
的代表性曲面
\(S\)
定义为:
\(S\)
在点
\(p\)
处的切向量都满足
\(ω(v) = 0\),
对应于被穿过的曲面数量为
\(0\).
- 用线性代数的语言来说,
\(S\)
的切向量集合满足
\(ω(v) = 0\),
因此它们构成
\(ω\)
的
核. - 一般来说, 只能用这种方式将一个点的
1-形式场表示为平面堆积. - 在 \(\mathbb{R}^3\) 空间中, 满足 \(ω(v) = 0\) 的向量集合张成一个二维平面, 而在 \(n\) 维空间中, \(ω\) 的核要用一个 \(n - 1\) 维空间来表示.
- 用线性代数的语言来说,
\(S\)
的切向量集合满足
\(ω(v) = 0\),
因此它们构成
\(ω\)
的
例子: 梯度
1-形式
- 如果我们将狄拉克右矢
\(\mid v \rangle\)
(即量子态) 视为”向量”, 而将狄拉克左矢
\(\langle ω \mid\)
视为
1-形式, 就可以将1-形式和向量的缩并定义为标准的 (复数) 内积:- \(ω(v) ≡ \langle ω \mid v \rangle\).
- 在
\(n\)
流形上的一个点
\(p\)
处, 我们选择切空间
\(T_p\)
的一个基底
\(\{ e_j \}\),
用爱因斯坦求和约定, 就可以将一般向量写成
\(v = v^j e_j\).
- 我们不假设这个基底是正交的. 在点
\(p\)
处有一个由
1-形式组成的空间 \(T_p^{*}\), 有了 \(\{ e_j \}\) 这个基底, 就有一种自然的方法将 \(\{ e_j \}\) 与空间 \(T_p^{*}\) 的一组基底 \(\{ ω^i \}\) (称为 \(\{ e_j \}\) 的对偶基) 联系起来: - \(ω^i\) 选出 \(v\) 的第 \(i\) 个分量 \(\Longleftrightarrow ω^i (v) = v^i\).
- 两个向量和的第
\(i\)
个分量就是两个向量第
\(i\)
个分量的和, 向量
\(kv\)
的第
\(i\)
个分量是
\(k v^i\),
这就证明了这些
\(\{ ω^i \}\)
的确就是
1-形式.
- 我们不假设这个基底是正交的. 在点
\(p\)
处有一个由
- 让我们把如下常见的误解消灭在萌芽状态. 因为基底
1-形式的集合 \(\{ ω^1, ω^2 \}\) 是基向量的集合 \(\{ e_1, e_2 \}\) 的对偶, 所以 \(ω^1\) 是 \(e_1\) 的对偶, 而且 \(ω^2\) 是 \(e_2\) 的对偶:- 这是完全错误的. 在一般的
\(n\)
维情况下, 改变一个基底向量可以改变
1-形式的整个对偶基底.
- 这是完全错误的. 在一般的
\(n\)
维情况下, 改变一个基底向量可以改变
- 克罗内克符号:
- \[δ^i_j ≡ \begin{cases} 1, & \mbox{ 若 } i = j, \\ 0, & \mbox{ 若 } i ≠ j. \end{cases}\]
- 基底 \(\{ ω^i \}\) 的等价定义:
- \(ω^i (e_j) = δ^i_j \Longleftrightarrow ω^i (v) = v^i\).
- 令一般的
1-形式\(φ\) 作用于 \(v\) 为- \(φ(v) = φ(v^j e_j) = v^j φ(e_j) = ω^j (v) φ(e_j)\).
- 我们现在定义 \(φ\) 的分量 \(φ_j\): \(φ_j ≡ φ(e_j)\).
- 于是 \(φ(v) = φ_j ω^j (v)\).
- 但因为我们是利用
1-形式对一般向量的作用来定义它的, 可以将方程两边的向量 \(v\) “抽出来”, 从而得到1-形式自身的相等关系. 而且, 这样就将任意一个1-形式\(φ\) 分解为它在基底1-形式\(\{ ω^j \}\) 中独特的分量形式, 其中 \(\{ ω^i \}\) 是向量基 \(\{ e_j \}\) 的对偶基, 所以- \(φ = φ_j ω^j = φ(e_j) ω^j\).
- 回顾向量微积分, 在
\(\mathbb{R}^2\)
中一个函数
\(f\)
的梯度被定义为向量
- \(\nabla f ≡ \begin{bmatrix} \partial_{x} f \\ \partial_{y} f \end{bmatrix}\).
- 这个向量的意义是 \(\nabla f\) 指向 \(f\) 增加最快的方向, 其大小 \(| \nabla f |\) 等于我们沿这个方向移动时 \(f\) 的最大增加率.
陶哲轩实分析 (下), 方向导数.
- 这种解释来自一个更原始的事实, 函数
\(f\)
的梯度
1-形式\(\mathbf{d} f\) 是由它对向量的作用来定义的:- \(\mathbf{d} f(v) ≡ \nabla_v f\).
- 加粗的
\(\mathbf{d}\)
算子称为
外导数, 它将在后面的讨论中发挥核心作用. - 注意到求导算子 \(\nabla_v\) 服从莱布尼茨法则 (又名乘积公式法则), 所以外导数也服从
- \(\mathbf{d} (fg) = f \mathbf{d} g + g \mathbf{d} f\).
- 显然, 所有这些都可以直接推广到任意维度. 设
\(\{ e_i \}\)
是
\(\mathbb{R}^n\)
的一个标准正交基底, 其直角坐标为
\(\{ x^j \}\),
因此
\(v = v^i e_i\)
是一个一般向量, 而
\(d x^j\)
决定其第
\(j\)
个分量, 即
\((d x^j) v = v^j\).
- 特别是, \((d x^i) e_j = δ_j^i\).
- 我们称之为
笛卡儿基: - \(\{ d x^j \} = \{ ω^j \}\)
是对偶于
\(\{ e_j \}\)
的
1-形式笛卡儿基. - 可以将一个一般的
1-形式\(φ\) 分解成在这个对偶基中的分量, 它们为 - \(φ = φ_j ω^j = φ(e_j) d x^j\).
- 取
\(φ = df\),
我们回到最初的定义, 将一般函数
\(f\)
的梯度
1-形式\(df\) 分解为它的1-形式笛卡儿基的分量, 如下所示:- \(df = [(df) e_j] d x^j = [\partial_{x^j} f] d x^j\).
- 在形式上, 这与经典公式是相同的, 但现在它有了精确, 严格的含义, 不需要用到无穷小. 然而, 它与几何意义上的最终相等有着非常直接和直观的联系.
张量
在讨论黎曼张量时, 我们初步地将一个张量定义为输入多个向量的多重线性函数.
因为缺乏 1-形式的概念, 这是我们当时所能做到的最好情况.
但一个完全一般的张量, 实际上是向量和 1-形式的多重线性函数,
它的阶告诉我们要输入多少个向量和多少个 1-形式:
- 一个在点
\(p\)
处的
\(\begin{Bmatrix}
f \\
v
\end{Bmatrix}\)
阶张量
\(H\)
是输入
\(f\)
个
1-形式和 \(v\) 个向量的实值多重线性函数, 使得 \(H\) 在点 \(p\) 处的值只依赖于这些1-形式和向量在点 \(p\) 处的值.- 或称为 \(f\) 阶协变 \(+\) \(v\) 阶逆变的张量, 简称为 \(f + v\) 阶张量.
- 所以, 一个
1-形式就是一个阶为 \(\begin{Bmatrix} 0 \\ 1 \end{Bmatrix}\) 的张量, 因为它只有一个输入空位容许填入一个向量, 它的输出是填入的向量与这个1-形式的缩并. 同样, 一个向量就是一个阶为 \(\begin{Bmatrix} 1 \\ 0 \end{Bmatrix}\) 的张量, 因为它只有一个输入空位容许填入一个1-形式, 它的输出是填入的1-形式与这个向量的缩并.- 一般情况下, 我们可以将
\(H\)
的输入空位分成两组: 第一组的
\(f\)
个空位输入
\(f\)
个
1-形式\(φ_1\), …, \(φ_f\), 第二组的 \(v\) 个空位输入 \(v\) 个向量 \(v_1\), …, \(v_v\). 利用记号 \(\|\) 表示这两组之间的界线, 于是有 - \(H(φ_1, ..., φ_f \| v_1, ..., v_v)\).
- 一般来说, 我们在这些空位中输入
1-形式和向量的顺序很重要: 如果在这些空位中交换一对1-形式或一对向量, 输出常常与最初的值完全无关.
- 一般情况下, 我们可以将
\(H\)
的输入空位分成两组: 第一组的
\(f\)
个空位输入
\(f\)
个
比其它书籍更显言简意赅~
- 给定两个
1-形式\(φ\) 和 \(ψ\), 它们各自可以作用于一个单一的向量, 自然可以定义它们的张量积为一个作用于两个向量的张量, 即一个阶为 \(\begin{Bmatrix} 0 \\ 2 \end{Bmatrix}\) 的张量, 如下所示:- \((φ \otimes ψ) (v, w) ≡ φ(v) ψ(w)\).
- 注意这里的次序很重要: \(φ \otimes ψ ≠ ψ \otimes φ\).
- 关于术语的注释: 张量积常常也称为直积或外积.
- 同样可以定义更高阶张量的张量积. 例如, 我们可以将一个阶为
\(\begin{Bmatrix}
2 \\
1
\end{Bmatrix}\)
的张量
\(J(φ, ψ \parallel u)\)
乘以一个阶为
\(\begin{Bmatrix}
0 \\
2
\end{Bmatrix}\)
的张量
\(T(v, w)\),
得到阶为
\(\begin{Bmatrix}
2 \\
3
\end{Bmatrix}\)
的张量
\(J \otimes T\):
- \((J \otimes T) (φ, ψ \parallel u, v, w) ≡ J(φ, ψ \parallel u) \cdot T(v, w)\).
- 和通常一样, 设
\(\{ \mathbf{e}_i \}\)
是一个标准正交向量基, 设
\(\{ \mathbf{d} x^j \}\)
是
1-形式的对偶笛卡儿基. 就像我们得到向量和1-形式的分量一样, 可以把基底的1-形式和向量填入它的空位来得到一个更一般的张量的分量.- 例如, \(\mathbf{T} (\mathbf{v}, \mathbf{w})\) 的分量是 \(T_{ij} = \mathbf{T} (\mathbf{e}_i, \mathbf{e}_j)\). 我们可以将整个张量 \(\mathbf{T}\) 分解为张量分量, 如下所示:
- \(\begin{align} \mathbf{T} (\mathbf{v}, \mathbf{w}) & = \mathbf{T} (v^i \mathbf{e}_i, w^j \mathbf{e}_j) \\ & = \mathbf{T} (\mathbf{e}_i, \mathbf{e}_j) v^i w^j \\ & = T_{ij} v^i w^j \\ & = T_{ij} [\mathbf{d} x^i (\mathbf{v})] [\mathbf{d} x^j (\mathbf{w})] \\ & = T_{ij} (\mathbf{d} x^i \otimes \mathbf{d} x^j) (\mathbf{v}, \mathbf{w}) \end{align}\).
- 因为 \(\mathbf{v}\) 和 \(\mathbf{w}\) 都是一般的向量, 所以可以将它们抽出来, 于是这个张量可以表示为
- \(\mathbf{T} = T_{ij} (\mathbf{d} x^i \otimes \mathbf{d} x^j)\).
- 由此可知: 由张量 \((\mathbf{d} x^i \otimes \mathbf{d} x^j)\) 组成的集合形成 \(\begin{Bmatrix} 0 \\ 2 \end{Bmatrix}\) 阶张量的基底.
- 用同样的方式, 我们可以得到两个向量的张量积:
- \((v \otimes w) (φ, ψ) = v(φ) w(ψ) = v^i w^j (e_i \otimes e_j) (φ, ψ)\).
- 同样, 一个阶为 \(\begin{Bmatrix} 2 \\ 0 \end{Bmatrix}\) 的张量 \(K(φ, ψ)\) 可以在张量基里分解为
- \(K = K^{ij} (e_i \otimes e_j)\).
- 显然, 这个方法适用于任意阶 \(\begin{Bmatrix} f \\ v \end{Bmatrix}\) 的张量, 可以用张量基分解出它们的分量:
- \((e_{i_1} \otimes e_{i_2} \otimes ... e_{i_f}) \otimes (d x^{j_1} \otimes d x^{j_2} \otimes ... \otimes d x^{j_v})\).
- 注意, 一个阶为 \(\begin{Bmatrix} f \\ v \end{Bmatrix}\) 的张量具有 \(f\) 个上标, \(v\) 个下标.
- 在过去的文献中, 上标称为逆变的 (或反变的), 下标称为协变的 (或共变的).
- 缩并的思想适用于至少输入一个
1-形式和一个向量的任意张量: 将一个上标和一个下标加起来. 缩并运算一般会消除一个上标和一个下标, 所以缩并后新张量的输入空位要减少一个1-形式和一个向量的输入.- 事实上, 缩并在张量积运算中还有更广的意义. 我们首先做一个 \(A \otimes B\), 然后对 \(A\) 的一个上标和 \(B\) 的一个下标求和.
- 这样得到的结果是一个新的张量, 而且与生成求和分量的向量基
\(\{ e_j \}\)
和
1-形式基 \(\{ d x^i \}\) 无关.
用度量张量来改变张量的阶
- 我们已经知道阶为
\(\begin{Bmatrix}
0 \\
2
\end{Bmatrix}\)
的度量张量
\(\mathbf{g}\)
是流形的基本结构: 它为我们提供测地线, 平行移动和曲率的信息. 此外,
\(\mathbf{g}\)
还扮演一个重要的角色: 我们可以借助它来改变张量的阶.
- 先来看看如何用度量张量将一个特定的
1-形式变换成一个特定的向量, 以及反过来的变换.
- 先来看看如何用度量张量将一个特定的
- 关于记号的注释: 按照通常的约定,
1-形式对应于向量 \(\mathbf{n}\) 的分量表示为 \(n_i\), 但是这违反了我们用希腊字母表示1-形式和用罗马字母表示向量的二分法. 因此, 必须比以前更加仔细地注意:- 如果一个字母的指标是上标, 那么它就表示一个向量;
如果是下标, 那么它就表示一个
1-形式.
- 如果一个字母的指标是上标, 那么它就表示一个向量;
如果是下标, 那么它就表示一个
- 如果我们让
\(\mathbf{g}\)
的一个空位空着, 在另一个空位中填入一个向量
\(\mathbf{n}\),
就得到了对应于
\(\mathbf{n}\)
的唯一一个
1-形式\(\mathbf{v}\):- 向量
\(\mathbf{n} \to\)
1-形式\(\mathbf{v}\), 其中 \(\mathbf{v} (\mathbf{w}) ≡ \mathbf{g} (\mathbf{w}, \mathbf{n})\). - 那么,
1-形式\(\mathbf{v}\) 的分量与原向量 \(\mathbf{n}\) 的分量有什么样的关系呢? 我们只需要将 \(\mathbf{v}\) 作用于基向量: - 按照约定, \(\mathbf{v} = n_i \mathbf{d} x^i\).
- 于是 \(n_i = \mathbf{v}(\mathbf{e}_i) = \mathbf{g} (\mathbf{e}_i, \mathbf{n}) = \mathbf{g} (\mathbf{e}_i, n^j \mathbf{e}_j) = \mathbf{g} (\mathbf{e}_i, \mathbf{e}_j) n^j\),
- 所以 \(n_i = g_{ij} n^j\).
- 向量
\(\mathbf{n} \to\)
- 利用度量张量可以将一个向量转换成
1-形式, 也可以改变任意一个张量的阶. 例如, 考虑阶为 \(\begin{Bmatrix} 1 \\ 3 \end{Bmatrix}\) 的黎曼张量 \(R(ψ \| u, v, w)\), 其分量为 \(R_{ijk}^{m}\).- 我们来演示如何将它变成阶为
\(\begin{Bmatrix}
0 \\
4
\end{Bmatrix}\)
的张量, 方法是将输入的
1-形式变成向量. 按照惯例, 这个新张量仍然记作 \(R\), 它的分量记作 \(R_{ijkl}\).
- 我们来演示如何将它变成阶为
\(\begin{Bmatrix}
0 \\
4
\end{Bmatrix}\)
的张量, 方法是将输入的
- 为了用四个向量输入来计算新张量, 我们只需将额外的输入向量
\(n\)
替换为黎曼张量最初定义中相应的
1-形式\(v\):- \(R(u, v, w, n) ≡ R(v \| u, v, w)\).
- 这个方程的分量形式为
- \(R_{ijkl} u^i v^j w^k n^l = R_{ijk}^{m} u^i v^j w^k n_m = R_{ijk}^{m} u^i v^j w^k (g_{ml} n^l)\).
- 所以, \(R_{ijkl} = R_{ijk}^{m} g_{ml}\).
- 这个过程 (相当符合逻辑地) 称为
指标下降.
对称张量和反对称张量
引言: 任意一个函数可分为对称函数 (偶函数) 与反对称函数 (奇函数) 的和
- 现在我们将这些类似的性质推广到阶为
\(\begin{Bmatrix}
0 \\
2
\end{Bmatrix}\)
的一般张量
\(E(v, w)\).
类似地, 定义
对称张量\(E^{+}\) 和反对称张量\(E^{-}\) 为- \(E^{+} (w, v) = + E^{+} (v, w)\) 和 \(E^{-} (w, v) = - E^{-} (v, w)\).
- 按照前面关于函数的论证, 我们发现总能将一个阶为 \(\begin{Bmatrix} 0 \\ 2 \end{Bmatrix}\) 的一般张量分解为一个对称部分和一个反对称部分:
- \(E(v, w) = E^{+}(v, w) + E^{-}(v, w)\),
- 其中 \(E^{+}(v, w) = [ \frac{E(v, w) + E(w, v)}{2} ]\) 和 \(E^{-}(v, w) = [ \frac{E(v, w) - E(w, v)}{2} ]\).
- 只要在输入空位里填入基向量, 我们就可以得到这些公式的分量形式. 对于这些分量形示, 我们引入下面的标准记号: 圆括号表示对称化, 方括号表示反对称化.
- \(E_{(ij)} ≡ E_{ij}^{+} = \frac{1}{2} [E_{ij} + E_{ji}]\) 和 \(E_{[ij]} ≡ E_{ij}^{-} = \frac{1}{2} [E_{ij} - E_{ji}]\).
- 所以, \(E_{ij} = E_{(ij)} + E_{[ij]}\).
2-形式
2-形式\(Ψ\) 是一个 \(\begin{Bmatrix} 0 \\ 2 \end{Bmatrix}\) 阶的反对称张量, 即- \(Ψ (v, u) = -Ψ (u, v)\).
p-形式(全称为 \(p\) 次微分形式) 是一个 \(\begin{Bmatrix} 0 \\ p \end{Bmatrix}\) 阶的完全反对称张量, 即交换任意两个输入向量的位置都会改变其正负号.
- 例子, 面积
2-形式. 在 \(\mathbb{R}^2\) 内, 定义:- \(\mathcal{A} (u, v) =\)
以
\(u\)
和
\(v\)
为边的平行四边形的有向面积, 则
\(\mathcal{A}\)
是一个
2-形式.
- \(\mathcal{A} (u, v) =\)
以
\(u\)
和
\(v\)
为边的平行四边形的有向面积, 则
\(\mathcal{A}\)
是一个
- 如果
\(Ψ\)
是一个一般的
2-形式, 所谓反对称性就是交换输入的两个向量的位置有 \(Ψ(v, u) = - Ψ(u, v)\), 所以对于任意的 \(u\) 都有 \(Ψ(u, u) = 0\).- 对于面积
2-形式的情况, 这个等式的几何意义是显然的: - 如果将 \(\mathcal{A} (u, v)\) 的 \(v\) 变成 \(u\), 则平行四边形收缩成一条线段, 其面积就收缩为零了, 所以我们有 \(\mathcal{A} (u, u) = 0\).
- 对于面积
两个 1-形式的楔积
- 这是一种新的乘法, 称为
楔积, 记为 \(\land\): \(φ \land ψ ≡ φ \otimes ψ - ψ \otimes φ\).- 就像我们可以借助张量积用低阶张量系统地构建高阶张量一样, 也可以借助楔积用低次形式构建高次形式.
- 我们强调, 使
\(φ \land ψ\)
变成
2-形式的原因是, 当作用于一对向量时, 它关于两个输入空位都是线性的, 并且交换两个输入向量只是反转输出的正负号,其大小保持不变:- \((φ \land ψ) (v_1, v_2) = φ(v_1) ψ(v_2) - ψ(v_1) φ(v_2) =- (φ \land ψ) (v_2, v_1)\).
- 注意: 还存在另一种反对称性, 也就是楔积本身的反对称性.
保持输入向量的顺序不变, 但是交换楔积中两个
1-形式的次序, 我们可以看到 - \((φ \land ψ) (v_1, v_2) =- (ψ \land φ) (v_1, v_2)\).
- 抽出其中的输入向量, 从定义显然可以证明楔积本身也具有反对称性: \(φ \land ψ = - (ψ \land φ)\).
- 由此可见, 对于任意 \(ψ\) 有 \(ψ \land ψ = 0\).
- 还可以注意到, 楔积对加法服从分配律: \(φ \land (ψ + σ) = φ \land ψ + φ \land σ\).
- 将楔积
\(φ \land ψ\)
应用于
\(\mathbb{R}^n\)
内的任意平行四边形时, 它输出的是, 映射
\(F\)
将这个平行四边形映射到
\(\mathbb{R}^2\)
中的像平行四边形的有向面积:
- \((φ \land ψ) (v_1, v_2) = \mathcal{A} [F(v_1), F(v_2)]\).
注: 上述结果在某些书籍就是
楔积的定义
基底 2-形式及投影
- 回想一下, 张量集
\(\{ d x^i \otimes d x^j \}\)
构成
\(\begin{Bmatrix}
0 \\
2
\end{Bmatrix}\)
阶张量的一组基, 适用于所有这些张量, 包括
2-形式. 但对于2-形式的情况, 我们可以更进一步: 由形如 \(d x^i \land d x^j\) (其中 \(i < j\)) 的2-形式组成的集合是所有2-形式的一个基底.- 设置条件
\(i < j\)
只是为了避免列出重复的
2-形式. 例如, \(d x^3 \land d x^2 = - (d x^2 \land d x^3)\). - 由于
\(d x^i \land d x^i = 0\),
就可以从
\(d x^i\)
(\(i ≤ n\))
中选取不同的无序对, 然后求它们的楔积, 形成非零 (非冗余) 的
2-形式基. - 那么, 在
\(\mathbb{R}^n\)
中, 所有
2-形式的集合是一个 \(\frac{1}{2} n (n - 1)\) 维的向量空间.
- 设置条件
\(i < j\)
只是为了避免列出重复的
-
设 \(P\) 是 \(\mathbb{R}^3\) 中的平行四边形, \(\mathcal{A}_z\) 是 \(P\) 在 \((x, y)\) 平面上 (沿 \(z\) 轴方向) 的
正交投影, 则将 \((dx \land dy)\) 作用于 \(P\) 的结果是 \(\mathcal{A}_z\) 的有向面积. 2-形式基的几何意义. 每个2-形式基产生 \(P\) 在相关坐标平面上投影的面积. 例如, \((dx \land dy) (v_1, v_2) = \mathcal{A}_z\), 是 \(P\) 沿 \(z\) 方向在 \((x, y)\) 平面上投影的面积.- 另外两个
2-形式基的意义是类似的: \(dy \land dz\) 是投影 (沿 \(x\) 轴方向) 在 \((y, z)\) 平面上的面积 \(\mathcal{A}_x\); \(dz \land dx\) 是投影 (沿 \(y\) 轴方向) 在 \((z, x)\) 平面上的面积 \(\mathcal{A}_y\).
- 另外两个
2-形式与 R3 中向量的联系: 流量
在且仅在三维空间中, 2-形式的分量与向量的分量的数量是相同的.
物理学家在 19 世纪 80 年代成功开创的向量微积分,
至今仍然被认为是 21 世纪现代科学不可或缺的工具.
现在可以看到, 它的基础就是这个奇异的数值巧合.
- 为了开始深入研究, 我们用单一的上标重写一般
2-形式\(Ψ\) 的分量, 并立即将它们与相应向量的分量等同起来. 我们将用与2-形式相同的希腊字母表示相应向量的分量, 但加下划线: \(\underline{Ψ}\), 即- \(Ψ = Ψ^1 (d x^2 \land d x^3) + Ψ^2 (d x^3 \land d x^1) + Ψ^3 (d x^1 \land d x^2) \leftrightarrows \underline{Ψ} = \begin{bmatrix} Ψ^1 \\ Ψ^2 \\ Ψ^3 \end{bmatrix}\).