一般不会阅读久远前的书籍, 但是
外尔
之大名, 总是不绝于耳! 于我等凡俗之人而言, 爱因斯坦, 薛定谔等先贤, 已是世间传奇. 而外尔在这些群星璀璨的大家之中, 尤又谓之: 数学物理之巨擘! 此生, 怎可不读外尔?
再者, 20 世纪的物理的数学形式的进化 (比如: 群), 于此书便可见发展之脉络~
读者在开始时所需要的理论储备是最少的. 狭义相对论不仅详尽地论述了相对论,
而且就连麦克斯韦理论和解析几何也在其主要内容中得到了发展.
这是整个计划的一部分. 张量微积分的建立 -- 仅仅依靠它,
就有可能充分地表达所讨论的物理知识 -- 占据了相当大的空间.
外尔
1918 年, 复活节
注: 此处的公式会忽略格式的细节, 比如原书的粗体小写字母表示向量, 基本忽略加粗 (好吧, 其实所有的文章都是). 因为公式并非本书的重点~
如果一个绝对孤立的物理系统 (即一个不受外部影响的系统)
再次恢复到与它在某个较早的时刻完全相同的状态,
那么同样状态的继承将及时地重复, 而整个事件系列将构成一个循环.
一般来说, 这样的系统叫作时钟. 循环的每个周期持续的时间等长.
通过测量时间来确定时间的数学基础是基于这两个关系,
"较早 (或较晚) 时间" 和 "相等时间" 计量的性质可简要说明如下:
时间是均匀的, 也就是说, 一个时间点只能通过单独指定才能给出.
不存在由时间的一般性质而产生的固有性质,
而时间的一般性质可归因于任何一点, 但不能归因于任何另一点;
或者, 从这两个基本关系中逻辑推导出来的每一个属性要么属于所有点,
要么不属于任何点. 同样的道理也适用于时间-长度和点对.
基于这两个关系并适用于一个点对的属性必须适用于每一个点对 AB (其中 A 早于 B).
然而, 在三个点对的情况下, 就会产生差异. 如果给定任意两个时间点 O 和 E,
使 O 早于 E, 则可以通过将它们引用单位距离 OE 在概念上来确定进一步的时间点 P.
测量的一个本质特征是:
通过个别规范"确定"一个对象与通过某些概念手段确定同一对象之间的区别.
后者可能只相对于必须直接定义的对象. 这就是为什么相对论总是与测量有关.
相对论提出的关于任意对象领域的一般问题的形式是:
(1) 必须给出什么, 以便相对于它 (以及任何期望的精度),
人们可以从所考虑的连续扩展的对象领域中, 从概念上挑出一个任意对象 P?
必须给出的 (对象的连续扩展域) 称为坐标系统,
概念的定义称为坐标系统中 P 的坐标 (或横坐标). 从客观的观点来讲,
两个不同的坐标系是完全等价的. 没有可以在概念上固定的属性,
它适用于一个坐标系, 但不适用于另一个坐标系;
那种只适用于一个坐标系而不适用于另一个坐标系的概念上固定的属性是不存在的;
因为如果那样的话, 就会有太多的东西必须直接给定了.
(2) 在两个不同的坐标系中, 同一个任意对象 P 的坐标之间存在什么关系?
欧几里得空间
我们可以说, 直线是由同一无穷小平移及其逆的无限重复的点导出的.
而平面则是通过将一条直线 g 沿另一条直线 h
的无穷小平移及其逆的无限重复导出的.
如果 g 和 h 是通过 A 点的两条不同的直线,
那么如果我们对 g 应用所有使 h 变换成其自身的变换,
所有由 g 产生的直线全体就形成 g 和 h 所确定的公共平面.
只有当我们首先将全等变换的一般概念缩小到平移的概念,
并以此作为公理基础时, 我们才能成功地将逻辑顺序引入几何学的结构中.
然而, 通过这样做, 我们就得出了一个只涉及变换的几何学, 即仿射几何,
在这种几何学的范围内, 一般全等概念必须重新引入.
仿射几何基础
向量 \(e_1\) (乘以实数) -> 直线; 引入另一个非共线向量 \(e_2\), 线性组合 -> 平面; 再引入另一个平面外向量 \(e_3\) 线性组合 -> (三维) 空间.
如果我们首先从 O 点开始度量流形 M 的所有向量, 然后从另一任意点 O' 开始度量,
则得到的两个线性点的总体被称为是彼此平行的. 平行平面和平行直线的定义就包含在这里.
线性变换的概念在仿射几何中所起的作用与全等变换在一般几何中的作用相同,
故而它有着基本的重要性. 在仿射变换中, 线性无关向量仍转化为线性无关向量;
同样地, 一个 h-维线性结构变成一个相似的结构;
平行变换成平行; 一个坐标系转化为一个新的坐标系.
线性方程组的基本定理是:
那些满足 h 个独立线性方程组的点, 构成 (n - h) 维的点构型.
- 为了完成从仿射几何到完备度量几何的过渡,
我们还需要一些在线性代数中出现的概念和事实,
这些概念和事实涉及
双线性
和二次型
的概念.- 任意两个向量
\(x\)
和
\(y\)
的函数
\(Q(x, y)\),
如果对于
\(x\)
和
\(y\)
中都是线性形式, 则称为
双线性形式
.
- 任意两个向量
\(x\)
和
\(y\)
的函数
\(Q(x, y)\),
如果对于
\(x\)
和
\(y\)
中都是线性形式, 则称为
- 如果
\(Q(y, x) = Q(x, y)\),
则称双线性形式为
对称形式
. 这在系数中由对称性质 \(a_{ki} = a_{ik}\) 体现出来. 每一个双线性型 \(Q(x, y)\) 都产生一个二次型
, 它仅依赖于一个可变向量 \(x\)- \(Q(x) = Q(x, x) = \sum_{i, k = 1}^{n} a_{ik} ξ_i ξ_k\).
- 这样, 每一个二次型一般都是由一个而且只由一个
对称
的双线性形式导出. - 我们刚刚得到的二次型 \(Q(x)\) 也可以由对称形式 \(\frac{1}{2} \{ Q(x, y) + Q(y, x) \}\) 通过令 \(x\) 与 \(y\) 恒等而产生.
- 如果对向量
\(x ≠ 0\)
的每个值满足不等式
\(Q(x) > 0\),
则称二次型是
正定
的. 这种形式肯定是非退化的, 因为向量 \(x ≠ 0\) 的任何值都不能使 \(Q(x, y)\) 在 \(y\) 中完全消失, 所以当 \(y = x\) 时结果是正的.
度量几何基础
- 任意两个向量的标量乘积 \(x \cdot y\) 是对称的双线性形式, 由此产生的二次型是正定的.
因此, 我们看到, 不是向量的长度, 而是向量长度的平方,
它以一种简单的有理方式依赖于向量本身; 它是二次型.
这就是毕达哥拉斯定理的真正内容.
标量积只不过是导出这种二次型的对称双线性形式.
因此, 我们制定如下的公理.
- 度量公理: 如果选定非零的单位向量
\(e\),
则任意两个向量
\(x\)
和
\(y\)
唯一地确定一个数
\((x \cdot y) = Q(x, y)\);
后者依赖于两个向量, 是一个对称的双线性形式. 由此产生的二次型
\((x \cdot x) = Q(x)\)
是正定的, 且
\(Q(e) = 1\).
- 我们称
\(Q\)
为
度量基本形式
. 因此我们有, 一个仿射变换将向量 \(x\) 变换为 \(x'\), 一般地, 如果它使得向量的度量基本形式保持不变, 即 \(Q(x) = Q(x')\), 则称该仿射变换是全等变换.
- 我们称
\(Q\)
为
通过全等变换可以相互转换的两个几何图形是全等的.
全等的概念是由这些陈述在我们的公理方案中定义的.
如果我们有一个运算域, 则可以在其中选择任一正定的二次型,
把它 "提升" 到度量基本形式的位置, 并以此为基础,
如刚才所做的方法那样定义全等的概念.
然后, 这种形式赋予仿射空间以度量属性,
而欧几里得几何学整体上现在都成立.
我们所得到的公式并不局限于任何特殊的维数.
-
\[Q(e_i, e_j) =
\begin{cases}
1 & (i = j), \\
0 & (i ≠ j),
\end{cases}\]
- 则
\(n\)
个独立的向量形成一个
笛卡儿
坐标系. - 从度量几何的观点来看, 所有的坐标系都是等价的.
- 则
\(n\)
个独立的向量形成一个
- 对应于每一个非退化二次型
\(Q\),
可以引入坐标系
\(e_i\),
使得
- \(Q(x) = ε_1 x_1^2 + ε_2 x_2^2 + ... + ε_n x_n^2\) \((ε_i = ±1)\).
- \(Q(e_i) = ε_i\), \(Q(e_i, e_k) = 0 (i ≠ k)\).
- \(x_i = ε_i \cdot Q(e_i, x)\).
- 在 “不确定的” 的情形下, 可以得出一个重要的推论. 与
\(ε_i\)
相关联的并且分别具有正负号数字
\(r\)
和
\(s\)
由二次型决定: 可以说它有
\(r\)
个正维数和
\(s\)
个负维数.
- (\(s\) 可称为二次形式的惯性指标, 而刚刚列举的定理以 “惯性定律” 的名称命名. 二阶曲面的分类取决于它.)
- \(r\) 和 \(s\) 的特征可以不变地表示为: 存在 \(r\) 个相互正交的向量 \(e\), 其中 \(Q(e) > 0\); 但是, 对于与这些向量正交且不等于 \(0\) 的向量 \(x\), 则必然是 \(Q(x) < 0\). 因此, 这种向量不能超过 \(r\) 个. 相应的定理适用于 \(s\).
- 在相对论中, 具有一个负的和
\((n - 1)\)
个正维的二次型的情形变得非常重要.
在三维空间中, 如果我们使用仿射坐标,
- \[- x_1^2 + x_2^2 + x_3^2 = 0\]
- 是顶点位于原点的锥面方程, 并由两个锥体组成, 正如 \(x_1^2\) 项的负号表示的那样, 它们只在坐标原点处互相连接. 这种划分分为两个部分, 使我们能够在相对论中区分过去和未来.
- 全等变换的行列式
\(Δ = | a_i^k |\)
与其逆变换的行列式是相等的, 因为其乘积必等于
\(1\),
因此
\(Δ = ±1\).
- 正号或负号将取决于全等变换是实像变换还是镜像变换 (“横向反演”).
- 度量几何的解析处理有两种可能性.
任何一种方法对所使用的仿射坐标系都没有限制:
接下来的问题是发展一种关于任意线性变换的不变性理论,
然而, 在这种理论中, 与仿射几何的情况相反,
我们有一个确定的不变二次型, 即度量基本形式
- \[Q(x) = \sum_{i, k = 1}^{n} g_{ik} ξ_i ξ_k\]
- 将一劳永逸地作为绝对的数据.
- 或者, 我们可以从一开始就使用笛卡儿坐标系: 在这种情况下, 我们关注正交变换的不变性理论, 即线性变换, 其中系数满足正交条件.
我们必须在这里遵循第一种方法,
以便能够在以后进行超越欧几里得几何学极限的推广.
这一计划从代数的角度来看似乎也是明智的,
因为对所有线性变换保持不变的表达式进行研究,
要比仅仅对正交变换保持不变的那些表达式进行研究要容易得多
(受次要限制的一类转换不容易定义).
虽然这么说不太好, 但还是忍不住拿 从矢量到张量 做个对比, 简直云泥之别! 外尔的娓娓道来, 行云流水, 一气呵成; 而另者, 词条罗列, 资料汇编罢了~
张量
每一个线性变换都对应着一个也是唯一的一个逆变换.
- 协变分量与逆变分量之间的联系由公式
- \[ξ_i = \sum_k (e_i \cdot e_k) ξ^k = \sum_k g_{ik} ξ^k\]
- 给出, 或由它们的逆 \(ξ^i = \sum_k g^{ik} ξ_k\) 分别给出.
在笛卡儿坐标系中, 协变分量与逆变分量重合.
必须再次强调的是, 在仿射空间中,
只有逆变分量我们可以处理, 因此,
我们在没有更详细说明的情况下讨论位移的分量时,
就隐含了逆步变量的假定.
当变量被反向变换时, 单线性形式的系数是共变的,
而如果变量是共变的则其系数是反变的.
协变指标总是以后缀形式附加到系数后面,
而反变指标则作为后缀写在系数的顶部.
带下标的变量总是被共变地变换为坐标系的基本向量,
带上标的变量则被逆变地变换为坐标系的基本向量.
如果给出了坐标系统中的分量, 张量是完全已知的
(当然, 假定给出了坐标系统本身); 然而, 这些分量可以任意规定.
张量演算涉及与坐标系统无关的张量的性质和关系.
以下的准则显然与张量概念的阐述是等价的.
如果在每一种情况下, 即假定 (1)
当一个任意逆变向量的分量被替换为变量的逆变序列时;
(2) 当一个任意协变向量的分量被替换成一个变量的协变序列时,
它都有一个与坐标系无关的值, 则这个依赖于坐标系的多变量线性形式称为张量.
如果现在从仿射回到度量几何, 我们可以看到,
仿射几何中影响张量自身的协变和逆变之间的区别:
缩小到仅仅是表示方式上的差异.
因此, 我们不再讨论协变, 混合和逆变张量,
我们发现在这里只讨论一个张量的协变, 混合和逆变的分量会更为方便.
在上述注解之后, 很明显,
从一个张量到另一个具有不同的协变性质的张量的变换可以简单地表述如下.
如果我们把张量中的逆变变量解释为任意位移的逆变分量,
而协变变量解释为任意位移的协变分量,
那么张量就转化为几个独立于坐标系统的任意位移的线性形式.
通过以它们的协变或反变分量的方式表示这些论点,
这表明它本身是适当的, 我们接着要考虑的是相同张量的其他表示形式.
在度量空间中, 从所说的可以清楚地看到,
协变向量和逆变向量之间的区别消失了:
在这种情况下, 我们可以表示一个力, 根据我们的观点,
它本质上是一个协变矢量, 作为一个逆变向量, 也可以通过位移来表示.
几何量和物理量是标量, 矢量和张量:
这表达了这些量存在的空间的数学构成.
数学的对称性这一条件绝不仅仅局限于几何学,
相反, 它在物理学中实现了其完全的有效性.
由于自然现象发生在度量空间之中,
张量微积分是表达它们的统一性的自然数学工具.
张量代数
在一般向量分析中, 用矢量代替反对称张量,
在表达简易性方面是合理的, 但在某些方面它却隐藏了本质特征;
它产生了众所周知的电动力学中的"游动规则", 在明智的意义上,
这并不意味着在发生电动力学事件的空间中有一个独特的扭曲方向;
它们之所以必要, 仅仅是因为磁场的强度被视为矢量, 而在现实中,
它是一个反对称的张量 (就像两个矢量的矢量乘积一样).
如果再给我们一个空间维度, 这个错误就不会发生.
无论在什么地方对某些指标进行求和,
求和指标在求和的成员中都出现两次,
一次为系数的上指标, 另一次为系数的下指标:
每一个这样的求和都是缩并的例子.