- 群论与量子力学
- 第一版: 1928 年; 第二版: 1930 年
虽然量子理论的历史只能追溯到 1900 年,
但群论的起源却迷失在历史几乎难以触及的过去.
最早的艺术作品表明, 平面图形的对称群甚至在那时就已经为人们所知,
尽管关于这些群的理论直到 18 世纪后半叶和 19 世纪才有了明确的形式.
克莱因认为群的概念是 19 世纪数学所具有的最大特色.
到目前为止, 它在自然科学中最重要的应用是对晶体对称性的描述.
但最近人们认识到, 群论对量子物理有着根本的重要性.
它在量子物理学中揭示出一些基本特征,
而这些特征既不依赖于一种特殊形式的动力学定律,
也不依赖于对涉及的那些力的特殊假设. 我们很可能会预期,
只有量子物理学的这一部分最可能会成为一个持久不衰的领域.
有两个群 (一个是三维空间中的旋转群, 另一个是置换群)
在量子物理学中发挥着主要作用, 这是因为,
支配着聚集在静止的原子核或离子周围的电子的可能排布的那些规律:
都是关于原子核呈球对称的, 并且由于构成原子或离子的许多电子都是全同的,
因此这些可能的排布在各个电子的置换下是不变的.
对群的研究, 首先在群的线性变换表示论中成为一个相互联系的, 完整的理论,
而这正是充分描述量子力学中的那些关系所必需的, 数学上最重要的部分.
除了所谓的主量子数之外, 所有量子数都是描述群表示特征的指标.
酉几何
其实译者应该把本书的符号改掉的~
- 假设
\(\mathfrak{R}'\)
是一个
\(n\)
维子空间, 如果两个向量
\(\mathfrak{x}\)
和
\(\mathfrak{y}\)
的差在
\(\mathfrak{R}'\)
中, 我们就说它们模
\(\mathfrak{R}'\)
同余:
- \(\mathfrak{x} ≡ \mathfrak{y} (mod. \mathfrak{R}')\).
- 同余满足任何相等关系所要求的公理:
- 每一个向量都与自身同余;
- 如果 \(\mathfrak{x} ≡ \mathfrak{y} (mod. \mathfrak{R}')\), 那么 \(\mathfrak{y} ≡ \mathfrak{x} (mod. \mathfrak{R}')\);
- 如果 \(\mathfrak{x} ≡ \mathfrak{y} (mod. \mathfrak{R}')\) 且 \(\mathfrak{y} ≡ \mathfrak{z} (mod. \mathfrak{R}')\), 那么 \(\mathfrak{x} ≡ \mathfrak{z} (mod. \mathfrak{R}')\).
- 因此, 可以把模 \(\mathfrak{R}'\) 同余的向量看作彼此是绝无差别的.
- 通过这种可称为关于
\(\mathfrak{R}'\)
的
投影的抽象, \(n\) 维空间 \(\mathfrak{R}\) 产生了一个 \((n - n')\) 维空间 \(\bar{\mathfrak{R}}\). \(\bar{\mathfrak{R}}\) 也是一个向量空间, 因为从- \(\mathfrak{x}_1 ≡ \mathfrak{x}_2\), \(\mathfrak{y}_1 ≡ \mathfrak{y}_2 (mod. \mathfrak{R}')\)
- 得到下列关系 \(a \mathfrak{x}_1 ≡ a \mathfrak{x}_2\), \(\mathfrak{x}_1 + \mathfrak{y}_1 ≡ \mathfrak{x}_2 + \mathfrak{y}_2 (mod. \mathfrak{R}')\).
- 因此, 数乘运算和加法运算可以被认为是直接作用于
\(\bar{\mathfrak{R}}\)
的向量
\(\bar{\mathfrak{x}}\)
上的运算. 所有模
\(\mathfrak{R}'\)
同余的
\(\mathfrak{R}\)
的向量
\(\mathfrak{x}\)
都给出相同的
\(\bar{\mathfrak{R}}\)
的向量
\(\bar{\mathfrak{x}}\).
- 如果 \(\mathfrak{R}'\) 是一维的, 并且由 \(\mathfrak{e}_i\) 张成, 那么上面的过程就是我们熟悉的 \(\mathfrak{e}_i\) 方向上的平行投影.
- 没有必要给出 \(\mathfrak{R}\) 的一个向其投影的 \((n - 1)\) 维子空间.
- 任意一个向量
\(\mathfrak{x}\)
在新坐标系和旧坐标系中的分量如果分别是
\(x_i\)
和
\(x'_i\),
那么
\(\mathfrak{x} = \sum_i x_i \mathfrak{e}_i =
\sum_k x'_k \mathfrak{e}'_k\),
可得变换定律
\(x_i = \sum_{k = 1}^{n} a_{ik} x'_k\).
- 坐标向量
\(\mathfrak{e}'_k\)
也线性无关这一要求在算术上表示为系数
\(a_{ik}\)
构成的行列式不为零. 在向新的坐标系
\(\mathfrak{e}'_i\)
过渡时,
\(\mathfrak{R}\)
中的向量
\(\mathfrak{x}\),
\(\mathfrak{y}\),
… 的各分量经历同一变换, 于是我们说这些分量发生
同步变换. - 不过, 我们对公式
\(x_i = \sum_{k = 1}^{n} a_{ik} x'_k\)
也可以作另一种解释; 它是空间
\(\mathfrak{R}\)
在其自身上的
线性或仿射对应或映射的表达式.
- 坐标向量
\(\mathfrak{e}'_k\)
也线性无关这一要求在算术上表示为系数
\(a_{ik}\)
构成的行列式不为零. 在向新的坐标系
\(\mathfrak{e}'_i\)
过渡时,
\(\mathfrak{R}\)
中的向量
\(\mathfrak{x}\),
\(\mathfrak{y}\),
… 的各分量经历同一变换, 于是我们说这些分量发生
- 现在让我们回来讨论一个空间
\(\mathfrak{R}\)
到其自身的线性对应
\(A\).
在
\(\mathfrak{R}'\)
是
\(\mathfrak{R}\)
的一个
\(n'\)
维线性子空间的情况下, 如果
\(A\)
将
\(\mathfrak{R}'\)
的任何向量变换到
\(\mathfrak{R}'\)
的任何向量, 那么我们就说
\(A\)
使
\(\mathfrak{R}'\)
不变. 如果我们这样选择坐标系:- 使得前 \(n'\) 个基本向量位于 \(\mathfrak{R}'\) 中, 那么与一个使 \(\mathfrak{R}'\) 不变的对应相应的矩阵, \(n'\) 列 \(n - n'\) 行矩形中的所有元素都为零. \(A\) 包含着 \(\mathfrak{R}'\) 到其自身的一个对应, 同时也包含着将 \(\mathfrak{R}\) 关于 \(\mathfrak{R}'\) 投影而产生的空间 \(\bar{\mathfrak{R}}\) 到其自身的一个对应.
- 这些对应的矩阵由两个带阴影的正方形组成. 如果将
\(\mathfrak{R}\)
分解为
\(\mathfrak{R}_1 + \mathfrak{R}_2\),
并且如果对应
\(A\)
同时分别保持子空间
\(\mathfrak{R}_1\)
和
\(\mathfrak{R}_2\)
不变, 那么
\(A\)
就
完全约化为 \(\mathfrak{R}_1\) 到其自身的一个对应和 \(\mathfrak{R}_2\) 到其自身的一个对应. - 如果坐标系选择得适应分解形式 \(\mathfrak{R}_1 + \mathfrak{R}_2\), 那么矩阵 \(A\) 就完全约化为两个沿主对角线排列的方阵.
- 如果
\(A\)
是在给定坐标系中
\(\mathfrak{R}\)
到其自身的一个对应的矩阵, 而
\(A'\)
是它在由第一个坐标系通过一个可逆变换
\(S\)
得到的另一个坐标系中的矩阵, 那么有
\(A' = S A^{-1} S\).
寻找这种对应的一个不变特征可用代数方式确切表述如下:
- 寻找一些由任意矩阵的元所构成的表达式, 使它们对于等价的矩阵具有相同的值. 所谓等价的矩阵指的是它们之间存在着关系 \(A' = S A^{-1} S\) 的矩阵 \(A\), \(A'\).
- 实现这一点的方法可用一个相关问题来说明, 即找到一个向量 \(\mathfrak{x} ≠ 0\), 该向量在 \(A\) 的作用下变换为自身的一个倍数 \(λ \mathfrak{x}\).
对偶向量空间
- 如果任意向量
\(\mathfrak{x}\)
的一个函数
\(L(\mathfrak{x})\)
具有如下形式
- \(α_1 x_1 + α_2 x_2 + ... + α_n x_n\),
- 那么它就称为一个
线性形式. 这个概念在仿射几何的意义上是不变的: 它可以用下列函数性质来界定: - \(L(α \mathfrak{x}) = α \cdot L(\mathfrak{x})\), \(L(\mathfrak{x} + \mathfrak{y}) = L(\mathfrak{x}) + L(\mathfrak{y})\).
- 表达式 \(α_1 x_1 + α_2 x_2 + ... + α_n x_n\) 显然具有这些性质.
- 反过来, 引入坐标系 \(\mathfrak{e}_i\), 并设 \(\mathfrak{x} = \sum x_i \mathfrak{e}_i\), 于是得到
- \(L(\mathfrak{x}) = \sum_i x_i L(\mathfrak{e}_i) = \sum_i α_i x_i\); \(α_i = L(\mathfrak{e}_i)\).
- 在过渡到另一个坐标系, 使得任意向量
\(\mathfrak{x}\)
的分量
\(x_i\)
经过变换时, 线性形式变为
\(\sum_i α_i x_i = \sum_i α'_i x'_i\),
- 其中的系数 \(α'_i\) 由等式 \(α'_k = \sum_i a_{ik} \cdot α_i\) 与原系数 \(α_i\) 相关联.
- 一个线性形式的系数
\(α_i\)
称为与变量
\(x_i\)
是
逆步变换的.
- 但是, 没有必要将
\(α_i\)
作为常量, 而将
\(x_i\)
作为变量来考虑. 当
\(α_i\)
不全为零时, 等式
\(L(\mathfrak{x}) = 0\)
定义了一个 “平面”, 即一个
\((n - 1)\)
维子空间; 如果一个向量
\(\mathfrak{x}\)
的各分量满足这个方程, 那么该向量就在这个平面上.
- 但另一方面, 我们可以求通过一个给定非零向量 \(\mathfrak{x}^0\) 的所有平面的方程, 那么此时 \(x_i = x_i^0\) 是常数, 而 \(α_i\) 是变量.
- 因此, 最合适的做法是并行考虑
\((x_1, x_2, ..., x_n)\)
和
\((α_1, α_2, ..., α_n)\)
这两个集合. 因此, 我们除了空间
\(\mathfrak{R}\)
以外再引入另一个
\(n\)
维向量空间, 即
对偶空间 \(P\).
- 引入这个对偶空间的目的实际上是为了使我们能够:
将每个一对一变换与一个逆步变换联系起来.
重申一下, 如果两个可逆线性变换
\(x = A x'\),
\(ξ = A ξ'\)
保持内积不变, 即
- \(ξ_1 x_1 + ξ_2 x_2 + ... + ξ_n x_n = ξ'_1 x'_1 + ξ'_2 x'_2 + ... + ξ'_n x'_n\),
- 那么它们彼此是互为逆步的. 如果
\(\mathfrak{R}\)
的一个向量
\(\mathfrak{x}\)
和
\(P\)
的一个向量
\(ξ\)
的乘积 (内积) 为零, 那么就说这两个向量是
对合的. - \(\mathfrak{R}\) 中的一条射线确定了 \(P\) 中的一个平面, 即与这条给定射线对合的各向量组成的平面, 反之亦然. 对偶是一种互反关系.
- (在相对论中, 通常把
\(\mathfrak{R}\)
和
\(P\)
中的向量分别称为
逆变向量和协变向量.) - 通过交换矩阵
\(A = [a_{ki}]\)
的行和列, 就得到
\(A\)
的
对偶或转置矩阵 \(A^{*}\).
对偶, 逆变, 协变
- 对应
\(A\)
和它的对偶
\(A^{*}\)
之间存在的互反关系可以表述如下: 如果
\(\mathfrak{x}\)
是
\(\mathfrak{R}\)
中的任意一个向量,
\(η\)
是
\(Σ\)
中的任意一个向量, 那么向量
\(A \mathfrak{x}\)
与
\(η\)
的乘积就等于
\(\mathfrak{x}\)
与
\(A^{*} η\)
的乘积. 对偶对应符合下列两条线性定律
- \((A_1 + A_2)^{*} = A_1^{*} + A_2^{*}\), \((aA)^{*} = a \cdot A^{*}\).
- 如果 \(A\) 是 \(\mathfrak{R}\) 到 \(\mathfrak{S}\) 的一个对应, 而 \(B\) 是 \(\mathfrak{S}\) 到 \(\mathfrak{T}\) 的一个对应, 那么由于
- \((BA)^{*} = A^{*} B^{*}\),
- \(BA\) 就将 \(\mathfrak{R}\) 线性映射到 \(\mathfrak{T}\), \(A^{*} B^{*}\) 将 \(\mathfrak{T}\) 的对偶空间 \(T\) 映射到 \(\mathfrak{R}\) 的对偶 \(P\).
- 设
\(\mathfrak{R}'\)
为
\(\mathfrak{R} = \mathfrak{R}_n\)
的
\(n'\)
维子空间. 由于关于线性齐次方程的那些最简单定理,
\(P\)
的所有与
\(\mathfrak{R}'\)
的全体向量对合的向量显然构成
\(P\)
的一个
\((n - n')\)
维的子空间
\(P'\).
并且我们由此立即得到以下结果:
- 如果 \(\mathfrak{R}\) 到其自身的一个对应 \(A\) 使子空间 \(\mathfrak{R}'\) 不变, 那么 \(P\) 到其自身的对偶对应 \(A^{*}\) 使相关的子空间 \(P'\) 不变.
- 如果
\(\mathfrak{R}\)
到其自身的一个对应
\(A\)
使
\(n'\)
维子空间
\(\mathfrak{R}'\)
不变, 那么这个
\((n - n')\)
维子空间
\(P'\)
在到其自身的对偶对应
\(A^{*}\)
下不变. 如果将
\(\mathfrak{R}\)
分解为
\(\mathfrak{R}_1 + \mathfrak{R}_2 + ...\),
并且如果
\(A\)
使每个子空间
\(\mathfrak{R}_α\)
不变, 那么
\(A^{*}\)
就使每个子空间
\(P_α\)
不变.
- 如果 \(A\) 是 \(\mathfrak{R}\) 的任何对应, 而 \([A]_{αβ}\) 是 \(\mathfrak{R}_α\) 与 \(\mathfrak{R}_β\) 相交的那部分, 那么 \(A^{*}\) 的 \(P_β\) 与 \(P_α\) 相交的那部分 \([A^{*}]_{βα}\) 与 \([A]_{αβ}\) 是对偶的:
- \([A^{*}]_{βα} = [A]_{αβ}^{*}\).
- \([A]_{αβ}\) 将 \(\mathfrak{R}_β\) 映射到 \(\mathfrak{R}_α\), 而 \([A^{*}]_{βα}\) 将对偶空间 \(P_α\) 映射到 \(P_β\).
酉几何和厄米形式
- 我们将把一切
复数构成的连续统作为各分量可取值的范围.平方和在这个域中失去了确定性. 平方和可以为零, 而这并不意味着每一项都是零. 因此, 可取的做法是将二次形式 (平方和) 替换为以下 “单位厄米形式”- \(\bar{x}_1 x_1 + \bar{x}_2 x_2 + ... + \bar{x}_n x_n\),
- 其中
\(\bar{x}\)
表示一个数
\(x\)
的复共轭,
单位厄米形式的 \(\mathfrak{x}^2\) 的值看作向量 \(\mathfrak{x} = (x_1, x_2, ..., x_n)\) 的绝对量的平方, 并把相应的双线性形式 - \[(\mathfrak{x} \mathfrak{y}) = x_1 y_1 + x_2 y_2 + ... + x_n y_n\]
- 看作两个向量
\(\mathfrak{x}\)
和
\(\mathfrak{y} = (y_1, y_2, ..., y_n)\)
的
标量积. 如果在一个坐标系中向量 \(\mathfrak{x}\) 的绝对量的平方由各分量 \(x_i\) 以平方和的形式表示, 那就说这个坐标系是正规的. 在一个正规坐标系 \(\mathfrak{e}_i\) 中, 这些分量就是标量积 - \(x_i = (\mathfrak{e}_i \mathfrak{x})\).
- 因此从一个正规坐标系到另一个正规坐标系的变换使
单位厄米形式保持不变, 这种变换被称为酉变换.
从一个正规坐标系到另一个正规坐标系的变换使单位厄米形式保持不变: 首先, 此处是根据
酉变换的定义, 推出了酉矩阵的主要性质~ 然后, 把使单位厄米形式保持不变视作需求, 去反推; 是个不错的练习~
- 我们看到酉空间
\(\mathfrak{R}\)
可以表征为这样一个事实: 它的共轭复数空间
\(\bar{\mathfrak{R}}\)
与它的对偶
\(P\)
重合, 或者更准确地说, 一个向量
\(\mathfrak{x}\)
的复共轭
\(\bar{\mathfrak{x}}\)
也可以同时被视为它的对偶. 我们发现, 对偶空间
\(Σ\)
到对偶空间
\(P\)
的对应
\(A^{*}\)
以一种不变的方式与
\(m\)
维酉空间
\(\mathfrak{R}\)
到
\(n\)
维酉空间
\(\mathfrak{S}\)
的一个对应
\(A\)
相关联.
- 作为等式
\(P = \bar{\mathfrak{R}}\)
的一个结果, 对于酉空间而言
\(\widetilde{A}^{*} = \widetilde{A}\)
是
\(\mathfrak{S}\)
到
\(\mathfrak{R}\)
的一个对应, 我们称之为
\(A\)
的
厄米共轭. - \(\widetilde{A} A\) 是 \(\mathfrak{R}\) 到其自身的一个对应, \(A \widetilde{A}\) 是 \(\mathfrak{S}\) 到其自身的一个对应. \(\mathfrak{S}\) 的一个对应若将一般向量 \(\mathfrak{x}\) 变换成 \(\mathfrak{x}' = S \mathfrak{x}\), 而保持 \(\mathfrak{x}\) 的绝对量不变: \(\mathfrak{x}'^2 = \mathfrak{x}^2\), 那么它就是酉变换.
- 作为等式
\(P = \bar{\mathfrak{R}}\)
的一个结果, 对于酉空间而言
\(\widetilde{A}^{*} = \widetilde{A}\)
是
\(\mathfrak{S}\)
到
\(\mathfrak{R}\)
的一个对应, 我们称之为
\(A\)
的
如果由向量组成的两种构形,
其中任何一种都可以通过酉变换从另一种构形得到,
那么它们在酉几何中就是全同的. 也就是说,
酉几何是关于那些在任意酉变换下不变的关系的理论.
- 在处理酉对应或酉变换时,
总是有可能找到一个不变的子空间
\(\mathfrak{R}''\),
它与给定的一个不变子空间
\(\mathfrak{R}'\)
相关联, 从而使
\(\mathfrak{R} = \mathfrak{R}' + \mathfrak{R}''\).
前面关于投影的评注表明, 在酉几何中, 我们把
\(\mathfrak{R}\)
关于
\(\mathfrak{R}'\)
投影而得出的空间与子空间
\(\mathfrak{R}''\)
等同起来:
- 我们投射到垂直于 \(\mathfrak{R}'\) 的空间 \(\mathfrak{R}''\) 上. 为此, 我们注意到, 在 \(\mathfrak{R}\) 中所有关于模 \(\mathfrak{R}'\) 同余的向量 \(\mathfrak{a}\) 中, 有一个位于 \(\mathfrak{R}''\) 中的 \((\mathfrak{a})\). 于是我们有
- \((a \cdot \mathfrak{a}) = a (\mathfrak{a})\), \((\mathfrak{a} + \mathfrak{b}) = (\mathfrak{a}) + (\mathfrak{b})\).
- 正如我们已经看到的, 与到 \(\mathfrak{R}\) 自身的一个任意线性对应 \(A\)
- \[\mathfrak{y} \to \mathfrak{y}' = A \mathfrak{y} : y'_i = \sum_k a_{ik} y_k\]
- 相关的是双线性形式 \(\sum_{ik} = a_{ik} ξ_i y_k\),
- 这个形式线性地依赖于 \(P\) 中的一个向量 \(ξ\) 和 \(\mathfrak{R}\) 中的一个向量 \(\mathfrak{y}\).
- 因此在酉空间中, 我们可以将线性依赖于 \(\mathfrak{y} = (y_i)\) 和 \(\bar{\mathfrak{x}} = (\bar{x}_i)\) 的形式
- \[A(\mathfrak{x}, \mathfrak{y}) = \sum_{ik} a_{ik} \bar{x}_i y_k\]
- 从仿射几何到度量几何的过渡于是可以通过引入以下公理来实现:
- (\(δ\)) 一个向量 \(\mathfrak{x}\) 的绝对量的平方是一个实数 \(\mathfrak{x}^2\), 它是用 \(\mathfrak{x}\) 的分量表示的正定厄米形式.
- 由于
\(\mathfrak{R}\)
到其自身的对应
\(A\)
与
\(\mathfrak{R}\)
中的厄米形式
\(A\)
总是有关联, 因此我们可以论及
\(\mathfrak{R}\)
中的两个厄米形式
\(A\),
\(B\)
的乘积
\(BA\),
但是这个乘积一般而言不是厄米的, 因为
- \(\widetilde{BA} = \widetilde{A} \widetilde{B} = AB\).
- 厄米形式或对应 \(A\) 的迹是实数. 正定表达式 \(tr(A \widetilde{A}) = \sum_{i, k} | a_{ik} |^2\) 具有特别的重要性.
- 当 \(\mathfrak{R}\) 分解为互相垂直的子空间 \(\mathfrak{R}_α\) (\(α = 1, 2, ...\)) 时, 该对应的 \(A_{αβ}\) 那部分, 或者说, \(A\) 中由 \(\mathfrak{R}_α\) 与 \(\mathfrak{R}_β\) 相交得出的那部分的形式就唯一确定了.
- 它是 \(\mathfrak{R}_β\) 到 \(\mathfrak{R}_α\) 的一个对应, 而 \(\widetilde{A}_{βα}\), 即 \(\widetilde{A}\) 的 \(βα\) 部分, 是 \(\mathfrak{R}_α\) 到 \(\mathfrak{R}_β\) 的一个对应.
- 当坐标系变换成适应 \(\mathfrak{R}\) 的这一分解时, 我们有
- \(tr(A_{αβ} \widetilde{A}_{βα}) = tr(\widetilde{A}_{βα} A_{αβ}) = \sum | a_{ik} |^2\),
- 在其中的求和过程中, \(i\) 遍历第 \(α\) 组下标, \(k\) 遍历第 \(β\) 组下标.
变换到主轴
- 关于到主轴的变换的定理可以表述如下: 一个厄米形式
\(A\)
将实数
\(α\)
与相互独立的幂等厄米形式
\(E_α\)
相关联, 使得
- \(\mathbf{1} = \sum_α E_α\), \(A = \sum_α α \cdot E_α\);
- \(E_α\) 只对有限个 \(α\) 值不为零.
- 这个过程可以立即应用于任何数量的厄米形式:
当且仅当任意数量的厄米形式彼此可交换时,
它们就可以同时转变成正规形式.
- 只要稍作修改, 我们就可以把这条定理进一步推广到厄米形式的一个任意有限或无限系 \(Σ\).
- 如果在任何
\(Σ\)
系中的厄米形式彼此可交换, 那么它们都可以同时变换到主轴上去.
上述关于厄米对应发展起来的理论, 对于酉变换也是成立的.
- 由于 \(S\) 是任意酉算子, 因此可以以某种方式引入一个正规坐标系 \(\mathfrak{e}_i\), 从而使 \(S\) 将每个基本向量 \(\mathfrak{e}_i\) 变换成其自身的一个倍数 \(σ_i \mathfrak{e}_i\).
- \(S\) 的特征数 \(σ_i\) 是模为 \(1\) 的那些数. 在这些坐标中, \(S\) 的矩阵是一个对角矩阵, 其中主对角线上的矩阵元就是数字 \(σ_i\).
- 在实数域中, 对称矩阵与反对称矩阵之间不存在任何密切关系,
但在复数域中情况就有所不同. 因为假如设
\(C = iH\)
(\(i\)
是虚数单位
\(\sqrt{-1}\)),
那么,
\(H\)
满足方程
\(\widetilde{H} = H\),
因此
\(C\)
就是
\(i\)
乘以一个厄米矩阵.
- 在一个向量场的无穷小酉旋转中, 速度 \(\frac{d \mathfrak{x}}{dr}\) 与 \(\mathfrak{x}\) 通过一个对应相联系, 这个对应的矩阵是 \(i\) 乘以一个厄米矩阵.
- 厄米形式到主轴的变换定理, 因此就是关于酉变换的一条类似定理的极限情形.
无穷维空间的一些注记
- 我们由此得到了关于变换到主轴的基本定理的以下更为宽泛的系统表述:
(1) 厄米形式
\(A\)
将每个区间
\(Δ\)
与一个幂等形式
\(Δ E(\mathfrak{x})\)
相关联; (2) 当两个相邻区间
\(Δ_1\),
\(Δ_2\)
加在一起形成一个区间
\(Δ\)
时, 有
- \[ΔE = Δ_1 E + Δ_2 E\]
- 并且与各分离区间相关的幂等形式都是独立的; (3) 我们有
- \(\mathfrak{x}^2 = \int_{- \infty}^{+ \infty} d_λ E(\mathfrak{x})\), \(A(\mathfrak{x}) = \int_{- \infty}^{+ \infty} λ \cdot d_λ E(\mathfrak{x})\).
- 在这种形式下, 该定理适用于特征数连续谱的出现, 而且特别适用于量子力学的目的. 离散的特征数位于 \(λ\) 的单调递增函数 \(Δ_{- \infty}^{λ} E(\mathfrak{x}) = E(λ; \mathfrak{x})\) 有一个不连续的那些点.
- 希尔伯特建立了无穷多变量的厄米形式的特征数理论,
但它只适用于
有界形式- \[A(\mathfrak{x}) = \sum_{i, k} a_{ik} \bar{x}_i x_k\]
- 即当 \(\mathfrak{x}^2 = \sum_i \bar{x}_i x_i ≤ 1\) 时, 其值要具有固定上界的那些形式. 事实上, 没有这个假设, 我们就不能保证 \(A(\mathfrak{x})\) 在整个 \(\mathfrak{x}^2 = \sum_i \bar{x}_i x_i ≤ 1\) 范围内的收敛性.
- 这只是用另一种方式表达了并不是每个连续函数都是可微的这一事实.
这种情况更有利于酉形式, 这是因为它们出于自身的定义而满足
有界条件. - 因此, 酉变换要看作同时满足两个条件 \(U \bar{U} = \mathbf{1}\), \(\bar{U} U = \mathbf{1}\). 对于有界厄米形式和 \(∞\) 维空间中的酉对应, 它们的主轴定理得到了严格的证明.
量子理论
-
事实上, 我们可以把用来描述这些现象的, 且定义在时间和空间上的一个复函数 \(ψ(t; xyz)\) 看成这样一个向量, 在其中每一个时空点表示一个复向量空间的一维.
- 我们通过保留线性波动方程来把两种观点统一起来, 不过要将强度
\(\bar{ψ} ψ\)
视为光子在
\(t\)
时刻出现在点
\((x, y, z)\)
的相对概率. 或者更精确地说,
- \[\bar{ψ} ψ dx dy dz\]
- 是在 \(t\) 时刻, 它在点 \((x, y, z)\) 周围在边长为 \(dx\), \(dy\), \(dz\) 的平行六面体内被发现的概率.
- 但是, 如果我们像处理光子一样处理物质粒子, 那就只能期望得到一个合理的理论.
- \(E = hν\)
这一关系要作以下解释: 如果
\(ν\)
是不确定的 (由于振荡过程中包含着频率
\(ν\)
的整个频谱), 那么能量也在同样程度上不确定.
在这一过程中, 各种简单振荡发生的强度度量着相应的能量的概率.
- 算子 \(- \frac{h}{i} \cdot \frac{d}{dt}\) 在以下意义上表示能量:
- \(H \to - \frac{h}{i} \frac{d}{dt}\), 该式的一个特征函数表示一个状态, 它的能量具有确定值 \(E\). 这个值就是对应的特征数.
- 在任意状态下, \(ψ\) 中关于这些特征函数的分量 \(a\) 决定了这些值 \(E\) 的相对概率 \(\bar{a} a\).
- 根据相对论, 能量被视为一个四维向量的时间分量,
这个向量的空间分量构成线性动量
\(\mathfrak{p} = (p_x, p_y, p_z)\).
- 从原点指向点 \((t, xyz)\), \((t', x'y'z')\) 的两个向量的基本度量不变量是标量积
- \(c^2 tt' - (xx' + yy' + zz')\).
- 在洛伦兹变换 (它将一个时空坐标系变换到另一个同样可允许的坐标系) 下,
\(c^2 t\),
\(-x\),
\(-y\),
\(-z\)
这些量必然因之逆步地变换为
\(t\),
\(xyz\).
因此, 它们是与四维时空世界对偶的空间中与
\((t, xyz)\)
相关的那个向量的分量.
- 这样的一个对偶向量由 \(H\), \(- p_x\), \(- p_y\), \(- p_z\) 给出, 或者相当于 \(H dt - (p_x dx + p_y dy + p_z dz)\) 在洛伦兹变换下是不变的.
全导数公式
薛定谔波动方程, 谐振子
- 与
\(x\),
\(y\),
\(z\)
对应的算子彼此可交换, 但对应于
\(x\)
的算子
\(Q\)
和对应于
\(p_x\)
的算子
\(P\)
不可交换. 事实上
- \[\frac{d}{dx} [x ψ(x)] - x \frac{d}{dx} ψ(x) = ψ(x)\]
- 或者
\(PQ - QP = \frac{h}{i} \mathbf{1}\),
等式右边的
\(\mathbf{1}\)
表示
恒等算子: \(ψ(x) \to ψ(x)\). - 由于算子 \(P\) 和 \(Q\) 之间的这种非交换关系, 因此当 \(x\) 确定时, \(p_x\) 就不可能具有确定值, 反之亦然.
- 事实上, 如果已知 \(p_x\) 确实具有确定的值 \(hα\), 那么 \(ψ\) 对 \(x\) 的依赖关系由因子 \(e^{iαx}\) 给出. 由此可知, 该粒子的位置 \(x\) 是完全不确定的, 因为定位概率 \(\bar{ψ} ψ\) 对所有点 \(x\) 都是相同的.
- 如果
\(V(x, y, z)\)
是粒子在其中运动的场的势能, 那么总能量为
- \(H = \frac{p_x^2 + p_y^2 + p_z^2}{2m} + V(x, y, z)\).
- 波动方程不仅能以特征值的方式给出能级,
而且通过特征函数给出了关于局域概率的信息.
为了方便起见, 我们现在取
\(α = \sqrt{\frac{h}{2mω}}\)
作为长度单位. 当该振子处于第
\(n\)
个能级所描述的态时, 振荡粒子到距离平衡位置为
\(x\)
处的概率由
\(e^{-x^2 / 2} \cdot η_n^2(x)\)
给出.
- 这些概率应理解为是相对的, 且是对各比较点 \(x\) 的相等无穷小区间而言的. 特别是对于 \(n = 0\) 时的最低能级, 概率密度为 \(e^{-x^2 / 2}\).
- 因此, 我们不能再说质点静止于平衡位置, 而是说质点偏离这个位置的位移的概率由高斯误差曲线给出.
球对称场中的电子, 方向量子化
- 原子的可能态
\((n, l)\)
由
\((2l + 1)\)
维线性族中的函数
\(ψ\):
- \[ψ = f_{nl} (r) Y_l = \sum_{m = -l}^{+l} x_m \cdot f_{nl} (r) Y_l^{(m)}\]
- 或者由各分量为 \(x_m\) 的 \((2l + 1)\) 维空间中的向量描述.
- 动量矩的
\(z\)
分量, 以及在任意方向上的分量, 只能取离散值
\(hm\)
(\(m = l, l - 1, ..., -l\)).
但是如果在一个态, 比如说其
\(z\)
分量
必定具有值 \(hm\), 那么它的任何其他分量会以某种概率具有其可能值 \(h \cdot 0\), \(h \cdot (±1)\), …, \(h \cdot (±l)\) 中的一个确定值. “方向量子化” 这个名称很难恰当地描述这种情况.
碰撞现象
- 一个具有确定能量的粒子从左边, 也就是从
\(x \to -∞\),
向势能山运动. 在经典力学中, 根据粒子的初始动能是大于还是小于
\(V(x)\)
的最大值, 粒子不是越过了山就是被扔了回来. 而量子力学则说, 它有
\(|a|^2\)
的概率越过, 有
\(|a'|^2\)
的概率被扔回来.
- 此外, 这些概率是粒子能量的连续函数, 经典理论的不连续性完全被打破了. 如果我们对大量的粒子进行一系列的实验, 就会发现粒子被分成两束, 分别沿着 \(x\) 轴正向和负向运动.
- 它们的相对强度在 \(x \to -∞\) 时分别为 \(1\) 和 \(|a'|^2\), 而在 \(x \to +∞\) 时仅存在强度为 \(|a|^2\) 的正向粒子束.
- 因此, 我们必须把振幅 \(a\) 的绝对值的平方 \(|a|^2\) 视为相对强度或概率.
量子力学的概念结构
考虑一个已知构成的物理体系.
这种体系的每一种特定的状态, 即每一种单独的情况,
都由一个酉体系空间中的一个模为 1 的向量表示.
与系统相关的每个物理量都用这个空间中的一个厄米形式表示.
我们对这种理论提出的根本问题不是像经典物理学中那样的
"这个物理量在这种特殊情况下的值是多少?" 而是
"物理量 A 的可能值是哪些? 以及在给定的情况下,
它具有这些值中的一个确定值的概率是多少?"
- 这个问题的答案是:
\(A\)
具有值
\(α\)
的概率是
\(A\)
的与
\(α\)
值相关的特征形式
\(E_α\)
的值
\(E_α (\mathfrak{x})\),
其中向量
\(\mathfrak{x}\)
代表所讨论的情况, 而
\(A\)
这个量由该体系空间中的厄米形式
\(A\)
来表示.
- 由 \(A\) 表示的量能取的值只能是形式 \(A\) 给出的那些特征值 \(α\). 根据方程
- \(\mathfrak{x}^2 = \sum_α E_α (\mathfrak{x})\), \(A(\mathfrak{x}) = \sum_α α E_α (\mathfrak{x})\),
- 概率之和为 \(1\), 而形式 \(A\) 的值 \(A(\mathfrak{x})\) 是 \(A\) 这个量处于状态 \(\mathfrak{x}\) 的平均值或期望值. 对于一个给定状态 \(\mathfrak{x}\), 由它给出的概率的所有相关论断, 当用 \(ε \mathfrak{x}\) 来替换 \(\mathfrak{x}\) 时 (其中 \(ε\) 是模为 \(1\) 的任意复数), 在数值上都没有变化.
- 由于这一点, 我们就无法区分这两种情况. 因此, 用
射线\(\mathfrak{x}\) 要比用向量\(\mathfrak{x}\) 来表示纯态更为恰当, 于是我们必须在体系空间中的射线场中而不是在向量场中进行运算.
用
射线要比用向量来表示纯态更为恰当!
- 具有单位迹的正定厄米形式
\(A\)
(即统计集合) 在以下意义上构成凸区域
\(\mathfrak{S}\):
\(A\)
和
\(B\)
属于
\(\mathfrak{S}\),
则它们的 “质心”
\(λA + μB\)
(\(λ\),
\(μ\)
是任意正数, 它们的和为
\(1\))
也属于
\(\mathfrak{S}\).
- 如果
\(\mathfrak{S}\)
中的一个点不能视为
\(\mathfrak{S}\)
中不同于所讨论的点的两个点的这样一个质心,
那么按照闵可夫斯基的称呼, 将这个点称为
极值点. - \(\mathfrak{S}\)
是所有极值点构成的类
\(\mathfrak{E}\)
的
凸核, 即它是包含 \(\mathfrak{E}\) 的所有点的最小凸区域. - 我们不能丢弃 \(\mathfrak{E}\) 的任何一个极值点. 我们只要漏掉 \(\mathfrak{E}\) 的一个点, 整个凸核就会收缩到一起. 因此, 我们可以将纯态表征为所有可能的统计集合中的”极端”.
- 如果
\(\mathfrak{S}\)
中的一个点不能视为
\(\mathfrak{S}\)
中不同于所讨论的点的两个点的这样一个质心,
那么按照闵可夫斯基的称呼, 将这个点称为
动力学定律, 跃迁概率
- 在考虑了量子理论的一般概率定律之后,
我们现在转向讨论支配物理体系处于状态
\(\mathfrak{x}\)
时在时间间隔
\(dt\)
内变化的动力学定律. 这条动力学定律表明,
这种变化是通过无穷小酉算子
\(- \frac{i dt}{h} \cdot H\)
来实现的, 其中
\(H\)
是表示能量的厄米形式:
- \(\frac{h}{i} \frac{d \mathfrak{x}}{dt} + H \mathfrak{x} = 0\).
- 量子力学中能量所具有的特殊意义应归根于它出现在动力学定律中. 我们还将这条定律视为量子理论中一条普遍成立的基本公理.
- 对于矩阵 \(X\): \(x_{ik} = x_i \bar{x}_k\)
- (它表征由向量 \(\mathfrak{x} = (x_i)\) 描述的一个纯态的统计集合), 我们应用 \(\frac{h}{i} \frac{d \mathfrak{x}}{dt} + H \mathfrak{x} = 0\), 并考虑到 \(H\) 是厄米形式, 就得到方程
- \(\frac{h}{i} \frac{dX}{dt} = XH - HX\).
- 同样, 这个方程也决定了混合态下统计集合 \(X\) 随时间的变化.
微扰理论
- 我们可以用两种形式来表述微扰问题:
- (a) 在无扰体系的能量 \(H\) 是确定的那些状态下, 确定由微扰引起的变化. 如果我们认为微扰在一个时间区间 \([t_1, t_2]\) 中发生作用, 那么这一表述就有一个合理的物理解释. 然后我们找出各种量子态的概率在微扰的作用下如何发生变化.
- (b) 确定微扰体系的量子态和能级, 即 \(H\) 的特征值和特征空间. 我们特别要问的是, 这些项在微扰下是如何分裂和移位的. 我们首先考虑 (b).
多体问题, 乘积空间
- 将两个物理体系
\(\mathfrak{a}\)
和
\(\mathfrak{b}\)
按如下方式复合形成一个总体系
\(\mathfrak{c}\).
\(\mathfrak{c}\)
的体系空间
\(\mathfrak{T}\)
是
\(\mathfrak{R} \times \mathfrak{S}\),
其中
\(\mathfrak{R}\)
是
\(\mathfrak{a}\)
的体系空间, 而
\(\mathfrak{S}\)
是
\(\mathfrak{b}\)
的体系空间. 设
\(\mathfrak{R}\)
中的任意物理量
\(α\)
用厄米形式
\(A\)
来表示. 当用
\(A \times \mathbf{1}_s\)
(其中
\(\mathbf{1}_s\)
是任意空间
\(\mathfrak{S}\)
中的单位形式) 来代替所有这些形式
\(A\)
时, 前者之间存在的关系与
\(A\)
之间的关系完全相同.
- 因此从 \(\mathfrak{R}\) 中的一个量子问题的解, 会产生 \(\mathfrak{R} \times \mathfrak{S}\) 中相应问题的解, 但两者之间不存在任何真正的区别. 因此在通过复合而获得的体系 \(\mathfrak{c}\) 中, 我们必须将厄米形式 \(A \times \mathbf{1}_s\) 与 \(\mathfrak{a}\) 的一个量 \(α\) 相联系, 将厄米形式 \(\mathbf{1}_r \times B\) 与 \(\mathfrak{b}\) 的一个量 \(β\) 相联系, 这里 \(A\), \(B\) 分别是与 \(\mathfrak{R}\) 中的 \(α\), \(\mathfrak{S}\) 中的 \(β\) 相联系的形式.
- 复合体系 \(\mathfrak{c}\) 的量的总体是由属于组成体系 \(\mathfrak{a}\) 和体系 \(\mathfrak{b}\) 的量开始, 以所有可能的方式将它们相乘和相加而得到的. \(\mathfrak{a}\) 的量 \(α\) 与 \(\mathfrak{b}\) 的量 \(β\) 是可交换的, 这是因为
- \((A \times \mathbf{1}_s) (\mathbf{1}_r \times B) = A \times B = (\mathbf{1}_r \times B) (A \times \mathbf{1}_s)\).
- 当我们说 \(\mathfrak{c}\) 是由两个动力学独立的部分 \(\mathfrak{a}\) 和 \(\mathfrak{b}\) 组成时, 我们指的就是上面最后两句话的内容.
- 一个体系可以分解为几个运动学独立的部分,
这些部分既不需要在空间上分离,
甚至也不需要以不同的一些粒子为参考.
- 例如, 一个物理量都可以用 \(x\), \(y\), \(z\); \(p_x\), \(p_y\), \(p_z\) 表示的单个粒子, 我们可以将这个粒子分解成基本量为 \(x\), \(p_x\); \(y\), \(p_y\); \(z\), \(p_z\) 的三个部分体系.
- 对于属于不同子体系的量, 例如一个可以仅用 \(x\), \(p_x\) 表示的量和一个可以仅用 \(y\), \(p_y\) 表示的量, 它们在矩阵乘法的意义上是可以互换的.
对易法则, 正则变换
- 对于表示一个直角坐标及其动量的厄米形式
\(q\),
\(p\),
我们假设存在对易法则
\(pq - qp = \frac{h}{i} \mathbf{1}\).
如果体系只有一个自由度,
那么这两个量在经典力学中以
正则变量出现. 体系的所有物理量此时都是 \(p\) 和 \(q\) 的函数.- 为了避免复杂化, 我们局限于讨论以 \(p\) 和 \(q\) 为变量的多项式 \(f\), 特别是假设哈密顿函数 \(H\) 具有这种形式. 在 \(p\) 和 \(q\) 不满足乘法交换律的范围中, 通过 \(f\) 关于 \(p\) 和 \(q\) 的导数 \(f_p\) 和 \(f_q\), 我们要理解什么?
- 在任何情况下, 我们都应要求关于 \(q\) 的微分遵循下列假设:
- (1) \(p_q = 0\), \(q_q = 1\);
- (2) \((f + g)_q = f_q + g_q\) 和 \((αf)_q = α \cdot f_q\), 其中 \(α\) 是一个数;
- (3) \((fg)_q = f_q \cdot g + f \cdot g_q\).
- 我们立刻看到, 这些条件唯一决定了一个多项式 \(f\) 的导数, 除非它们恰好导致矛盾. 但它们并不会导致矛盾, 可以通过定义 \(ih \cdot f_q = fp - pf\) 看出这些条件是满足的.
保留经典物理的一切关系, 这是量子理论的一般特征.
但是尽管经典物理是把这些关系解释为物理量的值在所有个别情况下都遵循的条件,
然而量子理论则把它们解释为物理量本身要服从的条件,
或者更确切地说是表示物理量的厄米矩阵要遵循的条件.
- 连续地施行无穷多次无穷小酉变换, 可以生成一个有限正则变换.
由此, 我们得到结论: 量子理论中体系空间到其自身的酉对应
\(\mathfrak{x}' = U \mathfrak{x}\)
对应于经典力学中的正则变换.
- 更准确地说, 只有对那些矩阵 \(U\) 可以用矩阵 \(p\), \(q\) 来表示的酉对应是如此, 但我们可以暂且不去关注这样一个问题: 是否每个矩阵 \(U\) 都可以用这种方法得到, 或者至少任意接近.
- 由于对易法则在正规坐标系的旋转下保持不变, 因此它们对任一组正则变量都成立. 这一点由以下事实也可以明显看出: 它们是由动力学定律导出哈密顿方程 \(\frac{d q_α}{dt} = \frac{∂ H}{∂ p_α}\), \(\frac{d p_α}{dt} = - \frac{∂ H}{∂ q_α}\) 的条件.
关于物质和辐射之间能量交换的这种 (狄拉克提出的) 处理方法,
我们现在必须补充三条评注. 首先, 它能够解释这样一个事实:
谱线不是锐利的, 而是具有一个自然的宽度.
其次, 我们必须探究是什么原因造成了吸收和发射之间的这种差异.
如果改变时间的方向, 吸收和发射这两个过程就会相互转化.
- 事实上, 基本的力学定律和场定律在
\(t \to -t\)
变换下是不变的!
- 答案是, 这种差异来自应用概率论时涉及的时间优先方向.
我们假设一个固定的初始状态,
并利用跃迁概率计算出不同状态在一个以后的时刻在各个态上的分布,
而不是由以前的时刻从方程会得到的分布.
如果关于这个优先方向不作任何假设的话, 那么就应该用 |t| 来取代 t.
最后, 我们在这里把麦克斯韦方程组当作经典运动方程来处理,
并且以此使它们经受量子化的过程, 这种处理可能会引起令人担心的疑问,
因为在我们的一般表述中, 麦克斯韦方程组已经是光子的量子理论波动方程了!
但是, 我们将看到, 为了从一个微粒发展到无穷多个微粒,
利用这种方法实际上是正确的.
因为既然光子的数量必须保持不确定,
与电子不同, 光子可以突然形成或突然消失.