我们的教学经验证明, 开始时就将这些假设集中起来讲要比分成几个阶段介绍好.
同样, 我们还认为, 最好一开始就用态空间和狄拉克符号.
如果起先只用波函数来建立波动力学, 然后再讲左矢 (即刁) 和右矢 (即刃) 的普遍理论,
那就难免会有重复; 特别是, 符号改变得晚了, 容易使学生迷惑不解,
使他们觉得好像刚刚学过但还未掌握的那些概念, 又成问题了.
由于这种实质上是演绎的观点, 我们没有按历史顺序来引入量子概念,
也就是说, 没有介绍和讨论迫使人们重新审度经典概念的那些实验事实.
于是我们放弃了归纳的方法.
然而, 物理学是一门要经受实验事实检验并在检验中不断发展的科学,
要得到这样一门科学的可靠图像, 归纳法还是必要的;
不过我们认为这种方法更适合于原子物理学或较低程度的量子物理学导论.
此外, 我们有意识地撇开了关于量子力学的哲学意义和其他解释的讨论.
虽然这类讨论是很有意义的, 但它似乎是另一种水平上的工作了;
事实上, 我们感到, 要能有效地讨论这些问题, 必须事先掌握 "正统的" 量子理论.
这套理论, 由于它在物理学和化学的各个领域中所取得的巨大成就, 已为人们所接受.
波和粒子; 量子力学的基本概念
电磁波与光子
每当我们对一个微观体系进行一次测量时, 我们便从根本上干扰了它.
这是一种新的性质, 因为在宏观领域中我们从来都认为,
人们总可以设想出这样的测量仪器, 它们对体系的干扰实际上要多小就有多小.
对经典物理的这种批判性的修正是由实验决定的, 当然也要由实验来引导.
测量 (系统状态) 必定破坏 (系统状态)
- 经过反复探索, 人们形成了波粒二象性的概念, 我们可以将它概述如下:
- (i) 光的粒子性方面和波动性方面是不可分割的, 光同时表现为波和粒子流, 波可以用来计算粒子出现的概率.
- (ii) 对光子行为的预言只能是概率性的.
- (iii) 波 \(E(\mathbf{r}, t)\) 提供一个光子在 \(t\) 时刻的信息, 它是麦克斯韦方程组的解; 我们说这个波表征光子在 \(t\) 时刻的状态. 我们将 \(E(\mathbf{r}, t)\) 解释为一个光子在 \(t\) 时刻出现于 \(\mathbf{r}\) 点的概率幅. 这就意味着相应的概率正比于 \(\mid E(\mathbf{r}, t) \mid ^{2}\).
两个基础实验~
- 因为麦克斯韦方程组是线性的和齐次的, 故可对它应用
叠加原理
: 若 \(E_1\) 和 \(E_2\) 是方程组的两个解, 则 \(E = λ_1 E_1 + λ_2 E_2\) (此处 \(λ_1\) 和 \(λ_2\) 为常数) 也是它的解. 正是这个叠加原理在经典光学中解释了波动型的现象 (干涉, 衍射).- 在量子物理中, 既然也有波动型的现象, 那么将 \(E(\mathbf{r}, t)\) 作为概率幅来解释, 便是必要的了.
叠加原理的基础性~
- 因而本征结果与本征态之间的对应是这样的:
- 如果测量以前粒子处于本征态之一, 那么这次测量的结果便是确定的, 它只能是与这个本征态对应的本征结果.
- 如果测量前的状态是任意的, 那么我们只能预言测得各种本征结果的概率. 为了求得这些概率, 我们将粒子的态分解为各本征态的线性组合.
- 在这里, 对于任意的 \(\mathbf{e}_{p}\), 我们写出:
- \[\mathbf{e}_{p} = \mathbf{e}_{x} \cos \theta + \mathbf{e}_{y} \sin \theta\]
- 于是, 得到某一本征结果的概率正比于该本征态的系数的模的平方
(所有这些概率的总和为
1
, 用此条件即可确定比例常数).
- 谱分解原理: 必须注意, 分解的方式依赖于我们所考虑的测量仪器的类型,
这是因为我们必须使用与它相应的各种本征态.
- 在这里, 粒子的态发生了突变.
- 测量从根本上干扰了微观体系 (这里是指光子).
物质粒子与物质波
德布罗意关系
-
一种特定的原子只能发射或吸收具有某些确定频率 (或者能量) 的光子. 如果我们承认原子的能量是量子化的, 就是说承认原子的能量只能取某些离散的值 \(E_{i} (i = 1, 2, ..., n, ...)\), 则这个事实便很容易解释如下:
- 伴随着一个光子的发射或吸收, 原子的能量便从一个允许值 \(E_i\) 突变到另一个允许值 \(E_j\);
- 于是由能量守恒便可推知光子应具有这样的频率 \(v_{ij}\):
- \[h v_{ij} = \mid E_i - E_j \mid\]
- 故只有满足上式的那些频率才能被原子所发射或吸收.
1923 年, 德布罗意提出了下述假说:
完全和光子一样, 物质微粒也具有波动性的一面.
电子衍射实验 (1927 年) 表明, 利用物质微粒, 例如电子,
也可以得到干涉图, 这就出色地证实了物质的波动性的存在.
- 于是, 一个能量为
\(E\),
动量为 p 的物质粒子,
可以同一个波相联系, 这种波的角频率
\(ω = 2πv\)
及波矢 k 由适用于光子的同样关系式给出:
- \[\begin{cases} E = hv = \hbar ω \\ \mathbf{p} = \hbar \mathbf{k} \end{cases}\]
- 换言之, 对应的波长是:
- \(\lambda = \frac{2π}{\mid \mathbf{k} \mid} = \frac{h}{\mid \mathbf{p} \mid}\) (德布罗意关系式)
波函数; 薛定谔方程
- 按照德布罗意的假说, 我们将把关于光子的那些概念推广到所有的物质粒子.
- (i) 必须用与时间
\(t\)
有关的
态
的概念代替经典的轨道概念. - (ii) 我们将
\(\psi (\mathbf{r}, t)\)
解释为粒子出现的
概率幅
. - (iii) 谱分解原理适用于任意物理量 \(\mathcal{A}\) 的测量.
- (iv) 还要写出 \(\psi (\mathbf{r}, t)\) 的演变所遵循的方程.
- (i) 必须用与时间
\(t\)
有关的
利用普朗克和德布罗意关系式, 可以很自然地引入这个方程.
但是我们不可能证明这个基本方程, 即所谓薛定谔方程;
我们只是把它提出来, 然后讨论它的一些推论
(正是这些推论的实验证明肯定了它的正确性).
此外, 到了第三章 (量子力学的假定),
我们还要回过头来更详细地探讨这个方程.
关于 (iii), (iv), 详见 Page 17.
薛定谔方程: 对于 \(\psi (\mathbf{r}, t)\) 是线性的, 齐次的; 对于时间 \(t\) 是一阶的.
波函数 \(\psi (\mathbf{r}, t)\) 必须是平方可积的. (可归一性)
同时, 薛定谔方程确保了归一化系数与时间无关.
- 要注意经典态与量子态这两种概念之间的重大区别. 一个粒子在时刻
\(t\)
的经典态是由描述粒子在时刻
\(t\)
的位置和速度的六个参量
\(x\),
\(y\),
\(z\);
\(v_x\),
\(v_y\),
\(v_z\)
确定的; 一个粒子的量子态则是由
无穷多个
参数所确定的, 这些参数就是与该粒子相联系的波函数 \(\psi (\mathbf{r}, t)\) 在空间各点的数值.
轨道这个经典概念, 亦即经典粒子在相继各时刻的那些态,
应该代之以和粒子相联系的波的传播的概念.
例如, 再回想前面描述的用光子进行的杨氏双狭缝实验,
这种实验从原则上说对于物质微粒 (如电子) 也是可行的.
在观察干涉图时, 如果还要知道每个粒子通过的是哪条狭缝,
这是没有意义的, 因为与粒子相联系的波同时通过了两条狭缝.
或者说: 粒子只有同时经过两个狭缝才能得到干涉的结果. 粒子的双缝干涉不是来源于粒子之间的干涉, 而是各个粒子与其自身的干涉.
必须指出, 光子在实验中可能被发射或被吸收, 物质微粒则不一样,
它们既不能被产生也不能被消灭: 被加热的灯丝发射出电子,
这些电子是原来就存在于灯丝中的; 同样, 被计数器吸收的电子并未消失,
它又回到了某个原子中或参与形成电流.
实际上, 相对论告诉我们, 物质粒子的产生和湮没是可能的.
例如, 一个能量充分大的光子穿过原子近旁时, 可以实物化而成为电子-正电子对;
反过来, 正电子碰撞电子时便和电子一起湮没而产生光子.
但是, 在这一章开头我们就声明过, 本书的范围只限于非相对论量子力学,
并且事实上我们已经按不对称的方式处理了时间和空间坐标.
在非相对论量子力学的范畴内, 物质微粒既不会产生也不会湮没.
我们将会看到, 这个守恒定律占有头等重要的地位;
而放弃这个定律的必要性正是人们在建立相对论量子力学时遇到的重大困难之一.
本书的范围只限于非相对论量子力学!
对一个粒子的量子描述; 波包
自由粒子
若一个粒子在空间各点的势能都为零 (或为常值),
则这个粒子未受力的作用, 我们说它是自由的.
详见 Page 19. 另, 附录 I (傅立叶级数和傅立叶变换) 在卷二.
海森伯不确定度关系
附录 II (狄拉克的 δ 函数) 也在卷二.
附注:
我们的出发点, 即不等式 (C-18), 就其本身而言, 并没有什么典型的量子意义.
它只不过表示傅里叶变换的一个普遍性质
(在经典物理学中已有这个性质的很多应用, 例如大家都知道,
在无线电理论中不存在人们能够以无限的精确度同时确定其位置和波长的电磁波波列);
真正有量子意义的只是:
将波和物质粒子联系起来, 并规定波长和动量要满足德布罗意关系式.
上面这一段, 就通俗性描述而言, 不如
格里菲斯
.
自由波包随时间的演变
在与时间无关的标量势场中的粒子
刚才的说明告诉我们, 如果在比波长短的路程上, 势的变化是显著的,
那么, 就应该出现典型的量子效应 (即起因于波动性的量子效应),
这时波长已是不可忽略的了. 正因为如此,
所以我们要研究处于各种 "方形势" 中的量子性粒子的行为.
所谓方形势, 就是其变化呈 "阶梯" 状的势.
既然这种势是不连续的, 那么, 不论波长多么短,
它在与波长同数量级的区间上一定有显著的变化,
因此, 量子效应总是会表现出来的.
所以我们要研究处于各种 "方形势" 中的量子性粒子的行为.
点明为什么要研究方形势
, 蛮好的~
变量的分离. 定态
- 形如
\(ψ (\mathbf{r}, t) = φ (\mathbf{r}) e^{-iωt}\)
的波函数叫做薛定谔方程的定态解, 由此函数得到的概率密度
\(\mid ψ (\mathbf{r}, t) \mid^2 = \mid φ (\mathbf{r}) \mid^2\)
与时间无关.
- 定态波函数只含一个角频率
\(ω\),
故根据
普朗克-爱因斯坦关系式
, 定态就是对应的能量为确定值 \(E = \hbar ω\) 的态 (即能量的本征态). - 在经典力学中, 若势能与时间无关, 总能量就是一个运动常量;
- 在量子力学中则存在着能量完全确定的态.
- 定态波函数只含一个角频率
\(ω\),
故根据
于是, 我们可以将波动光学中熟知的结果转借到这里要研究的问题.
然而必须充分理解这仅仅是一种类比,
我们对波函数的解释与经典波动光学对电磁波的解释本质上是不同的.
一维方形势的光学类比, 有点意思~
在这种情况下我们知道, 对入射波的某些频率, 波将完全透射;
从量子的观点来看, 这就是说, 粒子被反射的概率一般不为零,
但是存在着一些能值, 叫做谐振能, 对于取这些能值的粒子,
透射概率为 1, 因而反射概率为 0.
定性地基本概念描述, 结束~
- 这一章只讨论了由一个粒子构成的物理体系. 在经典力学中,
对这些体系在某一时刻的态的描述是以六个参量的数据为基础的,
这些参量就是粒子的位置
\(\mathbf{r} (t)\)
和速度
\(\mathbf{v} (t)\)
的分量; 给出
\(\mathbf{r} (t)\)
和
\(\mathbf{v} (t)\),
所有的力学变量 (如能量, 动量, 角动量等) 就都决定了.
- 根据牛顿定律, 函数 \(\mathbf{r} (t)\) 可以从以时间为自变量的二阶微分方程解出, 从而, 知道了 \(\mathbf{r} (t)\) 和 \(\mathbf{v} (t)\) 在初始时刻的值, 便可以确定它们在任意时刻 \(t\) 的值.
- 量子力学对现象的描述更加复杂: 一个粒子在指定时刻的动力学状态由波函数来表述.
它不再只依赖于六个参量, 而是依赖于无限多个参量
(\(ψ(\mathbf{r}, t)\)
在空间所有各点
\(\mathbf{r}\)
处的数值).
- 此外, 对测量结果的预言只能是概率性的 (即只能给出测量一个力学变量时得到某一预期结果的概率).
- 波函数是薛定谔方程的解, 知道了 \(ψ(\mathbf{r}, 0)\), 就可用这个方程来计算 \(ψ(\mathbf{r}, t)\); 这个方程蕴含着导致波动型效应的叠加原理.
说得更广泛一些, 直到现在,
还没有任何观测结果是与量子力学的基本原理相抵触的.
可是, 关于既是相对论性又是量子性的现象,
目前还没有一套总的理论, 既然如此, 再来一次震动也是可能的.
希望 2025 可以开始阅读温伯格的量子场论~
量子力学的数学工具
我们打算最大限度地简化有关的论述,
凡是只有数学家才能满意的那些普遍定义和严格证明, 这里一概从略.
例如, 遇到无限多维空间时, 我们将把它当作有限多维空间来分析;
此外, 我们将按照物理学所约定的意义来使用术语 (如平方可积函数, 基, ...),
而这种意义与纯数学所赋予它们的并不完全一致.
表象
: 还是译为表示/表征
更好;观察
: 还是译为观测/测量
更好.
可以对比阅读: 量子计算与量子信息 - 线性代数; 也可对比阅读: 格里菲斯 - 形式理论.
一个粒子的波函数空间
- 从物理的观点看来,
\(L^2\)
这个集合实在是太广泛了. 既然已经给定了
\(\mid ψ (\mathbf{r}, t) \mid^2\)
的意义, 那么, 实际上使用的那些波函数就应该具备一些正规的性质.
- 我们可以只考虑这样一类函数 \(ψ (\mathbf{r}, t)\), 它们是处处确定的, 处处连续的, 而且是任意多次可微分的 (譬如, 某函数在空间某点确实不连续, 这种说法就没有任何物理意义; 因为任何实验也不可能使我们知道在很小的尺度上的实际现象究竟如何).
- 我们还可以只考虑有界区域中的波函数 (我们确信粒子处在空间的有限范围内, 譬如实验室内).
- 在这里, 我们不打算就普遍情况来精确地陈述这些补充条件; 我们将称由 \(L^2\) 中的充分正规函数构成的波函数集合为 \(\mathcal{F}\) (\(\mathcal{F}\) 是 \(L^2\) 的子空间).
物理意义
波函数空间的结构
-
\(\mathcal{F}\) 是一个矢量空间.
- 对于
\(\mathcal{F}\)
中的任意一对顺序为
\(φ(\mathbf{r})\)
及
\(ψ(\mathbf{r})\)
的函数, 我们引入一个相关的复数, 记作
\((φ, ψ)\),
它的定义是:
- \[(φ, ψ) = \int d^3 r φ^{*}(\mathbf{r}) ψ(\mathbf{r})\]
- \((φ, ψ)\)
叫做
\(φ(\mathbf{r})\)
与
\(ψ(\mathbf{r})\)
的
标量积
(只要 \(φ\) 和 \(ψ\) 属于 \(\mathcal{F}\), 这个积分总是收敛的).
- 我们说一对函数的标量积与其第二个因子的关系是
线性
的, 与其第一个因子的关系是反线性
的.- 如果
\((φ, ψ) = 0\),
我们就说
\(φ(\mathbf{r})\)
和
\(ψ(\mathbf{r})\)
是
正交
的.
- 如果
\((φ, ψ) = 0\),
我们就说
\(φ(\mathbf{r})\)
和
\(ψ(\mathbf{r})\)
是
- 施瓦茨不等式
- 详见补充材料: Page 165
- 按定义, 线性算符
\(A\)
是一种数学实体, 它使每一个函数
\(ψ(\mathbf{r}) \in \mathcal{F}\)
都有与之对应的另一个函数
\(ψ'(\mathbf{r}) \in \mathcal{F}\),
而且它们的对应关系是线性的:
- \[ψ'(\mathbf{r}) = A ψ(\mathbf{r})\]
- \[A [ λ_1 ψ_1 (\mathbf{r}) + λ_2 ψ_2 (\mathbf{r}) ] = λ_1 A ψ_1 (\mathbf{r}) + λ_2 A ψ_2 (\mathbf{r})\]
- 两个线性算符
\(A\)
和
\(B\)
的乘积
\(AB\)
由下式定义:
- \[(AB) ψ(\mathbf{r}) = A [ B ψ(\mathbf{r}) ]\]
- 即先将 \(B\) 作用于 \(ψ(\mathbf{r})\), 得到 \(φ(\mathbf{r}) = B ψ(\mathbf{r})\), 再将 \(A\) 作用于所得的函数 \(φ(\mathbf{r})\).
- 一般说来,
\(AB ≠ BA\),
我们定义:
- \[[ A, B ] = AB - BA\]
- 并把算符
\([ A, B ]\)
称为
\(A\)
与
\(B\)
的
对易子
.
波函数空间的离散的正交归一基
- 设有
\(\mathcal{F}\)
空间中的一个可列的函数集合; 这集合中的函数可用离散的指标
\(i (i = 1, 2, ..., n, ...)\)
来标记:
- \(u_1 (\mathbf{r}) \in \mathcal{F}\), \(u_2 (\mathbf{r}) \in \mathcal{F}\), …, \(u_i (\mathbf{r}) \in \mathcal{F}\), …
- 如果 \((u_i, u_j) = \int d^{3} r u_i^{*} (\mathbf{r}) u_j (\mathbf{r}) = δ_{ij}\)
- (式中
\(δ_{ij}\)
是克罗内克符号, 当
\(i = j\)
时, 其值为
1
; 当 \(i ≠ j\) 时, 其值为0
), 则集合 \(\{ u_i (\mathbf{r}) \}\) 是正交归一
的.
- 如果每一个函数
\(ψ (\mathbf{r}) \in \mathcal{F}\)
都可以唯一地按全体
\(u_i (\mathbf{r})\)
展开:
- \[ψ (\mathbf{r}) = \sum_{i} c_i u_i (\mathbf{r})\]
- 则这个集合
\(\{ u_i (\mathbf{r}) \}\)
构成一个
基
.
封闭性关系式
, 对比阅读: Page 98 vs Page 121
连续的正交归一基
注: 此处改了原书的章节名
- 引入的连续基的用途在后面将会显得更清楚. 但是, 绝不能忘记这一点: 和某一物理状态对应的总是一个平方可积的波函数. 在任何情况下, \(v_{\mathbf{p}}(\mathbf{r})\) 或 \(ξ_{\mathbf{r}_0}(\mathbf{r})\) 都不能表示粒子的态. 这些函数仅仅是在对波函数 \(ψ(\mathbf{r})\) 进行运算时, 很方便的一些工具, 而波函数才是描述物理状态的函数.
- 在经典光学中我们也遇到过类似的情况, 在那里, 单色平面波是一种极为方便的模型, 但在物理上它是永远不能实现的; 即使选择性最好的滤光片所滤过的也是某一频带 \(Δ ν\) 中的光, 这个频带可能很窄, 但绝不为零.
- 对于函数
\(ξ_{\mathbf{r}_0}(\mathbf{r})\)
来说, 也是一样. 我们可以设想一个平方可积的波函数, 它定域在点
\(\mathbf{r}_0\)
附近, 例如
\(ξ_{\mathbf{r}_0}^{(ε)} (\mathbf{r}) =
δ^{(ε)} (\mathbf{r} - \mathbf{r}_0) =
δ^{(ε)} (x - x_0) δ^{(ε)} (y - y_0) δ^{(ε)} (z - z_0)\),
其中
\(δ^{(ε)}\)
是这样一种函数:
- 它的中心在点 \(x_0\) (或 \(y_0\), 或 \(z_0\)) 处, 它具有宽度为 \(ε\), 高度为 \(\frac{1}{ε}\) 的峰, 并保持 \(\int_{- \infty}^{+ \infty} δ^{(ε)} (x - x_0) dx = 1\) (这种函数的例子见附录 II: 狄拉克的 \(δ\) 函数).
- 当 \(ε \rightarrow 0\) 时, \(ξ_{\mathbf{r}_0}^{(ε)} (\mathbf{r}) \rightarrow ξ_{\mathbf{r}_0} (\mathbf{r})\), 但后者不再是平方可积的了.
- 实际上, 对应于这种极限情况的物理状态是不可能实现的; 不管粒子处于位置多么确切的物理状态, \(ε\) 也绝不等于零.
狄拉克意义下正交归一
比格里菲斯的狄拉克-正交归一
详细的多~
- 将前面两节的结果加以推广, 我们称
\(\mathbf{r}\)
的函数的一个集合
\(\{ w_α (\mathbf{r}) \}\)
为连续的”正交归一”基, 它以连续指标
\(α\)
为标记, 并满足下列的所谓
正交归一
和封闭性
关系式- \[(w_α, w_{α'}) = \int d^3 r w_α^{*} (\mathbf{r}) w_{α'} (\mathbf{r}) = δ (α - α')\]
- \[\int dα w_α (\mathbf{r}) w_α^{*} (\mathbf{r}') = δ (\mathbf{r} - \mathbf{r}')\]
Page 105: 对比后续引入狄拉克符号后的形式.
态空间; 狄拉克符号
至此, 才正式介绍狄拉克符号, 前面的铺垫还是很用心的~
- 绝不要把线性泛函与线性算符混为一谈.
虽然两者都涉及线性运算,
但是前者给每一个右矢联系上一个复数,
而后者给每一个右矢联系上另一个右矢.
- 可以证明, 定义在右矢
\(\mid ψ \rangle \in \mathcal{E}\)
上的线性泛函的集合构成一个矢量空间, 叫做
\(\mathcal{E}\)
的
对偶空间
, 记作 \(\mathcal{E}^{*}\).
- 可以证明, 定义在右矢
\(\mid ψ \rangle \in \mathcal{E}\)
上的线性泛函的集合构成一个矢量空间, 叫做
\(\mathcal{E}\)
的
- 事实上, 右矢
\(\mid φ \rangle\)
可以决定这样一个线性泛函, 它按线性方式使得每一个右矢
\(\mid ψ \rangle \in \mathcal{E}\)
都有一个对应的复数, 而且这个复数就是
\(\mid φ \rangle\)
和
\(\mid ψ \rangle\)
的标量积
\((\mid φ \rangle, \mid ψ \rangle)\).
假设
\(\langle φ \mid\)
就是这个线性泛函, 那么它应由下式所决定
- \[\langle φ \mid ψ \rangle = (\mid φ \rangle, \mid ψ \rangle)\]
- 关于
\(\mid φ \rangle\)
和
\(\mid ψ \rangle\)
的标量积, 我们现在已有两种不同的符号:
\((\mid φ \rangle, \mid ψ \rangle)\)
或
\(\langle φ \mid ψ \rangle\),
这里的
\(\langle φ \mid\)
是右矢
\(\mid φ \rangle\)
的对应左矢. 今后我们只用一种符号:
\(\langle φ \mid ψ \rangle\),
即狄拉克符号.
- 在之前已经给出的标量积的性质, 可用狄拉克符号重新归纳如下:
- \[\langle φ \mid ψ \rangle = \langle ψ \mid φ \rangle^{*}\]
- \[\langle φ \mid (λ_1 ψ_1 + λ_2 ψ_2) \rangle = λ_1 \langle φ \mid ψ_1 \rangle + λ_2 \langle φ \mid ψ_2 \rangle\]
- \[\langle (λ_1 φ_1 + λ_2 φ_2) \mid ψ \rangle = λ_1^{*} \langle φ_1 \mid ψ \rangle + λ_2^{*} \langle φ_2 \mid ψ \rangle\]
- \(\langle ψ \mid ψ \rangle\) 为正实数, 当而且仅当 \(\mid ψ \rangle = 0\) 时, 其值为零.
每一个左矢都有对应的右矢吗? Page 109 ~ 111
- 一般地说, 态空间
\(\mathcal{E}\)
和它的对偶空间
\(\mathcal{E}^{*}\)
并不是同构的 (当然, 除非
\(\mathcal{E}\)
是有限多维的), 这就是说,
如果对于每一个右矢
\(\mid ψ \rangle \in \mathcal{E}\),
对应着一个左矢
\(\langle ψ \mid \in \mathcal{E}^{*}\),
那么, 相反的对应关系并不存在.
- 但是, 我们约定, 除了使用
\(\mathcal{E}\)
空间的矢量 (它们的模方是有限的) 以外, 还可以使用
广义右矢
, 它们的模方虽是无限的, 但它们与 \(\mathcal{E}\) 空间中任何右矢的标量积却都是有限的. - 这样一来, 对于每一个左矢 \(\langle φ \mid \in \mathcal{E}^{*}\), 就都对应着一个右矢.
- 但是广义右矢并不表示体系的物理状态.
- 但是, 我们约定, 除了使用
\(\mathcal{E}\)
空间的矢量 (它们的模方是有限的) 以外, 还可以使用
但是广义右矢并不表示体系的物理状态
. 好吧~ 时至今日, 对于只存在于计算的中间步骤, 而不代表物理实在性. 嗯, 还是觉得似懂非懂! 哈哈
线性算符
- 设
\(\mid φ \rangle\)
与
\(\mid ψ \rangle\)
是两个右矢. 我们称下列的标量积为
\(A\)
在
\(\mid φ \rangle\)
和
\(\mid ψ \rangle\)
之间的
矩阵元
:- \[\langle φ \mid (A \mid ψ \rangle)\]
- 因而, 这是一个数, 它线性地依赖于 \(\mid ψ \rangle\), 反线性地依赖于 \(\mid φ \rangle\).
引出
张量积
和投影算符
的步骤很清晰简洁~
其实, 感觉重点是, 哪里的介绍, 相较之下, 留下了不清晰, 不简洁的印象? 哈哈
厄米共轭
Page 116, 图: 从右矢和左矢之间的对应关系来定义算符的
伴随算符
- 在前面我们曾经提到两个容易混淆的记号:
\(\mid λψ \rangle\)
和
\(\langle λψ \mid\),
其中
\(λ\)
是标量. 对于记号
\(\mid Aψ \rangle\)
和
\(\langle Aψ \mid\)
(其中
\(A\)
是线性算符) 也会出现同样的问题.
- \(\mid Aψ \rangle\) 就是右矢 \(A \mid ψ \rangle\) 的另一种记法:
- \[\mid Aψ \rangle = A \mid ψ \rangle\]
- 但
\(\langle Aψ \mid\)
则是对应于右矢
\(\mid Aψ \rangle\)
的左矢.
- 可以看出:
- \[\langle Aψ \mid = \langle ψ \mid A^{\dagger}\]
- 这就是说, 如果要把一个线性算符 \(A\) 从左矢的符号中提出去, 就必须将它放到该左矢符号的右边并且换成它的伴随算符 \(A^{\dagger}\).
- 因此, 一个右 (左) 矢的厄米共轭是一个左 (右) 矢;
一个算符的厄米共轭是它的伴随算符;
一个数的厄米共轭是它的共轭复数.
- 采用狄拉克符号, 厄米共轭运算是很容易进行的, 只要应用下面的规则即可.
- 当一个式子中含有常数, 右矢, 左矢及算符时,
要得到这个式子的厄米共轭式 (或伴随式), 必须:
- 代换:
- 将常数换成其共轭复数;
- 将右矢换成其对应的左矢;
- 将左矢换成其对应的右矢;
- 将算符换成其伴随算符.
- 反序:
- 即颠倒各因子的顺序 (但常数的位置无关紧要).
- 如果算符
\(A\)
等于它的伴随算符, 即
\(A = A^{\dagger}\)
- 我们就称它为
厄米算符
.
- 我们就称它为
- 厄米算符满足下列关系式:
- \[\langle ψ \mid A \mid φ \rangle = \langle φ \mid A \mid ψ \rangle^{*}\]
- 此式对任意的 \(\mid φ \rangle\) 和 \(\mid ψ \rangle\) 都成立.
- 最后, 对于厄米算符:
- \[\langle A φ \mid ψ \rangle = \langle φ \mid A ψ \rangle\]
- 两个厄米算符
\(A\)
和
\(B\)
的
乘积
, 仅当 \([ A, B ] = 0\) 时, 才是厄米算符.
注: 是
乘积
才是厄米算符.
态空间中的表象
正交归一关系式 vs 封闭性关系式
一个正交归一基的特征关系式
- 离散的
- \[\langle u_i \mid u_j \rangle = δ_{ij}\]
- \[P_{ \{ u_i \} } = \sum_{i} \mid u_i \rangle \langle u_i \mid = \mathbb{1}\]
- 连续的
- \[\langle ω_α \mid ω_{α'} \rangle = δ (α - α')\]
- \[P_{ \{ ω_α \} } = \int dα \mid ω_α \rangle \langle ω_α \mid = \mathbb{1}\]
右矢和左矢的表示法
- 可见 \(\langle φ \mid\) 可以唯一地按这些左矢 \(\langle u_i \mid\) 展开; \(\langle φ \mid\) 的诸分量 \(\langle φ \mid u_i \rangle\) 就是与 \(\langle φ \mid\) 相联系的右矢 \(\mid φ \rangle\) 的诸分量 \(b_i = \langle u_i \mid φ \rangle\) 的共轭复数.
左行, 右列
- 在一种指定的表象中, 表示右矢
\(\mid ψ \rangle\)
的矩阵和表示对应的左矢
\(\langle ψ \mid\)
的矩阵互为厄米共轭矩阵.
- 这就是说, 将一个矩阵中的行列互易, 并将每个矩阵元换成其共轭复数, 这样便得到它的厄米共轭矩阵.
算符的表示法
Page 127, 再一次, 自然导出张量积的表示, 都没有明确提到
张量积
三个字. 也就是说, 不是数学定义, 而是从完备或者自洽的角度, 导出来的.
伴随算符, 亦是同样~
单就到此为止, 已然超出
量子计算与量子信息
和格里菲斯
一截. 当然,量子计算与量子信息
不适宜用来直接比较~
- 因此, 一个厄米算符由厄米矩阵来表示, 在这种矩阵中,
相对于主对角线对称的任意一对元素互为共轭复数.
- 特别地, 若 \(i = j\) 或 \(α = α'\), 则: \(A_{ii} = A_{ii}^{*}\) 或 \(A(α, α) = A^{*} (α, α)\)
- 这就是说, 厄米矩阵的对角元素必是实数.
表象的变换
- 基的变换矩阵
\(S\)
是一个幺正矩阵, 即它满足条件:
\(S^{\dagger} S = S S^{\dagger} = I\)
- 此处的 \(I\) 是单位矩阵.
Page 129 ~ 130
本征值方程; 观察算符
-
这些本征值的集合叫做 \(A\) 的
谱
. -
为了避免这种不确定性, 我们可以约定将本征矢归一化为
1
, 即取 \(\langle ψ \mid ψ \rangle = 1\)- 但是这种做法并没有完全消除不确定性, 因为 \(e^{iθ} \mid ψ \rangle\) (\(θ\) 为任意实数) 和 \(\mid ψ \rangle\) 具有相同的模方.
- 以后我们将会看到, 在量子力学中, 从 \(\mid ψ \rangle\) 和从 \(e^{iθ} \mid ψ \rangle\) 得到的物理预言是一样的.
得到的物理实在是一样的: 全局相位
- 如果本征值
\(λ\)
只对应于一个本征矢 (除一个倍乘因子以外), 也就是说与
\(λ\)
对应的全体本征矢是共线的, 我们便称这个本征值是
非简并
的 (或简单的).- 反之, 如果至少有两个线性无关的右矢都是
\(A\)
的属于同一本征值的本征矢, 我们便称这个本征值是
简并
的; 属于这个本征值的线性无关本征矢的个数, 叫做该本征值的简并度
(一个本征值的简并度可以是有限的, 也可以是无限的).
- 反之, 如果至少有两个线性无关的右矢都是
\(A\)
的属于同一本征值的本征矢, 我们便称这个本征值是
- 因而,
\(A\)
的属于
\(λ\)
的本征右矢的集合构成一个
\(g\)
维矢量空间 (
\(g\)
也可能是无穷大), 我们称它为本征值
\(λ\)
的
本征子空间
.- 特别地, 说 \(λ\) 是非简并的, 或说它的简并度 \(g = 1\), 这两种说法是等价的.
- 于是
\(P_ψ\)
的谱只包含两个数:
1
和0
.- 前者是非简并的, 后者的简并度为无穷大 (如果待研究的态空间是无限多维的).
- 对应于
\(λ = 0\)
的本征子空间就是
\(\mid ψ \rangle\)
的
补空间
.
若无特殊说明, 本书的
补空间
一般都是: 正交补
- 此外, 进行一次任意的基变换, 便很容易证明,
特征方程和我们所选用的表象无关.
- 因此, 一个算符的本征值就是它的特征方程的根.
求算符的本征值和本征矢: 只从实用角度讨论~
- 因此, 在
\(λ_0\)
为特征方程的单根时, 只有一个本征矢 (除一个倍乘因子以外) 和它对应,
也就是说, 这个本征值是非简并的.
- 当 \(λ_0\) 是特征方程的 \(q\) 重根 \((q > 1)\) 时, 有两种可能.
详见, Page 134
对于厄米算符, 可以证明, 本征值 λ 的简并度 p 总是等于特征方程的重根的重数 q.
以后, 大多数情况下, 由于我们只研究厄米算符, 于是,
只要知道特征方程的每一个根的重数, 立刻就可以知道对应的本征子空间的维数.
因此, 在维数 N 为有限的空间中, 一个厄米算符永远具有 N 个线性无关的本征矢
(以后将会看到, 我们可以使它们正交归一化, 因而这种算符是可以对角化的).
观察算符
-
\[A^{\dagger} = A\]
- (i) 厄米算符的本征值都是
实数
- (ii) 厄米算符的属于两个互异本征值的本征矢
互相正交
- (i) 厄米算符的本征值都是
- 我们证明过,
\(\mathcal{E}_n\)
中的每一个矢量都正交于另一个本征子空间
\(\mathcal{E}_{n'}\)
中的每一个矢量
(\(\mathcal{E}_{n'}\)
对应于
\(a_{n'} ≠ a_n\));
故有:
- \(\langle ψ_n^i \mid ψ_{n'}^j \rangle = 0\); 对于 \(n ≠ n'\) 和任意的 \(i\), \(j\).
- 在每一个子空间
\(\mathcal{E}_n\)
的内部, 我们总可选择诸矢量
\(\mid ψ_n^i \rangle\),
使得它们是正交归一的, 即使得:
- \[\langle ψ_n^i \mid ψ_n^j \rangle = δ_{ij}\]
- 实现了这样的选择, 就建立了算符
\(A\)
的本征矢的正交归一系: 诸矢量
\(\mid ψ_n^i \rangle\)
满足下列关系:
- \[\langle ψ_n^i \mid ψ_{n'}^{i'} \rangle = δ_{nn'} δ_{ii'}\]
- 按定义, 如果本征矢的这个正交归一系在态空间中构成一个基, 厄米算符
\(A\)
就是一个
观察算符
. 构成基这一事实可以用封闭性关系式来表示:- \[\sum_{n = 1}^{\infty} \sum_{i = 1}^{g_n} \mid ψ_n^i \rangle \langle ψ_n^i \mid = \mathbb{1}\]
- 定理 I: 如果两个算符
\(A\)
和
\(B\)
是可对易的, 而且
\(\mid ψ \rangle\)
是
\(A\)
的一个本征矢, 则
\(B \mid ψ \rangle\)
也是
\(A\)
的本征矢, 且属于同一本征值.
- 定理 I’: 如果两个算符 \(A\) 与 \(B\) 是可对易的, 那么, \(A\) 的所有本征子空间在 \(B\) 的作用下都是整体不变的.
-
定理 II: 如果两个观察算符 \(A\) 与 \(B\) 是可对易的, 又若 \(\mid ψ_1 \rangle\) 和 \(\mid ψ_2 \rangle\) 是 \(A\) 的两个本征矢, 属于不同的本征值, 则矩阵元 \(\langle ψ_1 \mid B \mid ψ_2 \rangle\) 等于零.
- 定理 III: (基本定理) 如果两个观察算符
\(A\)
与
\(B\)
可对易, 则
\(A\)
和
\(B\)
的共同本征矢构成态空间的一个正交归一基.
- 很容易证明
定理 III
的逆定理: 如果存在由 \(A\) 和 \(B\) 的共同本征矢构成的一个基, 则这两个观察算符是对易的.
- 很容易证明
几何视角; 重根~
- 从现在起, 我们用记号
\(\mid u_{n, p}^i \rangle\)
来表示
\(A\)
和
\(B\)
的共同本征矢:
- \[A \mid u_{n, p}^i \rangle = a_n \mid u_{n, p}^i \rangle\]
- \[B \mid u_{n, p}^i \rangle = b_p \mid u_{n, p}^i \rangle\]
- \(\mid u_{n, p}^i \rangle\) 中的指标 \(n\) 和 \(p\) 用来标记 \(A\) 和 \(B\) 的本征值 \(a_n\) 和 \(b_p\), 同属于本征值 \(a_n\) 和 \(b_p\) 的各基矢可以用上标 \(i\) 加以区别.
Page 140 ~ 141
Page 142 ~ 143
- 推广到一般情况, 我们可以说: 按定义, 把观察算符
\(A\),
\(B\),
\(C\)
… 的一个集合叫做可对易观察算符的
完全
集合的条件是:- (i) 所有的这些观察算符
\(A\),
\(B\),
\(C\)
… 是
两两对易
的; - (ii) 给出了全体算符 \(A\), \(B\), \(C\) … 的本征值的一个数组, 便足以决定唯一的一个共同本征矢 (除倍乘因子以外).
- (i) 所有的这些观察算符
\(A\),
\(B\),
\(C\)
… 是
- 还有一个等价的说法是: 观察算符
\(A\),
\(B\),
\(C\)
… 的一个集合成为可对易观察算符的完全集合的条件是:
- 存在着由共同本征矢构成的一个正交归一基, 而且这个基是唯一的 (除相位因子以外).
还有一个等价的说法
; 嗯, 这个说法更显简易~
- (i) 如果
\(\{ A, B \}\)
是一个 CSCO, 我们给它增添任意一个和
\(A\),
\(B\)
都可对易的观察算符
\(C\),
便可以得到另一个 CSCO.
- 但是, 我们通常约定只考虑
最小的
集合, 就是说, 如果从中去掉任意一个观察算符, 它就不成其为完全集合了.
- 但是, 我们通常约定只考虑
- (ii) 假设 \(\{ A, B, C, ... \}\) 是可对易观察算符的完全集合. 因为给出了本征值 \(a_n\), \(b_p\), \(c_r\) … 的一个可能的数组, 便足以决定一个对应的基右矢 (除一个倍乘因子以外), 所以有时我们将这个右矢记作 \(\mid a_n, b_p, c_r, ... \rangle\).
- (iii) 对于一个给定的物理体系, 可对易观察算符的完全集合不止一个.
表象和观察算符的两个重要例子
此章节值得反复阅读
- 对于每一个波函数
\(ψ(r)\),
我们取
\(\mathcal{E}_r\)
空间中的一个右矢
\(\mid ψ \rangle\)
和它对应, 使这种对应关系是线性的;
而且使两个右矢的标量积和两个对应函数的标量积一致, 即
- \[\langle φ \mid ψ \rangle = \int d^{3} r φ^{*}(r) ψ(r)\]
- 这样的 \(\mathcal{E}_r\) 就是一个无自旋粒子的态空间.
-
由此可见, 波函数在点 \(r_0\) 处的值 \(ψ(r_0)\) 就是右矢 \(\mid ψ \rangle\) 在 \(\{ \mid r_0 \rangle \}\) 表象中的基矢 \(\mid r_0 \rangle\) 上的分量; “动量空间中的波函数” \(\overline{ψ} (p)\) 也可以得到类似的解释.
- 既然我们已经重新解释过波函数
\(ψ(r)\)
及其傅里叶变换
\(\overline{ψ} (p)\),
我们将用
\(\mid r \rangle\)
和
\(\mid p \rangle\)
代替
\(\mid r_0 \rangle\)
和
\(\mid p_0 \rangle\)
来表示我们在这里所研究的两种表象的基矢. 于是:
- \[\langle r \mid ψ \rangle = ψ(r)\]
- \[\langle p \mid ψ \rangle = \overline{ψ} (p)\]
- 正交归一关系式和封闭性关系式可以写作:
- (a) \(\langle r \mid r' \rangle = δ(r - r')\)
- (b) \(\int d^{3} r \mid r \rangle \langle r \mid = \mathbb{1}\)
- (c) \(\langle p \mid p' \rangle = δ(p - p')\)
- (d) \(\int d^{3} p \mid p \rangle \langle p \mid = \mathbb{1}\)
- 当然, 在这里我们总是把 \(\mathbf{r}\) 及 \(\mathbf{p}\) 看作分别在两种表象中标记基右矢的连续指标 \(\{ x, y, z \}\) 及 \(\{ p_x, p_y, p_z \}\) 的两个集合.
Page 147
算符 R 和算符 P
- 假设
\(\mid ψ \rangle\)
是
\(\mathcal{E}_r\)
空间中的一个任意右矢, 则
\(\langle r \mid ψ \rangle = ψ(r) ≡ ψ(x, y, z)\)
表示对应的波函数. 按算符
\(X\)
的定义, 右矢
- \[\mid ψ' \rangle = X \mid ψ \rangle\]
- 在基 \(\{ \mid r \rangle \}\) 中由函数 \(\langle r \mid ψ' \rangle = ψ'(r) ≡ ψ'(x, y, z)\) 来表示; 这里
- \[ψ'(x, y, z) = x ψ(x, y, z)\]
- 因此, 在
\(\{ \mid r \rangle \}\)
表象中,
\(X\)
算符与表示 “乘以
\(x\)”
的倍乘算符一致.
- 虽然这里是通过波函数的变换来引入算符 \(X\) 的, 但 \(X\) 是在态空间 \(\mathcal{E}_r\) 中起作用的算符.
- 在
\(\{ \mid r \rangle \}\)
表象中, 也可以计算算符
\(X\),
\(Y\),
\(Z\),
\(P_x\),
\(P_y\),
\(P_z\)
之间的对易子. 例如
- \[\begin{align} \langle r \mid [ X, P_x ] \mid ψ \rangle & = \langle r \mid (X P_x - P_x X) \mid ψ \rangle \\ & = x \langle r \mid P_x \mid ψ \rangle - \frac{\hbar}{i} \frac{\partial}{\partial x} \langle r \mid X \mid ψ \rangle \\ & = \frac{\hbar}{i} x \frac{\partial}{\partial x} \langle r \mid ψ \rangle - \frac{\hbar}{i} \frac{\partial}{\partial x} x \langle r \mid ψ \rangle \\ & = i \hbar \langle r \mid ψ \rangle \\ \end{align}\]
- 上面的计算对于任意右矢 \(\mid ψ \rangle\) 和任意一个基右矢 \(\mid r \rangle\) 都成立, 因此便得到:
- \[[ X, P_x ] = i \hbar\]
- 用同样的方法可以得到
\(R\)
的诸分量和
\(P\)
的诸分量之间的其他对易子. 我们将结果归纳在下面:
- \[[ R_i, R_j ] = 0\]
- \[[ P_i, P_j ] = 0\]
- \[[ R_i, P_j ] = i \hbar δ_{ij}\]
- \[i, j = 1, 2, 3\]
- 式中 \(R_1\), \(R_2\), \(R_3\) 和 \(P_1\), \(P_2\), \(P_3\) 分别代表 \(X\), \(Y\), \(Z\) 和 \(P_x\), \(P_y\), \(P_z\).
- 上述公式叫做正则对易关系式.
-
\[\begin{align}
X \mid r \rangle = x \mid r \rangle \\
Y \mid r \rangle = y \mid r \rangle \\
Z \mid r \rangle = z \mid r \rangle
\end{align}\]
- 于是, 右矢 \(\mid r \rangle\) 是算符 \(X\), \(Y\), \(Z\) 的共同本征右矢; 现在可以说明, 为什么一开始要选用 \(\mid r \rangle\) 这个符号:
- 这是由于, 每一个本征矢都是由矢量 \(r\) 来标记的, \(r\) 的坐标 \(x\), \(y\), \(z\) 就是对应于 \(X\), \(Y\), \(Z\) 的本征值的三个连续指标.
- 对于算符
\(P\),
我们应该在
\(\{ \mid p \rangle \}\)
表象中去讨论, 这样便能建立起类似的概念和公式. 我们可以得到:
- \[\begin{align} P_x \mid p \rangle = p_x \mid p \rangle \\ P_y \mid p \rangle = p_y \mid p \rangle \\ P_z \mid p \rangle = p_z \mid p \rangle \end{align}\]
态空间的张量积
作者说张量积暂时不是必需的~
- 按同样的方式, 到后面 (第四章和第九章), 对某些粒子来说,
我们还要考虑一种固有的角动量即自旋的存在. 就是说,
不但要考虑用定义在空间
\(\mathcal{E}_r\)
中的可观察量
\(R\)
和
\(P\)
来处理的外部自由度 (位置, 动量), 还要考虑内部自由度,
并引入自旋这一观察算符, 它在自旋态空间
\(\mathcal{E}_s\)
中起作用.
- 因而, 一个有自旋的粒子的态空间 \(\mathcal{E}\) 就是 \(\mathcal{E}_r\) 和 \(\mathcal{E}_s\) 的张量积.
- 最后, 态空间的张量积概念可以解决下述问题: 假设有两个孤立的物理体系
\((S_1)\)
和
\((S_2)\)
(例如, 两者相距充分远, 以致它们的相互作用完全可以忽略), 对应于
\((S_1)\)
和
\((S_2)\)
的态空间分别为
\(\mathcal{E}_1\)
和
\(\mathcal{E}_2\);
- 现在假定我们要把这两个体系的集合看作一个物理体系 (当两个体系距离充分近, 以致发生相互作用时, 这种看法是必要的), 那么总体系 \((S)\) 的态空间是什么?
这就是我所谓的物理学家讲数学的实在性!
张量积的定义和性质
- (i) 对于用复数来倍乘, 张量积运算是线性的;
- (ii) 对于矢量的加法, 张量积运算是可分配的;
- (iii) 若在空间
\(\mathcal{E}_1\)
中选定了一个基
\(\{ \mid u_i (1) \rangle \}\),
在空间
\(\mathcal{E}_2\)
中选定了一个基
\(\{ \mid v_l (2) \rangle \}\);
则诸矢量
\(\mid u_i (1) \rangle \otimes \mid v_l (2) \rangle\)
的集合构成空间
\(\mathcal{E}\)
中的一个基.
- 若 \(N_1\) 和 \(N_2\) 是有限的, 则 \(\mathcal{E}\) 的维数等于 \(N_1 N_2\).
于是, 一个张量积矢量的分量就是该乘积中的两个矢量的分量之积.
- 在
\(\mathcal{E}\)
空间中, 存在着这样的矢量, 它们并不是
\(\mathcal{E}_1\)
空间中的矢量和
\(\mathcal{E}_2\)
空间中的矢量的张量积. 事实上, 根据假设,
\(\{ \mid u_i (1) \rangle \otimes \mid v_l (2) \rangle \}\)
是
\(\mathcal{E}\)
空间中的一个基, 因此,
\(\mathcal{E}\)
空间中最普遍的矢量可表示为:
- \[\mid ψ \rangle = \sum_{i, l} c_{i, l} \mid u_i (1) \rangle \otimes \mid v_l (2) \rangle\]
- 任意给定了 \(N_1 N_2\) 个复数 \(c_{i, l}\), 我们不一定能将它们写成 \(N_1\) 个数 \(a_i\) 和 \(N_2\) 个数 \(b_l\) 的乘积 \(a_i b_l\) 的形式, 因此, 一般说来, 并不存在这样的矢量 \(\mid φ(1) \rangle\) 和 \(\mid χ(2) \rangle\), 它们的张量积刚好就是 \(\mid ψ \rangle\).
- 但是 \(\mathcal{E}\) 空间中的任意一个矢量总可以分解为张量积矢量的线性组合, 如上式所示.
- 在
\(\mathcal{E}_1\)
空间和
\(\mathcal{E}_2\)
空间中存在着标量积, 这就使我们可以同样定义空间
\(\mathcal{E}\)
中的标量积.
- 首先, 我们定义矢量 \(\mid φ(1) χ(2) \rangle = \mid φ(1) \rangle \otimes \mid χ(2) \rangle\) 和矢量 \(\mid φ'(1) χ'(2) \rangle = \mid φ'(1) \rangle \otimes \mid χ'(2) \rangle\) 的标量积为:
- \[\langle φ'(1) χ'(2) \mid φ(1) χ(2) \rangle = \langle φ'(1) \mid φ(1) \rangle \langle χ'(2) \mid χ(2) \rangle\]
- 对于
\(\mathcal{E}\)
空间中的任意两个矢量, 由于其中的每一个都是张量积矢量的线性组合,
因此, 可以直接应用标量积的基本性质.
- 特别地, 我们注意, 如果每一个基 \(\{ \mid u_i (1) \rangle \}\) 和 \(\{ \mid v_l (2) \rangle \}\) 都是正交归一的, 那么基 \(\{ \mid u_i (1) v_l (2) \rangle = \mid u_i (1) \rangle \otimes \mid v_l (2) \rangle \}\) 也是正交归一的, 即
- \[\langle u_{i'} (1) v_{l'} (2) \mid u_i (1) v_l (2) \rangle = \langle u_{i'} (1) \mid u_i (1) \rangle \langle v_{l'} (2) \mid v_l (2) \rangle = δ_{ii'} δ_{ll'}\]
此节的概念编排, 可见风范!
忘了谁说过或者在哪看见过: 定义, 定理的组织编排, 可见作者的眼界格局.
- 我们首先考虑定义在
\(\mathcal{E}_1\)
空间中的一个线性算符
\(A(1)\).
现在给这个算符联系上
\(\mathcal{E}\)
空间中的一个线性算符
\(\widetilde{A}(1)\),
叫做
\(A(1)\)
在
\(\mathcal{E}\)
空间中的
延伸算符
, 它的定义如下:- 将 \(\widetilde{A}(1)\) 作用于一个张量积矢量 \(\mid φ(1) \rangle \otimes \mid χ(2) \rangle\) 的结果是:
- \[\widetilde{A}(1) [ \mid φ(1) \rangle \otimes \mid χ(2) \rangle ] = [ A(1) \mid φ(1) \rangle ] \otimes \mid χ(2) \rangle\]
- 假设
\(A(1)\)
和
\(B(2)\)
分别为在
\(\mathcal{E}_1\)
空间和
\(\mathcal{E}_2\)
空间中起作用的两个线性算符. 张量积
\(A(1) \otimes B(2)\)
是
\(\mathcal{E}\)
空间中的一个线性算符, 它的定义就是规定它对张量积矢量的作用的下列关系式:
- \[[ A(1) \otimes B(2) ] [ \mid φ(1) \rangle \otimes \mid χ(2) \rangle ] = [ A(1) \mid φ(1) \rangle ] \otimes [ B(2) \mid χ(2) \rangle ]\]
原书印刷错误~
- 张量积矢量
\(\mid φ(1) χ(2) \rangle = \mid φ(1) \rangle \otimes \mid χ(2) \rangle\)
上的投影算符是
\(\mathcal{E}\)
空间的一种算符, 也就是
\(\mid φ(1) \rangle\)
上及
\(\mid χ(2) \rangle\)
上的两个投影算符的张量积:
- \[\mid φ(1) χ(2) \rangle \langle φ(1) χ(2) \mid = \mid φ(1) \rangle \langle φ(1) \mid \otimes \mid χ(2) \rangle \langle χ(2) \mid\]
- 本书的符号约定:
- \(\mid φ(1) \rangle \mid χ (2) \rangle\) 表示 \(\mid φ(1) \rangle \otimes \mid χ (2) \rangle\)
- \(A(1) B(2)\) 表示 \(A(1) \otimes B(2)\)
- \(A(1)\) 表示 \(\widetilde{A}(1)\) 或 \(A(1)\)
注: 后两个符号约定需要参考上下文
张量积空间中的本征值方程
- (a) 若 \(A(1)\) 是 \(\mathcal{E}_1\) 空间中的一个观察算符, 则它也是 \(\mathcal{E}\) 空间中的观察算符.
- (b) \(A(1)\) 在 \(\mathcal{E}\) 空间中的谱和它在 \(\mathcal{E}_1\) 空间中的谱一样.
- (c) 但是, 在 \(\mathcal{E}_1\) 空间中 \(g_n\) 度简并的本征值 \(a_n\) 在 \(\mathcal{E}\) 空间中的简并度为 \(N_2 \times g_n\).
- 因此, \(C = A(1) + B(2)\) 的本征值是 \(A(1)\) 的一个本征值与 \(B(2)\) 的一个本征值之和; 我们可以得到由 \(C\) 的本征矢构成的一个基, 其中的基矢是 \(A(1)\) 的一个本征矢和 \(B(2)\) 的一个本征矢的张量积 (不一定).
不一定: 详见 Page 158 附注; 其中的基矢是 \(A(1)\) 的一个本征矢和 \(B(2)\) 的一个本征矢的张量积, 或者张量积的线性组合.
- 若在 \(\mathcal{E}_1\) 与 \(\mathcal{E}_2\) 中各有一个可对易观察算符的完全集合, 则将此两集合合并起来便得到 \(\mathcal{E}\) 中的一个可对易观察算符的完全集合.
本书二, 三章对比于: 格里菲斯 - 形式理论; 明显更加章法有度! 准确说, 格里菲斯单纯就是讲解预备知识; 而科恩其实是一个思考过程的描述~
应用举例
- 因此,
\(\mathcal{E}_{xyz}\)
空间与三维空间中的一个粒子的态空间
\(\mathcal{E}_{r}\)
完全一致, 而
\(\mid x, y, z \rangle\)
就是
\(\mid r \rangle\):
- \[\mid x, y, z \rangle ≡ \mid r \rangle = \mid x \rangle \mid y \rangle \mid z \rangle\]
- 式中 \(x\), \(y\), \(z\) 正是 \(r\) 在直角坐标系中的分量.
- 假设体系的态可以用张量积右矢
\(\mid ψ \rangle = \mid ψ_1 \rangle \mid ψ_2 \rangle\)
来描述. 于是, 对应的波函数可分解因子为:
- \[ψ(r_1, r_2) = \langle r_1, r_2 \mid ψ \rangle = \langle r_1 \mid ψ_1 \rangle \langle r_2 \mid ψ_2 \rangle = ψ_1 (r_1) ψ_2 (r_2)\]
- 在这种情况下, 我们说两个粒子之间没有联系. 到后面我们再分析这种情况的物理后果.
上面得到的结论可以推广:
如果一个物理体系由两个或更多的简单体系组合而成,
则它的态空间就是对应于每一个组分体系的态空间的张量积.
量子力学的假定
- 拉格朗日力学
- 对一个物理体系的经典描述可以归结如下:
- (i) 体系在确定时刻 \(t_0\) 的态, 决定于 \(N\) 个广义坐标 \(q_i (t_0)\) 和 \(N\) 个共轭动量 \(p_i (t_0)\) 的数值.
- (ii) 如果知道了体系在指定时刻的态, 那么, 各物理量在该时刻的值便完全确定了. 这就是说, 知道了体系在 \(t_0\) 时刻的态, 我们就可以确切地预言在该时刻进行的任何一种测量的结果.
- (iii) 体系的态随时间演变的规律由
哈密顿-雅可比
方程组来表达. 由于它是一个一阶微分方程组, 所以, 只要给定在指定时刻 \(t_0\) 的函数值 \(\{ q_i (t_0), p_i (t_0) \}\), 此方程组的解 \(\{ q_i (t), p_i (t) \}\) 就是唯一的. 这就是说, 只要知道了体系的初态, 便可以确定它在任意时刻的态.
- 对物理体系的量子描述是建立在一些假定的基础之上的,
在这一章中, 我们将研究这些假定. 这些假定可以回答下列问题
(对应于上面关于经典描述所列举的那三点):
- (i) 怎样从数学上描述一个量子体系在指定时刻的态?
- (ii) 知道了体系的态, 怎样预言各种物理量的测量结果?
- (iii) 知道了体系在 \(t_0\) 时刻的态, 怎样去找出它在任意时刻 \(t\) 的态?
假定的陈述
- 第一个假定: 在确定的时刻
\(t_0\),
一个物理体系的态由态空间
\(\mathcal{E}\)
中一个特定的右矢
\(\mid ψ (t_0) \rangle\)
来确定.
- 第一个假定就隐含着叠加原理.
- 例: 给出 \(\mathcal{E}_r\) 空间中的右矢 \(\mid ψ \rangle\) 等价于给出对应的波函数 \(ψ (r) = \langle r \mid ψ \rangle\).
- 第二个假定: 每一个可以测量的物理量
\(\mathcal{A}\)
都可以用在
\(\mathcal{E}\)
空间中起作用的一个算符
\(A\)
来描述; 这个算符是一个
观察算符
.- 与经典力学对比, 量子力学是以本质上不同的方式来描述体系的态及有关物理量的:
- 态用矢量来表示, 物理量用算符来表示.
物理量的测量
- 第三个假定: 每次测量物理量
\(\mathcal{A}\),
可能得到的结果, 只能是对应的观察算符
\(A\)
的本征值之一.
- (i) 按定义,
\(A\)
是
厄米算符
,所以测量 \(\mathcal{A}\) 所得的结果总是实数
. - (ii) 如果 \(A\) 的谱是离散的, 那么, 测量 \(\mathcal{A}\) 可能得到的结果就是量子化的.
- (i) 按定义,
\(A\)
是
- 第四个假定 (
非简并
的离散谱的情况): 若体系处于已归一化的态 \(\mid ψ \rangle\) 中, 则测量物理量 \(\mathcal{A}\) 得到的结果为对应观察算符 \(A\) 的非简并本征值 \(a_n\) 的概率 \(\mathcal{P} (a_n)\) 是:- \[\mathcal{P} (a_n) = \mid \langle u_n \mid ψ \rangle \mid^2\]
- 式中 \(\mid u_n \rangle\) 是 \(A\) 的已归一化的本征矢, 属于本征值 \(a_n\).
- 第四个假定 (离散谱的情况): 若体系处于已归一化的态
\(\mid ψ \rangle\)
中, 则测量物理量
\(\mathcal{A}\)
得到的结果为对应观察算符
\(A\)
的本征值
\(a_n\)
的概率
\(\mathcal{P} (a_n)\)
是:
- \[\mathcal{P} (a_n) = \sum_{i = 1}^{g_n} \mid \langle u_n^i \mid ψ \rangle \mid^2\]
- 式中 \(g_n\) 是 \(a_n\) 的简并度, 而 \(\{ \mid u_n^i \rangle \} (i = 1, 2, ..., g_n)\) 是一组正交归一矢量, 它们在对应于 \(A\) 的本征值 \(a_n\) 的本征子空间 \(\mathcal{E}_n\) 中构成一个基.
- 这个假定要有意义, 在 \(a_n\) 有简并时, 概率 \(\mathcal{P} (a_n)\) 就必须与 \(\mathcal{E}_n\) 中基 \(\{ \mid u_n^i \rangle \}\) 的选择无关.
证明: 详见 Page 219
- 第四个假定 (非简并连续谱的情况): 测量处于已归一化的态
\(\mid ψ \rangle\)
的体系的物理量
\(\mathcal{A}\)
时, 得到介于
\(α\)
和
\(α + dα\)
之间的结果的概率
\(d \mathcal{P} (α)\)
是:
- \[d \mathcal{P} (α) = \mid \langle v_α \mid ψ \rangle \mid^2 dα\]
- 其中 \(\mid v_α \rangle\) 是与 \(\mathcal{A}\) 相联系的观察算符 \(A\) 的本征矢, 属于本征值 \(α\).
- 互成比例的两个态矢量表示同一个物理状态. 必须留意正确地解释这个结果.
- 例如, 假设 \(\mid ψ \rangle = λ_1 \mid ψ_1 \rangle + λ_2 \mid ψ_2 \rangle\)
- 这里的 \(λ_1\) 和 \(λ_2\) 都是复数.
- 不论 \(θ_1\) 是任何实数, \(e^{i θ_1} \mid ψ_1 \rangle\) 和 \(\mid ψ_1 \rangle\) 确实表示同一个物理状态, \(e^{i θ_2} \mid ψ_2 \rangle\) 和 \(\mid ψ_2 \rangle\) 也确实表示同一个态.
- 但是, 一般地说: \(\mid φ \rangle = λ_1 e^{i θ_1} \mid ψ_1 \rangle + λ_2 e^{i θ_2} \mid ψ_2 \rangle\) 并不描述与 \(\mid ψ \rangle\) 相同的态
- (我们将会看到, 在态矢量的展开式中, 诸系数的相对相位起着重要的作用);
- 只有在 \(θ_1 = θ_2 + 2nπ\) 这个特殊情况下 \(\mid φ \rangle\) 与 \(\mid ψ \rangle\) 才表示同一个态, 这时
- \[\mid φ \rangle = e^{i θ_1} [ λ_1 \mid ψ_1 \rangle + λ_2 \mid ψ_2 \rangle ] = e^{i θ_1} \mid ψ \rangle\]
换句话说, 总的相位因子对于物理预言没有影响,
但展开式中各系数的相对相位则是有影响的.
- 第五个假定: 如果对处于
\(\mid ψ \rangle\)
态的体系测量物理量
\(\mathcal{A}\)
得到的结果是
\(a_n\),
则刚测量之后体系的态是
\(\mid ψ \rangle\)
在属于
\(a_n\)
的本征子空间上的
归一化
的投影 \(\frac{P_n \mid ψ \rangle}{\sqrt{ \langle ψ \mid P_n \mid ψ \rangle }}\).- 因此, 在刚测量之后, 体系的态矢量一定是 \(A\) 的属于本征值 \(a_n\) 的本征矢.
- 但是我们要强调这样一个事实: 这个本征矢决不是子空间 \(\mathcal{E}_n\) 中的任意右矢, 而是 \(\mid ψ \rangle\) 的属于 \(\mathcal{E}_n\) 的那一部分 (为方便起见, 已适当地归一化).
体系随时间的演变
- 第六个假定: 态矢量
\(\mid ψ (t) \rangle\)
随时间的演变遵从薛定谔方程:
- \[i \hbar \frac{d}{dt} \mid ψ (t) \rangle = H(t) \mid ψ (t) \rangle\]
- 式中 \(H(t)\) 是与体系的总能量相联系的观察算符.
- \(H\)
叫做体系的
哈密顿算符
, 因为它是从经典的哈密顿函数得来的.
量子化规则
此节, 言简意赅, 清晰明了~
- 首先考虑由处在标量势场中的一个无自旋粒子构成的体系.
这时, 我们有下述规则:
- 与粒子的位置 \(\mathbf{r} (x, y, z)\) 相联系的是观察算符 \(R (X, Y, Z)\).
- 与粒子的动量 \(\mathbf{p} (p_x, p_y, p_z)\) 相联系的是观察算符 \(P (P_x, P_y, P_z)\).
- 提醒一下,
\(R\)
和
\(P\)
的诸分量满足正则对易关系:
- \[[R_i, R_j] = [P_i, P_j] = 0\]
- \[[R_i, P_j] = i \hbar δ_{ij}\]
这里其实很有意思, \(i\) 所隐含的正交, 和 \(i\) 与 \(j\) 的实实在在的正交. 然后, 带来的不确定度. (嗯, 纯属个人的胡思乱想.)
- 要得到描述一个已有经典定义的物理量 \(\mathcal{A}\) 的观察算符 \(A\), 只需在 \(\mathcal{A}\) 的经过适当对称化的表达式中, 将 \(\mathbf{r}\) 与 \(\mathbf{p}\) 分别换成观察算符 \(R\) 与 \(P\).
但是, 我们将会看到, 还存在着一些量子的物理量, 它们并没有对应的经典物理量;
这些量将由对应的观察算符直接定义 (例如, 粒子的自旋便属于这种情况).
这就是为啥科普书没法解释: 何为粒子的自旋~
- 必须注意, 不要将
\(\mathbf{p}\)
(粒子的动量或称
\(\mathbf{r}\)
的共轭动量) 与
\(m \mathbf{v}\)
(粒子的机械动量) 混淆起来.
- 在量子力学中当然也有和粒子速度相联系的算符, 在这里, 我们将它写作: \(\mathcal{V} = \frac{1}{m} (P - qA)\)
- 于是 \(H\) 便成为: \(H(t) = \frac{1}{2} m \mathcal{V}^2 + V(\mathbf{R}, t)\)
- 这是两项之和, 一项对应于粒子的动能, 一项对应于它的势能.
- 但是, 与量子力学中满足正则对易关系式的算符 \(P\) 相对应的是共轭动量 \(P\) 而不是机械动量 \(m \mathbf{v}\).
关于可观察量及其测量的假定的物理解释
可观察量在指定态中的平均值
- 在
\(\mid ψ \rangle\)
这个态中, 可观察量
\(A\)
的平均值 (记作
\(\langle A \rangle_{ψ}\)
或简记作
\(\langle A \rangle\)),
可以定义为在处于
\(\mid ψ \rangle\)
这个态的诸体系中对这个可观察量进行很多次
(\(N\)
次) 测量所得结果的平均值.
- 如果 \(\mid ψ \rangle\) 已经给定, 我们就知道了得到每个可能结果的概率, 从而也就可以预言平均值 \(\langle A \rangle_{ψ}\).
- 我们将证明, 若
\(\mid ψ \rangle\)
是
已归一化
的, 则 \(\langle A \rangle_{ψ}\) 由下列公式给出: - \[\langle A \rangle_{ψ} = \langle ψ \mid A \mid ψ \rangle\]
- 如果表示体系状态的右矢
\(\mid ψ \rangle\)
未归一化
, 则公式应为 - \[\langle A \rangle_{ψ} = \frac {\langle ψ \mid A \mid ψ \rangle} {\langle ψ \mid ψ \rangle}\]
Page 231: (iii)
可观察量的相容性
- 如果两个可观察量
\(A\)
和
\(B\)
是相容的, 那么, 测量
\(A\)
所得到的信息不但不会因为对
\(B\)
的测量而遭受损失, 而且会因此得到补充; 反之亦然.
- 此外, 测量这两个可观察量 \(A\) 和 \(B\) 的顺序是无关紧要的. 最后这一点又使我们联想到同时测量 \(A\) 与 \(B\) 的问题.
- 可以看出, 第四个假定和第五个假定是可以推广到这样的同时测量的:
- 和测量结果 \(\{ a_n, b_p \}\) 对应的, 是正交归一本征矢 \(\mid a_n, b_p, i \rangle\).
- 反之, 如果 \(A\) 与 \(B\) 是不可对易的. 则前面的推理就不再成立了.
不相容的两个可观察量是不能同时测量的,
第二次测量会使第一次测量所得信息失去.
- 如果对应于
\((a_n, b_p)\),
存在着
\(A\)
和
\(B\)
的若干个本征矢
\(\mid a_n, b_p, i \rangle\),
那么, 我们可以重新推理, 并在测量
\(A\)
和
\(B\)
的同时, 测量与此两者都相容的第三个可观察量
\(C\).
- 这样, 我们可以得到下述结论:
- 为使体系在测量之后的态毫无例外地由测量结果唯一地确定, 所测量的那些量必须是对易可观察量的完全集合.
- 正是这个性质从物理上证实了引入 CSCO 这个概念的必要性.
因此, 制备一个处在完全确定的量子态的体系的方法, 从原则上说,
与得到偏振光的方法相似: 如果在一束光的途径中插入一个起偏器,
那么, 由此出来的光便是沿某一方向偏振的光, 这个方向决定于起偏器的特征,
因而所得偏振光与入射光的偏振状态没有关系.
同样地, 为了制备一个量子体系, 我们可以构成这样一种仪器, 它只允许一个态通过,
这个态对应于已经选定的完全集合中的每一个可观察量的一个特定本征值.
对一个 CSCO 的测量只能制备与这个 CSCO 相联系的基矢态中的任意一个态.
然而, 要得到体系的其他的态, 只需改换可观察量的集合.
薛定谔方程的物理意义
薛定谔方程的普遍性质
- a. 物理体系的演变的确定性
- 薛定谔方程是关于 \(t\) 的一阶微分方程. 由此可知, 只要给出了初态 \(\mid ψ (t_0) \rangle\) 就足以决定此后任意时刻 \(t\) 的态 \(\mid ψ (t) \rangle\).
- 因此, 在物理体系随时间演变的过程中, 没有任何不确定性.
- 不确定性只出现在测量某个物理量的时候. 这时态矢量发生不可预料的跃变 (参看第五个假定).
- 但是, 在两次测量之间, 态矢量是按完全确定的方式, 即按薛定谔方程演变的.
- b. 叠加原理
- 薛定谔方程是线性齐次的, 因而它的解是可以线性叠加的.
- c. 概率守恒
- α. 态矢量的模方保持为常数
- β. 概率的局域守恒; 概率密度和概率流
- (在这一段里, 只考虑由无自旋的单个粒子构成的物理体系.)
态矢量的模方保持为常数
. 证明, 详见 Page 239
Page 243: 埃伦费斯特定理
在大多数宏观体系可以满足的某些极限条件下,
从薛定谔方程可以得到经典力学方程.
Page 246
保守体系的情况
如果一个物理体系的哈密顿函数不明显地依赖于时间, 我们就称该体系是保守的,
在经典力学中, 这种情况的最重要的后果就是 (对时间而言的) 能量守恒.
或者说体系的总能量是一个运动常量.
在这一节里, 我们将会看到, 在量子力学中情况也一样,
保守体系除了具备上一节所说的普遍性质外, 还具有一些特别重要的性质.
Page 247: 知道 \(\mid ψ (t_0) \rangle\), 求 \(\mid ψ (t) \rangle\) 的步骤.
- 处在
\(H\)
的本征态中的体系的一切物理性质, 都不随时间而变; 由于这个原因, 我们称
\(H\)
的本征态为
定态
. 同样有意义的是, 分析一下在量子力学中保守体系的能量守恒是怎样出现的.- 假设在时刻 \(t_0\). 我们测量这个体系的能量, 譬如得到的结果是 \(E_k\).
- 刚测量之后, 体系处于 \(H\) 的属于本征值 \(E_k\) 的一个本征态 (关于波包收缩的假定).
- 刚才我们看到, \(H\) 的本征态都是定态, 因此, 在第一次测量之后, 体系的态不再演变而总是保持在 \(H\) 的属于本征值 \(E_k\) 的本征态.
- 由此可以推知, 在以后的任一时刻 \(t\), 第二次测量体系的能量, 必将总是得到和第一次相同的结果 \(E_k\).
- 按定义, 运动常量是这样一个可观察量
\(A\),
它不明显地依赖于时间, 并且可以和
\(H\)
对易:
- \[\begin{cases} \frac{\partial A}{\partial t} = 0 \\ [ A, H ] = 0 \end{cases}\]
- 由此可见, 对于保守体系来说, \(H\) 本身就是一个运动常量.
- 现在我们来证明运动常量的一些重要性质.
- (i) 不论物理体系处于什么态
\(\mid ψ(t) \rangle\),
在这个态中
\(A\)
的平均值不随时间而变 (
运动常量
的名称便由此而来). - (ii) 为简单起见, 假设 \(H\) 与 \(A\) 的谱都是离散的; 指标 \(τ\) 用来标记与 \(H\) 和 \(A\) 一起构成一个 CSCO 的那些观察算符的本征值.
- \(\mid φ_{n, p, τ} \rangle\) 态既然是 \(H\) 的本征态, 当然都是定态. 如果在初时刻, 体系处于 \(\mid φ_{n, p, τ} \rangle\) 态, 那么它将一直处于这个态 (除一个总的相位因子以外).
- 但是态
\(\mid φ_{n, p, τ} \rangle\)
也是
\(A\)
的本征态, 当
\(A\)
为运动常量时, 物理体系便有这样一些定态 (即态
\(\mid φ_{n, p, τ} \rangle\)),
在任何时刻
\(t\),
这些态都保持为
\(A\)
的属于同一本征值
(\(a_p\))
的本征态. 由于这个原因, 我们称
\(A\)
的本征值为
好量子数
. - (iii) 在任意态 \(\mid ψ (t) \rangle\) 中测量运动常量 \(A\), 得到本征值 \(a_p\) 的概率是不随时间而变的.
- (i) 不论物理体系处于什么态
\(\mid ψ(t) \rangle\),
在这个态中
\(A\)
的平均值不随时间而变 (
- 第四海森伯不确定度关系式和关于 \(R\) 与 \(P\) 的三个分量的那三个不确定度关系式显然不同. 事实上, 在第四海森伯不确定度关系式中, 只有能量才和 \(R\) 与 \(P\) 一样是物理量, 而 \(t\) 则是一个参变量, 在量子力学中没有任何算符和它相联系.
Page 254
叠加原理和物理上的预言
概率幅与干涉效应
- 将
\(\mid ψ \rangle\)
看作态的统计混合是错误的,
因为这种解释丢掉了公式中双重标量积所包含的全部干涉效应.
- 此外, 我们还看到, 起重要作用的不仅是 \(λ_1\) 和 \(λ_2\) 的模, \(λ_1\) 和 \(λ_2\) 的相对相位也有重要的作用, 因为相对相位通过 \(λ_1 λ_2^{*}\), 而明显地出现在物理预言中.
相对相位
- 从前面的讨论可以引申出下面的概念:
- (i) 量子理论中的概率型预言一概得自
概率幅
, 计算时要取它的模的平方. - (ii) 在一个确定的实验中, 如果没有进行中间阶段的测量, 那么, 我们绝不能根据中间测量可能得到的各种结果的概率, 而应根据它们的概率幅来分析问题.
- (iii) 一个物理体系的态可以线性叠加, 这意味着: 一个概率幅往往表现为若干部分幅之和, 因而对应的概率等于若干项之和的模的平方, 而且那些部分幅是彼此相干的.
- (i) 量子理论中的概率型预言一概得自
若干个态与同一测量结果相联系的情况
- 杨氏双狭缝实验. 为了计算在
\(M\)
点探测到光子的概率密度, 必须将狭缝
\(A\)
和
\(B\)
所辐射的电场加起来, 然后将所得结果平方 (即
和的平方
).- 在区间
\([ x_1, x_2 ]\)
中找到光子的概率则等于在
\(x_1\)
和
\(x_2\)
之间各点的概率密度的总和 (即
平方的和
).
- 在区间
\([ x_1, x_2 ]\)
中找到光子的概率则等于在
\(x_1\)
和
\(x_2\)
之间各点的概率密度的总和 (即
归结一下, 从这一段的讨论中, 必须抓住的基本概念可以简要地叙述如下:
将对应于同一末态的诸概率幅相加, 然后将对应于正交末态的诸概率相加.
Page 266 ~ 268
附录
附录原本在卷二末, 但我觉得其实应该放在卷一. 估计是第一卷太厚了, 哈哈~
傅立叶级数和傅立叶变换
物理学家讲数学就是更具
实在性
~
傅立叶级数
- 设
\(f(x)\)
是基本周期为
\(L\)
的周期函数. 若此函数满足某些数学条件 (在物理学中实际上都得以满足),
我们即可将它展成
虚指数函数
或三角函数
的级数.虚指数函数
的级数, 我们可将 \(f(x)\) 写成下列形式:- \[f(x) = \sum_{n = - \infty}^{+ \infty} c_n e^{i k_n x}\]
- 其中 \(k_n = n \frac{2π}{L}\)
- 傅里叶级数的系数 \(c_n\) 由下列公式给出:
- \[c_n = \frac{1}{L} \int_{x_0}^{x_0 + L} dx e^{- i k_n x} f(x)\]
- 其中 \(x_0\) 为任意实数.
- 我们称
\(| c_n |\)
的集合为
\(f(x)\)
的
傅里叶谱
.- 注意, 当而且仅当 \(c_{-n} = c^{*}_n\) 时, \(f(x)\) 才是实函数.
余弦级数和正弦级数: Page 542
- 帕塞瓦尔定理
-
\[\frac{1}{L} \int_{x_0}^{x_0 + L}
dx \mid f(x) \mid^2 =
\sum_{n = - \infty}^{+ \infty}
\mid c_n \mid^2\]
- 设有周期都是 \(L\) 的两个函数 \(f(x)\) 和 \(g(x)\), 它们的傅里叶系数分别为 \(c_n\) 和 \(d_n\), 则可将上式推广为下列形式:
- \[\frac{1}{L} \int_{x_0}^{x_0 + L} dx g^{*}(x) f(x) = \sum_{n = - \infty}^{+ \infty} d^{*}_{n} c_n\]
傅立叶变换
-
作为傅里叶级数的极限的傅里叶积分
- 现在我们来考虑一个函数
\(f(x)\),
不一定是周期性的, 再定义
\(f_L (x)\)
为周期等于
\(L\)
的周期函数, 它在区间
\([-L/2, L/2]\)
上同于
\(f(x)\),
我们可将
\(f_L (x)\)
展为傅里叶级数.
- 若 \(L\) 趋向无穷大, \(f_L (x)\) 便与 \(f(x)\) 重合. 我们若令
- \[\tilde{f} (k) = \frac{1}{\sqrt{2 \pi}} \int_{- \infty}^{+ \infty} dx e^{-ikx} f(x)\]
- 则在 \(L\) 为无穷大的极限情况下:
- \[f(x) = \frac{1}{\sqrt{2 \pi}} \int_{- \infty}^{+ \infty} dke^{ikx} \tilde{f}(k)\]
- 我们称 \(f(x)\) 和 \(\tilde{f} (k)\) 互为傅里叶变换.
-
量子力学中的傅里叶变换
- 在量子力学中, 我们通常使用略微不同的惯例: 设
\(ψ(x)\)
是一个 (一维的) 波函数, 则其傅里叶变换
\(\overset{-}{ψ}(p)\)
的定义为:
- \[\overset{-}{ψ} (p) = \frac{1}{\sqrt{2 \pi \hbar}} \int_{- \infty}^{+ \infty} dx e^{-ipx / \hbar} ψ(x)\]
- 而相反的公式则为:
- \[ψ(x) = \frac{1}{\sqrt{2 \pi \hbar}} \int_{- \infty}^{+ \infty} dpe^{ipx / \hbar} \overset{-}{ψ} (p)\]
简单性质
: 讲的比较简单~ Page 545
- 两个函数
\(ψ_1 (x)\)
和
\(ψ_2 (x)\)
的
卷积
定义为下式给出的函数 \(ψ(x)\):- \[ψ(x) = \int_{- \infty}^{+ \infty} dy ψ_1 (y) ψ_2 (x - y)\]
- 此函数的傅里叶变换正比于 \(ψ_1 (x)\) 和 \(ψ_2 (x)\) 的傅里叶变换的普通乘积:
- \[\overset{-}{ψ} (p) = \sqrt{2 \pi \hbar} \overset{-}{ψ_1} (p) \overset{-}{ψ_2} (p)\]
- 傅里叶变换保持模方不变:
- \[\int_{- \infty}^{+ \infty} dx \mid ψ(x) \mid^2 = \int_{- \infty}^{+ \infty} dp \mid \overset{-}{ψ} (p) \mid^2\]
帕塞瓦-普朗克尔公式
也可以推广为:- \[\int_{- \infty}^{+ \infty} dx φ^{*} (x) ψ(x) = \int_{- \infty}^{+ \infty} dp \overset{-}{φ}^{*} (p) \overset{-}{ψ} (p)\]
三维空间中的傅里叶变换
: Page 547
此章节可对比阅读: 陶哲轩实分析, 傅里叶级数; 陶哲轩的推进顺序会更加一气呵成~
狄拉克的 δ 函数
δ 函数其实是一种分布. 下面我们将从物理观点来考虑它, 并将它作为普通函数来处理;
这种方法在数学上虽不严格, 但对它在量子力学中的应用来说, 是可令人满意的.
- \(ε\)
越小, 近似程度越高. 因此, 我们过渡到极限
\(ε = 0\)
并以下式来定义
\(δ\)
函数:
- \[\int_{- \infty}^{+ \infty} dx δ(x) f(x) = f(0)\]
- 对于在原点有定义的一切函数 \(f(x)\), 此式都成立. 一般地, \(δ(x - x_0)\) 的定义为:
- \[\int_{- \infty}^{+ \infty} dx δ(x - x_0) f(x) = f(x_0)\]
- 附注: 其实, 式中的积分符号在数学上是不合理的, 我们应严格地将 \(δ\) 定义为一种广义函数, 而不是定义为一个函数.
- 从物理的观点看来, 这个区别并不重要, 在物理学中, 只要 \(ε\) 对给定问题所涉及的一切长度而言都可以忽略, 这就是说, 只要我们可能必须考虑的一切函数 \(f(x)\) 在宽度为 \(ε\) 的区间上没有明显的变化, 我们就不可能区别 \(δ^{(ε)} (x)\) 和 \(δ(x)\).
- 在这里每当遇到数学上的困难时, 我们只需设想 \(δ(x)\) 其实就是 \(δ^{(ε)} (x)\) 或一个类似的函数, 但更为平滑, 而 \(ε\) 非常小但不严格为零.
趋向于 δ 的函数: Page 551
-
\(δ\) 的性质:
- (i) \(δ(-x) = δ(x)\)
- (ii) \(δ(cx) = \frac{1}{|c|} δ(x)\)
- (iii) \(x δ(x - x_0) = x_0 δ(x - x_0)\)
- 更一般地, 有: \(g(x) δ(x - x_0) = g(x_0) δ(x - x_0)\)
- (iv) \(\int_{- \infty}^{+ \infty} dx δ(x - y) δ(x - z) = δ(y - z)\)
δ 函数和傅里叶变换
Page 555
三维空间中的 δ 函数
-
\[\int d^3 r δ(\mathbf{r} - \mathbf{r}_0) f(\mathbf{r}) =
f(\mathbf{r}_0)\]
- 我们可将 \(δ(\mathbf{r} - \mathbf{r}_0)\) 分解为三个一维函数的乘积:
- \[δ(\mathbf{r} - \mathbf{r}_0) = δ(x - x_0) δ(y - y_0) δ(z - z_0)\]
- 或利用极坐标将它写作:
- \[\begin{align} δ(\mathbf{r} - \mathbf{r}_0) & = \frac{1}{r^2 \sin θ} δ(r - r_0) δ(θ - θ_0) δ(φ - φ_0) \\ & = \frac{1}{r^2} δ(r - r_0) δ(\cos θ - \cos θ_0) δ(φ - φ_0) \end{align}\]
- 前面列举的
\(δ(x)\)
的性质很容易推广到
\(δ(\mathbf{r})\).
此外, 我们再提出一个重要的关系式:
- \[Δ (\frac{1}{r}) = - 4 \pi δ(\mathbf{r})\]
- 其中 \(Δ\) 是拉普拉斯算符.
本书
拉普拉斯算符
的符号貌似非主流~
Page 559, 560
经典力学中的拉格朗日函数和哈密顿函数
添加这一章作为附录, 作者也是用心~
质点组; 惯性系
- 如果我们涉及的体系含有
n
个质点, 那么, 可将基本定律应用于它们当中的每一个:- \[m_i \ddot{\mathbf{r}}_i = \mathbf{F}_i\]
- \[i = 1, 2, ..., n\]
作用于这些粒子的力可以分为两类:
内力, 它们表示体系内诸粒子间的相互作用;
外力, 它们来源于体系的外部.
我们假定内力服从作用与反作用相等的原理, 也就是说,
粒子 (i) 施于粒子 (j) 的力和粒子 (j) 施于粒子 (i) 的力大小相等, 方向相反.
这个原理已为引力 (牛顿定律) 和静电力所证实,
但没有为磁力所证实 (这种力具有相对论性的起因).
磁力: 相对论性
- 如果所有的力都导自一个势, 则上述运动方程组便可写作:
- \[m_i \ddot{\mathbf{r}}_i = - \nabla_{i} V\]
- 其中 \(▽_i\) 表示对于坐标 \(\mathbf{r}_i\) 的梯度, 势能 \(V\) 具有下列形式:
- \[V = \sum_{i = 1}^{n} V_i (\mathbf{r}_i) + \sum_{i < j} V_{ij} (\mathbf{r}_i - \mathbf{r}_j)\]
- (式中第一项来自外力, 第二项来自内力).
- 在直角坐标系中, 体系的运动是由
\(3n\)
个微分方程来描述的:
- \[m_i \ddot{x}_i = - \frac{\partial V}{\partial x_i}\]
- \[m_i \ddot{y}_i = - \frac{\partial V}{\partial y_i}\]
- \[m_i \ddot{z}_i = - \frac{\partial V}{\partial z_i}\]
- \[i = 1, 2, ..., n\]
注: 字母头上一个点表示一阶导数, 两个点表示二阶导数~
1. 体系的质心像一个质点那样运动, 该质点的质量等于体系的总质量,
它所受的力等于作用于体系的所有力的合力;
2. 对一个固定点所取的角动量对时间的导数等于对该点的力矩;
3. 在两个时刻 t1 和 t2 之间动能的变化等于所有的力在此两时刻之间的运动中所作的功.
如果内力服从作用与反作用相等的原理, 而且它们的方向沿着相互作用的粒子间的连接线,
那么, 它们对合力的贡献和对相对于原点的矩的贡献都等于零.
再进一步, 若所考察的体系是孤立的 (即它不受任何外力的作用),
则总角动量为一常量, 于是质心作匀速直线运动, 这就意味着总动量也是一个运动常量.
拉格朗日函数和拉格朗日方程
- 很多物理体系 (例如含有一个或多个固体的体系) 在某一给定的时刻可以由
\(N\)
个独立参数
\(q_i\)
\((i = 1, 2, ..., N)\)
的集合来描述, 这些参数叫做
广义坐标
, 知道了 \(q_i\) 就可以算出体系中任意点在空间的位置; 从而体系的运动便由 \(N\) 个时间函数 \(q_i (t)\) 来描述. 对时间的导数 \(\dot{q}_i (t)\) 叫做广义速度
.- 在某一给定时刻 \(t_0\), 体系的态便决定于全体 \(q_i (t_0)\) 和 \(\dot{q}_i (t_0)\).
- 若作用于体系的力导自一个势能 \(V (q_1, q_2, ..., q_N)\), 则拉格朗日函数 \(\mathcal{L} (q_1, q_2, ..., q_N; \dot{q}_1, \dot{q}_2, ..., \dot{q}_N)\) 仍然等于总动能 \(T\) 和势能 \(V\) 之差.
- 可以证明, 不论选用什么坐标 \(q_i\), 运动方程都可以写作:
- \[\frac{d}{dt} \frac{\partial \mathcal{L}}{\partial \dot{q}_i} - \frac{\partial \mathcal{L}}{\partial q_i} = 0\]
- 其中
\(\frac{d}{dt}\)
表示时间的
全导数
: - \[\frac{d}{dt} = \frac{\partial}{\partial t} + \sum_{i = 1}^{N} \dot{q}_i \frac{\partial}{\partial q_i} + \sum_{i = 1}^{N} \ddot{q}_i \frac{\partial}{\partial \dot{q}_i}\]
全导数
可以参见: 陶哲轩实分析, 多元微分学
- 其实, 为了定义一个拉格朗日函数并运用拉格朗日方程组, 不一定要假设力导自势能.
在普遍情况下, 拉格朗日函数是坐标
\(q_i\)
和速度
\(\dot{q}_i\)
的函数, 可能还明显地依赖于时间, 于是可将它写作:
- \[\mathcal{L} (q_i, \dot{q}_i; t)\]
哈密顿函数和正则方程
- 坐标的共轭动量 我们将广义坐标
\(q_i\)
的共轭动量
\(p_i\)
定义为:
- \[p_i = \frac{\partial \mathcal{L}}{\partial \dot{q}_i}\]
- \(p_i\)
又叫做
广义动量
. - 在粒子体系所受的力导自一个势能的情况下, 位置变量 \(\mathbf{r}_i (x_i, y_i, z_i)\) 的共轭动量其实就是机械动量:
- \[\mathbf{p}_i = m_i \dot{\mathbf{r}}_i\]
- 但是, 后面我们将会看到, 存在着磁场时, 情况并不如此.
留意
共轭
一词在不同上下文的出现~
- 今后, 我们不再用
\(N\)
个坐标
\(q_i (t)\)
和
\(N\)
个速度
\(\dot{q}_i (t)\),
而用
\(2N\)
个变量:
- \(\{ q_i (t), p_i (t); i = 1, 2, ..., N \}\) 来描述体系在给定时刻 \(t\) 的态.
- 这等于假设根据 \(2N\) 个参变量 \(q_i (t)\) 和 \(p_i (t)\) 我们就可以唯一地确定各 \(\dot{q}_i (t)\).
- 注意, 哈密顿量总是等于体系的
总能量
.- 正则方程组:
- \[\begin{align} \frac{d \mathbf{r}_i}{dt} & = \frac{\mathbf{p}_i}{m_i} \\ \frac{d \mathbf{p}_i}{dt} & = - ▽_i V \\ \end{align}\]
- 等价于牛顿方程组.
Page 568 ~ 572 的应用举例 (尤其第二个) 不错~
最小作用量原理
此一节, 个人觉得比
费曼物理学讲义
同名章节讲得好~ 本书的风格属于守正
, 我不敢说费曼物理学讲义
是出奇
. 但是费曼物理学讲义
的部分章节, 更适合掌握了相关知识之后再去思考启迪~
- 在一般情况下, 假设所研究的物质体系由
\(N\)
个广义坐标
\(q_i\)
来描述 (若体系含有
\(n\)
个粒子, 它们在三维空间中运动, 则
\(N = 3n\)).
比较方便的办法是将这些
\(q_i\)
解释为
\(N\)
维欧几里得空间
\(R_N\)
中的一个点
\(Q\)
的坐标; 这样, 在体系的各位置和
\(R_N\)
的各点之间便存在着一一对应的关系.
- 与体系的每一个运动都联系着 \(R_N\) 中的点 \(Q\) 的一个运动; 后一种运动可以用 \(N\) 维空间中的一个矢量函数 \(Q(t)\) 来描述, 它的分量就是诸 \(q_i (t)\).
- 和一维运动中的单个粒子的简单情况相似, 我们可以用
\(Q(t)\)
的图形来表示
\(Q\)
点的, 亦即体系的运动, 这种图形就是
\((N + 1)\)
维的
空-时
中的一条曲线 (时间轴已添加到 \(R_N\) 的 \(N\) 维上). - 这条曲线就可以用来描述我们所研究的运动的特征.
最小作用量原理
可以陈述如下: 在连接 \((Q_1, t_1)\) 和 \((Q_2, t_2)\) 的所有空-时
途径中, 实际上得以遵循的 (即描述体系的实际运动的) 是其作用量最小的一条途径.- 换句话说, 从实际上得以遵循的途径过渡到无限邻近的另一途径, 作用量没有第一级的变化.
- 我们还可注意这和其他一些变分原理, 诸如光学中的
费马原理
的相似性.
变分
结: 2024 年 7 月