我们的教学经验证明, 开始时就将这些假设集中起来讲要比分成几个阶段介绍好.
同样, 我们还认为, 最好一开始就用态空间和狄拉克符号.
如果起先只用波函数来建立波动力学, 然后再讲左矢 (即刁) 和右矢 (即刃) 的普遍理论,
那就难免会有重复; 特别是, 符号改变得晚了, 容易使学生迷惑不解,
使他们觉得好像刚刚学过但还未掌握的那些概念, 又成问题了.
由于这种实质上是演绎的观点, 我们没有按历史顺序来引入量子概念,
也就是说, 没有介绍和讨论迫使人们重新审度经典概念的那些实验事实.
于是我们放弃了归纳的方法.
然而, 物理学是一门要经受实验事实检验并在检验中不断发展的科学,
要得到这样一门科学的可靠图像, 归纳法还是必要的;
不过我们认为这种方法更适合于原子物理学或较低程度的量子物理学导论.
此外, 我们有意识地撇开了关于量子力学的哲学意义和其他解释的讨论.
虽然这类讨论是很有意义的, 但它似乎是另一种水平上的工作了;
事实上, 我们感到, 要能有效地讨论这些问题, 必须事先掌握 "正统的" 量子理论.
这套理论, 由于它在物理学和化学的各个领域中所取得的巨大成就, 已为人们所接受.
波和粒子; 量子力学的基本概念
电磁波与光子
每当我们对一个微观体系进行一次测量时, 我们便从根本上干扰了它.
这是一种新的性质, 因为在宏观领域中我们从来都认为,
人们总可以设想出这样的测量仪器, 它们对体系的干扰实际上要多小就有多小.
对经典物理的这种批判性的修正是由实验决定的, 当然也要由实验来引导.
测量 (系统状态) 必定破坏 (系统状态)
- 经过反复探索, 人们形成了波粒二象性的概念, 我们可以将它概述如下:
- (i) 光的粒子性方面和波动性方面是不可分割的, 光同时表现为波和粒子流, 波可以用来计算粒子出现的概率.
- (ii) 对光子行为的预言只能是概率性的.
- (iii) 波 \(E(\mathbf{r}, t)\) 提供一个光子在 \(t\) 时刻的信息, 它是麦克斯韦方程组的解; 我们说这个波表征光子在 \(t\) 时刻的状态. 我们将 \(E(\mathbf{r}, t)\) 解释为一个光子在 \(t\) 时刻出现于 \(\mathbf{r}\) 点的概率幅. 这就意味着相应的概率正比于 \(\mid E(\mathbf{r}, t) \mid ^{2}\).
两个基础实验~
- 因为麦克斯韦方程组是线性的和齐次的, 故可对它应用
叠加原理
: 若 \(E_1\) 和 \(E_2\) 是方程组的两个解, 则 \(E = λ_1 E_1 + λ_2 E_2\) (此处 \(λ_1\) 和 \(λ_2\) 为常数) 也是它的解. 正是这个叠加原理在经典光学中解释了波动型的现象 (干涉, 衍射).- 在量子物理中, 既然也有波动型的现象, 那么将 \(E(\mathbf{r}, t)\) 作为概率幅来解释, 便是必要的了.
叠加原理的基础性~
- 为了能够在后面建立
\(E(\mathbf{r}, t)\)
和描述粒子的量子态的波函数
\(ψ(\mathbf{r}, t)\)
之间的类比, 我们在这里提到了”光子的态”. 这种”光学类比”是颇有成效的.
- 特别是, 它可以使我们不经计算就较易定性地理解物质粒子的一些量子特性. 然而又不能将这种类比推广得太远, 而且不应使人们认为 \(E(\mathbf{r}, t)\) 表征光子的量子态这种看法是严格正确的.
因而本征结果与本征态之间的对应是这样的:
如果测量以前粒子处于本征态之一, 那么这次测量的结果便是确定的,
它只能是与这个本征态对应的本征结果.
如果测量前的状态是任意的, 那么我们只能预言测得各种本征结果的概率.
为了求得这些概率, 我们将粒子的态分解为各本征态的线性组合.
- 在这里, 对于任意的
\(\mathbf{e}_{p}\),
我们写出:
\(\mathbf{e}_{p} =
\mathbf{e}_{x} \cos \theta +
\mathbf{e}_{y} \sin \theta\)
- 于是, 得到某一本征结果的概率正比于该本征态的系数的模的平方 (所有这些概率的总和为 \(1\), 用此条件即可确定比例常数).
- 偏振片
谱分解原理: 必须注意,
分解的方式依赖于我们所考虑的测量仪器的类型,
这是因为我们必须使用与它相应的各种本征态.
在这里, 粒子的态发生了突变.
测量从根本上干扰了微观体系 (这里是指光子).
物质粒子与物质波
德布罗意关系
-
一种特定的原子只能发射或吸收具有某些确定频率 (或者能量) 的光子. 如果我们承认原子的能量是量子化的, 就是说承认原子的能量只能取某些离散的值 \(E_{i} (i = 1, 2, ..., n, ...)\), 则这个事实便很容易解释如下:
- 伴随着一个光子的发射或吸收, 原子的能量便从一个允许值 \(E_i\) 突变到另一个允许值 \(E_j\);
- 于是由能量守恒便可推知光子应具有这样的频率 \(ν_{ij}\): \(h ν_{ij} = \mid E_i - E_j \mid\)
- 故只有满足上式的那些频率才能被原子所发射或吸收.
1923 年, 德布罗意提出了下述假说:
完全和光子一样, 物质微粒也具有波动性的一面.
电子衍射实验 (1927 年) 表明, 利用物质微粒, 例如电子,
也可以得到干涉图, 这就出色地证实了物质的波动性的存在.
- 于是, 一个能量为
\(E\),
动量为
\(\mathbf{p}\)
的物质粒子,
可以同一个波相联系, 这种波的角频率
\(ω = 2πν\)
及波矢
\(\mathbf{k}\)
由适用于光子的同样关系式给出:
- \[\begin{cases} E = hν = \hbar ω \\ \mathbf{p} = \hbar \mathbf{k} \end{cases}\]
- 换言之, 对应的波长是: \(\lambda = \frac{2π}{\mid \mathbf{k} \mid} = \frac{h}{\mid \mathbf{p} \mid}\) (德布罗意关系式)
波函数; 薛定谔方程
- 按照德布罗意的假说, 我们将把关于光子的那些概念推广到所有的物质粒子.
- (i) 必须用与时间
\(t\)
有关的
态
的概念代替经典的轨道概念. - (ii) 我们将
\(\psi (\mathbf{r}, t)\)
解释为粒子出现的
概率幅
. - (iii) 谱分解原理适用于任意物理量 \(\mathcal{A}\) 的测量.
- (iv) 还要写出 \(\psi (\mathbf{r}, t)\) 的演变所遵循的方程.
- (i) 必须用与时间
\(t\)
有关的
利用普朗克和德布罗意关系式, 可以很自然地引入这个方程.
但是我们不可能证明这个基本方程, 即所谓薛定谔方程;
我们只是把它提出来, 然后讨论它的一些推论
(正是这些推论的实验证明肯定了它的正确性).
此外, 到了第三章 (量子力学的假定),
我们还要回过头来更详细地探讨这个方程.
薛定谔方程: 对于 \(\psi (\mathbf{r}, t)\) 是线性的, 齐次的; 对于时间 \(t\) 是一阶的.
波函数 \(\psi (\mathbf{r}, t)\) 必须是平方可积的. (可归一性)
同时, 薛定谔方程确保了归一化系数与时间无关.
- 要注意经典态与量子态这两种概念之间的重大区别. 一个粒子在时刻
\(t\)
的经典态是由描述粒子在时刻
\(t\)
的位置和速度的六个参量
\(x\),
\(y\),
\(z\);
\(v_x\),
\(v_y\),
\(v_z\)
确定的;
- 一个粒子的量子态则是由
无穷多个
参数所确定的, 这些参数就是与该粒子相联系的波函数 \(\psi (\mathbf{r}, t)\) 在空间各点的数值.
- 一个粒子的量子态则是由
轨道这个经典概念, 亦即经典粒子在相继各时刻的那些态,
应该代之以和粒子相联系的波的传播的概念.
例如, 再回想前面描述的用光子进行的杨氏双狭缝实验,
这种实验从原则上说对于物质微粒 (如电子) 也是可行的.
在观察干涉图时, 如果还要知道每个粒子通过的是哪条狭缝,
这是没有意义的, 因为与粒子相联系的波同时通过了两条狭缝.
或者说: 粒子只有同时经过两个狭缝才能得到干涉的结果. 粒子的双缝干涉不是来源于粒子之间的干涉, 而是各个粒子与其自身的干涉.
必须指出, 光子在实验中可能被发射或被吸收, 物质微粒则不一样,
它们既不能被产生也不能被消灭: 被加热的灯丝发射出电子,
这些电子是原来就存在于灯丝中的; 同样, 被计数器吸收的电子并未消失,
它又回到了某个原子中或参与形成电流.
实际上, 相对论告诉我们, 物质粒子的产生和湮没是可能的.
例如, 一个能量充分大的光子穿过原子近旁时, 可以实物化而成为电子-正电子对;
反过来, 正电子碰撞电子时便和电子一起湮没而产生光子.
但是, 在这一章开头我们就声明过, 本书的范围只限于非相对论量子力学,
并且事实上我们已经按不对称的方式处理了时间和空间坐标.
在非相对论量子力学的范畴内, 物质微粒既不会产生也不会湮没.
我们将会看到, 这个守恒定律占有头等重要的地位;
而放弃这个定律的必要性正是人们在建立相对论量子力学时遇到的重大困难之一.
本书的范围只限于非相对论量子力学!
对一个粒子的量子描述; 波包
若一个粒子在空间各点的势能都为零 (或为常值),
则这个粒子未受力的作用, 我们说它是自由的.
附录 I (傅立叶级数和傅立叶变换) 在卷二.
海森伯不确定度关系
附录 II (狄拉克的 δ 函数) 也在卷二.
- 帕塞瓦尔定理
- 我们的出发点, 即不等式
\(Δx ⋅ Δp ≥ \hbar\),
就其本身而言, 并没有什么典型的量子意义.
它只不过表示傅里叶变换的一个普遍性质:
- 在经典物理学中已有这个性质的很多应用, 例如大家都知道, 在无线电理论中, 不存在人们能够以无限的精确度同时确定其位置和波长的电磁波波列;
- 真正有量子意义的只是: 将波和物质粒子联系起来, 并规定波长和动量要满足德布罗意关系式.
由于不确定度关系的限制, 波函数的空间展延度越小, 电子的动能就越大;
而原子的基态则是动能与势能折中的结果. 我们还要强调一个事实:
以不确定度关系为基础的这种折中与我们在经典力学中所指望的那种折中是完全不相同的.
自由波包随时间的演变
- 色散
- 对于在真空中传播的电磁波,
\(V_φ\)
与
\(k\)
无关并且等于光速
\(c\).
构成波包的所有的波都以同样的速度传播, 结果, 整个波包也以速度
\(c\)
传播而保持其形状不变. 与此相反,
在色散介质中情况就不一样, 这时相速度由下式给出:
- \[V_φ (k) = \frac{c}{n(k)}\]
- \(n(k)\) 是介质的折射率, 它随波长而变.
- 实际上, 如果涉及的是一个宏观粒子
(关于尘埃的例子, 说明一个宏观粒子可能小到什么程度),
则确定其位置和动量的精确度, 并不受不确定度关系的明显影响.
这就意味着, 为了对这样的粒子进行量子描述, 我们能够作出其特征宽度
\(Δx\)
和
\(Δp\)
都可忽略的波包; 于是便可以使用粒子的位置
\(x_M (t)\)
和动量
\(p_0\)
这样的经典术语.
- 但是, 这样一来, 它的速度就应该是 \(v = \frac{p_0}{m}\). 这正好是在量子描述中得到的公式所表示的意义:
- 当 \(Δx\) 和 \(Δp\) 都可以忽略时, 波包的极大值便像遵循经典力学规律的一个粒子那样运动.
- 若宽度 \(Δp\) 是一个运动常量, 则 \(Δx\) 将随时间而变, 若时间充分长, 它将无限增大 (波包的扩展).
在与时间无关的标量势场中的粒子
如果光波的波长相对于问题中涉及的长度而言可以忽略,
则不考虑光的波动性的几何光学便是一种很好的近似.
所以经典力学相对于量子力学的地位就相当于几何光学相对于波动光学的地位.
刚才的说明告诉我们, 如果在比波长短的路程上, 势的变化是显著的,
那么, 就应该出现典型的量子效应 (即起因于波动性的量子效应),
这时波长已是不可忽略的了. 正因为如此,
所以我们要研究处于各种 "方形势" 中的量子性粒子的行为.
所谓方形势, 就是其变化呈 "阶梯" 状的势.
既然这种势是不连续的, 那么, 不论波长多么短,
它在与波长同数量级的区间上一定有显著的变化,
因此, 量子效应总是会表现出来的.
变量的分离. 定态
- 形如
\(ψ (\mathbf{r}, t) = φ (\mathbf{r}) e^{-iωt}\)
的波函数叫做薛定谔方程的定态解, 由此函数得到的概率密度
\(\mid ψ (\mathbf{r}, t) \mid^2 = \mid φ (\mathbf{r}) \mid^2\)
与时间无关.
- 定态波函数只含一个角频率
\(ω\),
故根据
普朗克-爱因斯坦
关系式, 定态就是对应的能量为确定值 \(E = \hbar ω\) 的态 (即能量的本征态).
- 定态波函数只含一个角频率
\(ω\),
故根据
在经典力学中, 若势能与时间无关, 总能量就是一个运动常量;
在量子力学中则存在着能量完全确定的态.
- 作用于粒子上的力是
\(F(x) = - \frac{dV(x)}{dx}\);
它是从势
\(V(x)\)
得到的. 我们看到, 在势并无变化的所有区域内,
粒子不受任何力的作用, 因而它的速度是恒定的.
- 只在陡坡附近才有力作用于粒子, 并按情况的不同使它加速或减速.
于是, 我们可以将波动光学中熟知的结果转借到这里要研究的问题.
然而必须充分理解这仅仅是一种类比,
我们对波函数的解释与经典波动光学对电磁波的解释本质上是不同的.
一维方形势的光学类比~
在这种情况下我们知道, 对入射波的某些频率, 波将完全透射;
从量子的观点来看, 这就是说, 粒子被反射的概率一般不为零,
但是存在着一些能值, 叫做谐振能, 对于取这些能值的粒子,
透射概率为 1, 因而反射概率为 0.
定性地基本概念描述, 结束~
- 这一章只讨论了由一个粒子构成的物理体系. 在经典力学中,
对这些体系在某一时刻的态的描述是以六个参量的数据为基础的,
这些参量就是粒子的位置
\(\mathbf{r} (t)\)
和速度
\(\mathbf{v} (t)\)
的分量; 给出
\(\mathbf{r} (t)\)
和
\(\mathbf{v} (t)\),
所有的力学变量 (如能量, 动量, 角动量等) 就都决定了.
- 根据牛顿定律, 函数 \(\mathbf{r} (t)\) 可以从以时间为自变量的二阶微分方程解出, 从而, 知道了 \(\mathbf{r} (t)\) 和 \(\mathbf{v} (t)\) 在初始时刻的值, 便可以确定它们在任意时刻 \(t\) 的值.
- 量子力学对现象的描述更加复杂:
一个粒子在指定时刻的动力学状态由波函数来表述.
它不再只依赖于六个参量, 而是依赖于无限多个参量
(\(ψ(\mathbf{r}, t)\)
在空间所有各点
\(\mathbf{r}\)
处的数值).
- 此外, 对测量结果的预言只能是概率性的 (即只能给出测量一个力学变量时得到某一预期结果的概率).
- 波函数是薛定谔方程的解, 知道了 \(ψ(\mathbf{r}, 0)\), 就可用这个方程来计算 \(ψ(\mathbf{r}, t)\); 这个方程蕴含着导致波动型效应的叠加原理.
说得更广泛一些, 直到现在,
还没有任何观测结果是与量子力学的基本原理相抵触的.
可是, 关于既是相对论性又是量子性的现象,
目前还没有一套总的理论, 既然如此, 再来一次震动也是可能的.
希望 2025 可以开始阅读温伯格的量子场论~
量子力学的数学工具
我们打算最大限度地简化有关的论述,
凡是只有数学家才能满意的那些普遍定义和严格证明, 这里一概从略.
例如, 遇到无限多维空间时, 我们将把它当作有限多维空间来分析;
此外, 我们将按照物理学所约定的意义来使用术语 (如平方可积函数, 基, ...),
而这种意义与纯数学所赋予它们的并不完全一致.
表象
: 还是译为表示
更好;观察
: 还是译为观测
更好.
一个粒子的波函数空间
- 从物理的观点看来,
\(L^2\)
这个集合实在是太广泛了. 既然已经给定了
\(\mid ψ (\mathbf{r}, t) \mid^2\)
的意义, 那么, 实际上使用的那些波函数就应该具备一些正规的性质.
- 我们可以只考虑这样一类函数 \(ψ (\mathbf{r}, t)\), 它们是处处确定的, 处处连续的, 而且是任意多次可微分的 (譬如, 某函数在空间某点确实不连续, 这种说法就没有任何物理意义; 因为任何实验也不可能使我们知道在很小的尺度上的实际现象究竟如何).
- 我们还可以只考虑有界区域中的波函数 (我们确信粒子处在空间的有限范围内, 譬如实验室内).
- 在这里, 我们不打算就普遍情况来精确地陈述这些补充条件; 我们将称由 \(L^2\) 中的充分正规函数构成的波函数集合为 \(\mathcal{F}\) (\(\mathcal{F}\) 是 \(L^2\) 的子空间).
物理意义
波函数空间的结构
- \(\mathcal{F}\)
是一个矢量空间. 对于
\(\mathcal{F}\)
中的任意一对顺序为
\(φ(\mathbf{r})\)
及
\(ψ(\mathbf{r})\)
的函数, 我们引入一个相关的复数, 记作
\((φ, ψ)\),
它的定义是:
- \[(φ, ψ) = \int d^3 r φ^{*}(\mathbf{r}) ψ(\mathbf{r})\]
- \((φ, ψ)\)
叫做
\(φ(\mathbf{r})\)
与
\(ψ(\mathbf{r})\)
的
标量积
(只要 \(φ\) 和 \(ψ\) 属于 \(\mathcal{F}\), 这个积分总是收敛的).
- 我们说一对函数的标量积与其第二个因子的关系是
线性
的, 与其第一个因子的关系是反线性
的.- 如果
\((φ, ψ) = 0\),
我们就说
\(φ(\mathbf{r})\)
和
\(ψ(\mathbf{r})\)
是
正交
的.
- 如果
\((φ, ψ) = 0\),
我们就说
\(φ(\mathbf{r})\)
和
\(ψ(\mathbf{r})\)
是
- 施瓦茨不等式
- 按定义, 线性算符
\(A\)
是一种数学实体, 它使每一个函数
\(ψ(\mathbf{r}) \in \mathcal{F}\)
都有与之对应的另一个函数
\(ψ'(\mathbf{r}) \in \mathcal{F}\),
而且它们的对应关系是线性的:
- \[ψ'(\mathbf{r}) = A ψ(\mathbf{r})\]
- \[A [λ_1 ψ_1 (\mathbf{r}) + λ_2 ψ_2 (\mathbf{r})] = λ_1 A ψ_1 (\mathbf{r}) + λ_2 A ψ_2 (\mathbf{r})\]
- 两个线性算符
\(A\)
和
\(B\)
的乘积
\(AB\)
由下式定义:
\((AB) ψ(\mathbf{r}) = A [B ψ(\mathbf{r})]\)
- 即先将 \(B\) 作用于 \(ψ(\mathbf{r})\), 得到 \(φ(\mathbf{r}) = B ψ(\mathbf{r})\), 再将 \(A\) 作用于所得的函数 \(φ(\mathbf{r})\).
- 一般说来,
\(AB ≠ BA\),
我们定义:
\([A, B] = AB - BA\)
- 并把算符
\([A, B]\)
称为
\(A\)
与
\(B\)
的
对易子
.
- 并把算符
\([A, B]\)
称为
\(A\)
与
\(B\)
的
波函数空间的离散的正交归一基
- 设有
\(\mathcal{F}\)
空间中的一个可列的函数集合; 这集合中的函数可用离散的指标
\(i (i = 1, 2, ..., n, ...)\)
来标记:
\(u_1 (\mathbf{r}) \in \mathcal{F}\),
\(u_2 (\mathbf{r}) \in \mathcal{F}\),
…,
\(u_i (\mathbf{r}) \in \mathcal{F}\),
…
- 如果
\((u_i, u_j) =
\int d^{3} r u_i^{*} (\mathbf{r}) u_j (\mathbf{r}) =
δ_{ij}\),
则集合
\(\{ u_i (\mathbf{r}) \}\)
是
正交归一
的. - (式中 \(δ_{ij}\) 是克罗内克符号, 当 \(i = j\) 时, 其值为 \(1\); 当 \(i ≠ j\) 时, 其值为 \(0\))
- 如果
\((u_i, u_j) =
\int d^{3} r u_i^{*} (\mathbf{r}) u_j (\mathbf{r}) =
δ_{ij}\),
则集合
\(\{ u_i (\mathbf{r}) \}\)
是
- 如果每一个函数
\(ψ (\mathbf{r}) \in \mathcal{F}\)
都可以唯一地按全体
\(u_i (\mathbf{r})\)
展开:
\(ψ (\mathbf{r}) = \sum_{i} c_i u_i (\mathbf{r})\)
- 则这个集合
\(\{ u_i (\mathbf{r}) \}\)
构成一个
基
.
- 则这个集合
\(\{ u_i (\mathbf{r}) \}\)
构成一个
封闭性关系式
: 对比后文连续的情况
连续的正交归一基
注: 此处改了原书的章节名
- 同样, 我们也可以引入
\(\mathbf{r}\)
的函数的一个集合
\(\{ ξ_{\mathbf{r}_0} (\mathbf{r}) \}\),
其中的函数是以连续指标
\(\mathbf{r}_0\)
(\(x_0\),
\(y_0\),
\(z_0\)
的缩并记号) 为标记的, 它们的定义是:
\(ξ_{\mathbf{r}_0} (\mathbf{r}) = δ(\mathbf{r} - \mathbf{r}_0)\)
- 因此, \(\{ ξ_{\mathbf{r}_0} (\mathbf{r}) \}\) 表示以空间的不同点 \(\mathbf{r}_0\) 为中心的 \(δ\) 函数的集合; \(ξ_{\mathbf{r}_0} (\mathbf{r})\) 显然不是平方可积的, 即 \(ξ_{\mathbf{r}_0} (\mathbf{r}) \notin \mathcal{F}\).
- 现在来考虑对于空间
\(\mathcal{F}\)
中的一切函数
\(ψ(\mathbf{r})\)
都能成立的下列等式:
- \[ψ(\mathbf{r}) = \int d^3 r_0 ψ(\mathbf{r}_0) δ(\mathbf{r} - \mathbf{r}_0)\]
- \[ψ(\mathbf{r}_0) = \int d^3 r δ(\mathbf{r}_0 - \mathbf{r}) ψ(\mathbf{r})\]
- 根据 \(ξ_{\mathbf{r}_0} (\mathbf{r}) = δ(\mathbf{r} - \mathbf{r}_0)\), 可将此两式改写为下列形式:
- \[ψ(\mathbf{r}) = \int d^3 r_0 ψ(\mathbf{r}_0) ξ_{\mathbf{r}_0} (\mathbf{r})\]
- \[ψ(\mathbf{r}_0) = (ξ_{\mathbf{r}_0}, ψ) = \int d^3 r ξ^{*}_{\mathbf{r}_0} (\mathbf{r}) ψ(\mathbf{r})\]
- 因而, \(ψ(\mathbf{r}_0)\) 的意义和 \(c_i\) 的相同, 是 \(c_i\) 的相当量; 这两个复数, 一个依赖于 \(\mathbf{r}_0\), 一个依赖于 \(i\), 表示同一个函数 \(ψ(\mathbf{r})\) 在 \(\{ ξ_{\mathbf{r}_0} (\mathbf{r}) \}\) 及 \(\{ u_i (\mathbf{r}) \}\) 这两个不同的基中的坐标 (分量).
上面的符号 \(\mathbf{r}_0\) 容易误导~
- 引入的连续基的用途在后面将会显得更清楚. 但是, 绝不能忘记这一点:
和某一物理状态对应的总是一个平方可积的波函数. 在任何情况下,
\(v_{\mathbf{p}}(\mathbf{r})\)
或
\(ξ_{\mathbf{r}_0}(\mathbf{r})\)
都不能表示粒子的态.
- 这些函数仅仅是在对波函数 \(ψ(\mathbf{r})\) 进行运算时, 很方便的一些工具, 而波函数才是描述物理状态的函数.
在经典光学中我们也遇到过类似的情况, 在那里,
单色平面波是一种极为方便的模型, 但在物理上它是永远不能实现的;
即使选择性最好的滤光片所滤过的也是某一频带 Δν 中的光,
这个频带可能很窄, 但绝不为零.
- 对于函数
\(ξ_{\mathbf{r}_0}(\mathbf{r})\)
来说, 也是一样. 我们可以设想一个平方可积的波函数, 它定域在点
\(\mathbf{r}_0\)
附近, 例如
\(ξ_{\mathbf{r}_0}^{(ε)} (\mathbf{r}) =
δ^{(ε)} (\mathbf{r} - \mathbf{r}_0) =
δ^{(ε)} (x - x_0) δ^{(ε)} (y - y_0) δ^{(ε)} (z - z_0)\),
其中
\(δ^{(ε)}\)
是这样一种函数:
- 它的中心在点 \(x_0\) (或 \(y_0\), 或 \(z_0\)) 处, 它具有宽度为 \(ε\), 高度为 \(\frac{1}{ε}\) 的峰, 并保持 \(\int_{- \infty}^{+ \infty} δ^{(ε)} (x - x_0) dx = 1\) (这种函数的例子见附录 II: 狄拉克的 \(δ\) 函数).
- 当 \(ε \rightarrow 0\) 时, \(ξ_{\mathbf{r}_0}^{(ε)} (\mathbf{r}) \rightarrow ξ_{\mathbf{r}_0} (\mathbf{r})\), 但后者不再是平方可积的了.
- 实际上, 对应于这种极限情况的物理状态是不可能实现的; 不管粒子处于位置多么确切的物理状态, \(ε\) 也绝不等于零.
- 将前面两节的结果加以推广, 我们称
\(\mathbf{r}\)
的函数的一个集合
\(\{ w_α (\mathbf{r}) \}\)
为连续的”正交归一”基, 它以连续指标
\(α\)
为标记, 并满足下列的所谓
正交归一
和封闭性
关系式- \[(w_α, w_{α'}) = \int d^3 r w_α^{*} (\mathbf{r}) w_{α'} (\mathbf{r}) = δ (α - α')\]
- \[\int dα w_α (\mathbf{r}) w_α^{*} (\mathbf{r}') = δ (\mathbf{r} - \mathbf{r}')\]
对比后续引入狄拉克符号后的形式.
- 每一个波函数 \(ψ(\mathbf{r})\) 都可唯一地按诸函数 \(w_α (\mathbf{r})\) 展开, \(ψ(\mathbf{r})\) 在 \(w_α (\mathbf{r})\) 上的分量 \(c(α)\) 等于标量积 \((w_α, ψ)\).
态空间; 狄拉克符号
- 波函数在空间某点 \(\mathbf{r}_0\) 处的值 \(ψ(\mathbf{r}_0)\) 可以看作这个波函数在一个特殊的基 (\(δ\) 函数基) 中的特定函数 \(ξ_{\mathbf{r}_0} (\mathbf{r})\) 上的分量.
至此, 才正式介绍狄拉克符号, 前面的铺垫还是很用心的~
- 粒子的每个量子态将用一个态矢量来描述, 这种矢量属于一种抽象空间 \(\mathcal{E}_{\mathbf{r}}\), 我们称它为粒子的态空间. 由 \(\mathcal{F}\) 空间是 \(L^2\) 的子空间可以推知 \(\mathcal{E}_{\mathbf{r}}\) 是希尔伯特空间的子空间.
其实, 态矢量和态空间的引入不但使理论体系得到简化, 还可以使它得以推广.
事实上, 确有一些物理体系是不可能用波函数来进行量子描述的;
我们将会看到, 即使就单个粒子而论, 只要将自旋自由度也考虑在内, 就属于上述情况.
此时, 先忽略自旋
- 特别地, 由于我们已经熟悉了波函数的概念,
我们这样定义一个粒子的态空间
\(\mathcal{E}_r\),
使得每一个平方可积函数
\(ψ(r)\)
都有
\(\mathcal{E}_r\)
中的一个右矢
\(\mid ψ \rangle\)
和它对应:
- \[ψ(r) \in \mathcal{F} \Longleftrightarrow \mid ψ \rangle \in \mathcal{E}_r\]
- 以后, 我们就把在 \(\mathcal{F}\) 空间中定义过的各种运算移植到 \(\mathcal{E}_r\) 空间中来. 虽然 \(\mathcal{F}\) 和 \(\mathcal{E}_r\) 是同构的, 但为避免混淆和可能的推广, 我们还是要细心地区别它们.
- 我们还要强调一点: 符号 \(\mid ψ \rangle\) 不再包含对 \(\mathbf{r}\) 的依赖关系, 只包含一个字母 \(ψ\), 它提醒我们这个右矢和哪一个函数对应; 以后, 我们将把 \(ψ(r)\) 解释为右矢 \(\mid ψ \rangle\) 在某一个基中的分量的集合, \(\mathbf{r}\) 则起着指标的作用.
- 因而, 为了确定一个矢量, 我们的做法是: 先用这个矢量在某一特定坐标系中的分量来表示这个矢量, 然后把这个特定坐标系放在和一切其他坐标系相同的地位上研究.
- 绝不要把线性泛函与线性算符混为一谈. 虽然两者都涉及线性运算,
但是前者给每一个右矢联系上一个复数, 而后者给每一个右矢联系上另一个右矢.
- 可以证明, 定义在右矢
\(\mid ψ \rangle \in \mathcal{E}\)
上的线性泛函的集合构成一个矢量空间, 叫做
\(\mathcal{E}\)
的
对偶
空间, 记作 \(\mathcal{E}^{*}\).
- 可以证明, 定义在右矢
\(\mid ψ \rangle \in \mathcal{E}\)
上的线性泛函的集合构成一个矢量空间, 叫做
\(\mathcal{E}\)
的
- 事实上, 右矢
\(\mid φ \rangle\)
可以决定这样一个线性泛函, 它按线性方式使得每一个右矢
\(\mid ψ \rangle \in \mathcal{E}\)
都有一个对应的复数, 而且这个复数就是
\(\mid φ \rangle\)
和
\(\mid ψ \rangle\)
的标量积
\((\mid φ \rangle, \mid ψ \rangle)\).
假设
\(\langle φ \mid\)
就是这个线性泛函, 那么它应由下式所决定
- \[\langle φ \mid ψ \rangle = (\mid φ \rangle, \mid ψ \rangle)\]
- 关于
\(\mid φ \rangle\)
和
\(\mid ψ \rangle\)
的标量积, 我们现在已有两种不同的符号:
\((\mid φ \rangle, \mid ψ \rangle)\)
或
\(\langle φ \mid ψ \rangle\),
这里的
\(\langle φ \mid\)
是右矢
\(\mid φ \rangle\)
的对应左矢. 今后我们只用一种符号:
\(\langle φ \mid ψ \rangle\),
即狄拉克符号.
- 在之前已经给出的标量积的性质, 可用狄拉克符号重新归纳如下:
- \[\langle φ \mid ψ \rangle = \langle ψ \mid φ \rangle^{*}\]
- \[\langle φ \mid (λ_1 ψ_1 + λ_2 ψ_2) \rangle = λ_1 \langle φ \mid ψ_1 \rangle + λ_2 \langle φ \mid ψ_2 \rangle\]
- \[\langle (λ_1 φ_1 + λ_2 φ_2) \mid ψ \rangle = λ_1^{*} \langle φ_1 \mid ψ \rangle + λ_2^{*} \langle φ_2 \mid ψ \rangle\]
- \(\langle ψ \mid ψ \rangle\) 为正实数, 当而且仅当 \(\mid ψ \rangle = 0\) 时, 其值为零.
- 右矢和左矢之间的对应关系中的这种不对称, 是和
\(\mathcal{F}_x\)
空间中存在着”连续基”有关的. 因为构成”基”的那些函数并不属于
\(\mathcal{F}_x\),
在
\(\mathcal{E}_x\)
中当然不存在与它们对应的右矢. 可是那些函数与
\(\mathcal{F}_x\)
中的任意函数的标量积是确定的, 因此, 它们可以和
\(\mathcal{E}_x\)
中的某个线性泛函相联系, 也就是说, 在
\(\mathcal{E}^{*}_x\)
中存在着对应的左矢.
- 我们之所以要使用这一类”连续基”, 是因为它们在一些实际运算中比较方便. 同样的理由 (这些理由在后面将会显得更清楚) 要求我们在右矢和左矢之间建立一种对称的关系, 办法是引入”广义右矢”, 它们由并不平方可积的函数所确定, 但这些函数与 \(\mathcal{F}_x\) 空间中任一函数的标量积都存在;
- 因此以后我们就具备了诸如 \(\mid ξ_{x_0} \rangle\) 或 \(\mid v_{p_0} \rangle\) 这样的”右矢”, 分别对应于 \(ξ_{x_0} (x)\) 或 \(v_{p_0} (x)\). 但是, 不要忘记, 严格说来, 这些广义的”右矢”不能表示物理状态, 只有 \(\mathcal{E}_x\) 空间中的真正右矢才表示实际存在的量子态; 广义右矢只不过是在包含右矢的某些运算中的一种比较方便的工具而已.
每一个左矢都有对应的右矢吗? 不用在意~
- 一般地说, 态空间
\(\mathcal{E}\)
和它的对偶空间
\(\mathcal{E}^{*}\)
并不是同构的 (当然, 除非
\(\mathcal{E}\)
是有限多维的), 这就是说,
如果对于每一个右矢
\(\mid ψ \rangle \in \mathcal{E}\),
对应着一个左矢
\(\langle ψ \mid \in \mathcal{E}^{*}\),
那么, 相反的对应关系并不存在.
- 但是, 我们约定, 除了使用
\(\mathcal{E}\)
空间的矢量 (它们的模方是有限的) 以外, 还可以使用
广义右矢
, 它们的模方虽是无限的, 但它们与 \(\mathcal{E}\) 空间中任何右矢的标量积却都是有限的. - 这样一来, 对于每一个左矢 \(\langle φ \mid \in \mathcal{E}^{*}\), 就都对应着一个右矢. 但是广义右矢并不表示体系的物理状态.
- 但是, 我们约定, 除了使用
\(\mathcal{E}\)
空间的矢量 (它们的模方是有限的) 以外, 还可以使用
但是广义右矢并不表示体系的物理状态
. 物理学总能用类似的实在性要求跳过数学的严格性要求~
线性算符
- 设
\(\mid φ \rangle\)
与
\(\mid ψ \rangle\)
是两个右矢. 我们称下列的标量积为
\(A\)
在
\(\mid φ \rangle\)
和
\(\mid ψ \rangle\)
之间的
矩阵元
:- \[\langle φ \mid (A \mid ψ \rangle)\]
- 因而, 这是一个数, 它线性地依赖于 \(\mid ψ \rangle\), 反线性地依赖于 \(\mid φ \rangle\).
标量积
为 \(A\) 在 \(\mid φ \rangle\) 和 \(\mid ψ \rangle\) 之间的矩阵元
.
引出
张量积
和投影算符
的步骤很清晰简洁~
- 对任意的
\(\mid ψ \rangle \in \mathcal{E}\),
我们有
\(P_q \mid ψ \rangle = \sum_{i = 1}^{q}
\mid φ_i \rangle \langle φ_i \mid ψ \rangle\)
- 由此可见, 将 \(P_q\) 作用于 \(\mid ψ \rangle\) 上, 得到 \(\mid ψ \rangle\) 在这些 \(\mid φ_i \rangle\) 上的投影的线性组合, 这也就是 \(\mid ψ \rangle\) 在子空间 \(\mathcal{E}_q\) 上的投影.
厄米共轭
从右矢和左矢之间的对应关系来定义算符的
伴随算符
- 在前面我们曾经提到两个容易混淆的记号:
\(\mid λψ \rangle\)
和
\(\langle λψ \mid\),
其中
\(λ\)
是标量. 对于记号
\(\mid Aψ \rangle\)
和
\(\langle Aψ \mid\)
(其中
\(A\)
是线性算符) 也会出现同样的问题.
- \(\mid Aψ \rangle\) 就是右矢 \(A \mid ψ \rangle\) 的另一种记法:
- \[\mid Aψ \rangle = A \mid ψ \rangle\]
- 但
\(\langle Aψ \mid\)
则是对应于右矢
\(\mid Aψ \rangle\)
的左矢.
- 可以看出:
- \[\langle Aψ \mid = \langle ψ \mid A^{\dagger}\]
- 这就是说, 如果要把一个线性算符 \(A\) 从左矢的符号中提出去, 就必须将它放到该左矢符号的右边并且换成它的伴随算符 \(A^{\dagger}\).
因此, 一个右 (左) 矢的厄米共轭是一个左 (右) 矢;
一个算符的厄米共轭是它的伴随算符; 一个数的厄米共轭是它的共轭复数.
采用狄拉克符号, 厄米共轭运算是很容易进行的, 只要应用下面的规则即可.
当一个式子中含有常数, 右矢, 左矢及算符时,
要得到这个式子的厄米共轭式 (或伴随式), 必须:
代换:
将常数换成其共轭复数;
将右矢换成其对应的左矢;
将左矢换成其对应的右矢;
将算符换成其伴随算符.
反序:
即颠倒各因子的顺序 (但常数的位置无关紧要).
- 如果算符
\(A\)
等于它的伴随算符, 即
\(A = A^{\dagger}\)
我们就称它为
厄米算符
. 厄米算符满足下列关系式:- \[\langle ψ \mid A \mid φ \rangle = \langle φ \mid A \mid ψ \rangle^{*}\]
- 此式对任意的 \(\mid φ \rangle\) 和 \(\mid ψ \rangle\) 都成立.
- 最后, 对于厄米算符: \(\langle A φ \mid ψ \rangle = \langle φ \mid A ψ \rangle\)
- 两个厄米算符
\(A\)
和
\(B\)
的
乘积
, 仅当 \([A, B] = 0\) 时, 才是厄米算符.
注: 是
乘积
才是厄米算符.
态空间中的表象
正交归一关系式 & 封闭性关系式
一个正交归一基的特征关系式
- 离散的
- \[\langle u_i \mid u_j \rangle = δ_{ij}\]
- \[P_{ \{ u_i \} } = \sum_{i} \mid u_i \rangle \langle u_i \mid = \mathbb{1}\]
- 连续的
- \[\langle ω_α \mid ω_{α'} \rangle = δ (α - α')\]
- \[P_{ \{ ω_α \} } = \int dα \mid ω_α \rangle \langle ω_α \mid = \mathbb{1}\]
右矢和左矢的表示法
- 可见 \(\langle φ \mid\) 可以唯一地按这些左矢 \(\langle u_i \mid\) 展开; \(\langle φ \mid\) 的诸分量 \(\langle φ \mid u_i \rangle\) 就是与 \(\langle φ \mid\) 相联系的右矢 \(\mid φ \rangle\) 的诸分量 \(b_i = \langle u_i \mid φ \rangle\) 的共轭复数.
左行, 右列
- 在一种指定的表象中, 表示右矢
\(\mid ψ \rangle\)
的矩阵和表示对应的左矢
\(\langle ψ \mid\)
的矩阵互为厄米共轭矩阵.
- 这就是说, 将一个矩阵中的行列互易, 并将每个矩阵元换成其共轭复数, 这样便得到它的厄米共轭矩阵.
算符的表示法
插入封闭性关系式, 然后展开; 利用正交归一关系式, 合并~
再一次, 自然导出张量积的表示, 都没有明确提到
张量积
三个字. 也就是说, 不是数学定义, 而是从完备或者自洽的角度, 导出来的.
伴随算符, 亦是同样~
单就到此为止, 已然超出
量子计算与量子信息
和格里菲斯
一截. 当然,量子计算与量子信息
不适宜用来直接比较~
- 因此, 一个厄米算符由厄米矩阵来表示, 在这种矩阵中,
相对于主对角线对称的任意一对元素互为共轭复数.
- 特别地, 若 \(i = j\) 或 \(α = α'\), 则: \(A_{ii} = A_{ii}^{*}\) 或 \(A(α, α) = A^{*} (α, α)\)
- 这就是说, 厄米矩阵的对角元素必是实数.
表象的变换
给出了新基的每一个右矢在旧基的每一个右矢上的分量,
就确定了基的变换.
基于此, 感受厄米共轭 (伴随) 矩阵的意义
- 基的变换矩阵
\(S\)
是一个幺正矩阵, 即它满足条件:
\(S^{\dagger} S = S S^{\dagger} = I\)
- 此处的 \(I\) 是单位矩阵.
本征值方程; 观察算符
-
这些本征值的集合叫做 \(A\) 的
谱
. -
为了避免这种不确定性, 我们可以约定将本征矢归一化为 \(1\), 即取 \(\langle ψ \mid ψ \rangle = 1\)
- 但是这种做法并没有完全消除不确定性, 因为 \(e^{iθ} \mid ψ \rangle\) (\(θ\) 为任意实数) 和 \(\mid ψ \rangle\) 具有相同的模方.
- 以后我们将会看到, 在量子力学中, 从 \(\mid ψ \rangle\) 和从 \(e^{iθ} \mid ψ \rangle\) 得到的物理预言是一样的.
得到的物理实在是一样的: 全局相位
- 如果本征值
\(λ\)
只对应于一个本征矢 (除一个倍乘因子以外), 也就是说与
\(λ\)
对应的全体本征矢是共线的, 我们便称这个本征值是
非简并
的 (或简单的).- 反之, 如果至少有两个线性无关的右矢都是
\(A\)
的属于同一本征值的本征矢, 我们便称这个本征值是
简并
的; 属于这个本征值的线性无关本征矢的个数, 叫做该本征值的简并度
(一个本征值的简并度可以是有限的, 也可以是无限的).
- 反之, 如果至少有两个线性无关的右矢都是
\(A\)
的属于同一本征值的本征矢, 我们便称这个本征值是
- 因而,
\(A\)
的属于
\(λ\)
的本征右矢的集合构成一个
\(g\)
维矢量空间 (
\(g\)
也可能是无穷大), 我们称它为本征值
\(λ\)
的
本征子空间
.- 特别地, 说 \(λ\) 是非简并的, 或说它的简并度 \(g = 1\), 这两种说法是等价的.
- 于是
\(P_ψ\)
的谱只包含两个数:
\(1\)
和
\(0\).
- 前者是非简并的, 后者的简并度为无穷大 (如果待研究的态空间是无限多维的).
- 对应于
\(λ = 0\)
的本征子空间就是
\(\mid ψ \rangle\)
的
补空间
.
- 对于一个指定的子空间
\(\mathcal{E}_1\),
和它互补的子空间
\(\mathcal{E}_2\)
实际上有无穷多个. 但我们可以规定
\(\mathcal{E}_2\)
必须和
\(\mathcal{E}_1\)
正交, 这样便选出一个
\(\mathcal{E}_2\)
(正交补).
- 本书始终这样规定, 所以
正交补
前面的正交
一词就常常省去. - 例如, 在普通的三维空间中, 如果 \(\mathcal{E}_1\) 是一个平面 \(P\), 那么, \(\mathcal{E}_2\) 可以是 \(P\) 以外的任意一条直线. 通过原点而且垂直于 \(P\) 的那条直线就是 \(P\) 的正交补.
- 本书始终这样规定, 所以
- 此外, 进行一次任意的基变换, 便很容易证明,
特征方程和我们所选用的表象无关.
- 因此, 一个算符的本征值就是它的特征方程的根.
求算符的本征值和本征矢: 只从实用角度讨论~
- 因此, 在
\(λ_0\)
为特征方程的单根时, 只有一个本征矢 (除一个倍乘因子以外) 和它对应,
也就是说, 这个本征值是非简并的.
- 当 \(λ_0\) 是特征方程的 \(q\) 重根 \((q > 1)\) 时, 有两种可能.
对于厄米算符, 可以证明, 本征值 λ 的简并度 p 总是等于特征方程的重根的重数 q.
以后, 大多数情况下, 由于我们只研究厄米算符, 于是,
只要知道特征方程的每一个根的重数, 立刻就可以知道对应的本征子空间的维数.
因此, 在维数 N 为有限的空间中, 一个厄米算符永远具有 N 个线性无关的本征矢
(以后将会看到, 我们可以使它们正交归一化, 因而这种算符是可以对角化的).
观察算符
-
\[A^{\dagger} = A\]
- (i) 厄米算符的本征值都是
实数
- (ii) 厄米算符的属于两个互异本征值的本征矢
互相正交
- (i) 厄米算符的本征值都是
- 我们证明过,
\(\mathcal{E}_n\)
中的每一个矢量都正交于另一个本征子空间
\(\mathcal{E}_{n'}\)
中的每一个矢量
(\(\mathcal{E}_{n'}\)
对应于
\(a_{n'} ≠ a_n\));
故有:
- \(\langle ψ_n^i \mid ψ_{n'}^j \rangle = 0\); 对于 \(n ≠ n'\) 和任意的 \(i\), \(j\).
- 在每一个子空间
\(\mathcal{E}_n\)
的内部, 我们总可选择诸矢量
\(\mid ψ_n^i \rangle\),
使得它们是正交归一的, 即使得:
- \[\langle ψ_n^i \mid ψ_n^j \rangle = δ_{ij}\]
- 实现了这样的选择, 就建立了算符
\(A\)
的本征矢的正交归一系: 诸矢量
\(\mid ψ_n^i \rangle\)
满足下列关系:
- \[\langle ψ_n^i \mid ψ_{n'}^{i'} \rangle = δ_{nn'} δ_{ii'}\]
- 按定义, 如果本征矢的这个正交归一系在态空间中构成一个基, 厄米算符
\(A\)
就是一个
观察算符
. 构成基这一事实可以用封闭性关系式来表示:- \[\sum_{n = 1}^{\infty} \sum_{i = 1}^{g_n} \mid ψ_n^i \rangle \langle ψ_n^i \mid = \mathbb{1}\]
- 定理 I: 如果两个算符
\(A\)
和
\(B\)
是可对易的, 而且
\(\mid ψ \rangle\)
是
\(A\)
的一个本征矢, 则
\(B \mid ψ \rangle\)
也是
\(A\)
的本征矢, 且属于同一本征值.
- 定理 I’: 如果两个算符 \(A\) 与 \(B\) 是可对易的, 那么, \(A\) 的所有本征子空间在 \(B\) 的作用下都是整体不变的.
- (i) 假设 \(a\) 是非简并的本征值, 则按定义, 属于它的全体本征矢是共线的, 因而 \(B \mid ψ \rangle\) 必然正比于 \(\mid ψ \rangle\), 可见 \(\mid ψ \rangle\) 也是 \(B\) 的本征矢.
- (ii) 如果 \(a\) 是简并的本征值, 我们就只能说 \(B \mid ψ \rangle\) 属于算符 \(A\) 的对应于本征值 \(a\) 的本征子空间 \(\mathcal{E}_a\). 因此, 对于任意的 \(\mid ψ \rangle \in \mathcal{E}_a\), 有 \(B \mid ψ \rangle \in \mathcal{E}_a\); 因此, 我们说本征子空间 \(\mathcal{E}_a\) 在算符 \(B\) 的作用下是整体不变的 (或稳定的).
-
定理 II: 如果两个观察算符 \(A\) 与 \(B\) 是可对易的, 又若 \(\mid ψ_1 \rangle\) 和 \(\mid ψ_2 \rangle\) 是 \(A\) 的两个本征矢, 属于不同的本征值, 则矩阵元 \(\langle ψ_1 \mid B \mid ψ_2 \rangle\) 等于零.
- 定理 III: (基本定理) 如果两个观察算符
\(A\)
与
\(B\)
可对易, 则
\(A\)
和
\(B\)
的共同本征矢构成态空间的一个正交归一基.
- 很容易证明定理 III 的逆定理: 如果存在由 \(A\) 和 \(B\) 的共同本征矢构成的一个基, 则这两个观察算符是对易的.
几何视角; 重根~
- 从现在起, 我们用记号
\(\mid u_{n, p}^i \rangle\)
来表示
\(A\)
和
\(B\)
的共同本征矢:
- \[A \mid u_{n, p}^i \rangle = a_n \mid u_{n, p}^i \rangle\]
- \[B \mid u_{n, p}^i \rangle = b_p \mid u_{n, p}^i \rangle\]
- \(\mid u_{n, p}^i \rangle\) 中的指标 \(n\) 和 \(p\) 用来标记 \(A\) 和 \(B\) 的本征值 \(a_n\) 和 \(b_p\), 同属于本征值 \(a_n\) 和 \(b_p\) 的各基矢可以用上标 \(i\) 加以区别.
- 以后会遇到求解这样一种观察算符
\(C\)
的本征值方程的问题, 其中的观察算符
\(C\)
是可对易的观察算符
\(A\)
与
\(B\)
之和, 即
- \(C = A + B\) 而且 \([A, B] = 0\)
- 如果我们找到了由 \(A\) 和 \(B\) 的共同本征矢构成的一个基 \(\{ \mid u_{n,p}^i \rangle \}\), 问题就解决了. 因为, 我们立即可以看到 \(\mid u_{n,p}^i \rangle\) 也是 \(C\) 的本征矢, 属于本征值 \(a_n + b_p\). 矢量集合 \(\{ \mid u_{n,p}^i \rangle \}\) 构成一个基这一点显然十分重要. 例如, 据此我们很容易证明 \(C\) 的全体本征值都具有 \(a_n + b_p\) 的形式.
- 这个条件也可以叙述为: 如果对于本征值的每一对可能的数值 \((a_n, b_p)\), 只有一个对应的基矢, 则 \(A\) 和 \(B\) 构成一个 CSCO.
可对易观察算符的完全集合 (法文缩写 ECOC, 英文缩写 CSCO) 后文交替使用 ECOC 和 CSCO (其实是我个人尽量替换成 CSCO).
- 如果, 至少对于
\(\{ a_n, b_p \}\)
的可能数组中的一组, 存在着若干个独立矢量, 它们都是
\(A\)
和
\(B\)
的属于这一组本征值的本征矢, 则集合
\(\{ A, B \}\)
就是不完全的. 这时, 我们给这个集合增添第三个观察算符
\(C\),
它同时和
\(A\),
\(B\)
对易. 然后我们进行如下的推广:
- 如果和 \(\{ a_n, b_p \}\) 的一个数组对应的矢量只有一个, 那么它一定是 \(C\) 的本征矢; 如果对应的矢量有若干个, 则它们张成一个本征子空间 \(\mathcal{E}_{n,p}\), 在这个空间中, 我们可以选出这样一个基, 使构成它的矢量同时也是 \(C\) 的本征矢.
- 这样一来, 我们就在态空间中构成了这样一个正交归一基, 构成它的矢量是 \(A\), \(B\), \(C\) 的共同本征矢. 如果这个基是唯一的 (除倍乘因子以外). 也就是说, 如果给出了 \(A\), \(B\), \(C\) 的本征值的一个可能的数组 \(\{ a_n, b_p, c_r \}\), 对应的基矢只有一个, 那么 \(A\), \(B\), \(C\) 就构成一个 CSCO. 如果情况并非如此, 我们也许可以在 \(A\), \(B\), \(C\) 之外再增添一个观察算符 \(D\), 它同时和前三个算符对易.
- 推广到一般情况, 我们可以说: 按定义, 把观察算符
\(A\),
\(B\),
\(C\)
…
的一个集合叫做可对易观察算符的
完全
集合的条件是:- (i) 所有的这些观察算符
\(A\),
\(B\),
\(C\)
…
是
两两对易
的; - (ii) 给出了全体算符 \(A\), \(B\), \(C\) … 的本征值的一个数组, 便足以决定唯一的一个共同本征矢 (除倍乘因子以外).
- (i) 所有的这些观察算符
\(A\),
\(B\),
\(C\)
…
是
- 还有一个等价的说法是: 观察算符
\(A\),
\(B\),
\(C\)
…
的一个集合成为可对易观察算符的完全集合的条件是:
- 存在着由共同本征矢构成的一个正交归一基, 而且这个基是唯一的 (除相位因子以外).
- (i) 如果
\(\{ A, B \}\)
是一个 CSCO, 我们给它增添任意一个和
\(A\),
\(B\)
都可对易的观察算符
\(C\),
便可以得到另一个 CSCO.
- 但是, 我们通常约定只考虑
最小的
集合, 就是说, 如果从中去掉任意一个观察算符, 它就不成其为完全集合了.
- 但是, 我们通常约定只考虑
- (ii) 假设 \(\{ A, B, C, ... \}\) 是可对易观察算符的完全集合. 因为给出了本征值 \(a_n\), \(b_p\), \(c_r\) … 的一个可能的数组, 便足以决定一个对应的基右矢 (除一个倍乘因子以外), 所以有时我们将这个右矢记作 \(\mid a_n, b_p, c_r, ... \rangle\).
- (iii) 对于一个给定的物理体系, 可对易观察算符的完全集合不止一个.
表象和观察算符的两个重要例子
- 对于每一个波函数
\(ψ(r)\),
我们取
\(\mathcal{E}_r\)
空间中的一个右矢
\(\mid ψ \rangle\)
和它对应, 使这种对应关系是线性的;
而且使两个右矢的标量积和两个对应函数的标量积一致, 即
- \[\langle φ \mid ψ \rangle = \int d^{3} r φ^{*}(r) ψ(r)\]
- 这样的 \(\mathcal{E}_r\) 就是一个无自旋粒子的态空间.
-
由此可见, 波函数在点 \(r_0\) 处的值 \(ψ(r_0)\) 就是右矢 \(\mid ψ \rangle\) 在 \(\{ \mid r_0 \rangle \}\) 表象中的基矢 \(\mid r_0 \rangle\) 上的分量; “动量空间中的波函数” \(\overline{ψ} (p)\) 也可以得到类似的解释.
- 既然我们已经重新解释过波函数
\(ψ(r)\)
及其傅里叶变换
\(\overline{ψ} (p)\),
我们将用
\(\mid r \rangle\)
和
\(\mid p \rangle\)
代替
\(\mid r_0 \rangle\)
和
\(\mid p_0 \rangle\)
来表示我们在这里所研究的两种表象的基矢. 于是:
- \[\langle r \mid ψ \rangle = ψ(r)\]
- \[\langle p \mid ψ \rangle = \overline{ψ} (p)\]
- 正交归一关系式和封闭性关系式可以写作:
- (a) \(\langle r \mid r' \rangle = δ(r - r')\)
- (b) \(\int d^{3} r \mid r \rangle \langle r \mid = \mathbb{1}\)
- (c) \(\langle p \mid p' \rangle = δ(p - p')\)
- (d) \(\int d^{3} p \mid p \rangle \langle p \mid = \mathbb{1}\)
- 当然, 在这里我们总是把 \(\mathbf{r}\) 及 \(\mathbf{p}\) 看作分别在两种表象中标记基右矢的连续指标 \(\{ x, y, z \}\) 及 \(\{ p_x, p_y, p_z \}\) 的两个集合.
算符 R 和算符 P
- 假设
\(\mid ψ \rangle\)
是
\(\mathcal{E}_r\)
空间中的一个任意右矢, 则
\(\langle r \mid ψ \rangle = ψ(r) ≡ ψ(x, y, z)\)
表示对应的波函数. 按算符
\(X\)
的定义, 右矢
- \[\mid ψ' \rangle = X \mid ψ \rangle\]
- 在基 \(\{ \mid r \rangle \}\) 中由函数 \(\langle r \mid ψ' \rangle = ψ'(r) ≡ ψ'(x, y, z)\) 来表示; 这里
- \[ψ'(x, y, z) = x ψ(x, y, z)\]
- 因此, 在
\(\{ \mid r \rangle \}\)
表象中,
\(X\)
算符与表示 “乘以
\(x\)”
的倍乘算符一致.
- 虽然这里是通过波函数的变换来引入算符 \(X\) 的, 但 \(X\) 是在态空间 \(\mathcal{E}_r\) 中起作用的算符.
- 在
\(\{ \mid r \rangle \}\)
表象中, 也可以计算算符
\(X\),
\(Y\),
\(Z\),
\(P_x\),
\(P_y\),
\(P_z\)
之间的对易子. 例如
- \[\begin{align} \langle r \mid [X, P_x] \mid ψ \rangle & = \langle r \mid (X P_x - P_x X) \mid ψ \rangle \\ & = x \langle r \mid P_x \mid ψ \rangle - \frac{\hbar}{i} \frac{\partial}{\partial x} \langle r \mid X \mid ψ \rangle \\ & = \frac{\hbar}{i} x \frac{\partial}{\partial x} \langle r \mid ψ \rangle - \frac{\hbar}{i} \frac{\partial}{\partial x} x \langle r \mid ψ \rangle \\ & = i \hbar \langle r \mid ψ \rangle \\ \end{align}\]
- 上面的计算对于任意右矢 \(\mid ψ \rangle\) 和任意一个基右矢 \(\mid r \rangle\) 都成立, 因此便得到:
- \[[X, P_x] = i \hbar\]
- 用同样的方法可以得到
\(R\)
的诸分量和
\(P\)
的诸分量之间的其他对易子. 我们将结果归纳在下面:
- \[[R_i, R_j] = 0\]
- \[[P_i, P_j] = 0\]
- \[[R_i, P_j] = i \hbar δ_{ij}\]
- \[i, j = 1, 2, 3\]
- 式中 \(R_1\), \(R_2\), \(R_3\) 和 \(P_1\), \(P_2\), \(P_3\) 分别代表 \(X\), \(Y\), \(Z\) 和 \(P_x\), \(P_y\), \(P_z\).
- 上述公式叫做正则对易关系式.
-
\[\begin{align}
X \mid r \rangle = x \mid r \rangle \\
Y \mid r \rangle = y \mid r \rangle \\
Z \mid r \rangle = z \mid r \rangle
\end{align}\]
- 于是, 右矢 \(\mid r \rangle\) 是算符 \(X\), \(Y\), \(Z\) 的共同本征右矢; 现在可以说明, 为什么一开始要选用 \(\mid r \rangle\) 这个符号:
- 这是由于, 每一个本征矢都是由矢量 \(r\) 来标记的, \(r\) 的坐标 \(x\), \(y\), \(z\) 就是对应于 \(X\), \(Y\), \(Z\) 的本征值的三个连续指标.
- 对于算符
\(P\),
我们应该在
\(\{ \mid p \rangle \}\)
表象中去讨论, 这样便能建立起类似的概念和公式. 我们可以得到:
- \[\begin{align} P_x \mid p \rangle = p_x \mid p \rangle \\ P_y \mid p \rangle = p_y \mid p \rangle \\ P_z \mid p \rangle = p_z \mid p \rangle \end{align}\]
- 要注意, 在
\(\mathcal{E}_r\)
空间中, 仅仅
\(X\)
本身还不能构成一个 CSCO: 即使将
\(x_0\)
固定,
\(y_0\),
\(z_0\)
还可以取任意实数值, 因此, 每一个本征值
\(x_0\)
都是无穷多重简并的.
- 反之, 在一维问题的态空间 \(\mathcal{E}_r\) 中, \(X\) 构成一个 CSCO, 因为此时本征值 \(x_0\) 唯一地确定了一个对应的本征右矢 \(\mid x_0 \rangle\), 它在 \(\{ \mid x \rangle \}\) 表象中的坐标是 \(δ(x - x_0)\).
态空间的张量积
- 按同样的方式, 到后面章节, 对某些粒子来说,
我们还要考虑一种固有的角动量即自旋的存在. 就是说,
不但要考虑用定义在空间
\(\mathcal{E}_r\)
中的可观察量
\(R\)
和
\(P\)
来处理的外部自由度 (位置, 动量), 还要考虑内部自由度,
并引入自旋这一观察算符, 它在自旋态空间
\(\mathcal{E}_s\)
中起作用.
- 因而, 一个有自旋的粒子的态空间 \(\mathcal{E}\) 就是 \(\mathcal{E}_r\) 和 \(\mathcal{E}_s\) 的张量积.
- 最后, 态空间的张量积概念可以解决下述问题: 假设有两个孤立的物理体系
\((S_1)\)
和
\((S_2)\)
(例如, 两者相距充分远, 以致它们的相互作用完全可以忽略), 对应于
\((S_1)\)
和
\((S_2)\)
的态空间分别为
\(\mathcal{E}_1\)
和
\(\mathcal{E}_2\);
- 现在假定我们要把这两个体系的集合看作一个物理体系 (当两个体系距离充分近, 以致发生相互作用时, 这种看法是必要的), 那么总体系 \((S)\) 的态空间是什么?
这就是我所谓的物理学家讲数学的实在性!
张量积的定义和性质
- (i) 对于用复数来倍乘, 张量积运算是线性的;
- (ii) 对于矢量的加法, 张量积运算是可分配的;
- (iii) 若在空间
\(\mathcal{E}_1\)
中选定了一个基
\(\{ \mid u_i (1) \rangle \}\),
在空间
\(\mathcal{E}_2\)
中选定了一个基
\(\{ \mid v_l (2) \rangle \}\);
则诸矢量
\(\mid u_i (1) \rangle \otimes \mid v_l (2) \rangle\)
的集合构成空间
\(\mathcal{E}\)
中的一个基.
- 若 \(N_1\) 和 \(N_2\) 是有限的, 则 \(\mathcal{E}\) 的维数等于 \(N_1 N_2\).
于是, 一个张量积矢量的分量就是该乘积中的两个矢量的分量之积.
- 在
\(\mathcal{E}\)
空间中, 存在着这样的矢量, 它们并不是
\(\mathcal{E}_1\)
空间中的矢量和
\(\mathcal{E}_2\)
空间中的矢量的张量积. 事实上, 根据假设,
\(\{ \mid u_i (1) \rangle \otimes \mid v_l (2) \rangle \}\)
是
\(\mathcal{E}\)
空间中的一个基, 因此,
\(\mathcal{E}\)
空间中最普遍的矢量可表示为:
- \[\mid ψ \rangle = \sum_{i, l} c_{i, l} \mid u_i (1) \rangle \otimes \mid v_l (2) \rangle\]
- 任意给定了 \(N_1 N_2\) 个复数 \(c_{i, l}\), 我们不一定能将它们写成 \(N_1\) 个数 \(a_i\) 和 \(N_2\) 个数 \(b_l\) 的乘积 \(a_i b_l\) 的形式, 因此, 一般说来, 并不存在这样的矢量 \(\mid φ(1) \rangle\) 和 \(\mid χ(2) \rangle\), 它们的张量积刚好就是 \(\mid ψ \rangle\).
- 但是 \(\mathcal{E}\) 空间中的任意一个矢量总可以分解为张量积矢量的线性组合, 如上式所示.
- 在
\(\mathcal{E}_1\)
空间和
\(\mathcal{E}_2\)
空间中存在着标量积, 这就使我们可以同样定义空间
\(\mathcal{E}\)
中的标量积.
- 首先, 我们定义矢量 \(\mid φ(1) χ(2) \rangle = \mid φ(1) \rangle \otimes \mid χ(2) \rangle\) 和矢量 \(\mid φ'(1) χ'(2) \rangle = \mid φ'(1) \rangle \otimes \mid χ'(2) \rangle\) 的标量积为:
- \[\langle φ'(1) χ'(2) \mid φ(1) χ(2) \rangle = \langle φ'(1) \mid φ(1) \rangle \langle χ'(2) \mid χ(2) \rangle\]
- 对于
\(\mathcal{E}\)
空间中的任意两个矢量, 由于其中的每一个都是张量积矢量的线性组合,
因此, 可以直接应用标量积的基本性质.
- 特别地, 我们注意, 如果每一个基 \(\{ \mid u_i (1) \rangle \}\) 和 \(\{ \mid v_l (2) \rangle \}\) 都是正交归一的, 那么基 \(\{ \mid u_i (1) v_l (2) \rangle = \mid u_i (1) \rangle \otimes \mid v_l (2) \rangle \}\) 也是正交归一的, 即
- \[\langle u_{i'} (1) v_{l'} (2) \mid u_i (1) v_l (2) \rangle = \langle u_{i'} (1) \mid u_i (1) \rangle \langle v_{l'} (2) \mid v_l (2) \rangle = δ_{ii'} δ_{ll'}\]
此节的概念编排, 可见风范!
忘了谁说过或者在哪看见过: 定义, 定理的组织编排, 可见作者的眼界格局.
- 我们首先考虑定义在
\(\mathcal{E}_1\)
空间中的一个线性算符
\(A(1)\).
现在给这个算符联系上
\(\mathcal{E}\)
空间中的一个线性算符
\(\widetilde{A}(1)\),
叫做
\(A(1)\)
在
\(\mathcal{E}\)
空间中的
延伸算符
, 它的定义如下:- 将 \(\widetilde{A}(1)\) 作用于一个张量积矢量 \(\mid φ(1) \rangle \otimes \mid χ(2) \rangle\) 的结果是:
- \[\widetilde{A}(1) [\mid φ(1) \rangle \otimes \mid χ(2) \rangle] = [A(1) \mid φ(1) \rangle] \otimes \mid χ(2) \rangle\]
- 假设
\(A(1)\)
和
\(B(2)\)
分别为在
\(\mathcal{E}_1\)
空间和
\(\mathcal{E}_2\)
空间中起作用的两个线性算符. 张量积
\(A(1) \otimes B(2)\)
是
\(\mathcal{E}\)
空间中的一个线性算符, 它的定义就是规定它对张量积矢量的作用的下列关系式:
- \[[A(1) \otimes B(2)] [\mid φ(1) \rangle \otimes \mid χ(2) \rangle] = [A(1) \mid φ(1) \rangle] \otimes [B(2) \mid χ(2) \rangle]\]
原书印刷错误~
- 张量积矢量
\(\mid φ(1) χ(2) \rangle = \mid φ(1) \rangle \otimes \mid χ(2) \rangle\)
上的投影算符是
\(\mathcal{E}\)
空间的一种算符, 也就是
\(\mid φ(1) \rangle\)
上及
\(\mid χ(2) \rangle\)
上的两个投影算符的张量积:
- \[\mid φ(1) χ(2) \rangle \langle φ(1) χ(2) \mid = \mid φ(1) \rangle \langle φ(1) \mid \otimes \mid χ(2) \rangle \langle χ(2) \mid\]
- 本书的符号约定:
- \(\mid φ(1) \rangle \mid χ (2) \rangle\) 表示 \(\mid φ(1) \rangle \otimes \mid χ (2) \rangle\)
- \(A(1) B(2)\) 表示 \(A(1) \otimes B(2)\)
- \(A(1)\) 表示 \(\widetilde{A}(1)\) 或 \(A(1)\)
注: 后两个符号约定需要参考上下文
张量积空间中的本征值方程
- (a) 若 \(A(1)\) 是 \(\mathcal{E}_1\) 空间中的一个观察算符, 则它也是 \(\mathcal{E}\) 空间中的观察算符.
- (b) \(A(1)\) 在 \(\mathcal{E}\) 空间中的谱和它在 \(\mathcal{E}_1\) 空间中的谱一样.
-
(c) 但是, 在 \(\mathcal{E}_1\) 空间中 \(g_n\) 度简并的本征值 \(a_n\) 在 \(\mathcal{E}\) 空间中的简并度为 \(N_2 \times g_n\).
- 因此, \(C = A(1) + B(2)\) 的本征值是 \(A(1)\) 的一个本征值与 \(B(2)\) 的一个本征值之和; 我们可以得到由 \(C\) 的本征矢构成的一个基, 其中的基矢是 \(A(1)\) 的一个本征矢和 \(B(2)\) 的一个本征矢的张量积 (不一定).
不一定: 其中的基矢是 \(A(1)\) 的一个本征矢和 \(B(2)\) 的一个本征矢的张量积, 或者张量积的线性组合.
- \(C\)
的本征值都属于
\(c_{np} = a_n + b_p\)
这种形式. 如果不存在
\(n\)
和
\(p\)
的两个互异的数组可以给出同一个数
\(c_{np}\),
这个本征值就是非简并的 (提醒一下, 前面假设过, 分别在
\(\mathcal{E}_1\)
及
\(\mathcal{E}_2\)
空间中,
\(a_n\)
及
\(b_p\)
都是非简并的); 那么,
\(C\)
的本征矢必然就是张量积
\(\mid φ_n (1) \rangle \mid χ_p (2) \rangle\).
- 反之, 如果本征值 \(c_{np}\), 譬如, 是二重简并的 (即存在着这样的 \(m\) 和 \(q\) 使得 \(c_{mq} = c_{np}\)), 那么, 我们只能推断 \(C\) 的对应于这个本征值的每个本征矢都可以写作:
- \[λ \mid φ_n (1) \rangle \mid χ_p (2) \rangle + μ \mid φ_m (1) \rangle \mid χ_q (2) \rangle\]
- 式中 \(λ\) 与 \(μ\) 是任意复数; 在这种情况下, \(C\) 的本征矢中有一些并不是张量积.
- 若在 \(\mathcal{E}_1\) 与 \(\mathcal{E}_2\) 中各有一个可对易观察算符的完全集合, 则将此两集合合并起来便得到 \(\mathcal{E}\) 中的一个可对易观察算符的完全集合.
应用举例
- 因此,
\(\mathcal{E}_{xyz}\)
空间与三维空间中的一个粒子的态空间
\(\mathcal{E}_{r}\)
完全一致, 而
\(\mid x, y, z \rangle\)
就是
\(\mid r \rangle\):
- \[\mid x, y, z \rangle ≡ \mid r \rangle = \mid x \rangle \mid y \rangle \mid z \rangle\]
- 式中 \(x\), \(y\), \(z\) 正是 \(r\) 在直角坐标系中的分量.
- 假设体系的态可以用张量积右矢
\(\mid ψ \rangle = \mid ψ_1 \rangle \mid ψ_2 \rangle\)
来描述. 于是, 对应的波函数可分解因子为:
- \[ψ(r_1, r_2) = \langle r_1, r_2 \mid ψ \rangle = \langle r_1 \mid ψ_1 \rangle \langle r_2 \mid ψ_2 \rangle = ψ_1 (r_1) ψ_2 (r_2)\]
- 在这种情况下, 我们说两个粒子之间没有联系. 到后面我们再分析这种情况的物理后果.
上面得到的结论可以推广:
如果一个物理体系由两个或更多的简单体系组合而成,
则它的态空间就是对应于每一个组分体系的态空间的张量积.
量子力学的假定
- 拉格朗日力学
- 对一个物理体系的经典描述可以归结如下:
- (i) 体系在确定时刻 \(t_0\) 的态, 决定于 \(N\) 个广义坐标 \(q_i (t_0)\) 和 \(N\) 个共轭动量 \(p_i (t_0)\) 的数值.
- (ii) 如果知道了体系在指定时刻的态, 那么, 各物理量在该时刻的值便完全确定了. 这就是说, 知道了体系在 \(t_0\) 时刻的态, 我们就可以确切地预言在该时刻进行的任何一种测量的结果.
- (iii) 体系的态随时间演变的规律由
哈密顿-雅可比
方程组来表达. 由于它是一个一阶微分方程组, 所以, 只要给定在指定时刻 \(t_0\) 的函数值 \(\{ q_i (t_0), p_i (t_0) \}\), 此方程组的解 \(\{ q_i (t), p_i (t) \}\) 就是唯一的. 这就是说, 只要知道了体系的初态, 便可以确定它在任意时刻的态.
\[N = 3n\]
(i) 态, (ii) 测量, (iii) 演变
- 对物理体系的量子描述是建立在一些假定的基础之上的,
在这一章中, 我们将研究这些假定. 这些假定可以回答下列问题
(对应于上面关于经典描述所列举的那三点):
- (i) 怎样从数学上描述一个量子体系在指定时刻的态?
- (ii) 知道了体系的态, 怎样预言各种物理量的测量结果?
- (iii) 知道了体系在 \(t_0\) 时刻的态, 怎样去找出它在任意时刻 \(t\) 的态?
假定的陈述
- 首先, 我们用一个平方可积波函数来描述粒子在指定时刻的态;
然后, 我们用态空间
\(\mathcal{E}_r\)
中的一个右矢和每一个波函数联系起来: 给出
\(\mathcal{E}_r\)
空间中的右矢
\(\mid ψ \rangle\)
等价于给出对应的波函数
\(ψ(r) = \langle r \mid ψ \rangle\).
- 因此, 一个粒子在确定时刻的量子态可由 \(\mathcal{E}_r\) 空间中的一个右矢来描述.
- 第一个假定: 在确定的时刻
\(t_0\),
一个物理体系的态由态空间
\(\mathcal{E}\)
中一个特定的右矢
\(\mid ψ (t_0) \rangle\)
来确定.
- 第一个假定就隐含着叠加原理.
- 例: 给出 \(\mathcal{E}_r\) 空间中的右矢 \(\mid ψ \rangle\) 等价于给出对应的波函数 \(ψ (r) = \langle r \mid ψ \rangle\).
- 第二个假定: 每一个可以测量的物理量
\(\mathcal{A}\)
都可以用在
\(\mathcal{E}\)
空间中起作用的一个算符
\(A\)
来描述; 这个算符是一个
观察算符
.- 与经典力学对比, 量子力学是以本质上不同的方式来描述体系的态及有关物理量的:
- 态用矢量来表示, 物理量用算符来表示.
物理量的测量
- 第三个假定: 每次测量物理量
\(\mathcal{A}\),
可能得到的结果, 只能是对应的观察算符
\(A\)
的本征值之一.
- (i) 按定义,
\(A\)
是
厄米算符
,所以测量 \(\mathcal{A}\) 所得的结果总是实数
. - (ii) 如果 \(A\) 的谱是离散的, 那么, 测量 \(\mathcal{A}\) 可能得到的结果就是量子化的.
- (i) 按定义,
\(A\)
是
- 第四个假定 (
非简并
的离散谱的情况): 若体系处于已归一化的态 \(\mid ψ \rangle\) 中, 则测量物理量 \(\mathcal{A}\) 得到的结果为对应观察算符 \(A\) 的非简并本征值 \(a_n\) 的概率 \(\mathcal{P} (a_n)\) 是:- \[\mathcal{P} (a_n) = \mid \langle u_n \mid ψ \rangle \mid^2\]
- 式中 \(\mid u_n \rangle\) 是 \(A\) 的已归一化的本征矢, 属于本征值 \(a_n\).
- 第四个假定 (离散谱的情况): 若体系处于已归一化的态
\(\mid ψ \rangle\)
中, 则测量物理量
\(\mathcal{A}\)
得到的结果为对应观察算符
\(A\)
的本征值
\(a_n\)
的概率
\(\mathcal{P} (a_n)\)
是:
- \[\mathcal{P} (a_n) = \sum_{i = 1}^{g_n} \mid \langle u_n^i \mid ψ \rangle \mid^2\]
- 式中 \(g_n\) 是 \(a_n\) 的简并度, 而 \(\{ \mid u_n^i \rangle \} (i = 1, 2, ..., g_n)\) 是一组正交归一矢量, 它们在对应于 \(A\) 的本征值 \(a_n\) 的本征子空间 \(\mathcal{E}_n\) 中构成一个基.
- 这个假定要有意义, 在 \(a_n\) 有简并时, 概率 \(\mathcal{P} (a_n)\) 就必须与 \(\mathcal{E}_n\) 中基 \(\{ \mid u_n^i \rangle \}\) 的选择无关.
- 第四个假定 (非简并连续谱的情况): 测量处于已归一化的态
\(\mid ψ \rangle\)
的体系的物理量
\(\mathcal{A}\)
时, 得到介于
\(α\)
和
\(α + dα\)
之间的结果的概率
\(d \mathcal{P} (α)\)
是:
- \[d \mathcal{P} (α) = \mid \langle v_α \mid ψ \rangle \mid^2 dα\]
- 其中 \(\mid v_α \rangle\) 是与 \(\mathcal{A}\) 相联系的观察算符 \(A\) 的本征矢, 属于本征值 \(α\).
- 互成比例的两个态矢量表示同一个物理状态. 必须留意正确地解释这个结果.
- 例如, 假设 \(\mid ψ \rangle = λ_1 \mid ψ_1 \rangle + λ_2 \mid ψ_2 \rangle\)
- 这里的 \(λ_1\) 和 \(λ_2\) 都是复数.
- 不论 \(θ_1\) 是任何实数, \(e^{i θ_1} \mid ψ_1 \rangle\) 和 \(\mid ψ_1 \rangle\) 确实表示同一个物理状态, \(e^{i θ_2} \mid ψ_2 \rangle\) 和 \(\mid ψ_2 \rangle\) 也确实表示同一个态.
- 但是, 一般地说: \(\mid φ \rangle = λ_1 e^{i θ_1} \mid ψ_1 \rangle + λ_2 e^{i θ_2} \mid ψ_2 \rangle\) 并不描述与 \(\mid ψ \rangle\) 相同的态
- (我们将会看到, 在态矢量的展开式中, 诸系数的相对相位起着重要的作用);
- 只有在 \(θ_1 = θ_2 + 2nπ\) 这个特殊情况下 \(\mid φ \rangle\) 与 \(\mid ψ \rangle\) 才表示同一个态, 这时
- \[\mid φ \rangle = e^{i θ_1} [λ_1 \mid ψ_1 \rangle + λ_2 \mid ψ_2 \rangle] = e^{i θ_1} \mid ψ \rangle\]
换句话说, 总的相位因子对于物理预言没有影响,
但展开式中各系数的相对相位则是有影响的.
- 第五个假定: 如果对处于
\(\mid ψ \rangle\)
态的体系测量物理量
\(\mathcal{A}\)
得到的结果是
\(a_n\),
则刚测量之后体系的态是
\(\mid ψ \rangle\)
在属于
\(a_n\)
的本征子空间上的
归一化
的投影 \(\frac{P_n \mid ψ \rangle}{\sqrt{ \langle ψ \mid P_n \mid ψ \rangle }}\).- 因此, 在刚测量之后, 体系的态矢量一定是 \(A\) 的属于本征值 \(a_n\) 的本征矢.
- 但是我们要强调这样一个事实: 这个本征矢决不是子空间 \(\mathcal{E}_n\) 中的任意右矢, 而是 \(\mid ψ \rangle\) 的属于 \(\mathcal{E}_n\) 的那一部分 (为方便起见, 已适当地归一化).
体系随时间的演变
- 第六个假定: 态矢量
\(\mid ψ (t) \rangle\)
随时间的演变遵从薛定谔方程:
- \[i \hbar \frac{d}{dt} \mid ψ (t) \rangle = H(t) \mid ψ (t) \rangle\]
- 式中 \(H(t)\) 是与体系的总能量相联系的观察算符.
- \(H\)
叫做体系的
哈密顿算符
, 因为它是从经典的哈密顿函数得来的.
如何直觉上认知薛定谔方程? 设想态矢量的无穷小变化时, 方程代表的意义~
量子化规则
- 首先考虑由处在标量势场中的一个无自旋粒子构成的体系.
这时, 我们有下述规则:
- 与粒子的位置 \(\mathbf{r} (x, y, z)\) 相联系的是观察算符 \(R (X, Y, Z)\).
- 与粒子的动量 \(\mathbf{p} (p_x, p_y, p_z)\) 相联系的是观察算符 \(P (P_x, P_y, P_z)\).
- 提醒一下,
\(R\)
和
\(P\)
的诸分量满足正则对易关系:
- \[[R_i, R_j] = [P_i, P_j] = 0\]
- \[[R_i, P_j] = i \hbar δ_{ij}\]
这里其实很有意思, \(i\) 所隐含的正交, 和 \(i\) 与 \(j\) 的实实在在的正交. 然后, 带来的不确定度. (嗯, 纯属个人的胡思乱想.)
- 在经典力学中标量积
\(\mathbf{r} ⋅ \mathbf{p}\)
是可以对易的, 我们完全可以将此式写作:
\(\mathbf{p} ⋅ \mathbf{r} = p_x x + p_y y + p_z z\)
- 但是如果将 \(\mathbf{r}\) 和 \(\mathbf{p}\) 换成对应的观察算符 \(R\) 和 \(P\), 则: \(R ⋅ P ≠ P ⋅ R\)
- 此外, \(R ⋅ P\) 和 \(P ⋅ R\) 都不是厄米算符: \((R ⋅ P)^{\dagger} = (X P_x + Y P_y + Z P_z)^{\dagger} = P ⋅ R\)
- 有鉴于此, 我们再给上述的做法加上一条对称化规则. 例如, 和 \(\mathbf{r} ⋅ \mathbf{p}\) 相联系的观察算符将是 \(\frac{1}{2} (R ⋅ P + P ⋅ R)\)
- 这样的算符自然是厄米的. 遇到比 \(R ⋅ P\) 更复杂的观察算符也要类似地使它对称化.
- 要得到描述一个已有经典定义的物理量 \(\mathcal{A}\) 的观察算符 \(A\), 只需在 \(\mathcal{A}\) 的经过适当对称化的表达式中, 将 \(\mathbf{r}\) 与 \(\mathbf{p}\) 分别换成观察算符 \(R\) 与 \(P\).
但是, 我们将会看到, 还存在着一些量子的物理量, 它们并没有对应的经典物理量;
这些量将由对应的观察算符直接定义 (例如, 粒子的自旋便属于这种情况).
上述这些规则, 特别是对易规则, 只在直角坐标系中才成立.
我们可以将它们推广到其他坐标系, 但这样一来, 它们就不再具有上面的简单形式.
- 必须注意, 不要将
\(\mathbf{p}\)
(粒子的动量或称
\(\mathbf{r}\)
的共轭动量) 与
\(m \mathbf{v}\)
(粒子的机械动量) 混淆起来.
- 在量子力学中当然也有和粒子速度相联系的算符, 在这里, 我们将它写作: \(\mathcal{V} = \frac{1}{m} (P - qA)\)
- 于是 \(H\) 便成为: \(H(t) = \frac{1}{2} m \mathcal{V}^2 + V(\mathbf{R}, t)\)
- 这是两项之和, 一项对应于粒子的动能, 一项对应于它的势能.
- 但是, 与量子力学中满足正则对易关系式的算符 \(P\) 相对应的是共轭动量 \(P\) 而不是机械动量 \(m \mathbf{v}\).
关于可观察量及其测量的假定的物理解释
可观察量在指定态中的平均值
- 在
\(\mid ψ \rangle\)
这个态中, 可观察量
\(A\)
的平均值 (记作
\(\langle A \rangle_{ψ}\)
或简记作
\(\langle A \rangle\)),
可以定义为在处于
\(\mid ψ \rangle\)
这个态的诸体系中对这个可观察量进行很多次
(\(N\)
次) 测量所得结果的平均值.
- 如果 \(\mid ψ \rangle\) 已经给定, 我们就知道了得到每个可能结果的概率, 从而也就可以预言平均值 \(\langle A \rangle_{ψ}\).
- 我们将证明, 若
\(\mid ψ \rangle\)
是
已归一化
的, 则 \(\langle A \rangle_{ψ}\) 由下列公式给出: - \[\langle A \rangle_{ψ} = \langle ψ \mid A \mid ψ \rangle\]
- 如果表示体系状态的右矢
\(\mid ψ \rangle\)
未归一化
, 则公式应为 - \[\langle A \rangle_{ψ} = \frac {\langle ψ \mid A \mid ψ \rangle} {\langle ψ \mid ψ \rangle}\]
- 现在引入方均根偏差
\(ΔA\),
它的定义是
\(ΔA = \sqrt{\langle (A - \langle A \rangle)^2 \rangle}\)
进而, 我们有:
\(ΔA =
\sqrt{\langle ψ \mid (A - \langle A \rangle)^2 \mid ψ \rangle}\)
- 这个关系式还可写成略微不同的形式. 由于
- \[\begin{align} \langle (A - \langle A \rangle)^2 \rangle & = \langle (A^2 - 2 \langle A \rangle A + \langle A \rangle^2) \rangle \\ & = \langle A^2 \rangle - 2 \langle A \rangle^2 + \langle A \rangle^2 \\ & = \langle A^2 \rangle - \langle A \rangle^2 \\ \end{align}\]
- 因此, 方均根偏差 \(ΔA\) 又可由下式给出: \(ΔA = \sqrt{\langle A^2 \rangle - \langle A \rangle^2}\)
- 如果将定义式
\(ΔA = \sqrt{\langle (A - \langle A \rangle)^2 \rangle}\)
应用于可观察量
\(R\)
和
\(P\),
再利用它们之间的对易关系, 可以证明: 对于任意的态
\(\mid ψ \rangle\),
有
- \[\begin{cases} ΔX \cdot ΔP_x ≥ \frac{\hbar}{2} \\ ΔY \cdot ΔP_y ≥ \frac{\hbar}{2} \\ ΔZ \cdot ΔP_z ≥ \frac{\hbar}{2} \\ \end{cases}\]
- 这就是说, 我们又得到海森伯的不确定度关系式, 不过下限是精确的, 这是由于不确定度已有精确定义.
可观察量的相容性
- 如果两个可观察量
\(A\)
和
\(B\)
是相容的, 那么, 测量
\(A\)
所得到的信息不但不会因为对
\(B\)
的测量而遭受损失, 而且会因此得到补充; 反之亦然.
- 此外, 测量这两个可观察量 \(A\) 和 \(B\) 的顺序是无关紧要的. 最后这一点又使我们联想到同时测量 \(A\) 与 \(B\) 的问题.
- 可以看出, 第四个假定和第五个假定是可以推广到这样的同时测量的:
- 和测量结果 \(\{ a_n, b_p \}\) 对应的, 是正交归一本征矢 \(\mid a_n, b_p, i \rangle\).
- 反之, 如果 \(A\) 与 \(B\) 是不可对易的. 则前面的推理就不再成立了.
不相容的两个可观察量是不能同时测量的,
第二次测量会使第一次测量所得信息失去.
- 如果对应于
\((a_n, b_p)\),
存在着
\(A\)
和
\(B\)
的若干个本征矢
\(\mid a_n, b_p, i \rangle\),
那么, 我们可以重新推理, 并在测量
\(A\)
和
\(B\)
的同时, 测量与此两者都相容的第三个可观察量
\(C\).
- 这样, 我们可以得到下述结论:
- 为使体系在测量之后的态毫无例外地由测量结果唯一地确定, 所测量的那些量必须是对易可观察量的完全集合.
- 正是这个性质从物理上证实了引入 CSCO 这个概念的必要性.
因此, 制备一个处在完全确定的量子态的体系的方法, 从原则上说,
与得到偏振光的方法相似: 如果在一束光的途径中插入一个起偏器,
那么, 由此出来的光便是沿某一方向偏振的光, 这个方向决定于起偏器的特征,
因而所得偏振光与入射光的偏振状态没有关系.
同样地, 为了制备一个量子体系, 我们可以构成这样一种仪器, 它只允许一个态通过,
这个态对应于已经选定的完全集合中的每一个可观察量的一个特定本征值.
对一个 CSCO 的测量只能制备与这个 CSCO 相联系的基矢态中的任意一个态.
然而, 要得到体系的其他的态, 只需改换可观察量的集合.
薛定谔方程的物理意义
薛定谔方程的普遍性质
- a. 物理体系的演变的确定性
- 薛定谔方程是关于 \(t\) 的一阶微分方程. 由此可知, 只要给出了初态 \(\mid ψ (t_0) \rangle\) 就足以决定此后任意时刻 \(t\) 的态 \(\mid ψ (t) \rangle\).
- 因此, 在物理体系随时间演变的过程中, 没有任何不确定性.
- 不确定性只出现在测量某个物理量的时候. 这时态矢量发生不可预料的跃变 (参看第五个假定).
- 但是, 在两次测量之间, 态矢量是按完全确定的方式, 即按薛定谔方程演变的.
- b. 叠加原理
- 薛定谔方程是线性齐次的, 因而它的解是可以线性叠加的.
- c. 概率守恒
- α. 态矢量的模方保持为常数
- 态随时间的演变并不会改变在整个空间找到粒子的总概率, 其值永远等于 \(1\). 因此, 实际上就可以把 \(\mid ψ(r, t) \mid^2\) 解释为概率密度.
- β. 概率的局域守恒; 概率密度和概率流 (在这一段里, 只考虑由无自旋的单个粒子构成的物理体系.)
- 概率密度 \(ρ(r, t)\) 在整个空间的积分对时间来说是不变的 (在 \(ψ\) 归一化时, 其值为 \(1\)). 但不能因此就认为 \(ρ(r, t)\) 在每一点 \(r\) 都应该与 \(t\) 无关. 这里的情况和电磁现象中的情况相似:
- 假设在一个孤立的物理体系中存在着电荷的空间分布, 其体密度是 \(ρ(r, t)\), 总电荷 (即 \(ρ(r, t)\) 在整个空间的积分) 对时间而言是守恒的, 但是电荷的空间分布是可能改变的, 这种变化将产生电流.
- 其实, 我们还可以继续类比下去. 电荷在整个空间中的守恒是以局域性的守恒为基础的. 如果固定的体积 \(V\) 所含有的电荷 \(Q\) 随时间改变, 则必有电流穿过限定 \(V\) 的闭曲面 \(S\). 更精确地说, 在 \(dt\) 时间内, \(V\) 中电荷的改变量 \(dQ\) 等于 \(-I dt\), 这里 \(I\) 是穿过 \(S\) 的电流强度, 也就是穿出 \(S\) 的电流密度矢量 \(\mathbf{J}(r, t)\) 的通量.
- 根据经典的矢量分析, 电荷的局域守恒可以表示为如下的形式: \(\frac{\partial}{\partial t} ρ(r, t) + \mbox{div} \mathbf{J}(r, t) = 0\)
- 现在可以找到一个矢量 \(\mathbf{J}(r, t)\), 称为概率流, 它满足全同于上式的方程. 这样一来, 就有概率的局城守恒. 所发生的情况犹如所涉及的是一种”概率流体”, 它的密度和运动分别由 \(ρ(r, t)\) 和 \(\mathbf{J}(r, t)\) 来描述. 如果在点 \(r\) 附近的固定的体积元 \(d^3 r\) 中找到粒子的概率随时间变化, 那么, 穿过限定该体积元的曲面的概率流便有不等于零的通量.
- 用
\(A\)
表示一个可观察量. 假设体系的态
\(\mid ψ(t) \rangle\)
是归一化的 (我们已看到, 在任何时刻
\(t\)
这个性质都保持不变), 在
\(t\)
时刻可观察量
\(A\)
的平均值为:
\(\langle A \rangle (t) =
\langle ψ(t) \mid A \mid ψ(t) \rangle\)
- 我们看到, \(\langle A \rangle (t)\) 是通过 \(\mid ψ(t) \rangle\) (和 \(\langle ψ(t) \mid\)) 而依赖于 \(t\) 的, 而态矢量又是按薛定谔方程随时间演变的. 此外, 可观察量 \(A\) 也可能明显地依赖于时间, 这是 \(\langle A \rangle (t)\) 随 \(t\) 而变的另一个原因.
- 假设描述粒子的态的波函数
\(ψ(r, t)\)
是一个波包. 于是
\(\langle R \rangle\)
表示依赖于时间的三类数值的集合
\(\{ \langle X \rangle, \langle Y \rangle, \langle Z \rangle \}\).
我们称坐标为
\(\langle R \rangle (t)\)
的点为
\(t\)
时刻波包的中心. 对应于相继各时刻
\(t\)
的这些点的集合便构成了
波包中心所走过的轨道
.
但是, 我们要提醒一下, 严格说来, 粒子本身是永远没有什么轨道可言的;
事实上, 粒子的态是由波包的整体来描述的, 而波包当然在空间占有一定的范围.
然而, 可以想见, 如果这个宽度和问题所涉及的其他长度相比是很小的,
我们就可以将波包近似地用其中心来代替, 在这种极限情况下,
对粒子的量子描述与经典描述就不应该有显著的差异了.
因而, 重要的是, 我们必须知道下述问题的答案:
波包中心的运动是否遵从经典规律? 埃伦费斯特定理就提供了这个问题的答案.
在宏观极限下 (与势函数在其上有显著变化的距离相比, 德布罗意波长甚小),
我们可以构成充分狭窄的波包, 而同时又将动量的不确定度保持在合理的限度之内,
于是波包的运动实际上就是处在势场 V(r) 中的质量为 m 的经典粒子的运动.
我们在这里得到的结果是非常重要的, 因为这个结果可以用来证明,
在大多数宏观体系可以满足的某些极限条件下, 从薛定谔方程可以得到经典力学方程.
保守体系的情况
如果一个物理体系的哈密顿函数不明显地依赖于时间, 我们就称该体系是保守的,
在经典力学中, 这种情况的最重要的后果就是 (对时间而言的) 能量守恒.
或者说体系的总能量是一个运动常量.
在这一节里, 我们将会看到, 在量子力学中情况也一样,
保守体系除了具备上一节所说的普遍性质外, 还具有一些特别重要的性质.
- 处在
\(H\)
的本征态中的体系的一切物理性质, 都不随时间而变; 由于这个原因, 我们称
\(H\)
的本征态为
定态
. 同样有意义的是, 分析一下在量子力学中保守体系的能量守恒是怎样出现的.- 假设在时刻 \(t_0\). 我们测量这个体系的能量, 譬如得到的结果是 \(E_k\).
- 刚测量之后, 体系处于 \(H\) 的属于本征值 \(E_k\) 的一个本征态 (关于波包收缩的假定).
- 刚才我们看到, \(H\) 的本征态都是定态, 因此, 在第一次测量之后, 体系的态不再演变而总是保持在 \(H\) 的属于本征值 \(E_k\) 的本征态.
- 由此可以推知, 在以后的任一时刻 \(t\), 第二次测量体系的能量, 必将总是得到和第一次相同的结果 \(E_k\).
- 按定义, 运动常量是这样一个可观察量
\(A\),
它不明显地依赖于时间, 并且可以和
\(H\)
对易:
- \[\begin{cases} \frac{\partial A}{\partial t} = 0 \\ [A, H] = 0 \end{cases}\]
- 由此可见, 对于保守体系来说, \(H\) 本身就是一个运动常量.
- 现在我们来证明运动常量的一些重要性质.
- (i) 不论物理体系处于什么态
\(\mid ψ(t) \rangle\),
在这个态中
\(A\)
的平均值不随时间而变 (
运动常量
的名称便由此而来). - (ii) 为简单起见, 假设 \(H\) 与 \(A\) 的谱都是离散的; 指标 \(τ\) 用来标记与 \(H\) 和 \(A\) 一起构成一个 CSCO 的那些观察算符的本征值.
- \(\mid φ_{n, p, τ} \rangle\) 态既然是 \(H\) 的本征态, 当然都是定态. 如果在初时刻, 体系处于 \(\mid φ_{n, p, τ} \rangle\) 态, 那么它将一直处于这个态 (除一个总的相位因子以外).
- 但是态
\(\mid φ_{n, p, τ} \rangle\)
也是
\(A\)
的本征态, 当
\(A\)
为运动常量时, 物理体系便有这样一些定态 (即态
\(\mid φ_{n, p, τ} \rangle\)),
在任何时刻
\(t\),
这些态都保持为
\(A\)
的属于同一本征值
(\(a_p\))
的本征态. 由于这个原因, 我们称
\(A\)
的本征值为
好量子数
. - (iii) 在任意态 \(\mid ψ (t) \rangle\) 中测量运动常量 \(A\), 得到本征值 \(a_p\) 的概率是不随时间而变的.
- (i) 不论物理体系处于什么态
\(\mid ψ(t) \rangle\),
在这个态中
\(A\)
的平均值不随时间而变 (
- \(ΔE ⋅ Δt \simeq Δx ⋅ Δp \gtrsim \hbar\) 通常叫做第四海森伯不确定度关系式. 它和关于 \(R\) 与 \(P\) 的三个分量的那三个不确定度关系式显然不同. 事实上, 在 \(ΔE ⋅ Δt \gtrsim \hbar\) 中, 只有能量才和 \(R\) 与 \(P\) 一样是物理量, 而 \(t\) 则是一个参变量, 在量子力学中没有任何算符和它相联系.
叠加原理和物理上的预言
概率幅与干涉效应
- 将
\(\mid ψ \rangle\)
看作态的统计混合是错误的,
因为这种解释丢掉了公式中双重标量积所包含的全部干涉效应.
- 此外, 我们还看到, 起重要作用的不仅是 \(λ_1\) 和 \(λ_2\) 的模, \(λ_1\) 和 \(λ_2\) 的相对相位也有重要的作用, 因为相对相位通过 \(λ_1 λ_2^{*}\), 而明显地出现在物理预言中.
相对相位
- 从前面的讨论可以引申出下面的概念:
- (i) 量子理论中的概率型预言一概得自
概率幅
, 计算时要取它的模的平方. - (ii) 在一个确定的实验中, 如果没有进行中间阶段的测量, 那么, 我们绝不能根据中间测量可能得到的各种结果的概率, 而应根据它们的概率幅来分析问题.
- (iii) 一个物理体系的态可以线性叠加, 这意味着: 一个概率幅往往表现为若干部分幅之和, 因而对应的概率等于若干项之和的模的平方, 而且那些部分幅是彼此相干的.
- (i) 量子理论中的概率型预言一概得自
若干个态与同一测量结果相联系的情况
- 杨氏双狭缝实验. 为了计算在
\(M\)
点探测到光子的概率密度, 必须将狭缝
\(A\)
和
\(B\)
所辐射的电场加起来, 然后将所得结果平方 (即
和的平方
).- 在区间
\([x_1, x_2]\)
中找到光子的概率则等于在
\(x_1\)
和
\(x_2\)
之间各点的概率密度的总和 (即
平方的和
).
- 在区间
\([x_1, x_2]\)
中找到光子的概率则等于在
\(x_1\)
和
\(x_2\)
之间各点的概率密度的总和 (即
归结一下, 从这一段的讨论中, 必须抓住的基本概念可以简要地叙述如下:
将对应于同一末态的诸概率幅相加, 然后将对应于正交末态的诸概率相加.
- (i) 通过这个例子可以更清楚地看出
波包的收缩
的具体含意. - (ii) 如果将处在同一状态 \(\mid ψ \rangle\) 的大量粒子一个个地送入仪器, 那么我们得到的结果将忽而是”是”, 忽而是”否” (各以概率 \(\mathcal{P}(\mbox{是})\) 和 \(\mathcal{P}(\mbox{否})\) 出现), 若结果是”是”, 则粒子将以”切削”过的新态继续前进, 若结果是”否”, 就表示粒子被障板吸收.
附录
附录原本在卷二末, 但我觉得其实应该放在卷一. 估计是第一卷太厚了, 哈哈~
傅立叶级数和傅立叶变换
物理学家讲数学就是更具
实在性
~
傅立叶级数
- 设
\(f(x)\)
是基本周期为
\(L\)
的周期函数. 若此函数满足某些数学条件 (在物理学中实际上都得以满足),
我们即可将它展成
虚指数函数
或三角函数
的级数.虚指数函数
的级数, 我们可将 \(f(x)\) 写成下列形式:- \[f(x) = \sum_{n = - \infty}^{+ \infty} c_n e^{i k_n x}\]
- 其中 \(k_n = n \frac{2π}{L}\)
- 傅里叶级数的系数 \(c_n\) 由下列公式给出:
- \[c_n = \frac{1}{L} \int_{x_0}^{x_0 + L} dx e^{- i k_n x} f(x)\]
- 其中 \(x_0\) 为任意实数.
- 我们称
\(| c_n |\)
的集合为
\(f(x)\)
的
傅里叶谱
.- 注意, 当而且仅当 \(c_{-n} = c^{*}_n\) 时, \(f(x)\) 才是实函数.
余弦级数和正弦级数, 不如: 复数表示
- 帕塞瓦尔定理
-
\[\frac{1}{L} \int_{x_0}^{x_0 + L}
dx \mid f(x) \mid^2 =
\sum_{n = - \infty}^{+ \infty}
\mid c_n \mid^2\]
- 设有周期都是 \(L\) 的两个函数 \(f(x)\) 和 \(g(x)\), 它们的傅里叶系数分别为 \(c_n\) 和 \(d_n\), 则可将上式推广为下列形式:
- \[\frac{1}{L} \int_{x_0}^{x_0 + L} dx g^{*}(x) f(x) = \sum_{n = - \infty}^{+ \infty} d^{*}_{n} c_n\]
傅立叶变换
-
作为傅里叶级数的极限的傅里叶积分
-
现在我们来考虑一个函数 \(f(x)\), 不一定是周期性的, 再定义 \(f_L (x)\) 为周期等于 \(L\) 的周期函数, 它在区间 \([-L/2, L/2]\) 上同于 \(f(x)\), 我们可将 \(f_L (x)\) 展为傅里叶级数.
- 若 \(L\) 趋向无穷大, \(f_L (x)\) 便与 \(f(x)\) 重合. 我们若令
- \[\tilde{f} (k) = \frac{1}{\sqrt{2 \pi}} \int_{- \infty}^{+ \infty} dx e^{-ikx} f(x)\]
- 则在 \(L\) 为无穷大的极限情况下:
- \[f(x) = \frac{1}{\sqrt{2 \pi}} \int_{- \infty}^{+ \infty} dke^{ikx} \tilde{f}(k)\]
- 我们称 \(f(x)\) 和 \(\tilde{f} (k)\) 互为傅里叶变换.
量子力学中的傅里叶变换
- 在量子力学中, 我们通常使用略微不同的惯例: 设
\(ψ(x)\)
是一个 (一维的) 波函数, 则其傅里叶变换
\(\overset{-}{ψ}(p)\)
的定义为:
- \[\overset{-}{ψ} (p) = \frac{1}{\sqrt{2 \pi \hbar}} \int_{- \infty}^{+ \infty} dx e^{-ipx / \hbar} ψ(x)\]
- 而相反的公式则为:
- \[ψ(x) = \frac{1}{\sqrt{2 \pi \hbar}} \int_{- \infty}^{+ \infty} dpe^{ipx / \hbar} \overset{-}{ψ} (p)\]
简单性质
: 讲的比较简单~
- 两个函数
\(ψ_1 (x)\)
和
\(ψ_2 (x)\)
的
卷积
定义为下式给出的函数 \(ψ(x)\):- \[ψ(x) = \int_{- \infty}^{+ \infty} dy ψ_1 (y) ψ_2 (x - y)\]
- 此函数的傅里叶变换正比于 \(ψ_1 (x)\) 和 \(ψ_2 (x)\) 的傅里叶变换的普通乘积:
- \[\overset{-}{ψ} (p) = \sqrt{2 \pi \hbar} \overset{-}{ψ_1} (p) \overset{-}{ψ_2} (p)\]
- 傅里叶变换保持模方不变:
- \[\int_{- \infty}^{+ \infty} dx \mid ψ(x) \mid^2 = \int_{- \infty}^{+ \infty} dp \mid \overset{-}{ψ} (p) \mid^2\]
帕塞瓦-普朗克尔公式
也可以推广为:- \[\int_{- \infty}^{+ \infty} dx φ^{*} (x) ψ(x) = \int_{- \infty}^{+ \infty} dp \overset{-}{φ}^{*} (p) \overset{-}{ψ} (p)\]
三维空间中的傅里叶变换
此章节可对比阅读: 陶哲轩实分析, 傅里叶级数; 陶哲轩的推进顺序会更加一气呵成~
狄拉克的 δ 函数
δ 函数其实是一种分布. 下面我们将从物理观点来考虑它, 并将它作为普通函数来处理;
这种方法在数学上虽不严格, 但对它在量子力学中的应用来说, 是可令人满意的.
- \(ε\)
越小, 近似程度越高. 因此, 我们过渡到极限
\(ε = 0\)
并以下式来定义
\(δ\)
函数:
- \[\int_{- \infty}^{+ \infty} dx δ(x) f(x) = f(0)\]
- 对于在原点有定义的一切函数 \(f(x)\), 此式都成立. 一般地, \(δ(x - x_0)\) 的定义为:
- \[\int_{- \infty}^{+ \infty} dx δ(x - x_0) f(x) = f(x_0)\]
- 附注: 其实, 式中的积分符号在数学上是不合理的, 我们应严格地将 \(δ\) 定义为一种广义函数, 而不是定义为一个函数.
- 从物理的观点看来, 这个区别并不重要, 在物理学中, 只要 \(ε\) 对给定问题所涉及的一切长度而言都可以忽略, 这就是说, 只要我们可能必须考虑的一切函数 \(f(x)\) 在宽度为 \(ε\) 的区间上没有明显的变化, 我们就不可能区别 \(δ^{(ε)} (x)\) 和 \(δ(x)\).
- 在这里每当遇到数学上的困难时, 我们只需设想 \(δ(x)\) 其实就是 \(δ^{(ε)} (x)\) 或一个类似的函数, 但更为平滑, 而 \(ε\) 非常小但不严格为零.
趋向于 δ 的函数
-
\(δ\) 的性质:
- (i) \(δ(-x) = δ(x)\)
- (ii) \(δ(cx) = \frac{1}{|c|} δ(x)\)
- (iii) \(x δ(x - x_0) = x_0 δ(x - x_0)\)
- 更一般地, 有: \(g(x) δ(x - x_0) = g(x_0) δ(x - x_0)\)
- (iv) \(\int_{- \infty}^{+ \infty} dx δ(x - y) δ(x - z) = δ(y - z)\)
δ 函数和傅里叶变换
三维空间中的 δ 函数
-
\[\int d^3 r δ(\mathbf{r} - \mathbf{r}_0) f(\mathbf{r}) =
f(\mathbf{r}_0)\]
- 我们可将 \(δ(\mathbf{r} - \mathbf{r}_0)\) 分解为三个一维函数的乘积:
- \[δ(\mathbf{r} - \mathbf{r}_0) = δ(x - x_0) δ(y - y_0) δ(z - z_0)\]
- 或利用极坐标将它写作:
- \[\begin{align} δ(\mathbf{r} - \mathbf{r}_0) & = \frac{1}{r^2 \sin θ} δ(r - r_0) δ(θ - θ_0) δ(φ - φ_0) \\ & = \frac{1}{r^2} δ(r - r_0) δ(\cos θ - \cos θ_0) δ(φ - φ_0) \end{align}\]
- 前面列举的
\(δ(x)\)
的性质很容易推广到
\(δ(\mathbf{r})\).
此外, 我们再提出一个重要的关系式:
- \[Δ (\frac{1}{r}) = - 4 \pi δ(\mathbf{r})\]
- 其中 \(Δ\) 是拉普拉斯算符.
本书
拉普拉斯算符
的符号貌似非主流~
经典力学中的拉格朗日函数和哈密顿函数
添加这一章作为附录, 作者也是用心~
质点组; 惯性系
- 如果我们涉及的体系含有
\(n\)
个质点, 那么, 可将基本定律应用于它们当中的每一个:
- \[m_i \ddot{\mathbf{r}}_i = \mathbf{F}_i\]
- \[i = 1, 2, ..., n\]
作用于这些粒子的力可以分为两类:
内力, 它们表示体系内诸粒子间的相互作用;
外力, 它们来源于体系的外部.
我们假定内力服从作用与反作用相等的原理, 也就是说,
粒子 (i) 施于粒子 (j) 的力和粒子 (j) 施于粒子 (i) 的力大小相等, 方向相反.
这个原理已为引力 (牛顿定律) 和静电力所证实,
但没有为磁力所证实 (这种力具有相对论性的起因).
磁力: 相对论性
- 如果所有的力都导自一个势, 则上述运动方程组便可写作:
- \[m_i \ddot{\mathbf{r}}_i = - \nabla_{i} V\]
- 其中 \(\nabla_i\) 表示对于坐标 \(\mathbf{r}_i\) 的梯度, 势能 \(V\) 具有下列形式:
- \[V = \sum_{i = 1}^{n} V_i (\mathbf{r}_i) + \sum_{i < j} V_{ij} (\mathbf{r}_i - \mathbf{r}_j)\]
- (式中第一项来自外力, 第二项来自内力).
- 在直角坐标系中, 体系的运动是由
\(3n\)
个微分方程来描述的:
- \[m_i \ddot{x}_i = - \frac{\partial V}{\partial x_i}\]
- \[m_i \ddot{y}_i = - \frac{\partial V}{\partial y_i}\]
- \[m_i \ddot{z}_i = - \frac{\partial V}{\partial z_i}\]
- \[i = 1, 2, ..., n\]
注: 字母头上一个点表示一阶导数, 两个点表示二阶导数~
1 体系的质心像一个质点那样运动, 该质点的质量等于体系的总质量,
它所受的力等于作用于体系的所有力的合力;
2 对一个固定点所取的角动量对时间的导数等于对该点的力矩;
3 在两个时刻 t1 和 t2 之间动能的变化等于所有的力在此两时刻之间的运动中所作的功.
如果内力服从作用与反作用相等的原理, 而且它们的方向沿着相互作用的粒子间的连接线,
那么, 它们对合力的贡献和对相对于原点的矩的贡献都等于零.
再进一步, 若所考察的体系是孤立的 (即它不受任何外力的作用),
则总角动量为一常量, 于是质心作匀速直线运动, 这就意味着总动量也是一个运动常量.
拉格朗日函数和拉格朗日方程
- 很多物理体系 (例如含有一个或多个固体的体系) 在某一给定的时刻可以由
\(N\)
个独立参数
\(q_i\)
\((i = 1, 2, ..., N)\)
的集合来描述, 这些参数叫做
广义坐标
, 知道了 \(q_i\) 就可以算出体系中任意点在空间的位置; 从而体系的运动便由 \(N\) 个时间函数 \(q_i (t)\) 来描述. 对时间的导数 \(\dot{q}_i (t)\) 叫做广义速度
.- 在某一给定时刻 \(t_0\), 体系的态便决定于全体 \(q_i (t_0)\) 和 \(\dot{q}_i (t_0)\).
- 若作用于体系的力导自一个势能 \(V (q_1, q_2, ..., q_N)\), 则拉格朗日函数 \(\mathcal{L} (q_1, q_2, ..., q_N; \dot{q}_1, \dot{q}_2, ..., \dot{q}_N)\) 仍然等于总动能 \(T\) 和势能 \(V\) 之差.
- 可以证明, 不论选用什么坐标 \(q_i\), 运动方程都可以写作:
- \[\frac{d}{dt} \frac{\partial \mathcal{L}}{\partial \dot{q}_i} - \frac{\partial \mathcal{L}}{\partial q_i} = 0\]
- 其中
\(\frac{d}{dt}\)
表示时间的
全导数
: - \[\frac{d}{dt} = \frac{\partial}{\partial t} + \sum_{i = 1}^{N} \dot{q}_i \frac{\partial}{\partial q_i} + \sum_{i = 1}^{N} \ddot{q}_i \frac{\partial}{\partial \dot{q}_i}\]
全导数
可以参见: 陶哲轩实分析, 多元微分学
- 其实, 为了定义一个拉格朗日函数并运用拉格朗日方程组, 不一定要假设力导自势能.
在普遍情况下, 拉格朗日函数是坐标
\(q_i\)
和速度
\(\dot{q}_i\)
的函数, 可能还明显地依赖于时间, 于是可将它写作:
- \[\mathcal{L} (q_i, \dot{q}_i; t)\]
哈密顿函数和正则方程
- 坐标的共轭动量 我们将广义坐标
\(q_i\)
的共轭动量
\(p_i\)
定义为:
- \[p_i = \frac{\partial \mathcal{L}}{\partial \dot{q}_i}\]
- \(p_i\)
又叫做
广义动量
. - 在粒子体系所受的力导自一个势能的情况下, 位置变量 \(\mathbf{r}_i (x_i, y_i, z_i)\) 的共轭动量其实就是机械动量:
- \[\mathbf{p}_i = m_i \dot{\mathbf{r}}_i\]
- 但是, 后面我们将会看到, 存在着磁场时, 情况并不如此.
留意
共轭
一词在不同上下文的出现~
- 今后, 我们不再用
\(N\)
个坐标
\(q_i (t)\)
和
\(N\)
个速度
\(\dot{q}_i (t)\),
而用
\(2N\)
个变量:
- \(\{ q_i (t), p_i (t); i = 1, 2, ..., N \}\) 来描述体系在给定时刻 \(t\) 的态.
- 这等于假设根据 \(2N\) 个参变量 \(q_i (t)\) 和 \(p_i (t)\) 我们就可以唯一地确定各 \(\dot{q}_i (t)\).
- 注意, 哈密顿量总是等于体系的
总能量
.- 正则方程组:
- \[\begin{align} \frac{d \mathbf{r}_i}{dt} & = \frac{\mathbf{p}_i}{m_i} \\ \frac{d \mathbf{p}_i}{dt} & = - \nabla_i V \\ \end{align}\]
- 等价于牛顿方程组.
最小作用量原理
此一节, 个人觉得比
费曼物理学讲义
同名章节讲得好~ 本书的风格属于守正
, 我不敢说费曼物理学讲义
是出奇
. 但是费曼物理学讲义
的部分章节, 更适合掌握了相关知识之后再去思考启迪~
- 在一般情况下, 假设所研究的物质体系由
\(N\)
个广义坐标
\(q_i\)
来描述 (若体系含有
\(n\)
个粒子, 它们在三维空间中运动, 则
\(N = 3n\)).
比较方便的办法是将这些
\(q_i\)
解释为
\(N\)
维欧几里得空间
\(R_N\)
中的一个点
\(Q\)
的坐标; 这样, 在体系的各位置和
\(R_N\)
的各点之间便存在着一一对应的关系.
- 与体系的每一个运动都联系着 \(R_N\) 中的点 \(Q\) 的一个运动; 后一种运动可以用 \(N\) 维空间中的一个矢量函数 \(Q(t)\) 来描述, 它的分量就是诸 \(q_i (t)\).
- 和一维运动中的单个粒子的简单情况相似, 我们可以用
\(Q(t)\)
的图形来表示
\(Q\)
点的, 亦即体系的运动, 这种图形就是
\((N + 1)\)
维的
空-时
中的一条曲线 (时间轴已添加到 \(R_N\) 的 \(N\) 维上). - 这条曲线就可以用来描述我们所研究的运动的特征.
最小作用量原理
可以陈述如下: 在连接 \((Q_1, t_1)\) 和 \((Q_2, t_2)\) 的所有空-时
途径中, 实际上得以遵循的 (即描述体系的实际运动的) 是其作用量最小的一条途径.- 换句话说, 从实际上得以遵循的途径过渡到无限邻近的另一途径, 作用量没有第一级的变化.
- 我们还可注意这和其他一些变分原理, 诸如光学中的
费马原理
的相似性.
变分
结: 2024 年 7 月