复习线性算符的常用性质
算符的迹
在一个任意的基中, 表示算符 A 的矩阵的对角元之和与这个基无关.
我们可以通过基的变换来证明这个性质.
- 如果算符
\(A\)
是一个观察算符, 我们就可以在由
\(A\)
的本征矢构成的基中去计算
\(Tr \mbox{ } A\).
这时矩阵的对角元素就是
\(A\)
的诸本征值
\(a_n\)
(它的简并度是
\(g_n\)),
因而算符的迹可以写作:
- \[Tr \mbox{ } A = \sum_{n} g_n a_n\]
- 重要性质
- \[Tr \mbox{ } AB = Tr \mbox{ } BA\]
- \[Tr \mbox{ } ABC = Tr \mbox{ } BCA = Tr \mbox{ } CAB\]
- 一般地说, 对于若干算符的各种循环排列, 这些算符之积的迹是不变的.
算符的函数
- 怎样更普遍地定义一个算符的任意函数呢? 为此, 我们考虑一个变量
\(z\)
的函数
\(F\).
假设在一定的区间内可以将
\(F\)
展成
\(z\)
的幂级数:
- \[F(z) = \sum_{n = 0}^{\infty} f_n z^n\]
- 按定义, 算符 \(A\) 的对应函数是算符 \(F(A)\), 它是以上式中的 \(f_n\) 为系数的 \(A\) 的幂级数
- \[F(A) = \sum_{n = 0}^{\infty} f_n A^n\]
- 若 \(\mid φ_a \rangle\) 是算符 \(A\) 的本征矢, 属于本征值 \(a\), 则 \(\mid φ_a \rangle\) 也是算符 \(F(A)\) 的本征矢, 属于本征值 \(F(a)\).
-
有了这个性质, 我们就可以提出算符函数的第二个定义: 我们考虑一个可对角化的算符 \(A\) (只要 \(A\) 是观察算符, 这总是可以的), 现在取这样一个基, 在其中表示 \(A\) 的矩阵是对角的 (因而非零矩阵元就是 \(A\) 的诸本征值 \(a_i\)); 按定义, \(F(A)\) 是这样一个算符, 它在这同一个基中由元素为 \(F(a_i)\) 的对角矩阵表示.
-
应用算符函数时, 必须注意算符的顺序. 例如, 若 \(A\) 和 \(B\) 都是算符而不是数, 则一般说来算符 \(e^A e^B\), \(e^B e^A\) 以及 \(e^{A + B}\) 是不相等的.
- 算符
\(A\)
与
\(A\)
的任何函数都是对易的:
- \[[A, F(A)] = 0\]
- 同样, 若 \(A\) 与 \(B\) 是对易的, 则 \(F(A)\) 与 \(B\) 也是对易的:
- \[[B, A] = 0 \Rightarrow [B, F(A)] = 0\]
- 那么, 一个算符和一个同它不可对易的算符的函数的对易子又是怎样的呢?
在这里, 我们只考虑关于算符
\(X\)
和
\(P\)
的情况, 它们的对易子是:
- \[[X, P] = i \hbar\]
- 则有:
- \[[X, F(P)] = i \hbar F'(P)\]
- \[[P, G(X)] = -i \hbar G'(X)\]
算符的导数
-
\[(\frac{dA}{dt})_{ij} = \frac{d}{dt} A_{ij}\]
- 于是我们得到一个很简单的规则: 要得到表示 \(\frac{dA}{dt}\) 的矩阵的各元素, 只须将表示 \(A\) 的矩阵中的各元素求导 (但不改变元素的位置).
- 这些法则和我们熟知的普通函数的求导法则相似:
- \[\frac{d}{dt} (F + G) = \frac{dF}{dt} + \frac{dG}{dt}\]
- \[\frac{d}{dt} (FG) = \frac{dF}{dt} G + F \frac{dG}{dt}\]
- 但是必须注意, 公式中算符的顺序不能改动.
幺正算符
幺正: 幺 (一); 正 (酉)
- (i) 若
\(A\)
是厄米算符, 则
\(T = e^{iA}\)
是幺正算符; 因为, 我们有:
- \[T^{\dagger} = e^{-i A^{\dagger}} = e^{-i A}\]
- (ii) 两个幺正算符的乘积也是幺正算符.
-
(iii) 在三维实矢量的普通空间中, 我们也知道某些算符保持模方和标量积不变. 例如, 表示旋转的算符, 表示相对于某点或某平面对称的算符, 等等. 在这种情况下 (实空间), 我们说这些算符是正交的; 幺正算符则是正交算符在 (任意多维) 复空间中的推广.
- 如果一个矩阵是幺正的, 那么, 一列元素与另一列的对应元素的共轭复数的乘积之和:
- 等于零 (若这两列是不同的).
- 等于 \(1\) (若这两列是相同的).
- 幺正算符的本征值只能是模为
\(1\)
的复数, 即
- \(u = e^{i φ_u}\), 其中 \(φ_u\) 为实数
- 幺正算符的属于互异本征值的两个本征矢是正交的.
算符的幺正变换
-
\[\widetilde{A} = U A U^{\dagger}\]
- 上式可以看作经过幺正变换 \(U\) 而得到的算符 \(A\) 的变换 \(\widetilde{A}\) 的定义. 在量子力学中, 我们经常要用到这样的变换.
-
一般地说, 我们得到下述规则: \(A\) 的变换 \(\widetilde{A}\) 的本征矢就是 \(A\) 的本征矢 \(\mid φ_a \rangle\) 的变换 \(\mid \widetilde{φ}_a \rangle\); 本征值不变.
- 一般地, 我们有
- \[(\widetilde{A})^n = \widetilde{A^n}\]
- 很容易证明:
- \[\widetilde{F}(A) = F(\widetilde{A})\]
- 式中 \(F(A)\) 是算符 \(A\) 的函数.
对物理体系的一部分的测量
- 在测量之前, 不论总体系的态 \(\mid ψ \rangle\) 如何, 在对子体系 (1) 进行测量之后, 只要测量对于子体系 (1) 而言是完全的 (虽然对于总体系 (1) + (2) 来说是不完全的), 体系的态就一定是一个张量积.
张量积状态的物理意义
- 我们可以认为: 乘积态
\(\mid ψ (1) \rangle \otimes \mid χ (2) \rangle\)
表示两个体系的简单并列, 其中一个处于态
\(\mid ψ (1) \rangle\),
另一个处于态
\(\mid χ (2) \rangle\).
- 我们还可以说, 处于这种态时, 两个体系是没有相互联系的 (更精确地说, 对一个体系或对另一个体系进行的两种测量的结果对应于独立的随机变量).
- 使两个体系分别处于态 \(\mid ψ (1) \rangle\) 和 \(\mid χ (2) \rangle\), 再将两者联合起来而又不使它们之间发生相互作用, 这样就实现了上述的状态.
非张量积状态的物理意义
- 如果总体系的态不是张量积
\(\mid ψ (1) \rangle \otimes \mid χ (2) \rangle\),
我们就不能再使用右矢
\(\mid ψ (1) \rangle\)
(或
\(\mid χ (2) \rangle\)),
那么这时应该怎样描述子体系 (1) 或 (2) 的态呢?
- 这个问题是十分重要的, 因为, 一般说来, 每一个物理体系过去都曾和其他体系发生过相互作用 (即使在我们研究它的那个时刻它已被孤立起来).
- 因而, 总体系 (即子体系 (1) 加上它过去曾与之有过相互作用的子体系 (2)) 的态一般都不是乘积态, 我们就不能只用一个态矢量 \(\mid ψ (1) \rangle\) 去描述子体系 (1).
- 为了解决这个困难, 不能再用态矢量, 而必须用一个算符,
即所谓
密度算符
, 去描述子体系 (1).
但是, 如果对子体系 (1) 进行过一组完全的测量,
那么, 我们总可以用一个态矢量来表示它的态.
事实上, 不论测量以前总体系 (1) + (2) 的态如何,
我们已经看到, 对子体系 (1) 所实施的完全测量,
将使总体系处于乘积态, 这时, 与子体系 (1) 相联系的态矢量
(除倍乘因子以外) 是唯一的本征矢,
它与对该子体系所实施的一组完全测量的结果相联系. 因此,
这组测量便消除了两个子体系之间因以前的相互作用而形成的一切相互联系.
如果在进行测量的时刻, 子体系 (2) 已经远离子体系 (1),
以致它们之间不再发生相互作用, 那么我们就可以完全不考虑前者的存在.
密度算符
- 在量子力学中, 我们所具备的关于某一体系的不完备的知识,
往往表现为如下的形式: 该体系的态或者是
\(\mid ψ_1 \rangle\)
(它出现的概率是
\(p_1\)),
或者是
\(\mid ψ_2 \rangle\)
(它出现的概率是
\(p_2\)),
…. 显然, 应有
- \[p_1 + p_2 + ... = \sum_{k} p_k = 1\]
- 因此, 我们所涉及的是概率分别为
\(p_1\),
\(p_2\),
… 的诸态
\(\mid ψ_1 \rangle\),
\(\mid ψ_2 \rangle\),
… 的
统计混合
. - 各种态 \(\mid ψ_1 \rangle\), \(\mid ψ_2 \rangle\), … 不一定是正交的; 但是我们总可以将它们取作归一化的.
必须注意, 在我们现在所研究的问题中, 概率出现在两个不同的阶段:
首先, 出现在关于体系初态的知识中; 其次, 出现在应用有关测量的假定时
(即使体系的初态是完全知道的, 这些假设也只导致概率型的预言).
因此, 在两个阶段都必须引入概率的理由是完全不同的:
一种理由是关于体系的态的初始知识不完备 (在经典统计力学中也考虑过这种情况).
另一种理由是与测量过程有关的 (特别是量子力学的) 不确定性.
- 在研究普遍情况之前, 在这一段里, 我们先回到简单情况,
即体系的态是完全知道的 (全部
\(p_k\)
中除一个以外, 其他的都等于零). 这时我们说体系处于
纯态
.- 我们将证明, 用态矢量 \(\mid ψ \rangle\), 或用在态空间中起作用的某种算符, 即密度算符, 去描述这个体系, 完全是等价的.
纯态的情况
- 使用密度算符, 概率守恒的表达式就成为:
- \[Tr ρ(t) = 1\]
- 可观察量 \(A\) 的平均值则用下列公式来计算:
- \[\langle A \rangle (t) = Tr \{ A ρ(t) \} = Tr \{ ρ(t) A \}\]
- 而 \(ρ(t)\) 随时间的演变则遵从下列方程
- \[i \hbar \frac{d}{dt} ρ(t) = [H(t), ρ(t)]\]
- 为了完整起见, 我们还必须说明: 在时刻
\(t\)
测量可观察量
\(A\),
得到任一个结果
\(a_n\)
的概率
\(\mathcal{P}(a_n)\),
怎样用
\(ρ(t)\)
来计算.
- 其实, 我们知道 \(\mathcal{P}(a_n)\) 可以写作一个算符的平均值, 这个算符就是与 \(a_n\) 相联系的本征子空间上的投影算符 \(P_n\), 即:
- \[\mathcal{P}(a_n) = \langle ψ(t) \mid P_n \mid ψ(t) \rangle\]
- 进一步得到:
- \[\mathcal{P}(a_n) = Tr \{ P_n ρ(t) \}\]
态的统计混合
- 我们已经给出了根据
\(ρ\)
来计算概率
\(\mathcal{P} (a_n)\)
的表达式, 利用这个表达式, 就不难推广到态的统计混合:
- \[\begin{align} \langle A \rangle & = \sum_{n} a_n \mathcal{P} (a_n) \\ & = Tr \{ ρ \sum_{n} a_n P_n \} \\ & = Tr \{ ρ A \} \\ \end{align}\]
- 事实上, 由于
\(ρ\)
不再是投影算符, 故一般说来
- \[ρ^2 ≠ ρ\]
- 从而
- \[Tr ρ^2 ≤ 1\]
部分迹的概念
- (i) 我们已经看到, 如果总体系
\(\{ (1) + (2) \}\)
的态不是乘积态, 就不可能给体系
\((1)\)
(或体系
\((2)\))
指定一个态矢量. 现在我们看到, 密度算符是一个比态矢量简单得多的工具.
- 事实上, 在一切情况下 (不论总体系是处于乘积态或非乘积态, 也不论是纯态情况或统计混合的情况), 因为可以取部分迹, 我们总可以给子体系 \((1)\) (或 \((2)\)) 指定一个密度算符, 并可以用它去计算与该子体系有关的一切物理预言.
- (ii) 即使
\(ρ\)
描述的是一个纯态
(\(Tr ρ^2 = 1\)),
一般说来, 取
\(ρ\)
的部分迹所得的密度算符
\(ρ(1)\)
和
\(ρ(2)\)
并不描述纯态; 可以验证
\(Tr \{ ρ^2(1) \}\)
一般不等于 \(1\)
(\(Tr \{ ρ^2(2) \}\)
的情况相同);
- 这样, 我们就又从另一个角度看到了这一事实: 除总体系的态是一乘积态的情况之外, 一般说来, 不可能给体系 \((1)\) (或体系 \((2)\)) 指定一个态矢量.
- (iii) 如果总体系的态是一个乘积态:
- \[\mid ψ \rangle = \mid φ(1) \rangle \mid χ(2) \rangle\]
- 我们立即可以证明, 对应的密度算符可以写作:
- \[ρ = σ(1) \otimes τ(2)\]
- 其中
- \[σ(1) = \mid φ(1) \rangle \langle φ(1) \mid\]
- \[τ(2) = \mid χ(2) \rangle \langle χ(2) \mid\]
- 更普遍一些, 我们还可以考虑总体系的这样一些态, 即其对应的密度算符
\(ρ\)
可以分解为因子
(\(σ(1)\)
和
\(τ(2)\)
可以对应于纯态, 也可以对应于态的统计混合). 取部分迹便可得到:
- \[Tr_2 \{ σ(1) \otimes τ(2) \} = σ(1)\]
- \[Tr_1 \{ σ(1) \otimes τ(2) \} = τ(2)\]
- 因此, 表示体系 \((1)\) 和体系 \((2)\) 的简单并列, 前者由密度算符 \(σ(1)\) 所描述, 后者由密度算符 \(τ(2)\) 所描述.
- (iv) 从一个任意的 (即不能分解为因子的) 密度算符
\(ρ\)
出发, 我们先算出
\(ρ(1) = Tr_2 ρ\)
和
\(ρ(2) = Tr_1 ρ\),
再用它们构成下列的张量积:
- \[ρ' = ρ(1) \otimes ρ(2)\]
- 现在的情况和 (iii) 中考虑过的情况不一样, 一般说来, \(ρ'\) 不同于 \(ρ\). 因此, 如果密度算符不能分解, 那么在体系 \((1)\) 和 \((2)\) 之间便存在某种”相互联系”, 而这种联系不再包含在上式的算符 \(ρ'\) 中.
- (v) 如果总体系的演变由方程
\(i \hbar \frac{d}{dt} ρ(t) = [H(t), ρ(t)]\)
描述, 那么一般说来, 便不可能找到一个只与体系
\((1)\)
有关系的哈密顿算符, 并用它来写出关于
\(ρ(1)\)
的类似的方程.
- 通过 \(ρ\) 来定义每一时刻的 \(ρ(1)\) 是容易的, 但要描述 \(ρ(1)\) 的演变就困难得多.
薛定谔绘景与海森伯绘景
- 我们可以选择这样一种变换, 使得右矢
\(\mid ψ_S (t) \rangle\)
的变换式成为一个与时间无关的右矢; 当然,
上面提到过的那些可观察量经过这样的变换将依赖于时间了.
这样我们便得到了
海森伯绘景
.- 为了区别这两种绘景, 我们给薛定谔绘景中的右矢和算符加上下标 \(S\), 而在海森伯绘景中则采用下标 \(H\).
- 从历史上看, 第一种绘景是薛定谔创立的
(他根据这种绘景导出了以他的名字命名的方程),
第二种绘景则是海森伯创立的 (他推算了表示各种算符
\(A_H (t)\)
的矩阵随时间的演变, 由此出现了”矩阵力学”这个名称).
- 以后, 人们才证明了这两种表述方式是等价的.
海森伯绘景的一个优点就是在这种绘景中,
方程的形式与经典力学方程的形式相似.
遗憾, 缺失了: 相互作用绘景~