复习线性算符的常用性质
算符的迹
在一个任意的基中, 表示算符 A 的矩阵的对角元之和与这个基无关.
我们可以通过基的变换来证明这个性质.
- 如果算符
\(A\)
是一个观察算符, 我们就可以在由
\(A\)
的本征矢构成的基中去计算
\(Tr \mbox{ } A\).
这时矩阵的对角元素就是
\(A\)
的诸本征值
\(a_n\)
(它的简并度是
\(g_n\)),
因而算符的迹可以写作:
- \[Tr \mbox{ } A = \sum_{n} g_n a_n\]
- 重要性质
- \[Tr \mbox{ } AB = Tr \mbox{ } BA\]
- \[Tr \mbox{ } ABC = Tr \mbox{ } BCA = Tr \mbox{ } CAB\]
- 一般地说, 对于若干算符的各种循环排列, 这些算符之积的迹是不变的.
算符的函数
- 怎样更普遍地定义一个算符的任意函数呢? 为此, 我们考虑一个变量
\(z\)
的函数
\(F\).
假设在一定的区间内可以将
\(F\)
展成
\(z\)
的幂级数:
- \[F(z) = \sum_{n = 0}^{\infty} f_n z^n\]
- 按定义, 算符 \(A\) 的对应函数是算符 \(F(A)\), 它是以上式中的 \(f_n\) 为系数的 \(A\) 的幂级数
- \[F(A) = \sum_{n = 0}^{\infty} f_n A^n\]
- 若 \(\mid φ_a \rangle\) 是算符 \(A\) 的本征矢, 属于本征值 \(a\), 则 \(\mid φ_a \rangle\) 也是算符 \(F(A)\) 的本征矢, 属于本征值 \(F(a)\).
-
有了这个性质, 我们就可以提出算符函数的第二个定义: 我们考虑一个可对角化的算符 \(A\) (只要 \(A\) 是观察算符, 这总是可以的), 现在取这样一个基, 在其中表示 \(A\) 的矩阵是对角的 (因而非零矩阵元就是 \(A\) 的诸本征值 \(a_i\)); 按定义, \(F(A)\) 是这样一个算符, 它在这同一个基中由元素为 \(F(a_i)\) 的对角矩阵表示.
-
应用算符函数时, 必须注意算符的顺序. 例如, 若 \(A\) 和 \(B\) 都是算符而不是数, 则一般说来算符 \(e^A e^B\), \(e^B e^A\) 以及 \(e^{A + B}\) 是不相等的.
- 算符
\(A\)
与
\(A\)
的任何函数都是对易的:
- \[[A, F(A)] = 0\]
- 同样, 若 \(A\) 与 \(B\) 是对易的, 则 \(F(A)\) 与 \(B\) 也是对易的:
- \[[B, A] = 0 \Rightarrow [B, F(A)] = 0\]
- 那么, 一个算符和一个同它不可对易的算符的函数的对易子又是怎样的呢?
在这里, 我们只考虑关于算符
\(X\)
和
\(P\)
的情况, 它们的对易子是:
- \[[X, P] = i \hbar\]
- 则有:
- \[[X, F(P)] = i \hbar F'(P)\]
- \[[P, G(X)] = -i \hbar G'(X)\]
算符的导数
-
\[(\frac{dA}{dt})_{ij} = \frac{d}{dt} A_{ij}\]
- 于是我们得到一个很简单的规则: 要得到表示 \(\frac{dA}{dt}\) 的矩阵的各元素, 只须将表示 \(A\) 的矩阵中的各元素求导 (但不改变元素的位置).
- 这些法则和我们熟知的普通函数的求导法则相似:
- \[\frac{d}{dt} (F + G) = \frac{dF}{dt} + \frac{dG}{dt}\]
- \[\frac{d}{dt} (FG) = \frac{dF}{dt} G + F \frac{dG}{dt}\]
- 但是必须注意, 公式中算符的顺序不能改动.
幺正算符
幺正: 幺 (一); 正 (酉)
- (i) 若
\(A\)
是厄米算符, 则
\(T = e^{iA}\)
是幺正算符; 因为, 我们有:
- \[T^{\dagger} = e^{-i A^{\dagger}} = e^{-i A}\]
- (ii) 两个幺正算符的乘积也是幺正算符.
-
(iii) 在三维实矢量的普通空间中, 我们也知道某些算符保持模方和标量积不变. 例如, 表示旋转的算符, 表示相对于某点或某平面对称的算符, 等等. 在这种情况下 (实空间), 我们说这些算符是正交的; 幺正算符则是正交算符在 (任意多维) 复空间中的推广.
- 如果一个矩阵是幺正的, 那么, 一列元素与另一列的对应元素的共轭复数的乘积之和:
- 等于零 (若这两列是不同的).
- 等于 \(1\) (若这两列是相同的).
- 幺正算符的本征值只能是模为
\(1\)
的复数, 即
- \(u = e^{i φ_u}\), 其中 \(φ_u\) 为实数
- 幺正算符的属于互异本征值的两个本征矢是正交的.
算符的幺正变换
-
\[\widetilde{A} = U A U^{\dagger}\]
- 上式可以看作经过幺正变换 \(U\) 而得到的算符 \(A\) 的变换 \(\widetilde{A}\) 的定义. 在量子力学中, 我们经常要用到这样的变换.
-
一般地说, 我们得到下述规则: \(A\) 的变换 \(\widetilde{A}\) 的本征矢就是 \(A\) 的本征矢 \(\mid φ_a \rangle\) 的变换 \(\mid \widetilde{φ}_a \rangle\); 本征值不变.
- 一般地, 我们有
- \[(\widetilde{A})^n = \widetilde{A^n}\]
- 很容易证明:
- \[\widetilde{F}(A) = F(\widetilde{A})\]
- 式中 \(F(A)\) 是算符 \(A\) 的函数.
对物理体系的一部分的测量
- 在测量之前, 不论总体系的态 \(\mid ψ \rangle\) 如何, 在对子体系 (1) 进行测量之后, 只要测量对于子体系 (1) 而言是完全的 (虽然对于总体系 (1) + (2) 来说是不完全的), 体系的态就一定是一个张量积.
张量积状态的物理意义
- 我们可以认为: 乘积态
\(\mid ψ (1) \rangle \otimes \mid χ (2) \rangle\)
表示两个体系的简单并列, 其中一个处于态
\(\mid ψ (1) \rangle\),
另一个处于态
\(\mid χ (2) \rangle\).
- 我们还可以说, 处于这种态时, 两个体系是没有相互联系的 (更精确地说, 对一个体系或对另一个体系进行的两种测量的结果对应于独立的随机变量).
- 使两个体系分别处于态 \(\mid ψ (1) \rangle\) 和 \(\mid χ (2) \rangle\), 再将两者联合起来而又不使它们之间发生相互作用, 这样就实现了上述的状态.
非张量积状态的物理意义
- 如果总体系的态不是张量积
\(\mid ψ (1) \rangle \otimes \mid χ (2) \rangle\),
我们就不能再使用右矢
\(\mid ψ (1) \rangle\)
(或
\(\mid χ (2) \rangle\)),
那么这时应该怎样描述子体系 (1) 或 (2) 的态呢?
- 这个问题是十分重要的, 因为, 一般说来, 每一个物理体系过去都曾和其他体系发生过相互作用 (即使在我们研究它的那个时刻它已被孤立起来).
- 因而, 总体系 (即子体系 (1) 加上它过去曾与之有过相互作用的子体系 (2)) 的态一般都不是乘积态, 我们就不能只用一个态矢量 \(\mid ψ (1) \rangle\) 去描述子体系 (1).
- 为了解决这个困难, 不能再用态矢量, 而必须用一个算符,
即所谓
密度算符
, 去描述子体系 (1).
但是, 如果对子体系 (1) 进行过一组完全的测量,
那么, 我们总可以用一个态矢量来表示它的态.
事实上, 不论测量以前总体系 (1) + (2) 的态如何,
我们已经看到, 对子体系 (1) 所实施的完全测量,
将使总体系处于乘积态, 这时, 与子体系 (1) 相联系的态矢量
(除倍乘因子以外) 是唯一的本征矢,
它与对该子体系所实施的一组完全测量的结果相联系. 因此,
这组测量便消除了两个子体系之间因以前的相互作用而形成的一切相互联系.
如果在进行测量的时刻, 子体系 (2) 已经远离子体系 (1),
以致它们之间不再发生相互作用, 那么我们就可以完全不考虑前者的存在.
密度算符
- 在量子力学中, 我们所具备的关于某一体系的不完备的知识,
往往表现为如下的形式: 该体系的态或者是
\(\mid ψ_1 \rangle\)
(它出现的概率是
\(p_1\)),
或者是
\(\mid ψ_2 \rangle\)
(它出现的概率是
\(p_2\)),
…. 显然, 应有
- \[p_1 + p_2 + ... = \sum_{k} p_k = 1\]
- 因此, 我们所涉及的是概率分别为
\(p_1\),
\(p_2\),
… 的诸态
\(\mid ψ_1 \rangle\),
\(\mid ψ_2 \rangle\),
… 的
统计混合
. - 各种态 \(\mid ψ_1 \rangle\), \(\mid ψ_2 \rangle\), … 不一定是正交的; 但是我们总可以将它们取作归一化的.
必须注意, 在我们现在所研究的问题中, 概率出现在两个不同的阶段:
首先, 出现在关于体系初态的知识中; 其次, 出现在应用有关测量的假定时
(即使体系的初态是完全知道的, 这些假设也只导致概率型的预言).
因此, 在两个阶段都必须引入概率的理由是完全不同的:
一种理由是关于体系的态的初始知识不完备 (在经典统计力学中也考虑过这种情况).
另一种理由是与测量过程有关的 (特别是量子力学的) 不确定性.
- 在研究普遍情况之前, 在这一段里, 我们先回到简单情况,
即体系的态是完全知道的 (全部
\(p_k\)
中除一个以外, 其他的都等于零). 这时我们说体系处于
纯态
.- 我们将证明, 用态矢量 \(\mid ψ \rangle\), 或用在态空间中起作用的某种算符, 即密度算符, 去描述这个体系, 完全是等价的.
纯态的情况
- 使用密度算符, 概率守恒的表达式就成为:
- \[Tr ρ(t) = 1\]
- 可观察量 \(A\) 的平均值则用下列公式来计算:
- \[\langle A \rangle (t) = Tr \{ A ρ(t) \} = Tr \{ ρ(t) A \}\]
- 而 \(ρ(t)\) 随时间的演变则遵从下列方程
- \[i \hbar \frac{d}{dt} ρ(t) = [H(t), ρ(t)]\]
- 为了完整起见, 我们还必须说明: 在时刻
\(t\)
测量可观察量
\(A\),
得到任一个结果
\(a_n\)
的概率
\(\mathcal{P}(a_n)\),
怎样用
\(ρ(t)\)
来计算.
- 其实, 我们知道 \(\mathcal{P}(a_n)\) 可以写作一个算符的平均值, 这个算符就是与 \(a_n\) 相联系的本征子空间上的投影算符 \(P_n\), 即:
- \[\mathcal{P}(a_n) = \langle ψ(t) \mid P_n \mid ψ(t) \rangle\]
- 进一步得到:
- \[\mathcal{P}(a_n) = Tr \{ P_n ρ(t) \}\]