玻尔兹曼分布
背景
能量与动能
\[ \epsilon = \frac{1}{2}mv^2 \]
\[ p = mv \]
\[ \frac{p^2}{\epsilon} = \frac{m^2 v^2}{\frac{1}{2}mv^2} = 2m \]
\[ p = \sqrt{2m\epsilon} \quad \text{or} \quad \epsilon = \frac{p^2}{2m} \tag{1} \]
斯特林公式
\[ \ln n! \approx n \ln n - n \]
推导过程:
\[ \ln n! = \ln 1 + \ln 2 + \ln 3 + \cdots + \ln n = \sum_{x=1}^{n} \ln x \]
\[\begin{aligned} \sum_{x=1}^{n} \ln x &\approx \int_{1}^{n} \ln x dx\\ &= \left. x \ln x \right|_1^n - \int_1^n x d\ln x \\[8pt] &= n \ln n - \left. x \right|_1^n \\[8pt] &= n \ln n - n + 1 \end{aligned}\]在处理阿伏伽德罗常数级(\(10^{23}\))的粒子时,\(+1\) 可以忽略不计。故:
\[ \ln n! \approx n \ln n - n \]
相空间
Phase Space
在经典力学中,要描述一个质点的运动状态,需要知道它的位置 \(\mathbf{r}\) 与动量 \(\mathbf{p}\)。也就是说,我们需要 6 个参数来描述一个质点的运动状态。相空间是由这 6 个参数张成的空间,其 6 个坐标轴分别为 \(x, y, z, p_x, p_y, p_z\)。
因此相空间的体积计算公式为:
\[ \Omega = \int_x \int_y \int_z \int_{p_x} \int_{p_y} \int_{p_z} dx dy dz dp_x dp_y dp_z = \iint d^3 r d^3 p \]
相空间体积的微元为:
\[ d\Omega = d^3 r d^3 p \]
相空间的概念与能量的概念紧密相连。考虑一个粒子,其质量为 \(m\),能量(动能)为 \(\epsilon\)。在相空间中,我们有多少种办法可以分配这个粒子在相空间中的位置与动量?
位置空间
位置空间的体积为:
\[ V_q = \int_r d^3 r = V \]
动量空间
由于粒子的能量为 \(\epsilon\),根据公式 \((1)\),可得:
\[ p^2 = p_x^2 + p_y^2 + p_z^2 = 2m\epsilon \]
根据球面表达式 \(x^2 + y^2 + z^2 = r^2\),可知粒子落在动量空间中一个半径为 \(p=\sqrt{2m\epsilon}\) 的球体表面上。该球面的面积为:
\[ 4\pi p^2 \]
这意味着对于给定的能量 \(\epsilon\),我们无法得出一个适当的动量空间的体积。为此我们必须采用微分的思想,去求在能量区间 \([\epsilon, \epsilon + d\epsilon]\) 内,粒子落在动量空间中的微分体积。即:
\[ d V_p = \int_{p}^{p+dp} 4\pi p^2 dp = 4\pi p^2 dp \]
根据积分中值定理,如果 \(f\) 在该区间内连续,则存在一个介于 \(x\) 和 \(x+dx\) 之间的值 \(c\),使得:\(\displaystyle\int_x^{x+dx} f(t) dt = f(c) \cdot [(x+dx) - x] = f(c) dx\)
对公式 \((1)\) 两边求导,可得:
\[ \frac{d}{dp} \epsilon = \frac{d}{dp}\left(\frac{p^2}{2m}\right) \]
\[ d\epsilon = \frac{p}{m} dp \quad \text{or} \quad dp = \frac{m}{p} d\epsilon \tag{2} \]
根据式 \((1)(2)\),将 \(d V_p\) 表达式中的 \(p\) 替换为 \(\epsilon\),可得:
\[ d V_p = 4\pi (2m\epsilon) \left(\frac{m}{\sqrt{2m\epsilon}} d\epsilon\right) = 2\pi (2m)^{3/2} \epsilon^{1/2} d\epsilon \]
将位置空间体积与动量空间体积相乘,可得:
\[ d \Omega = V_q \cdot d V_p = V \cdot 2\pi (2m)^{3/2} \epsilon^{1/2} d\epsilon \]
\(d \Omega\) 即质量为 \(m\) 的粒子处在能量区间为 \([\epsilon, \epsilon + d\epsilon]\) 上时,对应的微分相空间体积。为了知道粒子有多少种分配在这个体积为 \(d \Omega\) 的相空间中,我们不得不将相空间离散化,即假设相空间被划分为许多小的立方体,每个立方体的大小为 \(\Delta q \cdot \Delta p\)。
虽然玻尔兹曼当时没有量子力学(即没有普朗克常数 \(h\)),但在现代半经典近似中,根据海森堡测不准原理 (\(\Delta x \Delta p \approx h\)),三维空间中一个量子态所占的相空间最小体积是 \(h^3\)。
这里的 \(h^3\) 来源于三维空间的测不准关系:\((\Delta x \Delta p_x)(\Delta y \Delta p_y)(\Delta z \Delta p_z) \ge (h)^3\)。
因此,在给定能量范围 \([\epsilon, \epsilon + d \epsilon]\) 下,单个粒子在相空间中可能的微观状态数为:
\[ \frac{d \Omega}{h^3} = \frac{V}{h^3} 2\pi (2m)^{3/2} \epsilon^{1/2} d\epsilon \]
这是一个无量纲量。
拉格朗日乘子法
\[ \nabla f = \lambda \nabla g \]
\[ L(x, y, \lambda) = f(x, y) - \lambda (g(x, y) - c) \]
- \(\displaystyle\frac{\partial L}{\partial x} = 0 \implies f_x = \lambda g_x\)
- \(\displaystyle\frac{\partial L}{\partial y} = 0 \implies f_y = \lambda g_y\)
- \(\displaystyle\frac{\partial L}{\partial \lambda} = 0 \implies g(x, y) = c\)
推导
微观状态数
假设:
- 系统中存在 \(N\) 个可区分粒子,总能量为 \(E\),总体积为 \(V\)。
- 能量 \(E\) 被分割为多个能级 \([\epsilon_i, \epsilon_i + d\epsilon_i]\),且每个能级上可以容纳的粒子数为 \(n_i\)。
- 每个能级 \([\epsilon_i, \epsilon_i + d\epsilon_i]\) 能够提供的微观状态数为 \(g_i = \frac{V}{h^3} 2\pi (2m)^{3/2} \epsilon_i^{1/2} d\epsilon_i\)。(来自我们在相空间部分的推导)
以上假设引出以下约束条件:
\[ \sum_i n_i = N \]
\[ \sum_i n_i \epsilon_i = E \]
考虑将 \(N\) 个粒子分配到能量为 \(\epsilon_i\) 的微观状态中,有多少种分配方式?
首先,从 \(N\) 个粒子中选择 \(n_1\) 个粒子分配到第一个能级 \(\epsilon_1\) 上,有以下几种情况:
\[ \binom{N}{n_1} \]
然后,从剩下的 \(N - n_1\) 个粒子中选择 \(n_2\) 个粒子分配到第二个能级 \(\epsilon_2\) 上,有以下几种情况:
\[ \binom{N - n_1}{n_2} \]
以此类推,从剩下的 \(N - n_1 - n_2\) 个粒子中选择 \(n_3\) 个粒子分配到第三个能级 \(\epsilon_3\) 上,有以下几种情况:
\[ \binom{N - n_1 - n_2}{n_3} \]
根据乘法原理和组合原理 \(\binom{n}{k} = \frac{n!}{k!(n-k)!}\),将所有情况相乘,可得将 \(N\) 个粒子分配到能量为 \(\epsilon_i\) 的微观状态中,有 \(W_1\) 种分配方式:
\[\begin{aligned} W_1 &= \binom{N}{n_1} \binom{N - n_1}{n_2} \binom{N - n_1 - n_2}{n_3} \cdots \binom{N - n_1 - n_2 - \cdots - n_{i-1}}{n_i}\\ &= \frac{N!}{n_1! \cancel{(N - n_1)!}} \cdot \frac{\cancel{(N - n_1)!}}{n_2! \cancel{(N - n_1 - n_2)!}} \cdot \frac{\cancel{(N - n_1 - n_2)!}}{n_3! \cancel{(N - n_1 - n_2 - n_3)!}} \cdots \frac{\cancel{(N - n_1 - n_2 - \cdots - n_{i-1})!}}{n_i! \cancel{(N - n_1 - n_2 - \cdots - n_{i-1} - n_i)!}}\\ &= \frac{N!}{n_1! n_2! n_3! \cdots n_i!} \end{aligned}\]即:
\[ W_1 = \frac{N!}{\prod_i n_i!} \]
考虑在每一个能级 \(\epsilon_i\) 的 \(n_i\) 个粒子,有多少种放置方式?
对于落在能级 \(\epsilon_i\) 上的这 \(n_i\) 个粒子,每个粒子都可以独立地处于该能级提供的 \(g_i\) 个微观状态中的任意一个。由于粒子是可辨的,每一个粒子都有 \(g_i\) 种选择,因此总的放置方式数为:
\[ W_2 = \prod_i g_i^{n_i} \]
结合粒子分配到能级的方式数 \(W_1\),总微观状态数为:
\[ W = W_1 \cdot W_2 = N! \prod_i \frac{g_i^{n_i}}{n_i!} \]
其中,\(\displaystyle g_i = \frac{V}{h^3} 2\pi (2m)^{3/2} \epsilon_i^{1/2} d\epsilon_i\)
玻尔兹曼分布
假设:
- 等概率假设:当系统处于平衡态时,其各个可能的微观态出现的概率相等。
- 热力学第二定律的微观解释:一个孤立系统如果最初处于非平衡状态,它会自发地向 \(W\) 值更高的宏观状态演化。当 \(W\) 达到最大值时,系统进入热平衡状态。
玻尔兹曼分布的研究目标是:通过求 \(W\) 的最大值(实际上是求 \(\ln W\) 的最大值),推导出系统处于热平衡态时分子的分布情况(即 \(n_i\) 的表达式)。
补充:为什么是 \(\ln W\) 而不是 \(W\)?
这是基于 \(S \propto \ln W\) 假设之上的。(为什么这样假设,这需要热力学的知识。)
熵 \(S\) 是系统混乱程度的度量,是广延量。如果有两个完全相同的系统(比如两盒气体),把它们合在一起,总熵等于两者之和:
\[ S_{total} = S_1 + S_2 \]
微观状态数 \(W\) 是系统微观状态数的度量,是组合量。如果系统1有 \(W_1\) 种微观状态,系统2有 \(W_2\) 种微观状态。根据概率论的乘法原理,两个系统合在一起的总状态数是两者的乘积:
\[ W_{total} = W_1 \cdot W_2 \]
那么问题来了:什么样的数学函数 \(f\) 能满足 \(f(W_1 \cdot W_2) = f(W_1) + f(W_2)\)?在数学上,满足这个性质的唯一基本函数就是对数函数 (Logarithmic Function)。
因此,从逻辑一致性上,熵必然是微观状态数的对数形式:
\[ S = k \ln W \]
其中,\(k\) 是玻尔兹曼常数。
我们没有证明这里的 \(S\) 就是克劳修斯在宏观热力学定义的那个 \(dS = \frac{dQ}{T}\)。(超纲了)
- 对 \(W\) 取对数并应用斯特林公式:
- 引入约束条件并使用拉格朗日乘子法:
系统必须满足两个物理约束:
- 物质守恒: \(f_1 = \sum_i n_i - N = 0\)
- 能量守恒: \(f_2 = \sum_i n_i \epsilon_i - E = 0\)
构造辅助函数 \(L\),并引入两个待定乘子 \(-\alpha\) 和 \(-\beta\):
\[\begin{aligned} L &= \ln W - \alpha f_1 - \beta f_2\\[8pt] &= \left( N \ln N + \sum_i n_i \ln g_i - \sum_i n_i \ln n_i \right) - \alpha \left( \sum_i n_i - N \right) - \beta \left( \sum_i n_i \epsilon_i - E \right) \end{aligned}\]对某个特定的 \(n_j\) 求导:
- \(N \ln N\) 是常数,导数为零。
- \(\sum_i n_i \ln g_i - \sum_i n_i \ln n_i\) 中,只有 \(i=j\) 的那一项对 \(n_j\) 有贡献:
- 对约束项求导:
\[ \frac{\partial L}{\partial \alpha} = \frac{\partial}{\partial \alpha} - \alpha \left(n_i - N \right) = -\alpha \]
\[ \frac{\partial L}{\partial \beta} = \frac{\partial}{\partial \beta} - \beta \left(n_j \epsilon_j - E \right) = -\beta \epsilon_j \]
将它们合并并令其等于 0:
\[ \frac{\partial L}{\partial n_j} = \ln \frac{g_j}{n_j} - 1 - \alpha - \beta \epsilon_j = 0 \]
移项并整理上式:
\[ \ln \frac{n_j}{g_j} = - (1 + \alpha) - \beta \epsilon_j \]
取指数:
\[ n_j = g_j e^{-1 + \alpha} e^{- \beta \epsilon_j} \]
为了简介,通常将常数项 \(e^{-1 + \alpha}\) 记为归一化常数 \(A\),即:
\[ n_j = A g_j e^{-\beta \epsilon_j} \]
其中,\(A = e^{-1 + \alpha}\)。
这个公式就是玻尔兹曼分布。