玻尔兹曼分布

作者

松原苏打

背景

能量与动能

\[ \epsilon = \frac{1}{2}mv^2 \]

\[ p = mv \]

\[ \frac{p^2}{\epsilon} = \frac{m^2 v^2}{\frac{1}{2}mv^2} = 2m \]

\[ p = \sqrt{2m\epsilon} \quad \text{or} \quad \epsilon = \frac{p^2}{2m} \tag{1} \]

斯特林公式

\[ \ln n! \approx n \ln n - n \]

推导过程：

\[ \ln n! = \ln 1 + \ln 2 + \ln 3 + \cdots + \ln n = \sum_{x=1}^{n} \ln x \]

\[\begin{aligned} \sum_{x=1}^{n} \ln x &\approx \int_{1}^{n} \ln x dx\\ &= \left. x \ln x \right|_1^n - \int_1^n x d\ln x \\[8pt] &= n \ln n - \left. x \right|_1^n \\[8pt] &= n \ln n - n + 1 \end{aligned}\]

在处理阿伏伽德罗常数级（\(10^{23}\)）的粒子时，\(+1\) 可以忽略不计。故：

\[ \ln n! \approx n \ln n - n \]

相空间

Phase Space

在经典力学中，要描述一个质点的运动状态，需要知道它的位置 \(\mathbf{r}\) 与动量 \(\mathbf{p}\)。也就是说，我们需要 6 个参数来描述一个质点的运动状态。相空间是由这 6 个参数张成的空间，其 6 个坐标轴分别为 \(x, y, z, p_x, p_y, p_z\)。

因此相空间的体积计算公式为：

\[ \Omega = \int_x \int_y \int_z \int_{p_x} \int_{p_y} \int_{p_z} dx dy dz dp_x dp_y dp_z = \iint d^3 r d^3 p \]

相空间体积的微元为：

\[ d\Omega = d^3 r d^3 p \]

相空间的概念与能量的概念紧密相连。考虑一个粒子，其质量为 \(m\)，能量（动能）为 \(\epsilon\)。在相空间中，我们有多少种办法可以分配这个粒子在相空间中的位置与动量？

位置空间

位置空间的体积为：

\[ V_q = \int_r d^3 r = V \]

动量空间

由于粒子的能量为 \(\epsilon\)，根据公式 \((1)\)，可得：

\[ p^2 = p_x^2 + p_y^2 + p_z^2 = 2m\epsilon \]

根据球面表达式 \(x^2 + y^2 + z^2 = r^2\)，可知粒子落在动量空间中一个半径为 \(p=\sqrt{2m\epsilon}\) 的球体表面上。该球面的面积为：

\[ 4\pi p^2 \]

这意味着对于给定的能量 \(\epsilon\)，我们无法得出一个适当的动量空间的体积。为此我们必须采用微分的思想，去求在能量区间 \([\epsilon, \epsilon + d\epsilon]\) 内，粒子落在动量空间中的微分体积。即：

\[ d V_p = \int_{p}^{p+dp} 4\pi p^2 dp = 4\pi p^2 dp \]

根据积分中值定理，如果 \(f\) 在该区间内连续，则存在一个介于 \(x\) 和 \(x+dx\) 之间的值 \(c\)，使得：\(\displaystyle\int_x^{x+dx} f(t) dt = f(c) \cdot [(x+dx) - x] = f(c) dx\)

对公式 \((1)\) 两边求导，可得：

\[ \frac{d}{dp} \epsilon = \frac{d}{dp}\left(\frac{p^2}{2m}\right) \]

\[ d\epsilon = \frac{p}{m} dp \quad \text{or} \quad dp = \frac{m}{p} d\epsilon \tag{2} \]

根据式 \((1)(2)\)，将 \(d V_p\) 表达式中的 \(p\) 替换为 \(\epsilon\)，可得：

\[ d V_p = 4\pi (2m\epsilon) \left(\frac{m}{\sqrt{2m\epsilon}} d\epsilon\right) = 2\pi (2m)^{3/2} \epsilon^{1/2} d\epsilon \]

将位置空间体积与动量空间体积相乘，可得：

\[ d \Omega = V_q \cdot d V_p = V \cdot 2\pi (2m)^{3/2} \epsilon^{1/2} d\epsilon \]

\(d \Omega\) 即质量为 \(m\) 的粒子处在能量区间为 \([\epsilon, \epsilon + d\epsilon]\) 上时，对应的微分相空间体积。为了知道粒子有多少种分配在这个体积为 \(d \Omega\) 的相空间中，我们不得不将相空间离散化，即假设相空间被划分为许多小的立方体，每个立方体的大小为 \(\Delta q \cdot \Delta p\)。

虽然玻尔兹曼当时没有量子力学（即没有普朗克常数 \(h\)），但在现代半经典近似中，根据海森堡测不准原理 (\(\Delta x \Delta p \approx h\))，三维空间中一个量子态所占的相空间最小体积是 \(h^3\)。

这里的 \(h^3\) 来源于三维空间的测不准关系：\((\Delta x \Delta p_x)(\Delta y \Delta p_y)(\Delta z \Delta p_z) \ge (h)^3\)。

因此，在给定能量范围 \([\epsilon, \epsilon + d \epsilon]\) 下，单个粒子在相空间中可能的微观状态数为：

\[ \frac{d \Omega}{h^3} = \frac{V}{h^3} 2\pi (2m)^{3/2} \epsilon^{1/2} d\epsilon \]

这是一个无量纲量。

拉格朗日乘子法

\[ \nabla f = \lambda \nabla g \]

\[ L(x, y, \lambda) = f(x, y) - \lambda (g(x, y) - c) \]

\(\displaystyle\frac{\partial L}{\partial x} = 0 \implies f_x = \lambda g_x\)
\(\displaystyle\frac{\partial L}{\partial y} = 0 \implies f_y = \lambda g_y\)
\(\displaystyle\frac{\partial L}{\partial \lambda} = 0 \implies g(x, y) = c\)

推导

微观状态数

假设：

系统中存在 \(N\) 个可区分粒子，总能量为 \(E\)，总体积为 \(V\)。
能量 \(E\) 被分割为多个能级 \([\epsilon_i, \epsilon_i + d\epsilon_i]\)，且每个能级上可以容纳的粒子数为 \(n_i\)。
每个能级 \([\epsilon_i, \epsilon_i + d\epsilon_i]\) 能够提供的微观状态数为 \(g_i = \frac{V}{h^3} 2\pi (2m)^{3/2} \epsilon_i^{1/2} d\epsilon_i\)。（来自我们在相空间部分的推导）

以上假设引出以下约束条件：

\[ \sum_i n_i = N \]

\[ \sum_i n_i \epsilon_i = E \]

考虑将 \(N\) 个粒子分配到能量为 \(\epsilon_i\) 的微观状态中，有多少种分配方式？

首先，从 \(N\) 个粒子中选择 \(n_1\) 个粒子分配到第一个能级 \(\epsilon_1\) 上，有以下几种情况：

\[ \binom{N}{n_1} \]

然后，从剩下的 \(N - n_1\) 个粒子中选择 \(n_2\) 个粒子分配到第二个能级 \(\epsilon_2\) 上，有以下几种情况：

\[ \binom{N - n_1}{n_2} \]

以此类推，从剩下的 \(N - n_1 - n_2\) 个粒子中选择 \(n_3\) 个粒子分配到第三个能级 \(\epsilon_3\) 上，有以下几种情况：

\[ \binom{N - n_1 - n_2}{n_3} \]

根据乘法原理和组合原理 \(\binom{n}{k} = \frac{n!}{k!(n-k)!}\)，将所有情况相乘，可得将 \(N\) 个粒子分配到能量为 \(\epsilon_i\) 的微观状态中，有 \(W_1\) 种分配方式：

\[\begin{aligned} W_1 &= \binom{N}{n_1} \binom{N - n_1}{n_2} \binom{N - n_1 - n_2}{n_3} \cdots \binom{N - n_1 - n_2 - \cdots - n_{i-1}}{n_i}\\ &= \frac{N!}{n_1! \cancel{(N - n_1)!}} \cdot \frac{\cancel{(N - n_1)!}}{n_2! \cancel{(N - n_1 - n_2)!}} \cdot \frac{\cancel{(N - n_1 - n_2)!}}{n_3! \cancel{(N - n_1 - n_2 - n_3)!}} \cdots \frac{\cancel{(N - n_1 - n_2 - \cdots - n_{i-1})!}}{n_i! \cancel{(N - n_1 - n_2 - \cdots - n_{i-1} - n_i)!}}\\ &= \frac{N!}{n_1! n_2! n_3! \cdots n_i!} \end{aligned}\]

即：

\[ W_1 = \frac{N!}{\prod_i n_i!} \]

考虑在每一个能级 \(\epsilon_i\) 的 \(n_i\) 个粒子，有多少种放置方式？

对于落在能级 \(\epsilon_i\) 上的这 \(n_i\) 个粒子，每个粒子都可以独立地处于该能级提供的 \(g_i\) 个微观状态中的任意一个。由于粒子是可辨的，每一个粒子都有 \(g_i\) 种选择，因此总的放置方式数为：

\[ W_2 = \prod_i g_i^{n_i} \]

结合粒子分配到能级的方式数 \(W_1\)，总微观状态数为：

\[ W = W_1 \cdot W_2 = N! \prod_i \frac{g_i^{n_i}}{n_i!} \]

其中，\(\displaystyle g_i = \frac{V}{h^3} 2\pi (2m)^{3/2} \epsilon_i^{1/2} d\epsilon_i\)

玻尔兹曼分布

假设：

等概率假设：当系统处于平衡态时，其各个可能的微观态出现的概率相等。
热力学第二定律的微观解释：一个孤立系统如果最初处于非平衡状态，它会自发地向 \(W\) 值更高的宏观状态演化。当 \(W\) 达到最大值时，系统进入热平衡状态。

玻尔兹曼分布的研究目标是：通过求 \(W\) 的最大值（实际上是求 \(\ln W\) 的最大值），推导出系统处于热平衡态时分子的分布情况（即 \(n_i\) 的表达式）。

补充：为什么是 \(\ln W\) 而不是 \(W\)？

这是基于 \(S \propto \ln W\) 假设之上的。（为什么这样假设，这需要热力学的知识。）

熵 \(S\) 是系统混乱程度的度量，是广延量。如果有两个完全相同的系统（比如两盒气体），把它们合在一起，总熵等于两者之和：

\[ S_{total} = S_1 + S_2 \]

微观状态数 \(W\) 是系统微观状态数的度量，是组合量。如果系统1有 \(W_1\) 种微观状态，系统2有 \(W_2\) 种微观状态。根据概率论的乘法原理，两个系统合在一起的总状态数是两者的乘积：

\[ W_{total} = W_1 \cdot W_2 \]

那么问题来了：什么样的数学函数 \(f\) 能满足 \(f(W_1 \cdot W_2) = f(W_1) + f(W_2)\)？在数学上，满足这个性质的唯一基本函数就是对数函数 (Logarithmic Function)。

因此，从逻辑一致性上，熵必然是微观状态数的对数形式：

\[ S = k \ln W \]

其中，\(k\) 是玻尔兹曼常数。

我们没有证明这里的 \(S\) 就是克劳修斯在宏观热力学定义的那个 \(dS = \frac{dQ}{T}\)。（超纲了）

对 \(W\) 取对数并应用斯特林公式：

\[\begin{aligned} \ln W &= \ln \left( N! \prod_i \frac{g_i^{n_i}}{n_i!}\right)\\[8pt] &= \ln N! + \ln \left( \prod_i g_i^{n_i} \right) - \ln \left( \prod_i n_i! \right) \\[8pt] &= \ln N! + \sum_i \ln g_i^{n_i} - \sum_i \ln n_i! \\[8pt] &\approx (N \ln N - N) + \sum_i n_i \ln g_i - \left( \sum_i (n_i \ln n_i - n_i) \right) \\[8pt] &= N \ln N - N + \sum_i n_i \ln g_i - \sum_i n_i \ln n_i + N \\[8pt] &= N \ln N + \sum_i n_i \ln g_i - \sum_i n_i \ln n_i \\[8pt] &= N \ln N + \sum_i n_i \ln \frac{g_i}{n_i} \end{aligned}\]

引入约束条件并使用拉格朗日乘子法：

系统必须满足两个物理约束：

物质守恒： \(f_1 = \sum_i n_i - N = 0\)
能量守恒： \(f_2 = \sum_i n_i \epsilon_i - E = 0\)

构造辅助函数 \(L\)，并引入两个待定乘子 \(-\alpha\) 和 \(-\beta\)：

\[\begin{aligned} L &= \ln W - \alpha f_1 - \beta f_2\\[8pt] &= \left( N \ln N + \sum_i n_i \ln g_i - \sum_i n_i \ln n_i \right) - \alpha \left( \sum_i n_i - N \right) - \beta \left( \sum_i n_i \epsilon_i - E \right) \end{aligned}\]

对某个特定的 \(n_j\) 求导：

\(N \ln N\) 是常数，导数为零。
\(\sum_i n_i \ln g_i - \sum_i n_i \ln n_i\) 中，只有 \(i=j\) 的那一项对 \(n_j\) 有贡献：

\[\begin{aligned} \frac{\partial L}{\partial n_j} &= \frac{\partial}{\partial n_j} \left[ n_j \ln g_j - n_j \ln n_j \right] \\ &= \ln g_j - (\ln n_j + n_j \frac{1}{n_j}) \\ &= \ln \frac{g_j}{n_j} - 1 \end{aligned}\]

对约束项求导：

\[ \frac{\partial L}{\partial \alpha} = \frac{\partial}{\partial \alpha} - \alpha \left(n_i - N \right) = -\alpha \]

\[ \frac{\partial L}{\partial \beta} = \frac{\partial}{\partial \beta} - \beta \left(n_j \epsilon_j - E \right) = -\beta \epsilon_j \]

将它们合并并令其等于 0：

\[ \frac{\partial L}{\partial n_j} = \ln \frac{g_j}{n_j} - 1 - \alpha - \beta \epsilon_j = 0 \]

移项并整理上式：

\[ \ln \frac{n_j}{g_j} = - (1 + \alpha) - \beta \epsilon_j \]

取指数：

\[ n_j = g_j e^{-1 + \alpha} e^{- \beta \epsilon_j} \]

为了简介，通常将常数项 \(e^{-1 + \alpha}\) 记为归一化常数 \(A\)，即：

\[ n_j = A g_j e^{-\beta \epsilon_j} \]

其中，\(A = e^{-1 + \alpha}\)。

这个公式就是玻尔兹曼分布。