玻尔兹曼分布

作者

松原苏打

背景

能量与动能

\[ \epsilon = \frac{1}{2}mv^2 \]

\[ p = mv \]

\[ \frac{p^2}{\epsilon} = \frac{m^2 v^2}{\frac{1}{2}mv^2} = 2m \]

\[ p = \sqrt{2m\epsilon} \quad \text{or} \quad \epsilon = \frac{p^2}{2m} \tag{1} \]

斯特林公式

\[ \ln n! \approx n \ln n - n \]

推导过程:

\[ \ln n! = \ln 1 + \ln 2 + \ln 3 + \cdots + \ln n = \sum_{x=1}^{n} \ln x \]

\[\begin{aligned} \sum_{x=1}^{n} \ln x &\approx \int_{1}^{n} \ln x dx\\ &= \left. x \ln x \right|_1^n - \int_1^n x d\ln x \\[8pt] &= n \ln n - \left. x \right|_1^n \\[8pt] &= n \ln n - n + 1 \end{aligned}\]

在处理阿伏伽德罗常数级(\(10^{23}\))的粒子时,\(+1\) 可以忽略不计。故:

\[ \ln n! \approx n \ln n - n \]

相空间

Phase Space

在经典力学中,要描述一个质点的运动状态,需要知道它的位置 \(\mathbf{r}\) 与动量 \(\mathbf{p}\)。也就是说,我们需要 6 个参数来描述一个质点的运动状态。相空间是由这 6 个参数张成的空间,其 6 个坐标轴分别为 \(x, y, z, p_x, p_y, p_z\)

因此相空间的体积计算公式为:

\[ \Omega = \int_x \int_y \int_z \int_{p_x} \int_{p_y} \int_{p_z} dx dy dz dp_x dp_y dp_z = \iint d^3 r d^3 p \]

相空间体积的微元为:

\[ d\Omega = d^3 r d^3 p \]

相空间的概念与能量的概念紧密相连。考虑一个粒子,其质量为 \(m\),能量(动能)为 \(\epsilon\)。在相空间中,我们有多少办法可以分配这个粒子在相空间中的位置与动量?

位置空间

位置空间的体积为:

\[ V_q = \int_r d^3 r = V \]

动量空间

由于粒子的能量为 \(\epsilon\),根据公式 \((1)\),可得:

\[ p^2 = p_x^2 + p_y^2 + p_z^2 = 2m\epsilon \]

根据球面表达式 \(x^2 + y^2 + z^2 = r^2\),可知粒子落在动量空间中一个半径为 \(p=\sqrt{2m\epsilon}\) 的球体表面上。该球面的面积为:

\[ 4\pi p^2 \]

这意味着对于给定的能量 \(\epsilon\),我们无法得出一个适当的动量空间的体积。为此我们必须采用微分的思想,去求在能量区间 \([\epsilon, \epsilon + d\epsilon]\) 内,粒子落在动量空间中的微分体积。即:

\[ d V_p = \int_{p}^{p+dp} 4\pi p^2 dp = 4\pi p^2 dp \]

根据积分中值定理,如果 \(f\) 在该区间内连续,则存在一个介于 \(x\)\(x+dx\) 之间的值 \(c\),使得:\(\displaystyle\int_x^{x+dx} f(t) dt = f(c) \cdot [(x+dx) - x] = f(c) dx\)

对公式 \((1)\) 两边求导,可得:

\[ \frac{d}{dp} \epsilon = \frac{d}{dp}\left(\frac{p^2}{2m}\right) \]

\[ d\epsilon = \frac{p}{m} dp \quad \text{or} \quad dp = \frac{m}{p} d\epsilon \tag{2} \]

根据式 \((1)(2)\),将 \(d V_p\) 表达式中的 \(p\) 替换为 \(\epsilon\),可得:

\[ d V_p = 4\pi (2m\epsilon) \left(\frac{m}{\sqrt{2m\epsilon}} d\epsilon\right) = 2\pi (2m)^{3/2} \epsilon^{1/2} d\epsilon \]

将位置空间体积与动量空间体积相乘,可得:

\[ d \Omega = V_q \cdot d V_p = V \cdot 2\pi (2m)^{3/2} \epsilon^{1/2} d\epsilon \]

\(d \Omega\) 即质量为 \(m\) 的粒子处在能量区间为 \([\epsilon, \epsilon + d\epsilon]\) 上时,对应的微分相空间体积。为了知道粒子有多少种分配在这个体积为 \(d \Omega\) 的相空间中,我们不得不将相空间离散化,即假设相空间被划分为许多小的立方体,每个立方体的大小为 \(\Delta q \cdot \Delta p\)

虽然玻尔兹曼当时没有量子力学(即没有普朗克常数 \(h\)),但在现代半经典近似中,根据海森堡测不准原理 (\(\Delta x \Delta p \approx h\)),三维空间中一个量子态所占的相空间最小体积是 \(h^3\)

这里的 \(h^3\) 来源于三维空间的测不准关系:\((\Delta x \Delta p_x)(\Delta y \Delta p_y)(\Delta z \Delta p_z) \ge (h)^3\)

因此,在给定能量范围 \([\epsilon, \epsilon + d \epsilon]\) 下,单个粒子在相空间中可能的微观状态数为:

\[ \frac{d \Omega}{h^3} = \frac{V}{h^3} 2\pi (2m)^{3/2} \epsilon^{1/2} d\epsilon \]

这是一个无量纲量。

拉格朗日乘子法

\[ \nabla f = \lambda \nabla g \]

\[ L(x, y, \lambda) = f(x, y) - \lambda (g(x, y) - c) \]

  1. \(\displaystyle\frac{\partial L}{\partial x} = 0 \implies f_x = \lambda g_x\)
  2. \(\displaystyle\frac{\partial L}{\partial y} = 0 \implies f_y = \lambda g_y\)
  3. \(\displaystyle\frac{\partial L}{\partial \lambda} = 0 \implies g(x, y) = c\)

推导

微观状态数

假设:

  • 系统中存在 \(N\) 个可区分粒子,总能量为 \(E\),总体积为 \(V\)
  • 能量 \(E\) 被分割为多个能级 \([\epsilon_i, \epsilon_i + d\epsilon_i]\),且每个能级上可以容纳的粒子数为 \(n_i\)
  • 每个能级 \([\epsilon_i, \epsilon_i + d\epsilon_i]\) 能够提供的微观状态数为 \(g_i = \frac{V}{h^3} 2\pi (2m)^{3/2} \epsilon_i^{1/2} d\epsilon_i\)。(来自我们在相空间部分的推导)

以上假设引出以下约束条件:

\[ \sum_i n_i = N \]

\[ \sum_i n_i \epsilon_i = E \]

考虑将 \(N\) 个粒子分配到能量为 \(\epsilon_i\) 的微观状态中,有多少种分配方式?

首先,从 \(N\) 个粒子中选择 \(n_1\) 个粒子分配到第一个能级 \(\epsilon_1\) 上,有以下几种情况:

\[ \binom{N}{n_1} \]

然后,从剩下的 \(N - n_1\) 个粒子中选择 \(n_2\) 个粒子分配到第二个能级 \(\epsilon_2\) 上,有以下几种情况:

\[ \binom{N - n_1}{n_2} \]

以此类推,从剩下的 \(N - n_1 - n_2\) 个粒子中选择 \(n_3\) 个粒子分配到第三个能级 \(\epsilon_3\) 上,有以下几种情况:

\[ \binom{N - n_1 - n_2}{n_3} \]

根据乘法原理和组合原理 \(\binom{n}{k} = \frac{n!}{k!(n-k)!}\),将所有情况相乘,可得将 \(N\) 个粒子分配到能量为 \(\epsilon_i\) 的微观状态中,有 \(W_1\) 种分配方式:

\[\begin{aligned} W_1 &= \binom{N}{n_1} \binom{N - n_1}{n_2} \binom{N - n_1 - n_2}{n_3} \cdots \binom{N - n_1 - n_2 - \cdots - n_{i-1}}{n_i}\\ &= \frac{N!}{n_1! \cancel{(N - n_1)!}} \cdot \frac{\cancel{(N - n_1)!}}{n_2! \cancel{(N - n_1 - n_2)!}} \cdot \frac{\cancel{(N - n_1 - n_2)!}}{n_3! \cancel{(N - n_1 - n_2 - n_3)!}} \cdots \frac{\cancel{(N - n_1 - n_2 - \cdots - n_{i-1})!}}{n_i! \cancel{(N - n_1 - n_2 - \cdots - n_{i-1} - n_i)!}}\\ &= \frac{N!}{n_1! n_2! n_3! \cdots n_i!} \end{aligned}\]

即:

\[ W_1 = \frac{N!}{\prod_i n_i!} \]

考虑在每一个能级 \(\epsilon_i\)\(n_i\) 个粒子,有多少种放置方式?

对于落在能级 \(\epsilon_i\) 上的这 \(n_i\) 个粒子,每个粒子都可以独立地处于该能级提供的 \(g_i\) 个微观状态中的任意一个。由于粒子是可辨的,每一个粒子都有 \(g_i\) 种选择,因此总的放置方式数为:

\[ W_2 = \prod_i g_i^{n_i} \]

结合粒子分配到能级的方式数 \(W_1\),总微观状态数为:

\[ W = W_1 \cdot W_2 = N! \prod_i \frac{g_i^{n_i}}{n_i!} \]

其中,\(\displaystyle g_i = \frac{V}{h^3} 2\pi (2m)^{3/2} \epsilon_i^{1/2} d\epsilon_i\)

玻尔兹曼分布

假设:

  • 等概率假设:当系统处于平衡态时,其各个可能的微观态出现的概率相等。
  • 热力学第二定律的微观解释:一个孤立系统如果最初处于非平衡状态,它会自发地向 \(W\) 值更高的宏观状态演化。当 \(W\) 达到最大值时,系统进入热平衡状态。

玻尔兹曼分布的研究目标是:通过求 \(W\) 的最大值(实际上是求 \(\ln W\) 的最大值),推导出系统处于热平衡态时分子的分布情况(即 \(n_i\) 的表达式)。

补充:为什么是 \(\ln W\) 而不是 \(W\)

这是基于 \(S \propto \ln W\) 假设之上的。(为什么这样假设,这需要热力学的知识。)

\(S\) 是系统混乱程度的度量,是广延量。如果有两个完全相同的系统(比如两盒气体),把它们合在一起,总熵等于两者之和:

\[ S_{total} = S_1 + S_2 \]

微观状态数 \(W\) 是系统微观状态数的度量,是组合量。如果系统1有 \(W_1\) 种微观状态,系统2有 \(W_2\) 种微观状态。根据概率论的乘法原理,两个系统合在一起的总状态数是两者的乘积:

\[ W_{total} = W_1 \cdot W_2 \]

那么问题来了:什么样的数学函数 \(f\) 能满足 \(f(W_1 \cdot W_2) = f(W_1) + f(W_2)\)?在数学上,满足这个性质的唯一基本函数就是对数函数 (Logarithmic Function)。

因此,从逻辑一致性上,熵必然是微观状态数的对数形式:

\[ S = k \ln W \]

其中,\(k\) 是玻尔兹曼常数。

我们没有证明这里的 \(S\) 就是克劳修斯在宏观热力学定义的那个 \(dS = \frac{dQ}{T}\)。(超纲了)

  1. \(W\) 取对数并应用斯特林公式:
\[\begin{aligned} \ln W &= \ln \left( N! \prod_i \frac{g_i^{n_i}}{n_i!}\right)\\[8pt] &= \ln N! + \ln \left( \prod_i g_i^{n_i} \right) - \ln \left( \prod_i n_i! \right) \\[8pt] &= \ln N! + \sum_i \ln g_i^{n_i} - \sum_i \ln n_i! \\[8pt] &\approx (N \ln N - N) + \sum_i n_i \ln g_i - \left( \sum_i (n_i \ln n_i - n_i) \right) \\[8pt] &= N \ln N - N + \sum_i n_i \ln g_i - \sum_i n_i \ln n_i + N \\[8pt] &= N \ln N + \sum_i n_i \ln g_i - \sum_i n_i \ln n_i \\[8pt] &= N \ln N + \sum_i n_i \ln \frac{g_i}{n_i} \end{aligned}\]
  1. 引入约束条件并使用拉格朗日乘子法:

系统必须满足两个物理约束:

  • 物质守恒: \(f_1 = \sum_i n_i - N = 0\)
  • 能量守恒: \(f_2 = \sum_i n_i \epsilon_i - E = 0\)

构造辅助函数 \(L\),并引入两个待定乘子 \(-\alpha\)\(-\beta\)

\[\begin{aligned} L &= \ln W - \alpha f_1 - \beta f_2\\[8pt] &= \left( N \ln N + \sum_i n_i \ln g_i - \sum_i n_i \ln n_i \right) - \alpha \left( \sum_i n_i - N \right) - \beta \left( \sum_i n_i \epsilon_i - E \right) \end{aligned}\]

对某个特定的 \(n_j\) 求导:

  • \(N \ln N\) 是常数,导数为零。
  • \(\sum_i n_i \ln g_i - \sum_i n_i \ln n_i\) 中,只有 \(i=j\) 的那一项对 \(n_j\) 有贡献:
\[\begin{aligned} \frac{\partial L}{\partial n_j} &= \frac{\partial}{\partial n_j} \left[ n_j \ln g_j - n_j \ln n_j \right] \\ &= \ln g_j - (\ln n_j + n_j \frac{1}{n_j}) \\ &= \ln \frac{g_j}{n_j} - 1 \end{aligned}\]
  • 对约束项求导:

\[ \frac{\partial L}{\partial \alpha} = \frac{\partial}{\partial \alpha} - \alpha \left(n_i - N \right) = -\alpha \]

\[ \frac{\partial L}{\partial \beta} = \frac{\partial}{\partial \beta} - \beta \left(n_j \epsilon_j - E \right) = -\beta \epsilon_j \]

将它们合并并令其等于 0:

\[ \frac{\partial L}{\partial n_j} = \ln \frac{g_j}{n_j} - 1 - \alpha - \beta \epsilon_j = 0 \]

移项并整理上式:

\[ \ln \frac{n_j}{g_j} = - (1 + \alpha) - \beta \epsilon_j \]

取指数:

\[ n_j = g_j e^{-1 + \alpha} e^{- \beta \epsilon_j} \]

为了简介,通常将常数项 \(e^{-1 + \alpha}\) 记为归一化常数 \(A\),即:

\[ n_j = A g_j e^{-\beta \epsilon_j} \]

其中,\(A = e^{-1 + \alpha}\)

这个公式就是玻尔兹曼分布。