拒绝采样（Rejection Sampling）是一种从复杂分布中生成随机样本的技术。它的核心思想是通过一个简单的分布来“模拟”复杂分布，然后通过某种规则来决定是否接受生成的样本。可以用一个简单的比喻来理解： **比喻：捕鱼与筛选** 想象你在一片大湖中捕鱼，湖里有各种各样的鱼，但你只想要一种特定的鱼（比如红色的鱼）。你使用的渔网（简单分布）可以捕到各种颜色的鱼，但你不能直接控制渔网只捕到红色的鱼。于是，你采取了以下策略： 1. **撒网捕鱼**：你用渔网随机捕鱼，捕上来的鱼可能是红色的，也可能是其他颜色的。 2. **筛选**：每捕到一条鱼，你检查它是否是红色的。如果是，就留下它（接受样本）；如果不是，就把它扔回湖里（拒绝样本）。 3. **重复**：你不断重复这个过程，直到捕到足够多的红色鱼。在这个比喻中： - **湖中的鱼**：代表你想要从中采样的复杂分布。 - **渔网**：代表一个简单分布，你可以很容易地从中生成样本。 - **红色的鱼**：代表你想要的样本，符合目标分布。 - **筛选过程**：就是拒绝采样的核心，通过判断样本是否符合目标分布来决定是否接受它。 **关键点**： - 你需要确保渔网（简单分布）能够覆盖所有可能的红色鱼（目标分布），否则有些红色鱼可能永远捕不到。 - 你希望渔网捕到红色鱼的效率尽可能高，否则你会浪费很多时间捕到不需要的鱼。 **总结**：拒绝采样就像通过一个简单的工具（渔网）来捕捉你想要的样本（红色的鱼），然后通过筛选来决定是否保留它们。虽然这个过程可能会浪费一些样本，但它提供了一种从复杂分布中生成样本的简单而有效的方法。

我们用一个具体的数学例子来说明**拒绝采样**的工作原理。 --- ### 问题描述：假设我们想要从一个复杂的概率分布 [imath:0] p(x) [/imath:0] 中生成样本，但这个分布难以直接采样。我们选择一个简单的分布 [imath:0] q(x) [/imath:0]（比如均匀分布或正态分布），并且已知 [imath:0] p(x) \leq M \cdot q(x) [/imath:0]，其中 [imath:0] M [/imath:0] 是一个常数。 --- ### 例子：假设目标分布 [imath:0] p(x) [/imath:0] 是一个**截断的指数分布**，定义在区间 [imath:0][0, 1][/imath:0] 上： \[ [math:0]p(x) = \frac{e^{-x}}{\int_0^1 e^{-t} dt} = \frac{e^{-x}}{1 - e^{-1}}, \quad x \in [0, 1][/math:0] \] 这个分布难以直接采样，因此我们选择一个简单的分布 [imath:0] q(x) [/imath:0] —— **均匀分布**： \[ [math:0]q(x) = 1, \quad x \in [0, 1][/math:0] \] 我们需要找到一个常数 [imath:0] M [/imath:0]，使得 [imath:0] p(x) \leq M \cdot q(x) [/imath:0] 对所有 [imath:0] x \in [0, 1] [/imath:0] 成立。观察到 [imath:0] p(x) [/imath:0] 在 [imath:0] x=0 [/imath:0] 时取得最大值： \[ [math:0]p(0) = \frac{1}{1 - e^{-1}} \approx 1.582[/math:0] \] 因此，我们可以选择 [imath:0] M = 1.582 [/imath:0]。 --- ### 拒绝采样的步骤： 1. **从简单分布 [imath:0] q(x) [/imath:0] 中生成一个样本 [imath:0] x [/imath:0]**：从均匀分布 [imath:0] U(0, 1) [/imath:0] 中生成一个随机数 [imath:0] x [/imath:0]。 2. **计算接受概率 [imath:0] \alpha(x) [/imath:0]**： \[ [math:0]\alpha(x) = \frac{p(x)}{M \cdot q(x)} = \frac{e^{-x}}{1 - e^{-1}} \cdot \frac{1}{1.582}[/math:0] \] 这里 [imath:0] M \cdot q(x) = 1.582 [/imath:0]。 3. **生成一个均匀随机数 [imath:0] u \in [0, 1] [/imath:0]**：从均匀分布 [imath:0] U(0, 1) [/imath:0] 中生成另一个随机数 [imath:0] u [/imath:0]。 4. **决定是否接受样本 [imath:0] x [/imath:0]**： - 如果 [imath:0] u \leq \alpha(x) [/imath:0]，则接受 [imath:0] x [/imath:0] 作为目标分布 [imath:0] p(x) [/imath:0] 的样本。 - 否则，拒绝 [imath:0] x [/imath:0]，重新生成样本。 --- ### 具体实现（伪代码）： ```python import numpy as np # 定义目标分布 p(x) 和常数 M def p(x): return np.exp(-x) / (1 - np.exp(-1)) M = 1.582 # 拒绝采样 def rejection_sampling(): while True: x = np.random.uniform(0, 1) # 从简单分布 q(x) 生成样本 u = np.random.uniform(0, 1) # 生成均匀随机数 alpha = p(x) / (M * 1) # 计算接受概率 if u

**接受概率 [imath:0]\alpha(x)[/imath:0]** 是拒绝采样中的关键概念，它决定了生成样本是否被接受作为目标分布的样本。它的作用是通过比较目标分布 [imath:0] p(x) [/imath:0] 和简单分布 [imath:0] q(x) [/imath:0] 的比值，来调整采样过程，使得最终接受的样本符合目标分布。 --- ### 定义：接受概率 [imath:0]\alpha(x)[/imath:0] 定义为： \[ [math:0]\alpha(x) = \frac{p(x)}{M \cdot q(x)}[/math:0] \] 其中： - [imath:0] p(x) [/imath:0] 是目标分布（难以直接采样）。 - [imath:0] q(x) [/imath:0] 是简单分布（容易采样）。 - [imath:0] M [/imath:0] 是一个常数，确保 [imath:0] p(x) \leq M \cdot q(x) [/imath:0] 对所有 [imath:0] x [/imath:0] 成立。 --- ### 直观理解：接受概率 [imath:0]\alpha(x)[/imath:0] 的作用是衡量从简单分布 [imath:0] q(x) [/imath:0] 生成的样本 [imath:0] x [/imath:0] 有多大概率符合目标分布 [imath:0] p(x) [/imath:0]。它通过以下方式实现： 1. **调整比例**：将 [imath:0] p(x) [/imath:0] 和 [imath:0] q(x) [/imath:0] 的比值归一化到 [imath:0][0, 1][/imath:0] 范围内。 2. **筛选样本**：通过比较 [imath:0]\alpha(x)[/imath:0] 和一个均匀随机数 [imath:0] u \in [0, 1] [/imath:0]，决定是否接受样本 [imath:0] x [/imath:0]。 --- ### 为什么需要 [imath:0]\alpha(x)[/imath:0]？ 1. **校正偏差**：简单分布 [imath:0] q(x) [/imath:0] 可能无法准确反映目标分布 [imath:0] p(x) [/imath:0] 的形状。通过 [imath:0]\alpha(x)[/imath:0]，我们可以调整采样过程，使得接受的样本符合 [imath:0] p(x) [/imath:0]。 2. **确保正确性**：接受概率 [imath:0]\alpha(x)[/imath:0] 确保最终的样本分布与目标分布 [imath:0] p(x) [/imath:0] 一致。 --- ### 例子：继续用之前的例子，目标分布 [imath:0] p(x) [/imath:0] 是截断的指数分布： \[ [math:0]p(x) = \frac{e^{-x}}{1 - e^{-1}}, \quad x \in [0, 1][/math:0] \] 简单分布 [imath:0] q(x) [/imath:0] 是均匀分布： \[ [math:0]q(x) = 1, \quad x \in [0, 1][/math:0] \] 常数 [imath:0] M [/imath:0] 选择为 [imath:0] p(x) [/imath:0] 的最大值： \[ [math:0]M = \frac{1}{1 - e^{-1}} \approx 1.582[/math:0] \] 因此，接受概率 [imath:0]\alpha(x)[/imath:0] 为： \[ [math:0]\alpha(x) = \frac{p(x)}{M \cdot q(x)} = \frac{e^{-x}}{1 - e^{-1}} \cdot \frac{1}{1.582} \approx e^{-x}[/math:0] \] --- ### 接受概率的作用： 1. **生成样本**：从简单分布 [imath:0] q(x) [/imath:0] 中生成一个样本 [imath:0] x [/imath:0]。 2. **计算接受概率**：计算 [imath:0]\alpha(x) = e^{-x}[/imath:0]。 3. **决定是否接受**： - 生成一个均匀随机数 [imath:0] u \in [0, 1] [/imath:0]。 - 如果 [imath:0] u \leq \alpha(x) [/imath:0]，则接受 [imath:0] x [/imath:0] 作为目标分布的样本。 - 否则，拒绝 [imath:0] x [/imath:0]，重新生成样本。 --- ### 为什么 [imath:0]\alpha(x)[/imath:0] 有效？通过接受概率 [imath:0]\alpha(x)[/imath:0]，我们可以确保： 1. **高概率区域**：在 [imath:0] p(x) [/imath:0] 较高的区域，[imath:0]\alpha(x)[/imath:0] 也较高，样本更容易被接受。 2. **低概率区域**：在 [imath:0] p(x) [/imath:0] 较低的区域，[imath:0]\alpha(x)[/imath:0] 也较低，样本更容易被拒绝。 3. **分布一致性**：最终接受的样本分布与目标分布 [imath:0] p(x) [/imath:0] 一致。 --- ### 总结：接受概率 [imath:0]\alpha(x)[/imath:0] 是拒绝采样的核心，它通过调整简单分布 [imath:0] q(x) [/imath:0] 的样本，使其符合目标分布 [imath:0] p(x) [/imath:0]。它的计算基于 [imath:0] p(x) [/imath:0] 和 [imath:0] q(x) [/imath:0] 的比值，并通过与均匀随机数的比较来决定是否接受样本。

拒绝采样（Rejection Sampling）

步子哥

拒绝采样（Rejection Sampling）是一种从复杂分布中生成随机样本的技术。它的核心思想是通过一个简单的分布来“模拟”复杂分布，然后通过某种规则来决定是否接受生成的样本。可以用一个简单的比喻来理解：

比喻：捕鱼与筛选

想象你在一片大湖中捕鱼，湖里有各种各样的鱼，但你只想要一种特定的鱼（比如红色的鱼）。你使用的渔网（简单分布）可以捕到各种颜色的鱼，但你不能直接控制渔网只捕到红色的鱼。于是，你采取了以下策略：

撒网捕鱼：你用渔网随机捕鱼，捕上来的鱼可能是红色的，也可能是其他颜色的。
筛选：每捕到一条鱼，你检查它是否是红色的。如果是，就留下它（接受样本）；如果不是，就把它扔回湖里（拒绝样本）。
重复：你不断重复这个过程，直到捕到足够多的红色鱼。

在这个比喻中：

湖中的鱼：代表你想要从中采样的复杂分布。
渔网：代表一个简单分布，你可以很容易地从中生成样本。
红色的鱼：代表你想要的样本，符合目标分布。
筛选过程：就是拒绝采样的核心，通过判断样本是否符合目标分布来决定是否接受它。

关键点：

你需要确保渔网（简单分布）能够覆盖所有可能的红色鱼（目标分布），否则有些红色鱼可能永远捕不到。
你希望渔网捕到红色鱼的效率尽可能高，否则你会浪费很多时间捕到不需要的鱼。

总结：

拒绝采样就像通过一个简单的工具（渔网）来捕捉你想要的样本（红色的鱼），然后通过筛选来决定是否保留它们。虽然这个过程可能会浪费一些样本，但它提供了一种从复杂分布中生成样本的简单而有效的方法。

步子哥

我们用一个具体的数学例子来说明拒绝采样的工作原理。

问题描述：

假设我们想要从一个复杂的概率分布 p(x) 中生成样本，但这个分布难以直接采样。我们选择一个简单的分布 q(x) （比如均匀分布或正态分布），并且已知 p(x) \leq M \cdot q(x) ，其中 M 是一个常数。

例子：

假设目标分布 p(x) 是一个截断的指数分布，定义在区间 [0, 1] 上：
[
p(x) = \frac{e^{-x}}{\int_0^1 e^{-t} dt} = \frac{e^{-x}}{1 - e^{-1}}, \quad x \in [0, 1]
]
这个分布难以直接采样，因此我们选择一个简单的分布 q(x) —— 均匀分布：
[
q(x) = 1, \quad x \in [0, 1]
]
我们需要找到一个常数 M ，使得 p(x) \leq M \cdot q(x) 对所有 x \in [0, 1] 成立。观察到 p(x) 在 x=0 时取得最大值：
[
p(0) = \frac{1}{1 - e^{-1}} \approx 1.582
]
因此，我们可以选择 M = 1.582 。

拒绝采样的步骤：

从简单分布 q(x) 中生成一个样本 x ：
从均匀分布 U(0, 1) 中生成一个随机数 x 。
计算接受概率 \alpha(x) ：
[
\alpha(x) = \frac{p(x)}{M \cdot q(x)} = \frac{e^{-x}}{1 - e^{-1}} \cdot \frac{1}{1.582}
]
这里 M \cdot q(x) = 1.582 。
生成一个均匀随机数 u \in [0, 1] ：
从均匀分布 U(0, 1) 中生成另一个随机数 u 。
决定是否接受样本 x ：
- 如果 u \leq \alpha(x) ，则接受 x 作为目标分布 p(x) 的样本。
- 否则，拒绝 x ，重新生成样本。

具体实现（伪代码）：

import numpy as np

# 定义目标分布 p(x) 和常数 M
def p(x):
    return np.exp(-x) / (1 - np.exp(-1))

M = 1.582

# 拒绝采样
def rejection_sampling():
    while True:
        x = np.random.uniform(0, 1)  # 从简单分布 q(x) 生成样本
        u = np.random.uniform(0, 1)  # 生成均匀随机数
        alpha = p(x) / (M * 1)       # 计算接受概率
        if u <= alpha:
            return x                 # 接受样本

# 生成 1000 个样本
samples = [rejection_sampling() for _ in range(1000)]

结果：

通过上述方法，我们可以生成符合目标分布 p(x) 的样本。这些样本的分布会逐渐逼近目标分布 p(x) 。

关键点：

简单分布 q(x) ：必须能够覆盖目标分布 p(x) 的支持区域（这里是 [0, 1]）。
常数 M ：需要确保 p(x) \leq M \cdot q(x) 对所有 x 成立。
效率：接受概率 \alpha(x) 越高，采样效率越高。如果 M 过大，会导致大量样本被拒绝，效率降低。

这个例子清晰地展示了拒绝采样的数学原理和实现过程！

步子哥

接受概率 \alpha(x) 是拒绝采样中的关键概念，它决定了生成样本是否被接受作为目标分布的样本。它的作用是通过比较目标分布 p(x) 和简单分布 q(x) 的比值，来调整采样过程，使得最终接受的样本符合目标分布。

定义：

接受概率 \alpha(x) 定义为：
[
\alpha(x) = \frac{p(x)}{M \cdot q(x)}
]
其中：

p(x) 是目标分布（难以直接采样）。
q(x) 是简单分布（容易采样）。
M 是一个常数，确保 p(x) \leq M \cdot q(x) 对所有 x 成立。

直观理解：

接受概率 \alpha(x) 的作用是衡量从简单分布 q(x) 生成的样本 x 有多大概率符合目标分布 p(x) 。它通过以下方式实现：

调整比例：将 p(x) 和 q(x) 的比值归一化到 [0, 1] 范围内。
筛选样本：通过比较 \alpha(x) 和一个均匀随机数 u \in [0, 1] ，决定是否接受样本 x 。

为什么需要 \alpha(x)？

校正偏差：简单分布 q(x) 可能无法准确反映目标分布 p(x) 的形状。通过 \alpha(x)，我们可以调整采样过程，使得接受的样本符合 p(x) 。
确保正确性：接受概率 \alpha(x) 确保最终的样本分布与目标分布 p(x) 一致。

例子：

继续用之前的例子，目标分布 p(x) 是截断的指数分布：
[
p(x) = \frac{e^{-x}}{1 - e^{-1}}, \quad x \in [0, 1]
]
简单分布 q(x) 是均匀分布：
[
q(x) = 1, \quad x \in [0, 1]
]
常数 M 选择为 p(x) 的最大值：
[
M = \frac{1}{1 - e^{-1}} \approx 1.582
]
因此，接受概率 \alpha(x) 为：
[
\alpha(x) = \frac{p(x)}{M \cdot q(x)} = \frac{e^{-x}}{1 - e^{-1}} \cdot \frac{1}{1.582} \approx e^{-x}
]

接受概率的作用：

生成样本：从简单分布 q(x) 中生成一个样本 x 。
计算接受概率：计算 \alpha(x) = e^{-x}。
决定是否接受：
- 生成一个均匀随机数 u \in [0, 1] 。
- 如果 u \leq \alpha(x) ，则接受 x 作为目标分布的样本。
- 否则，拒绝 x ，重新生成样本。

为什么 \alpha(x) 有效？

通过接受概率 \alpha(x)，我们可以确保：

高概率区域：在 p(x) 较高的区域，\alpha(x) 也较高，样本更容易被接受。
低概率区域：在 p(x) 较低的区域，\alpha(x) 也较低，样本更容易被拒绝。
分布一致性：最终接受的样本分布与目标分布 p(x) 一致。

总结：

接受概率 \alpha(x) 是拒绝采样的核心，它通过调整简单分布 q(x) 的样本，使其符合目标分布 p(x) 。它的计算基于 p(x) 和 q(x) 的比值，并通过与均匀随机数的比较来决定是否接受样本。