1. 核心定义与条件
一个随机变量 $X$ 服从二项分布,当且仅当满足以下所有四个条件:
- 固定次数的试验 (Fixed number of trials, $n$): 试验次数 $n$ 是预先确定的。
- 两种互斥结果 (Two outcomes): 每次试验只有两种可能的结果:“成功” 和 “失败”。
- 恒定成功概率 (Constant probability of success, $p$): 每次试验中“成功”的概率 $p$ 保持不变。
- 试验相互独立 (Independence): 各次试验的结果相互之间没有影响。
如果满足这些条件,我们记作:
其中:
- $X$ 是 $n$ 次试验中“成功”的次数。
- $n$ 是试验次数。
- $p$ 是单次试验的“成功”概率。
2. 概率公式
二项分布的概率公式用于计算恰好有 $r$ 次成功的概率:
其中:
- $\binom{n}{r} = \frac{n!}{r!(n-r)!}$ 是二项式系数,计算从 $n$ 次试验中选出 $r$ 次成功组合的方式数量。
- $p^r$ 是 $r$ 次成功的概率。
- $(1-p)^{n-r}$ 是 $n-r$ 次失败的概率。
3. 累积概率 (Cumulative Probabilities)
考试中经常要求计算的是累积概率,即 $P(X \leq r)$, $P(X < r)$, $P(X \geq r)$, 或 $P(X > r)$。
- 使用公式册 (Formula Booklet): CIE提供的公式册中给出了二项分布的累积概率表。你必须学会如何使用它。通常,表格给出的是 $P(X \leq x)$ 的值。
- 关系转换 (Key Relationships):
- $P(X \leq r) =$ 查表直接可得
- $P(X < r) = P(X \leq r-1)$
- $P(X \geq r) = 1 - P(X \leq r-1)$
- $P(X > r) = 1 - P(X \leq r)$
- $P(X = r) = P(X \leq r) - P(X \leq r-1)$
4. 期望与方差 (Mean and Variance)
对于 $X \sim B(n, p)$:
- 期望 (均值): $E(X) = np$
- 方差: $Var(X) = np(1-p)$
这两个公式不需要推导,直接应用即可。
真题解析 (近5年精选)
真题示例 1: 基础概率与计算 (2022年11月)
来源: 9709/w22/62 Question 2
题目:
The probability that a certain electrical component is faulty is 0.08. A random sample of 20 of these components is chosen. Find the probability that the number of faulty components in the sample is exactly 2.
解析:
- 定义变量: Let $X$ be the number of faulty components.
- 判断分布: 有固定样本数 (n=20), 每个组件只有“故障”或“正常”两种结果,概率恒定 (p=0.08),且可假定样本随机,相互独立。故 $X \sim B(20, 0.08)$.
- 应用公式: 求 $P(X = 2)$.
- 计算: 直接使用计算器计算即可。
坑点与建议:
- 坑点: 此题非常直接,主要坑点在于计算时的按键错误,特别是 $(1-p)^{n-r}$ 部分。
- 建议: 熟练使用计算器的二项分布概率功能(例如 Casio fx-991EX 的
Distribution
模式),可以快速且准确地得到结果 $P(X=2) = 0.271$,节省时间并避免计算错误。
真题示例 2: 累积概率应用 (2019年10月/11月)
来源: 9709/61/O/N/19 Question 6
题目:
In a large survey, 30% of people said that they preferred coffee to tea. A random sample of 15 people is taken.
(a) Find the probability that the number of people in the sample who prefer coffee to tea is at least 4.
(b) Find the probability that the number of people in the sample who prefer coffee to tea is fewer than 4.
解析:
(a)
- 定义变量: Let $X$ be the number of people who prefer coffee. $X \sim B(15, 0.30)$.
- 转换关系: “At least 4” 意味着 $P(X \geq 4)$.
- 查表/计算器: 使用公式册中的累积二项分布表找到 $n=15, p=0.30, x=3$ 的值,或者用计算器直接计算 $P(X \leq 3)$。
- $P(X \leq 3) = 0.2969$ (查表或计算所得)
- $P(X \geq 4) = 1 - 0.2969 = 0.7031$
(b)
- 转换关系: “Fewer than 4” 意味着 $P(X < 4) = P(X \leq 3)$.
- 直接得出: 答案就是 (a) 中我们已经用到的值。
坑点与建议:
- 坑点: 混淆“at least” (≥) 和 “more than” (>),以及“fewer than” (<) 和 “at most” (≤)。这道题完美地考察了这些关键词的转换。
- 建议: 在答题时,务必写出概率的转换步骤,例如 $P(X \geq 4) = 1 - P(X \leq 3)$。这即使你最后数值算错了,也能拿到过程分 (Method Mark)。
真题示例 3: 综合题——求参数 $n$ 和 $p$ (2021年10月/11月)
来源: 9709/63/O/N/21 Question 3
题目:
The random variable $X$ has the distribution $B(n, p)$. The mean of $X$ is 6 and the variance of $X$ is 2.4. Find $P(X \leq 4)$.
解析:
此题需要先利用均值和方差的公式建立方程,解出 $n$ 和 $p$,然后再计算概率。
- 建立方程:
- Mean: $E(X) = np = 6$
- Variance: $Var(X) = np(1-p) = 2.4$
- 求解 $p$:
- 将方差公式除以均值公式:
- 求解 $n$:
- 代入 $np=6$:
- 确定分布并计算概率: 现在我们知道 $X \sim B(10, 0.6)$. 需要求 $P(X \leq 4)$.
- 查表/计算器: 使用公式册中 $n=10, p=0.6$ 的累积概率表,找到 $x=4$ 对应的值,或直接用计算器计算。
坑点与建议:
- 坑点: 看到题目直接去查表,却发现没有 $n$ 和 $p$。这是一道典型的“逆向思维”题,首要任务是找到分布的参数。
- 建议: 牢记二项分布的期望和方差公式。当题目中给出均值、方差等条件时,要立刻想到可以联立方程求解 $n$ 和 $p$。
真题示例 4: 综合题——与条件概率结合 (2018年10月/11月)
来源: 9709/62/O/N/18 Question 4
题目:
On a particular farm, the probability that a potato is rotten is 0.12. Potatoes are packed in bags of 15.
(a) Find the probability that a randomly chosen bag contains more than 4 rotten potatoes. It is given that a bag contains more than 3 rotten potatoes.
(b) Find the probability that it contains more than 4 rotten potatoes.
解析:
此题分为两部分。
第一部分:
- Let $X$ be the number of rotten potatoes. $X \sim B(15, 0.12)$.
- Find $P(X > 4)$.
- 查表或计算 $P(X \leq 4) = 0.901$ (假设值,需实际查表确认)。
第二部分 (条件概率):
- Let $A$ be the event “more than 4” ($X>4$).
Let $B$ be the event “more than 3” ($X>3$). - 我们需要求的是已知事件B发生的条件下,事件A发生的概率:$P(A|B)$.
- 根据条件概率公式:注意,如果“多于4个”,那它肯定已经“多于3个”了,所以 $A \cap B = A$.
Therefore, - 我们从第一部分已知 $P(X > 4) = 0.099$.
现在计算 $P(X > 3)$:查表得 $P(X \leq 3) = 0.748$, so $P(X > 3) = 1 - 0.748 = 0.252$. - Final Answer:
坑点与建议:
- 坑点: 第二部分是最大难点。学生可能不识别出这是条件概率,或者无法正确写出条件概率的公式 $P(A|B) = \frac{P(A \cap B)}{P(B)}$,以及理解 $A \cap B = A$ 这一关系。
- 建议: 当看到“It is given that…”或“Given that…”这类短语时,要立刻警觉这可能是一个条件概率问题。仔细定义事件是解决此类问题的关键。
常见坑点 (Common Pitfalls)总结
- 错误判断分布: 忽略四个条件中的某一个(尤其是恒定概率 $p$ 和独立性),错误地使用二项分布。
- 关键词混淆: 不能正确转换“at least”, “more than”, “at most”, “fewer than” 与累积概率 $P(X \leq r)$ 的关系。
- 查表错误: 错误地使用公式册中的统计表(看错行、列,或用错 $n, p$ 的值)。
- 忽略计算器: 不熟悉计算器的统计功能,手动计算 $\binom{n}{r}p^r(1-p)^{n-r}$ 既慢又容易出错。
- 综合能力不足: 在面对与条件概率、求参数等结合的题目时,无法分解问题步骤。
复习建议 (Revision Advice)
- 掌握基础: 确保能流利地说出二项分布的四个条件、概率公式、期望和方差公式。
- 熟练查表: 拿出公式册,专门练习如何查找二项分布的累积概率值。
- 精通计算器: 学会用计算器直接计算 $P(X = r)$ 和 $P(X \leq r)$,并会用计算器验证你查表得到的结果。
- 总结词汇: 制作一张关键词转换表(如 above->>, below->< 等),贴在笔记本上。
- 刷真题: 完成近5-7年的所有S1真题中关于二项分布的题目。重点关注那些包含条件概率、求参数 $n$ 和 $p$ 的难题,并总结解题套路。
- 步骤清晰: 在答题时,总是先定义随机变量 $X$ 及其分布 $X \sim B(n, p)$,再写出概率转换的公式,最后代入数值。清晰的步骤能帮助你获得过程分。