第二章 随机变量
一、随机变量
- 定义:随机变量X是定义在样本空间Ω上的实值函数,对每一个样本点$ω$,$X(\omega)$是一个实数(即对每一样本点对应一个实数值)。
- 分类:
- 若X的取值为有限或可数个,称为离散型随机变量,概率规律为一个分布列。
- 若X的取值为连续区间,单点的概率为0,只能定义一个密度函数。
- 分布函数:设X为随机变量,称$F(x)=P\{X \leq x\}$($-\infty < x < +\infty$)为X的分布函数,简称分布函数,记为$x$ ~ $F(x)$(或CDF)。
分布函数性质:
- ①F(x)单调非减,$F(+\infty)=1$,$F(-\infty)=0$
- ②F(x)右连续
二、离散型随机变量
- 定义:随机变量取值为有限或可数个时,称为离散型随机变量。
- 设$P_k = P\{X = x_k\}$,$k=1,2,...$为概率分布,称$\{P_k\}$为概率分布列。
- 定理:
- ①$\sum_{k} P_k = 1$
- ②X的分布函数为$F(x)=P\{X \leq x\}=\sum_{x_k \leq x} P_k,-\infty < x < +\infty$
- 两点分布(贝努利分布):
- 定义:X取值0或1,概率分布为P(X=1)=p,P(X=0)=1-p,记为B(1, p)。
- 模型:只有两种结果的随机试验。
- 二项分布:来源于重复伯努利试验。
- 定义:随机变量X取值为0,1,...,N,且满足$P(X=k)=C_N^k p^k q^{N-k}$,k=0,1,...,N,p+q=1,则X服从二项分布,记为B(N, p)。
- 模型:N次独立试验中的成功次数。
- 数学来源:概率分布列恰为二项式定理展开各项$(p+q)^N = \sum_{k=0}^{N} C_N^k p^k q^{N-k}$。
- 几何分布:
- 定义:随机变量Y的取值为自然数k=1,2,...,且满足$P(Y=k)=p(1-p)^{k-1}$,其中0<p<1,则Y服从几何分布。
- 模型:重复试验直到首次成功时的试验次数。
- 负二项分布:
- 定义:$P(Y=k)=C_{k-1}^{r-1} p^r (1-p)^{k-r}$,$k=r,r+1,...$,记为$NB(r, p)$。
- 模型:记Y为第r次成功时的总试验次数。
- 关联:$Y = Y_1 + Y_2 + ... + Y_r$($Y_i$为第i次成功所需次数,均为几何分布)。
- 超几何分布:
- 定义:$P(X=k)=\frac{C_M^k \cdot C_{N-M}^{n-k}}{C_N^n}$,满足条件则X服从超几何分布,记为H(n, M, N)。
- 模型:总样本数N,其中M个为特殊类,从中抽取n次,恰抽到k个特殊品的概率。
- 数学近似:当N,M较大时,可用二项分布$B(n, p=\frac{M}{N})$逼近(即抽样不放回近似为放回)。
- 泊松分布:
- 定义:随机变量X取值为$k=0,1,2,...$,满足$P(X=k)=\frac{\lambda^k}{k!} e^{-\lambda}$,λ为正常数,则X服从泊松分布,记为$\pi(\lambda)$或$P(\lambda)$。
- 模型:大量试验中的小概率事件发生次数。
- 近似关系:若$X \sim B(n, p)$,当n很大,p很小时,$\lambda = np$,则X近似服从$P(\lambda)$。
- 查表:设$P(Y=k)=\frac{e^{-\lambda} \cdot \lambda^k}{k!}$,则$P\{Y \geq x\}=1-P\{Y \leq x-1\}=1-F(x-1)=\sum_{k=x}^{+\infty} \frac{e^{-\lambda} \cdot \lambda^k}{k!}$