Skip to content

第二章 随机变量及其概率分布

约 1586 个字 预计阅读时间 5 分钟

2.1 随机变量

对于任何可以将研究对象数量化的,我们引入随机变量方便进行概率运算。

随机变量
设随机试验的样本空间为\({S=\{e\}}\), 若\({X=\{e\}}\)为定义在样本空间S上的实值单值函数, 则称\({X=\{e\}}\)为随机变量。

一般的,若\({I\in R}\),则\({X\in I}\)为事件\({\{e:X(e)\in I\}}\)

常见的随机变量类型有:离散型连续型

2.2 离散型随机变量及其分布

离散型随机变量
取值至多可数的随机变量为离散型的随机变量

概率分布律如下:

\({X}\)取值 \({x_1}\) \({x_2}\) \({\cdots}\) \({x_i}\) \({\cdots}\)
\({P\{X=x_i\}}\) \({p_1}\) \({p_2}\) \({\cdots}\) \({p_i}\) \({\cdots}\)

其中\({\displaystyle p_i\geq 0,\sum_{i=1}^\infty p_i=1}\)

2.2.1 0-1点分布

0-1分布/两点分布
设随机变量X只可能取0、1两个值,其概率分布为:

\({X}\) \({1}\) \({0}\)
\({P}\) \({p}\) \({1-p}\)

则称X服从参数为p的0-1分布或两点分布,记作\({X\sim B(1,p)}\)

0-1分布的分布律还可以写为:

\[ P(X=k)=p^k(1-p)^{1-k},k=0, 1 \]

2.2.2 二项分布

对于一个服从0-1分布的事件,倘若进行多次试验,我们称为n重贝努利试验

n重贝努利试验
将某个试验独立重复n次,且每次试验只有两个可能结果(成功/失败),成功概率保持不变(记为p),称为n重贝努利试验。

n重贝努利试验有两个要点:

  • 每次实验结果独立
  • 相同条件重复进行

在n重贝努利试验中,设X为n次试验中成功的次数,则X的分布律为:

\(P\{X=k\}=C_n^kp^k(1-p)^{n-k},k=0,1,2,...,n\)

称X服从参数为n,p的二项分布,记作\({X\sim B(n,p)}\)

2.2.3 泊松分布

泊松分布
设随机变量X的分布律为:

\({\displaystyle P\{X=k\}=\frac{\lambda^k}{k!}e^{-\lambda}},k=0,1,2,...\)

其中\({\lambda>0}\)是常数,则称X服从参数为\({\lambda}\)的泊松分布,记作\({X\sim P(\lambda)}\)

特别的,当n>10,p<0.1时候,泊松分布与二项式分布有近似结果:

\[ C^k_np^k(1-p)^{n-k} \approx \frac{e^{-\lambda}\lambda^k}{k!},其中\lambda = np \]

2.2.3 超几何分布

\[ P\{X=k\}=\frac{C^k_aC^{n-k}_b}{C^n_N} \]

记为\({H(n, a, N)}\)

2.2.4 帕斯卡分布

\[ P\{X=k\}=C^{r-1}_{k-1}p^r(1-p)^{k-r} \]

记作\({NB(r, p)}\)

2.3 随机变量的概率分布函数

很多随机变量的分布是连续的而非离散的,这意味着存在着不可列的样本点,如果仍旧采用离散型的研究思路,一本草稿纸都写不下所有情况。

所以在这里我们不再只关注单独样本点,而是关注连续的范围

注意到,对于一个区间上的连续变量X,有:

\[ \{a\leq X\leq b\} = \{X\leq b\} - \{X\leq a\} \]

同时我们定义有函数:\({F(x)=P(X\leq x)}\),则称\({F(x)}\)为X的分布函数

所以上式在概率可为:

\[ P(a\leq X\leq b) = F(b) - F(a) \]

分布函数的性质

  1. 单调性:\({x_1 < x_2}\),则\({F(x_1) \leq F(x_2)}\)
  2. 有界性:对任意x,有\({0 \leq F(x) \leq 1}\)
  3. 右连续性:对任意x,有\({F(x+0)=F(x)}\)
  4. 极限性:\({F(-\infty)=0}\)\({F(+\infty)=1}\)

一般地,设离散型随机变量X的分布律为:

\[ P\{X=x_k\}=p_k,\quad k = 1,2,\dots \]

由概率可列可加性得到:

\[ F(x)=\sum_{x_k\leq x}p_k \]

不难看出,离散型的分布函数在各样本点上存在跳跃。

有了以上认识,我们可以知道,随机变量X在x样本点上的概率为:

\[ P(X=x) = F(x+0) - F(x-0) \]

也就是该点上分布函数的右极限减去左极限。

2.4 连续型随机变量

对于随机变量F(x),若存在非负的函数f(x),使对于任意实数x,有:

\[ F(x)=\int^x_{-\infty}f(t){\rm d}t \]

称X为连续型随机变量,其中f(x)称为X的概率密度函数,简称密度函数

概率密度函数的性质

  1. 非负性:对任意x,有\({f(x)\geq 0}\)
  2. 归一性:\({\displaystyle\int_{-\infty}^{+\infty}f(x){\rm d}x=1}\)
  3. 连续性:在f(x)的连续点x处,有\({F'(x)=f(x)}\)
  4. 区间概率:对任意区间[a,b],有\({\displaystyle P\{a\leq X\leq b\}=\int_a^bf(x){\rm d}x}\)

一般来说,我们对密度函数的检验主要依据前两条性质。

2.4.1 均匀分布

设随机变量X的密度函数为:

\[ f(x)=\begin{cases} \frac{1}{b-a}, & a\leq x\leq b\\ 0, & 其他 \end{cases} \]

则称X服从区间[a,b]上的均匀分布,记作\({X\sim U(a,b)}\)

其分布函数为:

\[ F(x)=\begin{cases} 0, & x<a\\ \frac{x-a}{b-a}, & a\leq x\leq b\\ 1, & x>b \end{cases} \]

2.4.2 正态分布

正态分布是一种最重要的连续型分布。设随机变量X的密度函数为:

\[ f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}, \quad -\infty < x < +\infty \]

其中\(\mu\)\(\sigma>0\)为常数,则称X服从参数为\(\mu\)\(\sigma^2\)的正态分布,记作\({X\sim N(\mu,\sigma^2)}\)

特别地,当\(\mu=0,\sigma=1\)时,称为标准正态分布,记作\({X\sim N(0,1)}\)。其密度函数记作:

\[ \varphi(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}} \]

分布函数记作:

\[ \Phi(x)=\int_{-\infty}^x\varphi(t)dt \]

同时有如下关系:

\[ \begin{aligned} &\varphi(x)=\varphi(-x)\\ &\Phi(x)+\Phi(-x)=1 \end{aligned} \]

正态分布的性质

  • 对称性:正态分布的密度函数关于\({x=\mu}\)对称
  • 单峰性:\({x=\mu}\)处取最大值\({\frac{1}{\sqrt{2\pi}\sigma}}\)
  • 尾部性质:\({|x|\to\infty}\)时,\({f(x)\to 0}\)
  • 线性性质:\({X\sim N(\mu,\sigma^2)}\),则\({Y=aX+b\sim N(a\mu+b,a^2\sigma^2)}\)

正态函数的标准化:\({X\sim N(\mu,\sigma^2)}\),则\({\frac{X-\mu}{\sigma}\sim N(0,1)}\)

也就是:

\[ P(a<X<b)=F(b)-F(a)=\Phi(\frac{b-\mu}{\sigma})-\Phi(\frac{a-\mu}{\sigma}) \]

所以所有正态函数都可以转化为标准正态函数的情况,根据一张标准正态分布表,就可以求出所有正态函数的相应结果。

我们同样有常用的\({3\sigma}\)法则:

\[ \begin{aligned} &P\{|X-\mu|\leq\sigma\}\approx 0.6826\\ &P\{|X-\mu|\leq 2\sigma\}\approx 0.9544\\ &P\{|X-\mu|\leq 3\sigma\}\approx 0.9974 \end{aligned} \]

一般认为超出\({3\sigma}\)的数据是意外的,无效的,无需考虑。

2.4.3 指数分布

设随机变量X的密度函数为:

\[ f(x)=\begin{cases} \lambda e^{-\lambda x}, & x\geq 0\\ 0, & x<0 \end{cases} \]

其中\(\lambda>0\)为常数,则称X服从参数为\(\lambda\)的指数分布,记作\({X\sim E(\lambda)}\)

其分布函数为:

\[ F(x)=\begin{cases} 1-e^{-\lambda x}, & x\geq 0\\ 0, & x<0 \end{cases} \]

指数分布的无记忆性
\({X\sim E(\lambda)}\),对任意\({s,t>0}\),有:

\({P\{X>s+t|X>s\} = P\{X>t\}}\)

即:在已知\({X>s}\)的条件下,\({X>s+t}\)的条件概率只依赖于\({t}\)的大小,与\({s}\)无关。

2.5 随机变量函数的分布

一般,若已知\({X}\)的概率分布,\({Y=g(X)}\),求\({Y}\)的概率分布的过程为:

  1. \({Y}\)为离散型随机变量,则先写出所有可能取值,再找出等价事件使得\({P(Y=y_i)=P(X\in D_j)}\)
  2. \({Y}\)为连续型随机变量,则先写出概率分布函数,找出等价事件,使得\({F_Y(y)=P(X\in D_y)}\),求出概率密度函数\({f_Y(y)}\)

2.5.1 定理

\({X\sim f_X(x),-\infty < x < +\infty,g'(x)>0(或者g'(x)<0)}\),若\({Y=g(X)}\),那么\({Y}\)具有概率密度函数为:

\[ f_Y(y)=\begin{cases} f_X(h(y))·\left|h'(y)\right|,\quad\alpha<y<\beta\\ \\ 0,\quad 其他 \end{cases} \]

其中\({(\alpha,\beta)}\)\({Y}\)的取值范围,\({h}\)\({g}\)的反函数。

证明如下图:

同时该定理有推论:

设随机变量X的密度函数为\({f_X(x)}\)\({g(x)}\)\({x}\)的函数,若在\({f_X(x)≠0}\)的区域内,\({g(x)}\)严格单调,则\({Y=g(X)}\)的密度函数为:

\[ f_Y(y)=\begin{cases} f_X(h(y))·|h'(y)|, & \alpha < y < \beta\\ \\ 0, & 其他 \end{cases} \]

其中\({\alpha = \min(g(a),g(b))}\)\({\beta = \max(g(a),g(b))}\)