第二章 随机变量及其概率分布
2.1 随机变量
对于任何可以将研究对象数量化的,我们引入随机变量方便进行概率运算。
随机变量
设随机试验的样本空间为\({S=\{e\}}\), 若\({X=\{e\}}\)为定义在样本空间S上的实值单值函数, 则称\({X=\{e\}}\)为随机变量。
一般的,若\({I\in R}\),则\({X\in I}\)为事件\({\{e:X(e)\in I\}}\)
常见的随机变量类型有:离散型和连续型。
2.2 离散型随机变量及其分布
离散型随机变量
取值至多可数的随机变量为离散型的随机变量
概率分布律如下:
\({X}\)取值 | \({x_1}\) | \({x_2}\) | \({\cdots}\) | \({x_i}\) | \({\cdots}\) |
---|---|---|---|---|---|
\({P\{X=x_i\}}\) | \({p_1}\) | \({p_2}\) | \({\cdots}\) | \({p_i}\) | \({\cdots}\) |
其中\({\displaystyle p_i\geq 0,\sum_{i=1}^\infty p_i=1}\)
2.2.1 0-1点分布
0-1分布/两点分布
设随机变量X只可能取0、1两个值,其概率分布为:
\({X}\) \({1}\) \({0}\) \({P}\) \({p}\) \({1-p}\) 则称X服从参数为p的0-1分布或两点分布,记作\({X\sim B(1,p)}\)
0-1分布的分布律还可以写为:
2.2.2 二项分布
对于一个服从0-1分布的事件,倘若进行多次试验,我们称为n重贝努利试验。
n重贝努利试验
将某个试验独立重复n次,且每次试验只有两个可能结果(成功/失败),成功概率保持不变(记为p),称为n重贝努利试验。
n重贝努利试验有两个要点:
- 每次实验结果独立
- 相同条件重复进行
在n重贝努利试验中,设X为n次试验中成功的次数,则X的分布律为:
\(P\{X=k\}=C_n^kp^k(1-p)^{n-k},k=0,1,2,...,n\)
称X服从参数为n,p的二项分布,记作\({X\sim B(n,p)}\)
2.2.3 泊松分布
泊松分布
设随机变量X的分布律为:\({\displaystyle P\{X=k\}=\frac{\lambda^k}{k!}e^{-\lambda}},k=0,1,2,...\)
其中\({\lambda>0}\)是常数,则称X服从参数为\({\lambda}\)的泊松分布,记作\({X\sim P(\lambda)}\)
特别的,当n>10,p<0.1时候,泊松分布与二项式分布有近似结果:
2.2.3 超几何分布
记为\({H(n, a, N)}\)
2.2.4 帕斯卡分布
记作\({NB(r, p)}\)
2.3 随机变量的概率分布函数
很多随机变量的分布是连续的而非离散的,这意味着存在着不可列的样本点,如果仍旧采用离散型的研究思路,一本草稿纸都写不下所有情况。
所以在这里我们不再只关注单独样本点,而是关注连续的范围。
注意到,对于一个区间上的连续变量X,有:
同时我们定义有函数:\({F(x)=P(X\leq x)}\),则称\({F(x)}\)为X的分布函数。
所以上式在概率可为:
分布函数的性质
- 单调性:若\({x_1 < x_2}\),则\({F(x_1) \leq F(x_2)}\)
- 有界性:对任意x,有\({0 \leq F(x) \leq 1}\)
- 右连续性:对任意x,有\({F(x+0)=F(x)}\)
- 极限性:\({F(-\infty)=0}\),\({F(+\infty)=1}\)
一般地,设离散型随机变量X的分布律为:
由概率可列可加性得到:
不难看出,离散型的分布函数在各样本点上存在跳跃。
有了以上认识,我们可以知道,随机变量X在x样本点上的概率为:
也就是该点上分布函数的右极限减去左极限。
2.4 连续型随机变量
对于随机变量F(x),若存在非负的函数f(x),使对于任意实数x,有:
称X为连续型随机变量,其中f(x)称为X的概率密度函数,简称密度函数
概率密度函数的性质
- 非负性:对任意x,有\({f(x)\geq 0}\)
- 归一性:\({\displaystyle\int_{-\infty}^{+\infty}f(x){\rm d}x=1}\)
- 连续性:在f(x)的连续点x处,有\({F'(x)=f(x)}\)
- 区间概率:对任意区间[a,b],有\({\displaystyle P\{a\leq X\leq b\}=\int_a^bf(x){\rm d}x}\)
一般来说,我们对密度函数的检验主要依据前两条性质。
2.4.1 均匀分布
设随机变量X的密度函数为:
则称X服从区间[a,b]上的均匀分布,记作\({X\sim U(a,b)}\)
其分布函数为:
2.4.2 正态分布
正态分布是一种最重要的连续型分布。设随机变量X的密度函数为:
其中\(\mu\)和\(\sigma>0\)为常数,则称X服从参数为\(\mu\)和\(\sigma^2\)的正态分布,记作\({X\sim N(\mu,\sigma^2)}\)
特别地,当\(\mu=0,\sigma=1\)时,称为标准正态分布,记作\({X\sim N(0,1)}\)。其密度函数记作:
分布函数记作:
同时有如下关系:
正态分布的性质
- 对称性:正态分布的密度函数关于\({x=\mu}\)对称
- 单峰性:在\({x=\mu}\)处取最大值\({\frac{1}{\sqrt{2\pi}\sigma}}\)
- 尾部性质:当\({|x|\to\infty}\)时,\({f(x)\to 0}\)
- 线性性质:若\({X\sim N(\mu,\sigma^2)}\),则\({Y=aX+b\sim N(a\mu+b,a^2\sigma^2)}\)
正态函数的标准化:若\({X\sim N(\mu,\sigma^2)}\),则\({\frac{X-\mu}{\sigma}\sim N(0,1)}\)
也就是:
所以所有正态函数都可以转化为标准正态函数的情况,根据一张标准正态分布表,就可以求出所有正态函数的相应结果。
我们同样有常用的\({3\sigma}\)法则:
一般认为超出\({3\sigma}\)的数据是意外的,无效的,无需考虑。
2.4.3 指数分布
设随机变量X的密度函数为:
其中\(\lambda>0\)为常数,则称X服从参数为\(\lambda\)的指数分布,记作\({X\sim E(\lambda)}\)
其分布函数为:
指数分布的无记忆性
设\({X\sim E(\lambda)}\),对任意\({s,t>0}\),有:\({P\{X>s+t|X>s\} = P\{X>t\}}\)
即:在已知\({X>s}\)的条件下,\({X>s+t}\)的条件概率只依赖于\({t}\)的大小,与\({s}\)无关。
2.5 随机变量函数的分布
一般,若已知\({X}\)的概率分布,\({Y=g(X)}\),求\({Y}\)的概率分布的过程为:
- 若\({Y}\)为离散型随机变量,则先写出所有可能取值,再找出等价事件使得\({P(Y=y_i)=P(X\in D_j)}\)
- 若\({Y}\)为连续型随机变量,则先写出概率分布函数,找出等价事件,使得\({F_Y(y)=P(X\in D_y)}\),求出概率密度函数\({f_Y(y)}\)
2.5.1 定理
设\({X\sim f_X(x),-\infty < x < +\infty,g'(x)>0(或者g'(x)<0)}\),若\({Y=g(X)}\),那么\({Y}\)具有概率密度函数为:
其中\({(\alpha,\beta)}\)是\({Y}\)的取值范围,\({h}\)为\({g}\)的反函数。
证明如下图:
同时该定理有推论:
设随机变量X的密度函数为\({f_X(x)}\),\({g(x)}\)为\({x}\)的函数,若在\({f_X(x)≠0}\)的区域内,\({g(x)}\)严格单调,则\({Y=g(X)}\)的密度函数为:
其中\({\alpha = \min(g(a),g(b))}\),\({\beta = \max(g(a),g(b))}\)。