第四章 随机变量的数字特征
4.1 数学期望
4.1.1 数学期望定义
对于离散型随机变量:
若有分布律\(P(X = x_k) = p_k,\ k=1, 2\),并且级数\(\displaystyle\sum^{+\infty}_{k=1}\left|x_k\right|p_k<\infty\)(级数收敛),那么有数学期望:
对于连续型随机变量:
若有概率密度函数\(f(x)\),若积分\(\displaystyle\int^{+\infty}_{-\infty}\left|x\right|f(x){\rm d}x < \infty\)(积分收敛),则有数学期望:
数学期望简称期望,又称均值。
4.1.2 随机变量函数的数学期望
设\(Y=g(X)\)(连续函数)。
(1)如果\(X\)是离散型随机变量,有分布律:
并且\(\displaystyle\sum^\infty_{k=1}\left|g(x_k)\right|p_k<\infty\),那么有:
(2)如果\(X\)是连续型随机变量,密度函数为\(f(x)\),并且\(\displaystyle\int^{+\infty}_{-\infty}\left|g(x)\right|f(x){\rm d}x < \infty\),那么有:
更进一步,如果有\(Z = h(X, Y)\)。
(3)若二元离散型随机变量\((X, Y)\)分布律有:
则有:
(4)二元连续型随机变量\((X, Y)\)的密度函数为\(f(x, y)\),则有:
特别的,如果有\(X = h(X, Y)\),那么有:
这里举出一个特别有意思的题目:
设X服从\(U(-1,2)\),令\(Y=max{X, 0}\),求\(E(Y)\)。
值得注意的是,\(Y\)既不是离散型,也不是连续型(因为\(P(Y=0) = P(max\{X, 0\} = 0) = P(X\leq 0) = \frac{1}{3}\)
也可求\(Y\)的分布:
4.1.3 数学期望的特性
- 常数的数学期望等于其自己:\(E(C)=C\)
- 常数可外提:\(E(CX) = CE(X)\)
- 数学期望可加性:\(E(aX+bY+c) = aE(X) + bE(Y) + c\)
由上推广: \(\(E(c_0 + \sum^n_{i=1}c_iX_i) = c_0 + \sum^n_{i=1}c_iE(X_i)\)\) - 数学期望可乘性:\(E(XY) = E(X)E(Y)\)
以上性质当且两个变量独立或者无线性关系
4.2 方差
方差
定义:设\(X\)是随机变量,若\(E[(X-E(X))^2]\)存在,则称其为\(X\)的方差,记为\(Var(X)\)或\(D(X)\),即: \(\(Var(X) = E[(X-E(X))^2]\)\)将\(\sigma(X)=\sqrt{Var(X)}\)记为\(\sigma_X\),称为\(X\)的标准差或均方差,它与\(X\)有相同的量纲。
方差\(Var(X)\)刻画了\(X\)取值的分散程度:
- 若\(X\)取值比较集中,则\(Var(X)\)较小
- 若\(X\)取值比较分散,则\(Var(X)\)较大
\(Var(X)\)是衡量\(X\)取值分散程度的一个指标。
当然也有\(D(X)\)的记号方式。
对于离散型随机变量\(X\),有分布律\(P(X=x_i)=p_i, i=1,2\cdots\):
对于连续型随机变量,有密度函数\(f(x)\):
利用数学期望性质,还有:
还常用来计算\(E(X^2)\):
4.2.2 方差的形式
- 常数方差为0:\(Var(C)=0\)
- 常数可外提:\(Var(CX) = C^2Var(X)\)
- 方差可加性:\(Var(X+Y)=Var(X)+Var(Y)+2E\{[X-E(X)][Y-E(Y)]\}\)
特别的,如果\(X, Y\)相互独立,则有\(Var(X+Y)=Var(X)+Var(Y)\)
综合以上,如果\(X, Y\)独立,\(a, b, c\)是常数,则有:
4.3 协方差与相关系数
4.3.1 协方差
协方差
记作: \(\(Cov(X, Y) = E\{[X-E(X)][Y-E(Y)]\}\)\)
由上式,协方差有计算公式:
与前文联系,两个随机变量\(X, Y\)之和的方差为:
拓展有:
协方差有如下性质:
- \(Cov(X, Y) = Cov(Y,X)\)
- \(Cov(X,X) = Var(X)\)
- \(Cov(aX, bY) = abCov(X, Y)\)
- \(Cov(aX+bY, Z) = aCov(X, Z) + bCov(Y, Z)\)
- 当\(Var(X)Var(Y)\neq 0\)时,有: $$ (Cov(X,Y))^2 \leq Var(X)Var(Y) $$ 其中等号成立当且仅当\(X\)与\(Y\)线性相关,即存在常数\(a, b\),使得\(Y = aX + b\)。
4.3.2 相关系数
相关系数
记作: \(\(\rho_{XY} = \frac{Cov(X, Y)}{\sqrt{Var(X)}\sqrt{Var(Y)}}\)\)以上条件是\(E(X^2)\)与\(E(Y^2)\)均存在。
由标准化定义:
所以我们有:
相关系数有如下性质:
- \(|\rho_{XY}| \leq 1\)
- \(|\rho_{XY}| = 1\)当且仅当\(X\)与\(Y\)线性相关,即存在常数\(a, b\),使得\(Y = aX + b\)。
4.3.3 不相关定义
当随机变量\(X, Y\)的相关系数:
时,称\(X, Y\)不相关,或是零相关。
注意:不相关并不意味着独立。
有相关定义,“不相关”的等价定义还有:
- \(Cov(X, Y) = 0\)
- \(E(XY) = E(X)E(Y)\)
- \(Var(X+Y) = Var(X) + Var(Y)\)
在实际问题中,可以用独立可推不相关,相关可推不独立的结论进行判断。
特别地,对于\((X, Y)\)服从二维正态分布,则\(X, Y\)相互独立是\(X, Y\)不相关的充分必要条件。
4.4 其他数字特征
4.4.1 距
定义:\(X, Y\)为随机变量。
若\(\mu_k = E(X^k)\quad k=1,2,\dots\)存在,称其为X的k阶原点距。
称
为X的k阶中心距,称
为X与Y的k+l阶混合(原点)距,称
为X与Y的k+l阶混合中心距。
4.4.2 分位数
略。
4.5 多维随机变量的数字特征
关于n维正态分布有一些很好的性质,有如下几个:
- 如果\((X_1, X_2, \cdots, X_n)\)服从n维正态分布,那么它的每一个分量\(X_i\)也服从正态分布。
- 如果\((X_1, X_2, \cdots, X_n)\)服从n维正态分布,那么它的每一个线性组合\(Y = a_1X_1 + a_2X_2 + \cdots + a_nX_n\)也服从正态分布。
- 如果\((X_1, X_2, \cdots, X_n)\)服从n维正态分布,那么它的每一个线性组合\(Y_k = a_{1k}X_{1k} + a_{2k}X_{2k} + \cdots + a_{nk}X_{nk}\)的组合\((Y_1, Y_2, \dots, Y_k)\)也服从正态分布。
- 如果\((X_1, X_2, \cdots, X_n)\)服从n维正态分布,那么它的每一个分量\(X_i\)相互独立的充要条件是\(X_1, X_2,\dots,X_n\)两两不相关。