Skip to content

第四章 随机变量的数字特征

约 1310 个字 预计阅读时间 4 分钟

4.1 数学期望

4.1.1 数学期望定义

对于离散型随机变量

若有分布律\(P(X = x_k) = p_k,\ k=1, 2\),并且级数\(\displaystyle\sum^{+\infty}_{k=1}\left|x_k\right|p_k<\infty\)(级数收敛),那么有数学期望:

\[ E(X) = \sum^{+\infty}_{k=1}x_kp_k \]

对于连续型随机变量

若有概率密度函数\(f(x)\),若积分\(\displaystyle\int^{+\infty}_{-\infty}\left|x\right|f(x){\rm d}x < \infty\)(积分收敛),则有数学期望:

\[ E(X) = \int^{+\infty}_{-\infty}xf(x){\rm d}x \]

数学期望简称期望,又称均值。

4.1.2 随机变量函数的数学期望

\(Y=g(X)\)(连续函数)。

(1)如果\(X\)是离散型随机变量,有分布律:

\[ P(X=x_k) = p_k,\quad k=1, 2, \cdots \]

并且\(\displaystyle\sum^\infty_{k=1}\left|g(x_k)\right|p_k<\infty\),那么有:

\[ E(Y) = E[g(X)] = \sum^\infty_{k=1}g(x_k)p_k \]

(2)如果\(X\)是连续型随机变量,密度函数为\(f(x)\),并且\(\displaystyle\int^{+\infty}_{-\infty}\left|g(x)\right|f(x){\rm d}x < \infty\),那么有:

\[ E(Y) = E(g(X)) = \int^{+\infty}_{-\infty}g(x)f(x){\rm d}x \]

更进一步,如果有\(Z = h(X, Y)\)

(3)若二元离散型随机变量\((X, Y)\)分布律有:

\[ P(X=x_i, Y=y_j) = p_{ij},\quad i,j=1,2,\cdots \]

则有:

\[ E(Z) = E[h(X, Y)] = \sum^\infty_{i=1}\sum^\infty_{j=1}h(x_i, y_j)p_{ij} \]

(4)二元连续型随机变量\((X, Y)\)的密度函数为\(f(x, y)\),则有:

\[ E(Z) = E(h(X, Y)) = \int^{+\infty}_{-\infty}\int^{+\infty}_{-\infty}h(x, y)f(x, y){\rm d}x{\rm d}y \]

特别的,如果有\(X = h(X, Y)\),那么有:

\[ E(X) = \int^{+\infty}_{-\infty}\int^{+\infty}_{-\infty}xf(x, y){\rm d}x{\rm d}y \]

这里举出一个特别有意思的题目:

设X服从\(U(-1,2)\),令\(Y=max{X, 0}\),求\(E(Y)\)

值得注意的是,\(Y\)既不是离散型,也不是连续型(因为\(P(Y=0) = P(max\{X, 0\} = 0) = P(X\leq 0) = \frac{1}{3}\)

\[ \begin{aligned} 解:E(Y) &= E(g(X))\\ &= \int^{+\infty}_{-\infty}max(x, 0)f(x){\rm d}x\\ &= \int^2_{-1}max(x, 0)\frac{1}{3}{\rm d}x\\ &= \int^0_{-1}0·\frac{1}{3}{\rm d}x + \int^{2}_{0}x·\frac{1}{3}{\rm d}x\\ &= \frac{2}{3} \end{aligned} \]

也可求\(Y\)的分布:

\[ \begin{aligned} F_Y(y) = \begin{cases} 0, &y<0\\ \displaystyle\frac{y+1}{3}, &0\leq y < 2\\ 1, &y\geq 2 \end{cases} \end{aligned} \]

4.1.3 数学期望的特性

  • 常数的数学期望等于其自己:\(E(C)=C\)
  • 常数可外提:\(E(CX) = CE(X)\)
  • 数学期望可加性:\(E(aX+bY+c) = aE(X) + bE(Y) + c\)
    由上推广: \(\(E(c_0 + \sum^n_{i=1}c_iX_i) = c_0 + \sum^n_{i=1}c_iE(X_i)\)\)
  • 数学期望可乘性:\(E(XY) = E(X)E(Y)\)
    以上性质当且两个变量独立或者无线性关系

4.2 方差

方差
定义:设\(X\)是随机变量,若\(E[(X-E(X))^2]\)存在,则称其为\(X\)的方差,记为\(Var(X)\)\(D(X)\),即: \(\(Var(X) = E[(X-E(X))^2]\)\)

\(\sigma(X)=\sqrt{Var(X)}\)记为\(\sigma_X\),称为\(X\)的标准差或均方差,它与\(X\)有相同的量纲。

方差\(Var(X)\)刻画了\(X\)取值的分散程度:

  • \(X\)取值比较集中,则\(Var(X)\)较小
  • \(X\)取值比较分散,则\(Var(X)\)较大

\(Var(X)\)是衡量\(X\)取值分散程度的一个指标。

当然也有\(D(X)\)的记号方式。

对于离散型随机变量\(X\),有分布律\(P(X=x_i)=p_i, i=1,2\cdots\)

\[ Var(X) = \sum^\infty_{i=1}[x_i - E(X)]^2p_i \]

对于连续型随机变量,有密度函数\(f(x)\)

\[ Var(X) = \int^{+\infty}_{-\infty}[x - E(X)]^2f(x){\rm d}x \]

利用数学期望性质,还有:

\[ Var(X) = E(X^2) - [E(X)]^2 \]

还常用来计算\(E(X^2)\)

\[ E(X^2) = Var(X) + [E(X)]^2 \]

4.2.2 方差的形式

  • 常数方差为0:\(Var(C)=0\)
  • 常数可外提:\(Var(CX) = C^2Var(X)\)
  • 方差可加性:\(Var(X+Y)=Var(X)+Var(Y)+2E\{[X-E(X)][Y-E(Y)]\}\)
    特别的,如果\(X, Y\)相互独立,则有\(Var(X+Y)=Var(X)+Var(Y)\)

综合以上,如果\(X, Y\)独立,\(a, b, c\)是常数,则有:

\[ Var(aX+bY+c) = a^2Var(X) + b^2Var(Y) \]

4.3 协方差与相关系数

4.3.1 协方差

协方差
记作: \(\(Cov(X, Y) = E\{[X-E(X)][Y-E(Y)]\}\)\)

由上式,协方差有计算公式:

\[ Cov(X, Y) = E(XY) - E(X)E(Y) \]

与前文联系,两个随机变量\(X, Y\)之和的方差为:

\[ Var(X+Y) = Var(X) + Var(Y) + 2Cov(X, Y) \]

拓展有:

\[ Var\left(\sum^n_{i=1}X_i\right) = \sum^n_{i=1}Var(X_i) + \sum^n_{i=1}\sum^n_{j=1}Cov(X_i, X_j) \]

协方差有如下性质:

  • \(Cov(X, Y) = Cov(Y,X)\)
  • \(Cov(X,X) = Var(X)\)
  • \(Cov(aX, bY) = abCov(X, Y)\)
  • \(Cov(aX+bY, Z) = aCov(X, Z) + bCov(Y, Z)\)
  • \(Var(X)Var(Y)\neq 0\)时,有: $$ (Cov(X,Y))^2 \leq Var(X)Var(Y) $$ 其中等号成立当且仅当\(X\)\(Y\)线性相关,即存在常数\(a, b\),使得\(Y = aX + b\)

4.3.2 相关系数

相关系数
记作: \(\(\rho_{XY} = \frac{Cov(X, Y)}{\sqrt{Var(X)}\sqrt{Var(Y)}}\)\)

以上条件是\(E(X^2)\)\(E(Y^2)\)均存在。

由标准化定义:

\[ X^* = \frac{X - E(X)}{\sqrt{Var(X)}},\quad Y^* = \frac{Y - E(Y)}{\sqrt{Var(Y)}} \]

所以我们有:

\[ \rho_{XY} = Cov(X^*, Y^*) \]

相关系数有如下性质:

  • \(|\rho_{XY}| \leq 1\)
  • \(|\rho_{XY}| = 1\)当且仅当\(X\)\(Y\)线性相关,即存在常数\(a, b\),使得\(Y = aX + b\)

4.3.3 不相关定义

当随机变量\(X, Y\)的相关系数:

\[ \rho_{XY} = 0 \]

时,称\(X, Y\)不相关,或是零相关。

注意:不相关并不意味着独立。

有相关定义,“不相关”的等价定义还有:

  • \(Cov(X, Y) = 0\)
  • \(E(XY) = E(X)E(Y)\)
  • \(Var(X+Y) = Var(X) + Var(Y)\)

在实际问题中,可以用独立可推不相关,相关可推不独立的结论进行判断。

特别地,对于\((X, Y)\)服从二维正态分布,则\(X, Y\)相互独立是\(X, Y\)不相关的充分必要条件。

4.4 其他数字特征

4.4.1 距

定义:\(X, Y\)为随机变量。

\(\mu_k = E(X^k)\quad k=1,2,\dots\)存在,称其为X的k阶原点距。

\[ \nu_k = E[(X-E(X))^k] \]

为X的k阶中心距,称

\[ E(X^kY^l) \]

为X与Y的k+l阶混合(原点)距,称

\[ E[(X-E(X))^k(X-E(X))^l] \]

为X与Y的k+l阶混合中心距。

4.4.2 分位数

略。

4.5 多维随机变量的数字特征

关于n维正态分布有一些很好的性质,有如下几个:

  • 如果\((X_1, X_2, \cdots, X_n)\)服从n维正态分布,那么它的每一个分量\(X_i\)也服从正态分布。
  • 如果\((X_1, X_2, \cdots, X_n)\)服从n维正态分布,那么它的每一个线性组合\(Y = a_1X_1 + a_2X_2 + \cdots + a_nX_n\)也服从正态分布。
  • 如果\((X_1, X_2, \cdots, X_n)\)服从n维正态分布,那么它的每一个线性组合\(Y_k = a_{1k}X_{1k} + a_{2k}X_{2k} + \cdots + a_{nk}X_{nk}\)的组合\((Y_1, Y_2, \dots, Y_k)\)也服从正态分布。
  • 如果\((X_1, X_2, \cdots, X_n)\)服从n维正态分布,那么它的每一个分量\(X_i\)相互独立的充要条件是\(X_1, X_2,\dots,X_n\)两两不相关。