第一章 概率论的基本概念
第二章 随机变量及其分布
第三章 多维随机变量及其分布
第四章 随机变量的数字特征
第五章 大数定理及中心极限定理
第六章 样本及抽样分布
第七章 参数估计
第八章 假设检验
第四章 随机变量的数字特征
4.1 数学期望
数学期望的概念、计算
-
离散型随机变量的数学期望
设离散型随机变量X的分布律为:
P\{X=x_k\}=p_k,\quad k=1,2,...
若级数\sum\limits^{\infty}_{k=1}x_kp_k绝对收敛,则称级数\sum\limits^{\infty}_{k=1}x_kp_k的和为随机变量X的数学期望,记为E(X)。即:
E(X)=\sum\limits^{\infty}_{k=1}x_kp_k
-
连续型随机变量的数学期望
设X是连续性随机变量,其密度函数为f(x),若\int^{+\infty}_{-\infty}|x|f(x)\mathrm dx有限,则X的数学期望为:
E(X)=\int^{+\infty}_{-\infty}xf(x)dx
常见离散型随机变量的数学期望
-
0-1分布
X\sim b(1,p)\\E(X)=p
-
二项分布
X\sim b(n,p)\\E(X)=np
-
泊松分布
X\sim \pi(\lambda)\\E(X)=\lambda
常见的连续型随机变量的数学期望
-
均匀分布
X\sim U(a,b)\\E(X)=\frac {a+b}2
-
指数分布
f(x)=\begin{cases} \frac 1\theta e^{-\frac x\theta, }&x>0\\ 0,&其他 \end{cases}\\ E(X)=\theta
-
正态分布
X\sim N(\mu,\sigma^2)\\E(X)=\mu
随机变量函数的数学期望
-
定义:
设Y是随机变量X的函数,Y=g(X)(g是连续函数),则:
E(Y)=E[g(X)]=\begin{cases} \sum\limits^\infty_{k=1}g(x_k)p_k,&X离散型\\\int^\infty_{-\infty}g(x)f(x)\mathrm dx,&X连续型 \end{cases}
当X为离散型时,P\{X=x_k\}=p_k;
当X为连续型时,X的密度函数为f(x)。
-
推广到两个随机变量Z=g(X,Y):
设二维离散型随机变量(X,Y)的分布律为p_{ij},i=1,2,...;j=1,2,...。则:
E[g(X,Y)]=\sum\limits^{\infty}_{i=1}\sum\limits^{\infty}_{j=1}g(x_i,y_j)p_{ij}
设二维连续性随机变量(X,Y)的密度函数为f(x,y),则:
E[g(X,Y)]=\int^{+\infty}_{-\infty}\int^{+\infty}_{-\infty}g(x,y)f(x,y)\mathrm dx\mathrm dy
数学期望的性质
-
设C是常数,则有E(C)=C;
-
设X是一个随机变量,C是常数,则有:
E(CX)=CE(X)
-
设X,Y是两个随机变量,则有:
E(X+Y)=E(X)+E(Y)
-
设X,Y是相互独立的随机变量,则有:
E(XY)=E(X)E(Y)
4.2 方差
方差的定义
设X是一个随机变量,若E\{[X-E(X)]^2\}存在,记为D(x)或\mathrm{Var}(X)为X的方差,即:
D(X)=\mathrm{Var}(X)=E\{[X-E(X)]^2\}
在应用上还引入了\sqrt{D(X)},记为\sigma(X),称为标准差或均方差。
方差的意义
按照定义,随机变量X的方差表达了X的取值与其数学期望的偏离程度。若D(X)较小意味着X的取值比较集中在E(X)的附近,若D(X)较大,则表示X的取值较分散。
D(X)是刻画X取值分散程度的一个量,它是衡量X取值分散程度的一个尺度。
方差的计算
-
利用定义计算
对于离散型随机变量:
D(X)=\sum\limits^\infty_{k=1}[x_k-E(X)]^2p_k
其中P\{X=x_k\}=p_k,k=1,2,...是X的分布律。
对于连续型随机变量:
D(X)=\int^{+\infty}_{-\infty}[x-E(x)]^2f(x)\mathrm dx
其中f(x)为X的概率密度。
-
利用公式计算
D(X)=E(X^2)-[E(X)]^2
方差的性质
-
设C是常数,则D(C)=0;
-
设X是一个随机变量,C是常数,则有:
D(CX)=C^2D(X)\\D(X+C)=D(X)
-
设X,Y是两个随机变量,则有:
\begin{aligned} &D(X+Y)\\=&D(X)+D(Y)+2E\{[X-E(X)][Y-E(Y)]\}\\=&D(X)+D(Y)+2[E(XY)-E(X)E(Y)] \end{aligned}
若X,Y相互独立,则有:
D(X+Y)=D(X)+D(Y)
-
D(X)=0的充要条件是X取常数C的概率为1:
P\{X=E(X)\}=1,C=E(X)
重要概率的方差
-
0-1分布
X\sim b(1,p)\\D(X)=p(1-p)
-
二项分布
X\sim b(n,p)\\D(X)=np(1-p)
-
泊松分布
X\sim \pi(\lambda)\\D(X)=\lambda
-
均匀分布
X\sim U(a,b)\\D(X)=\frac{(b-a)^2}{12}
-
指数分布
f(x)=\begin{cases} \frac 1\theta e^{-\frac x\theta},&x>0\\0,&其他 \end{cases}\\D(X) = \theta^2
-
正态分布
X\sim N(\mu,\sigma^2)\\D(X)=\sigma^2
切比雪夫不等式
设随机变量X具有数学期望E(X)=\mu,方差D(X)=\sigma^2,则对于任意正数\epsilon,不等式:
P\{|X-\mu|\ge\epsilon\}\ge\frac{\sigma^2}{\epsilon^2}
成立。
- 应用:切比雪夫不等式给出了随机变量分布未知,而只知道E(x)和D(x)P\{|X-E(x)|<\epsilon\}情况下估计概率的P\{|X-\mu|\ge\epsilon\}的界限。
4.3 协方差及相关系数
协方差
- 定义:任意两个随机变量X和Y的协方差,记为Cov(X,Y),定义为:
Cov(X,Y)=E\{[X-E(X)][Y-E(Y)]\}
-
计算方法:
Cov(X,Y)=E(XY)-E(X)E(Y)
可见,若X与Y独立,Cov(X,Y)=0。
-
简单性质:
- Cov(X,Y)=Cov(Y,X);
- Cov(X,X)=D(X);
- Cov(aX,bY)=abCov(X,Y),a,b为常数。
- Cov(X_1+X_2,Y)=Cov(X_1,Y)+Cov(X_2,Y)。
-
协方差的大小在一定程度上反映了X,Y相互间的关系,但它还受X与Y本身量度的影响,为了克服这个缺点,对协方差进行标准化,这就引入了相关系数。
相关系数
-
定义:设D(X)>0,D(Y)>0,称:
\rho_{XY}=\frac{Cov(X,Y)}{\sqrt{D(X)D(Y)}}
为随机变量X与Y的相关系数。在不致引起混淆时,记\rho_{XY}为\rho。
-
相关系数的意义:
设e=E[Y-(a+bX)^2],则e可以用来衡量a+bX近似表达Y的好坏程度。当e的值越小,表示a+bX与Y的近似程度越好。- 当|\rho_{XY}|较大时e较小,表明X,Y的线性关系联系较紧密。
- 当|\rho_{XY}|较小时,表明X,Y的线性相关程度较差。
- 当|\rho_{XY}|=0时,称X,Y不相关。
-
相关系数的性质:
- |\rho_{XY}|\le1;
- |\rho_{XY}|=1的充要条件是:存在常数a,b使P\{Y=a+bX\}=1。
4.4 矩、协方差矩阵
该内容不做讨论。
习题

-
答案


-
答案


-
答案

设已知2X+3Y=7,则X和Y的相关系数=() 。
-
答案
-1
当X和Y成完全线性相关时,XY成正相关,相关系数为1,负相关相关系数为-1.
设随机变量X的方差为2,根据切比雪夫不等式估计P\{|X-E(X)|\ge2\}\le()。
-
答案
\frac 12
评论区