侧边栏壁纸
博主头像
LittleAO的学习小站 博主等级

在知识的沙漠寻找绿洲

  • 累计撰写 125 篇文章
  • 累计创建 27 个标签
  • 累计收到 0 条评论

目 录CONTENT

文章目录

概率论与数理统计第四章笔记

LittleAO
2023-04-13 / 0 评论 / 0 点赞 / 144 阅读 / 0 字
温馨提示:
本文最后更新于2023-11-18,若内容或图片失效,请留言反馈。 部分素材来自网络,若不小心影响到您的利益,请联系我们删除。

第一章 概率论的基本概念
第二章 随机变量及其分布
第三章 多维随机变量及其分布
第四章 随机变量的数字特征
第五章 大数定理及中心极限定理
第六章 样本及抽样分布
第七章 参数估计
第八章 假设检验

第四章 随机变量的数字特征

4.1 数学期望

数学期望的概念、计算

  • 离散型随机变量的数学期望

    设离散型随机变量X的分布律为:

    P\{X=x_k\}=p_k,\quad k=1,2,...

    若级数\sum\limits^{\infty}_{k=1}x_kp_k绝对收敛,则称级数\sum\limits^{\infty}_{k=1}x_kp_k的和为随机变量X的数学期望,记为E(X)。即:

    E(X)=\sum\limits^{\infty}_{k=1}x_kp_k

  • 连续型随机变量的数学期望

    X是连续性随机变量,其密度函数为f(x),若\int^{+\infty}_{-\infty}|x|f(x)\mathrm dx有限,则X的数学期望为:

    E(X)=\int^{+\infty}_{-\infty}xf(x)dx

常见离散型随机变量的数学期望

  1. 0-1分布

    X\sim b(1,p)\\E(X)=p

  2. 二项分布

    X\sim b(n,p)\\E(X)=np

  3. 泊松分布

    X\sim \pi(\lambda)\\E(X)=\lambda

常见的连续型随机变量的数学期望

  1. 均匀分布

    X\sim U(a,b)\\E(X)=\frac {a+b}2

  2. 指数分布

    f(x)=\begin{cases} \frac 1\theta e^{-\frac x\theta, }&x>0\\ 0,&其他 \end{cases}\\ E(X)=\theta

  3. 正态分布

    X\sim N(\mu,\sigma^2)\\E(X)=\mu

随机变量函数的数学期望

  • 定义:

    Y是随机变量X的函数,Y=g(X)g是连续函数),则:

    E(Y)=E[g(X)]=\begin{cases} \sum\limits^\infty_{k=1}g(x_k)p_k,&X离散型\\\int^\infty_{-\infty}g(x)f(x)\mathrm dx,&X连续型 \end{cases}

    X为离散型时,P\{X=x_k\}=p_k

    X为连续型时,X的密度函数为f(x)

  • 推广到两个随机变量Z=g(X,Y)

    设二维离散型随机变量(X,Y)的分布律为p_{ij},i=1,2,...;j=1,2,...。则:

    E[g(X,Y)]=\sum\limits^{\infty}_{i=1}\sum\limits^{\infty}_{j=1}g(x_i,y_j)p_{ij}

    设二维连续性随机变量(X,Y)的密度函数为f(x,y),则:

    E[g(X,Y)]=\int^{+\infty}_{-\infty}\int^{+\infty}_{-\infty}g(x,y)f(x,y)\mathrm dx\mathrm dy

数学期望的性质

  1. C是常数,则有E(C)=C

  2. X是一个随机变量,C是常数,则有:

    E(CX)=CE(X)

  3. X,Y是两个随机变量,则有:

    E(X+Y)=E(X)+E(Y)

  4. X,Y相互独立的随机变量,则有:

    E(XY)=E(X)E(Y)

4.2 方差

方差的定义

X是一个随机变量,若E\{[X-E(X)]^2\}存在,记为D(x)\mathrm{Var}(X)X的方差,即:

D(X)=\mathrm{Var}(X)=E\{[X-E(X)]^2\}

在应用上还引入了\sqrt{D(X)},记为\sigma(X),称为标准差或均方差。

方差的意义

按照定义,随机变量X的方差表达了X的取值与其数学期望的偏离程度。若D(X)较小意味着X的取值比较集中在E(X)的附近,若D(X)较大,则表示X的取值较分散。

D(X)是刻画X取值分散程度的一个量,它是衡量X取值分散程度的一个尺度。

方差的计算

  • 利用定义计算

    对于离散型随机变量:

    D(X)=\sum\limits^\infty_{k=1}[x_k-E(X)]^2p_k

    其中P\{X=x_k\}=p_k,k=1,2,...X的分布律。

    对于连续型随机变量:

    D(X)=\int^{+\infty}_{-\infty}[x-E(x)]^2f(x)\mathrm dx

    其中f(x)X的概率密度。

  • 利用公式计算

    D(X)=E(X^2)-[E(X)]^2

方差的性质

  1. C是常数,则D(C)=0

  2. X是一个随机变量,C是常数,则有:

    D(CX)=C^2D(X)\\D(X+C)=D(X)

  3. X,Y是两个随机变量,则有:

    \begin{aligned} &D(X+Y)\\=&D(X)+D(Y)+2E\{[X-E(X)][Y-E(Y)]\}\\=&D(X)+D(Y)+2[E(XY)-E(X)E(Y)] \end{aligned}

    X,Y相互独立,则有:

    D(X+Y)=D(X)+D(Y)

  4. D(X)=0的充要条件是X取常数C的概率为1:

    P\{X=E(X)\}=1,C=E(X)

重要概率的方差

  • 0-1分布

    X\sim b(1,p)\\D(X)=p(1-p)

  • 二项分布

    X\sim b(n,p)\\D(X)=np(1-p)

  • 泊松分布

    X\sim \pi(\lambda)\\D(X)=\lambda

  • 均匀分布

    X\sim U(a,b)\\D(X)=\frac{(b-a)^2}{12}

  • 指数分布

    f(x)=\begin{cases} \frac 1\theta e^{-\frac x\theta},&x>0\\0,&其他 \end{cases}\\D(X) = \theta^2

  • 正态分布

    X\sim N(\mu,\sigma^2)\\D(X)=\sigma^2

切比雪夫不等式

设随机变量X具有数学期望E(X)=\mu,方差D(X)=\sigma^2,则对于任意正数\epsilon,不等式:

P\{|X-\mu|\ge\epsilon\}\ge\frac{\sigma^2}{\epsilon^2}

成立。

  • 应用:切比雪夫不等式给出了随机变量分布未知,而只知道E(x)D(x)P\{|X-E(x)|<\epsilon\}情况下估计概率的P\{|X-\mu|\ge\epsilon\}的界限。

4.3 协方差及相关系数

协方差

  • 定义:任意两个随机变量XY的协方差,记为Cov(X,Y),定义为:

Cov(X,Y)=E\{[X-E(X)][Y-E(Y)]\}

  • 计算方法:

    Cov(X,Y)=E(XY)-E(X)E(Y)

    可见,若XY独立,Cov(X,Y)=0

  • 简单性质:

    1. Cov(X,Y)=Cov(Y,X)
    2. Cov(X,X)=D(X)
    3. Cov(aX,bY)=abCov(X,Y)a,b为常数。
    4. Cov(X_1+X_2,Y)=Cov(X_1,Y)+Cov(X_2,Y)
  • 协方差的大小在一定程度上反映了XY相互间的关系,但它还受XY本身量度的影响,为了克服这个缺点,对协方差进行标准化,这就引入了相关系数。

相关系数

  • 定义:设D(X)>0,D(Y)>0,称:

    \rho_{XY}=\frac{Cov(X,Y)}{\sqrt{D(X)D(Y)}}

    为随机变量XY的相关系数。在不致引起混淆时,记\rho_{XY}\rho

  • 相关系数的意义:
    e=E[Y-(a+bX)^2],则e可以用来衡量a+bX近似表达Y的好坏程度。当e的值越小,表示a+bXY的近似程度越好。

    1. |\rho_{XY}|较大时e较小,表明X,Y的线性关系联系较紧密。
    2. |\rho_{XY}|较小时,表明X,Y的线性相关程度较差。
    3. |\rho_{XY}|=0时,称X,Y不相关。
  • 相关系数的性质:

    1. |\rho_{XY}|\le1
    2. |\rho_{XY}|=1的充要条件是:存在常数a,b使P\{Y=a+bX\}=1

4.4 矩、协方差矩阵

该内容不做讨论。

习题

65582f296caf1.jpg

  • 答案

    65582f318bb3a.jpg


65582f3788db9.jpg

  • 答案

    65582f43a0877.jpg


65582f4d08856.jpg

  • 答案

    65582f6947bc0.jpg


设已知2X+3Y=7,则X和Y的相关系数=() 。

  • 答案

    -1

    当X和Y成完全线性相关时,XY成正相关,相关系数为1,负相关相关系数为-1.


设随机变量X的方差为2,根据切比雪夫不等式估计P\{|X-E(X)|\ge2\}\le()。

  • 答案

    \frac 12

0

评论区