侧边栏壁纸
博主头像
LittleAO的学习小站 博主等级

在知识的沙漠寻找绿洲

  • 累计撰写 125 篇文章
  • 累计创建 27 个标签
  • 累计收到 0 条评论

目 录CONTENT

文章目录

概率论与数理统计第七章笔记

LittleAO
2023-05-28 / 0 评论 / 0 点赞 / 42 阅读 / 0 字
温馨提示:
本文最后更新于2023-11-18,若内容或图片失效,请留言反馈。 部分素材来自网络,若不小心影响到您的利益,请联系我们删除。

第一章 概率论的基本概念
第二章 随机变量及其分布
第三章 多维随机变量及其分布
第四章 随机变量的数字特征
第五章 大数定理及中心极限定理
第六章 样本及抽样分布
第七章 参数估计
第八章 假设检验

第七章 参数估计

7.1 点估计

设总体X的分布形式已知,但它的一个或多个参数为未知,借助于总体X的一个样本来估计总体未知参数的值的问题称为点估计问题。

矩估计法

X为连续性随机变量,其概率密度为f(x;\theta_1,\theta_2,...,\theta_k),或X为离散型随机变量,其分布率为P\{X=x\}=p(x;\theta_1,\theta_2,...,\theta_k),其中\theta_1,\theta_2,...,\theta_k为待估参数,X_1,X_2,...,X_n是来自X的一个样本,假设总体X的前k阶矩存在,且均为\theta_1,\theta_2,...,\theta_k的函数,即E(X^l)=\mu_l=g(\theta_1,\theta_2,...,\theta_k)

用样本矩来估计总体矩,用样本矩的连续函数来估计总体矩的连续函数,这种估计法称为矩估计法。

  • 方法:
  1. 求出总体矩:

    \begin{cases}\mu_1=E(X)=\mu_1(\theta_1,\theta_2,...,\theta_k)\\ \mu_2=E(X^2)=\mu_2(\theta_1,\theta_2,...,\theta_k)\\...\\ \mu_k=E(X^k)=\mu_k(\theta_1,\theta_2,...,\theta_k)\end{cases}

  2. A_i来替换上式中的\mu_i

  • 矩估计法优缺点
  1. 优点:简单易行,并不需要事先知道总体是什么分布;
  2. 缺点:当总体类型已知时,没有充分利用分布提供的信息。一般场合下,矩估计量不具有唯一性。

最大似然估计

最大似然估计是在总体的分布类型已知的前提下,使用的一种参数估计法。

当总体X属离散型:

  • 似然函数的定义:

    设分布律P\{X=k\}=p(x;\theta),\theta为待估参数,\theta\in\Theta(其中\Theta\theta可能的取值范围),X_1,X_2,...,X_n是来自总体X的样本,则X_1,X_2,...,X_n的联合分布率为:

    \prod\limits^n_{i=1}p(x_i;\theta)

    又设x_1,x_2,...,x_n为相应于样本X_1,X_2,...,X_n的一个样本值,则样本X_1,X_2,...,X_n渠道观察值x_1,x_2,...,x_n的概率:

    L(\theta)=L(x_1,x_2,...,x_n;\theta)=\prod\limits^n_{i=1}p(x_i;\theta),~~\theta\in\Theta

    L(\theta)称为样本似然函数。

    取得样本值x_1,x_2,...,x_n时,选取似然函数L(\theta)取得最大值的\theta作为未知参数\theta的估计值,即L(x_1,x_2,...,x_n;\theta)=\max\limits_{\theta\in\Theta}{L(x_1,x_2,...,x_n;\theta)}。这样得到的\theta与样本值x_1,x_2,...,x_n有关,记为\theta(x_1,x_2,...,x_n),为参数\theta的最大似然估计值,\theta(X_1,X_2,...,X_n)为参数\theta的最大似然估计量。

当总体X属于连续型:

  • 似然函数的定义

    设概率密度为f(x;\theta)\theta为待估参数,\theta\in\ThetaX_1,X_2,...,X_n是来自总体X的样本,则X_1,X_2,...,X_n的联合密度为:

    \prod\limits^n_{i=1}f(x_i;\theta)

    又设x_1,x_2,...,x_n为相应于样本X_1,X_2,...,X_n的一个样本值:

    L(\theta)=L(x_1,x_2,...,x_n;\theta)=\prod\limits^n_{i=1}f(x_i;\theta)

    L(\theta)称为样本的似然函数。

    取得样本值x_1,x_2,...,x_n时,选取似然函数L(\theta)取得最大值的\theta作为未知参数\theta的估计值,即L(x_1,x_2,...,x_n;\theta)=\max\limits_{\theta\in\Theta}{L(x_1,x_2,...,x_n;\theta)}。这样得到的\theta与样本值x_1,x_2,...,x_n有关,记为\theta(x_1,x_2,...,x_n),为参数\theta的最大似然估计值,\theta(X_1,X_2,...,X_n)为参数\theta的最大似然估计量。

  • 求最大似然估计量的步骤:

  1. 写出似然函数:

    L(\theta)=L(x_1,x_2,...,x_n;\theta)=\prod\limits^n_{i=1}p(x_i;\theta)

    或者:

    L(\theta)=L(x_1,x_2,...,x_n;\theta)=\prod\limits^n_{i=1}f(x_i;\theta)

  2. 取对数

    \ln{L(\theta)}=\sum\limits^n_{i=1}\ln p(x_i;\theta)

    或者:

    \ln{L(\theta)}=\sum\limits^n_{i=1}\ln f(x_i;\theta)

  3. \theta求导\dfrac{\mathrm d\ln L(\theta)}{\mathrm d\theta},并令\dfrac{\mathrm d\ln L(\theta)}{\mathrm d\theta}=0(对数似然方程)

    解方程即得未知参数\theta的最大似然估计值\theta

  • 最大似然估计的性质:不变性

    \theta的函数u=u(\theta)\theta\in\Theta具有单值反函数\theta=\theta(u)u\in U,又设\hat \thetaX的概率分布中参数\theta的最大似然估计,则\hat u=u(\hat \theta)u(\theta)的最大似然估计。

7.3 估计量的评选标准

对于同一个参数,我们采用不同的估计方法得出的估计量可能不相同。如何评价一个估计量的“好”与“坏”?

无偏性

X_1,X_2,...,X_n为总体X的一个样本,\theta\in\Theta时包含在总体X的分布中的待估参数。若估计量\hat\theta=\hat\theta(X_1,X_2,...,X_n)的数学期望E(\theta)存在,且对于任意\theta\in\ThetaE(\hat\theta)=\theta,则称\hat\theta\theta的无偏估计量。

无偏性的意义是:用估计量\hat\theta估计参数\theta,有时可能估计偏高,有时可能偏低。但是平均来说它等于\theta

特别的:不论总体X服从什么分布,只要它的数学期望存在,\overline X总是总体X的数学期望\mu_1=E(X)的无偏估计量。故k阶样本矩A_kk阶总体矩\mu_k的无偏估计。

有效性

比较参数\theta的量个无偏估计量\hat\theta_1\hat\theta_2,如果在样本容量n相同的情况下,\hat\theta_1的观察值在真值的附近较\hat\theta_2更密集,则认为\hat\theta_1\hat\theta_2有效。

\hat\theta_1=\hat\theta_1(X_1,X_2,...,X_n)\hat\theta_2=\hat\theta_2(X_1,X_2,...,X_n)都是\theta的无偏估计量,若对任意的\theta\in\Theta,有D(\hat\theta_1)\le D(\hat\theta_2),且至少对某一个\theta\in\Theta上式中的不等号成立,则称\hat\theta_1\hat\theta_2有效。

相合性

\hat\theta(X_1,X_2,...,X_n)是参数\theta的估计量,若对任意的\theta\in\Theta,当n\rightarrow\infty\hat\theta(X_1,X_2,...,X_n)依概率收敛于\theta,则称\hat\theta\theta的相合估计量。

7.4 区间估计

置信区间的定义

设总体X的分布函数F(x;\theta)含有一个未知参数\theta\theta\in\Theta,对于给定值\alpha(0<\alpha<1),若由样本X_1,X_2,...,X_n确定的两个统计量\underline\theta=\underline\theta(X_1,X_2,...,X_n)\overline \theta=\overline \theta(X_1,X_2,...,X_n)(\theta<\overline\theta),对于任意\theta\in\Theta满足:

P\{\underline{\theta}(X_1,X_2,\cdots,X_n)<\theta<\overline{\theta}(X_1,X_2,\cdots,X_n)\}\geq1-\alpha,

则称随机区间(\underline\theta,\overline\theta)\theta的置信度为1-\alpha的置信区间\underline \theta\overline\theta分别称为置信度为1-\alpha的双侧置信区间的置信下限置信上限,1-\alpha为置信水平。

置信区间的求法

  1. 明确问题:是求什么参数的置信区间?置信水平1-\alpha是多少?

  2. 寻求样本:X_1,X_2,...,X_n\theta的函数:

    W=W(X_1,X_2,...,X_n;\theta)

    使W的分布不依赖于\theta以及其他未知参数,称具有这种性质的函数W枢轴量。

  3. 对于给定的置信度1-\alpha,定出两个常数a,b,使得:

    P\{a<W(X_1,X_2,\cdots,X_n;\theta)<b\}={1-\alpha}

  4. a<W(X_1,X_2,\cdots,X_n)<b得到的等价不等式\underline\theta<\theta<\overline\theta,其中\underline\theta=\underline\theta(X_1,X_2,...,X_n)\overline\theta=\overline\theta(X_1,X_2,...,X_n)都是统计量,那么(\underline\theta,\overline\theta)就是\theta的一个置信度为1-\alpha的置信区间。

7.5 正态总体均值与方差的区间估计

单个总体N(\mu,\sigma^2)的情况

设给所有置信水平为1-\alpha,并设X_1,X_2,...,X_n为总体N(\mu,\sigma^2)的样本,\overline X,S^2分别是样本均值和样本方差。

  1. 均值\mu的置信区间
  • \sigma^2为已知,\mu的一个置信水平为1-\alpha的置信区间:

    \left(\overline{X}\pm\frac{\sigma}{\sqrt{n}}z_{\alpha/2}\right)

  • \sigma^2为未知,\mu的一个置信水平为1-\alpha的置信区间:

    \bigg(X\pm\frac{S}{\sqrt{n}}t_{\alpha/2}(n-1)\bigg)

  1. 方差\sigma^2的置信区间
  • \mu为未知,方差\sigma^2的置信度为1-\alpha的置信区间:

    \left(\frac{(n-1)S^2}{\chi_{\alpha/2}^2(n-1)},\frac{(n-1)S^2}{\chi_{1-\alpha/2}^2(n-1)}\right)

两个总体N(\mu_1,\sigma_1^2),N(\mu_2,\sigma_2^2)的情况

  1. 两个均值差\mu_1-\mu_2的置信区间
  • \sigma_1^2\sigma_2^2均已知,\mu_1-\mu_2的置信度为1-\alpha的置信区间:

    \left(\overline{X}-\overline{Y}\pm z_{\alpha/2}\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}\right)

  • \sigma_{1}^{2}=\sigma_{2}^{2}=\sigma^{2},但\sigma^2未知,\mu_1-\mu_2的置信度为1-\alpha的置信区间:

    \bigg(\overline X-\overline Y\pm t_{\alpha/2}(n_1+n_2-2)S_w\sqrt{\frac 1 n_1+\frac{1}{n_2}}\bigg)

  1. 两个总体方差比\dfrac{\sigma_1^2}{\sigma^2_2}的置信区间
  • \mu_1,\mu_2均未知,\dfrac{\sigma_1^2}{\sigma^2_2}的置信度为1-\alpha的置信区间:

    \bigg(\frac{S_1^2}{S_2^2}\frac{1}{F_{\alpha/2}(n_1-1,n_2-1)},\frac{S_1^2}{S_2^2}\frac{1}{F_{1-\alpha/2}(n_1-1,n_2-1)}\bigg)

7.7 单侧置信区间

基本概念

对于给定值\alpha(0<\alpha<1),若由样本X_1.X_2,...,X_n确定的统计量\underline\theta=\underline\theta(X_1,X_2,...,X_n),对于任意\theta\in\Theta满足:

P\{\theta>\underline{\theta}\}\geq1-\alpha

则称随机区间(\underline\theta,+\infty)\theta的置信水平为1-\alpha的单侧置信区间,\underline\theta称为\theta的置信水平为1-\alpha的单侧置信下限。

又如果统计量\overline\theta=\overline\theta(X_1,X_2,...,X_n),对于任意\theta\in\Theta满足:

P\{\theta<\overline{\theta}\}\geq1-\alpha

则称随机区间(-\infty,\overline\theta)\theta的置信水平为1-\alpha的单侧置信区间,\overline\theta称为\theta的置信水平为1-\alpha的单侧置信上限。

正态总体均值与方差的单侧置信区间

设正态总体X的均值是\mu,方差是\sigma^2(均为未知)。

  1. 正态均值\mu的置信水平为1-\alpha的置信下限:

    \underline\mu=\overline X-\frac{S}{\sqrt{n}}t_\alpha(n-1)

  2. 正态均值\mu的置信水平为1-\alpha的置信上限:

    \overline\mu=\overline X-\frac{S}{\sqrt{n}}t_\alpha(n-1)

  3. 正态方差\sigma^2的置信水平为1-\alpha的置信上限:

    $$
    \overline{\sigma^2}=\frac
    {(n-1)S^2 }
    {\chi_{1-\alpha}^2(n-1) }

    $$

  4. 正态方差\sigma^2的置信水平为1-\alpha的置信下限:

    $$
    \underline{\sigma^2}=\frac
    {(n-1)S^2 }
    {\chi_{\alpha}^2(n-1) }

    $$

习题

655834c420c05.jpg

  • 答案

    655834cccaf06.jpg


655834e0a1801.jpg

655834eb73a40.jpg

  • 答案

    655834f593445.jpg


65583504b0457.jpg

  • 答案

    65583512af1bf.jpg


6558351a69081.jpg

  • 答案

    65583536ee8d2.jpg


6558354189f19.jpg

  • 答案

    6558354b373f0.jpg


65583551d2fac.jpg

  • 答案

    6558355ca216f.jpg


655835649964a.jpg

  • 答案

    6558356d120ae.jpg


65583574e3e0f.jpg

  • 答案

    6558357e66fa3.jpg

0

评论区