应用数理统计施雨课后题答案免费版|百度网盘下载

编者评论:关于应用数理统计的课后问题解答

应用数理统计 本书系统地介绍了数理统计的基本概念、原理和方法。全书共分6章,包括数理统计的基本概念、参数估计、假设检验、方差分析和正交实验设计等。今天,小编为大家带来本书课后习题的答案。欢迎下载学习

相关内容部分预览

简介

本书系统地介绍了数理统计的基本概念、原理和方法。全书共分6章,涵盖数理统计的基本概念、参数估计、假设检验、方差分析和正交实验设计,

统计决策理论和贝叶斯推理的回归分析和基础知识。每章都配有相应的习题。

本书适合高等院校工、经、管类研究生的教材,理科高年级本科生的教材。

数理统计知识点总结

大数定律

假设每次独立重复一次实验(如掷骰子),当试验次数足够大时,每个子事件的频率将无限接近其概率(如掷 100,000 个骰子,则你抛出的 1 的数量估计在 16,666 左右)。大数定律证明了这一现象的客观现实。

以下是两个大数定律。

大数的弱定理(Khinchin):

令[公式]为相互独立且服从相同分布且具有数学期望[公式]的随机变量序列,作为前n个变量的算术平均值[公式],则为[公式],有

[公式]

这个公式的字面意思很容易理解,就是当n为无穷大时,这个统计量(统计量的定义后面会提到)会无限接近[公式]。毕竟 [formula] 是 [formula] 的无偏估计(简单理解为具有无偏性,这就是为什么我们可以使用这个统计量来估计概率分布中的 [formula] 的原因。)。

如果这个解释没有意义,你可能想回顾一下limit的定义和mean的一些定义等。

我们给出一个证明,然后查看期望和方差函数。

等等!我们必须给出一个我们稍后会用到的引理,它本身也更重要。

[公式][公式][公式][公式][公式][公式][公式]

回到原来的证明。

首先,我们需要假设方差存在(统一证明方法需要使用特征函数法和泰勒公式(需要使用一些傅里叶分析)),设置 [公式] ,那么因为

[公式]

(使用的属性是[公式])

所以我们结合切比雪夫不等式有

[公式]

所以我们只需要制作 [formula] ,就可以得到我们的结论(钳位定理),证明就完成了。

如果你对更统一的证明方法感兴趣,可以参考

大数定律

根据第一定理,可以得到以下推论

推论:伯努利大数定理:

令[公式]为事件A在n次独立重复试验中出现的次数,p为事件A在每次试验中发生的概率,则对于[公式],有

[公式]

这里没有更多的证据。

中心极限定理

这个定理想告诉我们,大量独立随机因素综合作用形成的结果趋于近似服从正态分布。由于证明需要本征函数法,此处省略。

独立同分布的中心极限定理:

假设随机变量[公式]相互独立且服从均匀分布,有[公式],则随机变量之和[公式]的标准化变量[公式]的分布函数[公式] ] 有

[公式]

(标准化:[公式],如归一化后服从正态分布[公式]并服从[公式]的随机方差)

以下是推论

De Moivre-Laplace 定理:

假设随机变量[公式]服从参数为n的二项分布,p(0

[公式]

把二项分布的均值和方差联系起来,这个公式就不难理解了。

这方面的统一证明可以参考这个

中心极限定理

分位数和异常值

我们之前已经给大家讲过箱线图,这里再解释一下箱线图涉及的两个概念。

我们假设有一个样本[公式],样本p分位数(0

至少 np 个观察值小于或等于 [公式]

至少 n(1-p) 个观测值大于或等于 [公式]

根据这个要求,我们在数学上规定

[公式]

例如,一个样本有 18 个元素,那么 [formula] 是第 4 个元素(因为 18*0.2=3.6,[3.6]+1=4),[formula] 是第 9 个和第 10 个元素的均值(又名中位数)。

所以箱线图的几个数据是 [公式] , [公式] , [公式]

异常值在箱线图中定义为小于 [formula] 且大于 [formula] 的数据,其中 [formula] 。它们在箱线图中标有特殊符号。

常用统计列表

我们首先给出统计的定义。

定义:令[formula]为总体X的样本,[formula]为[formula]的函数,若g不包含未知参数,则称为统计量。

下面列出了常见的统计数据

[公式](样本均值)

[公式](样本方差)

[公式](样本标准差)

[公式](k阶原点)

[公式](k阶中心矩)

我们只需要替换对应的观察值[公式]就可以得到每个统计量对应的样本观察值的表达式,这里省略。

可能很多人会问为什么样本方差的分母是n-1,这好像和我们高中的方差不一样。这里主要考虑的是不偏不倚。

不偏不倚:

对于参数[公式]的估计量[公式],如果满足条件[公式],则称该估计是无偏的。

在工业上,我们可以理解为没有系统偏差。

那么对于样本方差,我们取均值来看看

[公式]

[公式]

(根据均值和方差的关系以及中心极限定理,有

[公式])

这就是样本方差的来源。

还有老师(比如我们萌萌总老师)会用自由度法来解释n-1分母的由来。反正关键是懂,懂就好。

三种抽样分布

我们在做统计推断的时候,不可避免的要用这些抽样统计来描述样本的分布。常见的抽样分布基于正态分布的样本。

卡方分布([公式])

定义:

令[公式]为总体N(0,1)中的一个样本,则称为统计量

[公式]

服从n自由度的[公式]分布(读作卡方分布),记为[公式]

这是卡方分布的密度函数图

我们给出了一系列没有证明的性质

可加性:如果[公式]和[公式]相互独立,则有[公式]

假设[公式],那么[公式]

上[公式]分位数:对于给定的正数[公式],[公式],满足条件[公式]的点[公式]称为分布的上[公式]分位数。

Fisher:当 n 足够大时,有一个近似值 [formula],其中 [formula] 是标准正态分布的上 [formula] 分位数。在实践中,一般在n>40时使用。

t 分布

定义:集合[公式],与[公式]相互独立,则称其为随机变量

【公式】服从n自由度的t分布,也称为Student分布。

这个公式可以理解为:分子服从正态分布,分母服从标准化卡方分布。

我们也可以用同样的方法定义 t 分布的分位数。此处不再赘述

这是t分布的密度函数的图像

以下是它的主要属性:

[公式]

[公式]

[公式]

F分布

定义:

假设[公式]和[公式]相互独立,则称为随机变量

[公式]服从[公式]分布,自由度为[公式],记为[公式]

这个公式相当于在t分布上又加了一步:分子是标准化的卡方分布,分母也是标准化的卡方分布。

下图是F分布

同理,我们可以定义 F 分布的分位数。

F分布的性质如下

[公式]

[公式]

总结

本节主要概述了统计的基础——大数定律和中心极限定理,以及一些基本概念,最后介绍了抽样统计和三大抽样分布。

其实三个抽样分布可以用R语言计算出对应的值,这也是后续抽样分布定理的基础,也是F,t检验的内容,等稍后介绍。

如何学好数理统计?

在我看来,要想学好数理统计,尤其是对于那些不是很高级的人,最重要的不是掌握一些定理的推导和证明,而是要理清统计和图形的概念出它在说什么。 ,先做这个,再讲后面的挖或者进阶。

上面提到的统计推断中的概念,往往乍一看会让人摸不着头脑,甚至是突如其来,但整理思路和理清思路后,你会觉得背景和框架都比较清晰,思路也比较直观.如果基本的数理统计教科书清楚地解释了这些概念,那么它们就很好。

对此,我认为已故陈希如院士为本科非数理统计专业的本科生写的《概率论与数理统计》(中国科技大学),东方的毛世松、程一鸣、蒲小龙中国师范大学《概率论与数理统计教程》老师为本科数学与统计学专业撰写的《概率论与数理统计教程》

(高等教育版)做得很好。前者不用多说,@卡卡目前票数最高的回答引用了陈院士的部分原话,确实是真心的。在这本教材的写作中,陈老师真的很注重用最直白甚至最日常的语言。解释统计概念和想法,

也要尽量兼顾广度和深度;后者的数理统计部分在很多统计概念的介绍和介绍中比较清晰,不突兀,不含糊,概率论部分感觉写的不如数理统计部分好,但基本内容都涵盖了。

阅读剩余
THE END