6.1 数理统计基本知识
总体和个体
- 一般地,所研究对象的某个(或某些)数量指标的全体称为总体。
- 如果所研究的问题只有一个数量指标,就是一个随机变量,如果所研究的问题有多个数量指标,就是多维随机变量。
- 个体就是总体的每个数量指标。
样本和样本空间
一般地,为研究总体的特征,从总体中抽取部分个体,称为样本
若从某个总体
中抽取了 个个体, 记为 , 则称其为总体 的一个容量为 的样本. 依次对它们进行观察得到
个数据 , 称这 个数据 ( 维实向量) 为总体 的一个容量为 的样本观测值, 简称样本值 可以将它们看作
维随机向量 的一组可能的取值, 样本 的所有可能取值的集合称为样本空间, 记为
样本与统计量
简单随机样本
若来自总体
- 独立性
- 同分布性
放回抽样与不放回抽样
一般, 对有限总体, 放回抽样所得到的样本为简单随机样本, 但使用不方便
用不放回抽样代替 代替条件
分布函数
总体的分布函数为
概率密度
总体的概率密度为
统计量
总体
统计量
常用统计量
https://teru.space/2022/09/17/概率统计笔记/#性质-4
设
样本均值
样本值记为
与数学期望的区别
- 样本均值是随机变量, 具有分布
- 数学期望是常数
- 依概率收敛到数学期望
样本均值与单个变量的协方差
样本方差
样本标准差
样本均值、样本方差与期望、方差的关系
样本 k 阶原点矩
样本 k 阶中心矩
- 知道均值和平方的均值即可知道 2 阶中心矩
- 知道 2 阶中心矩即可知道方差
样本方差 与样本二阶中心矩 的不同
- 关系式
样本方差与修正的样本方差
有的书中, 为了方便, 定义
顺序统计量
将一组样本的样本值
定义
则称
- 顺序统计量可能既不独立, 分布也不相同
极值的分布
极差
*样本中位数
*样本经验分布函数
, , 以概率 1 一致收敛于分布函数
直方图
对于连续型随机变量的研究, 引入 “频率直方图”
设
当
密度函数在
分位数
对于连续性随机变量
- 上侧
分位数 : 为 内的给定常数
- 双侧
分位数 (对于偶函数): 为 内的给定常数