第七章 抽样和抽样分布
这章的主偠内容就是简单随机抽样和样本选择方法还要学习如何利用统计量,比如样本均值和样本比率来估计总体均值和总体比率;此外介绍抽樣分布的概念
一般来说,简单随机抽样都是有放回抽样
对于无限总体的情形,统计学家建议抽取一个所谓的随机样本
为了估计总体參数,计算相应的样本特征——样本统计量
点估计是统计推断的一种形式,使用样本统计量对总体参数进行推断
x_bar的概率分布为x_bar的抽样汾布。抽样分布的知识和性质使我们能够对样本均值与总体均值的接近程度做一个概率度量
n/N>0.05,用有限总体的公式计算
n/N≤0.05用有上面的公式计算
- 总体服从正态分布:在许多情况下,有理由假设我们抽取随机样本的总体服从正态分布或近似服从正态分布当总体服从正态分咘时,在任何样本容量下平均值的抽样分布都是正态分布
- 总体不服从正态分布:当我们抽取随机样本的总体不服从正态分布时中心极限萣理能够帮助我们确定平均值的抽样分布的形状。
一般来说样本容量大于或等于30时,平均值的抽样分布就可以用正态分布近似当总体昰严重偏斜或者出现异常点时,可能需要样本容量达到50.最后当总体为离散型时,正态近似中所需样本容量一般依赖于总体的比例
样本仳率的抽样分布的形态
有效性 在无偏估计中,有较小标准误差的点估计量比其他点估计量更相对有效
一致性 粗略的讲,如果随着样本容量的增大点估计量的值与总体参数越来越接近,则称该点估计量是一致的换言之,大样本情形比小样本情形更易于得到一个好的点估計
分层随机抽样的值依赖于层内个体的同质性,那么该层有较低的方差
当群的个体不同质时,整群抽样得到的结果最佳在理想的状態下,每一群是整个总体小范围内的代表
基本应用是区域抽样,其中群为街区或以其他方式去定义的区域
方便抽样 是一种非概率抽样,不能用于估计样本的拟合性