🤵♂️ 个人主页:@艾派森的个人主页
✍🏻作者简介:Python学习者
🐋 希望大家多多支持,我们一起进步!😄
如果文章对你有帮助的话,
欢迎评论 💬点赞👍🏻 收藏 📂加关注+
目录
推断统计与参数检验
推断统计
- 推断统计方法是根据样本数据推断总体特征的方法
- 推断统计包括参数估计 (点估计和区间估计)和假设检验两大类
参数检验 VS 非参数检验
- 参数检验(参数假设检验)
总体分布已知 (如总体为正态分布)的情况下,根据样本数据对总体分布的统计参数(如均值、方差等)进行推断
- 非参数检验(非参数假设检验)
总体分布未知的情况下,根据样本数据对总体的分布形式或数字特征进行推断
假设检验
假设检验的基本思想
1 首先,对总体参数值提出假设
2 然后,利用样本告知的信息去验证先前提出的假设是否成立
- 如果样本数据不能够充分证明和支持假设,则应拒绝假设
- 如果样本数据能够充分证明和支持假设,则不能推翻假设
小概率原理:
- 发生概率很小的随机事件在某一次特定的实验中是几乎不可能发生的
- 小概率原理是假设检验所依据的原理
假设检验的基本步骤
1.提出原假设(记为H0 )和备择假设(记为H1 ) 通常,将希望推翻的假设放在原假设上
2.选择检验统计量:检验统计量服从或近似服从某种已知的理论分布
3.计算概率P值:在认为原假设成立的条件下,根据样本数据和检验统计量计算 概率P值,该概率值间接地给出了样本值(或更极端值)在原假设成 立条件下发生的概率,即:P(拒绝H0|H0为真)
4.给定显著性水平α,并作出统计决策:显著性水平α是在原假设H0正确的前提下却拒绝原假设的概率,即“弃真”概率,一般设定为 0.05或0.01 若概率P值小于等于α,拒绝原假设;否则,不能拒绝原假设
单样本t检验
单样本t检验介绍
- 单样本t检验是指研究问题中仅涉及一个总体,且将采用t检验的方法进行分析
- 单样本t检验的前提是样本来自的总体应服从或近似服从正态分布
- 单样本t检验的目的:利用来自某总体的样本数据,推断该总体的均值是否与指定的检验值存在显 著差异,是对总体均值的假设检验
单样本t检验的基本步骤
1.提出原假设(记为H0 )和备择假设(记为H1 )
双侧检验:
单侧检验:
μ为总体均值;μ0为检验值
2.选择检验统计量
- S是样本标准差,n是样本容量
- t统计量的自由度为n-1
- 当认为原假设成立时,μ用μ0代入
3.计算概率P值
SPSS会自动将样本均值、μ0、样本标准差、样本容量代入 检验统计量,计算得到t统计量的观测值,同时依据t统计量所服从的分布计算其对应的概率P值
4.给定显著性水平α,并作出统计决策
若概率P值小于等于α,拒绝原假设;否则,不能拒绝原假设因为SPSS给出的是双侧概率P值,所以在单侧检验中,应将P/2与α进行比较
单样本t检验应用举例
【案例】 为研究信用卡消费现状,对某地区500名信用卡持有者进行了随机调查,得到其月平均刷卡金额数据。据估计,该地区信用卡月刷卡金额的平均值不低于3000元。现依据所获得的调查数据判断是否支持平均刷卡金额不低于3000元的假设。
分析:
由于该问题涉及的是单个总体,且进行总体均值检验,同时月刷卡金额的总体可近似认为服从正态分布,因此,可采用单样本t检验来进行分析。
操作步骤:
①选择菜单【分析】—-> 【比较均值】—-> 【单样本T检验】
②选择待检验的变量到【检验变量(T)】框中,在【检验值(V)】框中输入原假设中的检验值
③点击【选项(O)】按钮指定缺失值的处理方法,并设置置信区间百分比
④分别点击“继续”、“确定”,分析结果如下:
结论:由以上分析可知:
从表一可得:500个被调查者月刷卡金额的平均值为4781.8786 元,标准差为7418.71785元,标准误差平均值(S/√n)为 331.77515;
从表二可得:t统计量的观测值为5.371,自由度为499(即n-1=500-1),Sig.(双尾)是t统计量观测值的双侧概率P值,平均值差值是样本均值与原假设检验值的差(4781.8786- 3000=1781.8786),这也是t统计量的分子部分,它除以表一的标 准误差平均值后得到t统计量的观测值,最后两列是总体均值μ与原 假设值μ0差的95%的置信区间,为(1130.0302,2433.7270),由此计算出总体均值的95%置信区间为(4130.0302,5433.7270)。 结合题意,可认为SPSS在分析的时候,原假设为:H0 :μ≤3000, 备择假设为: H1 :μ>3000,是一个单侧检验的问题,因此比较α和 p/2。由于p/2小于α,因此应该拒绝原假设,接受备择假设,认为该地区信用卡月刷卡金额的平均值与3000元有显著差异,且远远高 于3000元。另一方面,95%的置信区间也告诉我们有95%的把握认为月刷卡金额均值在4130.0~5433.7之间,3000元没有包含在置信区间内,也证实了上述推断。
文章出处登录后可见!