I4Jo_SunnY
Always dream. Always explore.
Sunny的小站

SPSS中的常用方法和统计学概论【2】

本文共8465字,预计阅读时间22分钟

0/ 前言

话接上回,我们简单的讲完了SPSS中常用的3种t检验原理和操作方式。但它们仅适用于假设数据总体分布符合正态的条件下。所以本篇内容顺理成章的来到了不需要对总体分布进行任何额外假设的部分,即我们常说的非参数检验。在有些时候,我们对总体分布未知或所知甚少,因此无法假定数据总体的分布是正态的,在这种情况下我们就需要用到不涉及总体分布,直接对数据的分布进行检验的非参数检验。非参数检验家族中分为了单样本比较、双样本比较和多样本比较三大类,其中的检验方法较为丰富,各类可讨论的方法多达19种。故本文以对应上一篇文章中参数检验的形式进行介绍,即在不符合正态分布的情况下单样本、双样本以及多样本该如何选择检验程序进行比较。本文所包含的部分检验规则和使用方法如下图所示:

https://www.gnt007484.cn/wp-content/uploads/2022/05/2-1.png

1/ 非参数检验(Nonparametric tests)

1.  参数检验与非参数检验的区别

  • 参数检验的集中趋势的衡量为均值,而非参数检验为中位数
  • 参数检验需要关于总体分布的信息;非参数检验不需要关于总体的信息
  • 参数检验只适用于变量,而非参数检验同时适用于变量和属性
  • 测量两个定量变量之间的相关程度,参数检验用Pearson相关系数,非参数检验用Spearman秩相关。
  • 简而言之,若可以假定样本数据来自具有特定分布的总体,则使用参数检验。如果不能对数据集做出必要的假设,则使用非参数检验

2.  单样本Wilcoxon符号秩检验(The one-sample Wilcoxon signed ranks test)

该检验是单样本t检验的非参数替代方法,用于在样本不符合正态假设时将该样本与参考值进行比较。下面以一道例题对该检验进行研究。

每1000行的错误:

在游戏开发中,程序员编写的每1000行代码中引入的新错误的中位数是25。一家开发公司想要评估他们由20名程序员组成的团队与平均水平相比表现如何。

https://www.gnt007484.cn/wp-content/uploads/2022/05/SPSS2-2.png

请问该公司的程序员比中位数强吗?

这项研究的目的是检验公司的程序员是否比业内中等水平的程序员更优秀。仅有一组数据用于检验,因此根据数据是否呈正态分布,选择使用参数单样本t检验或非参数单样本Wilcoxon符号秩检验

首先我们需要将该组数据放入SPSS中,并检验其是否符合正态性假设。这里因为数据集大小小于30,所以我们还是使用Shapiro-Wilks正态性检验来检查数据的分布。操作方法如下:

  • 分析->描述统计->探索
  • 点击图(Plots)按钮
  • 点选含检验的正态图
https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-3.png
https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-4.png

Shapiro-Wilks正态性检验的无效假设H0和替代假设HA如下

H0:数据呈正态分布

HA:数据不是正态分布的

https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-5.png

根据Shapiro-Wilks检验,数据在5%的显著性水平上不是正态分布的。错误数量:W(9)=0.852;p=0.006。在这种情况下,我们可以拒绝无效假设H0,接受数据不是正态分布的替代假设HA。因此,我们接下来将使用非参数单样本Wilcoxon符号秩检验。

在正式进行假设检验之前,我们将在SPSS(描述性统计)中进行一些探索性数据分析(EDA),这有助于我们形成对数据的看法,以便用来检查检验的结果。我们可以使用SPSS生成一些描述性统计数据(使用Explore或比较工具)。

要生成均值等数据描述:分析->报告->个案摘要->放入变量。选择右边选项按钮,点选需要的数据描述,然后点击确定。

要生成箱型图:图形->旧对话框->箱型图->单独变量的摘要。选择定义,将错误数量变量放入“箱表示”框中,然后点确定。

https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-6.png
https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-7.png
https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-8.png

我们可以看到,该公司每1000行新代码中出现错误数量的中位数是29,并且箱型图在中位数以下的范围比在中位数以上的范围大。

为了验证这些结果是否显著,我们需要对样本使用单样本Wilcoxon符号秩检验的方法进行假设检验。对于该公司的研究,单样本Wilcoxon符号秩检验的无效假设和替代假设是:

H0:每千行代码错误数量的中位数等于25

HA:每千行代码错误数量的中位数不等于25

为了在SPSS中进行单样本Wilcoxon符号秩检验,我们需要在SPSS中进行如下操作:

https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-9.png

https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-10.png

 

  • 点击分析->非参数检验->单样本
  • 字段选项卡中,将错误数量放置在检验字段
  • 设置选项卡中,选择定制检验
  • 在定制检验下的选项中,选择比较中位数和假设值(Wilcoxon符号秩检验),并将假设中位数设为25,最后点击运行

https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-11.png
https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-12.png

单样本测试结果:

单样本Wilcoxon符号秩检验的结果表明,样本数据中没有足够的证据表明,公司程序员每千行代码中出现的错误中位数在5%的水平上显著差异(单样本Wilcoxon符号秩检验p=0.559)。当p值>0.05时,我们可以拒绝替代假设HA并接受无效假设H0的观点,即每千行代码中出现错误数量的中位数等于25。


3.  配对Wilcoxon符号秩检验(The Wilcoxon signed ranks test for paired data)

该检验是配对样本t检验的非参数替代方法,用于不符合正态假设的配对数据。下面以某游戏制作公司实施的新的信息建模系统(BIM)前后的团队生产力数据作为研究资料。

生产力的提高:

一家游戏制作公司最近实施了一个新的BIM系统,公司为了解系统的使用情况,收集了12个小组的数据,以评估实施BIM系统前后表现如何(每月水平)。

https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-13.png

检验公司引入BIM系统是否提高了生产力

如果我们有配对的数据需要测量,我们首先还是需要考虑配对数据之间的差异是否是正态分布的。如果是正态分布的,则应使用参数检验(配对样本t检验)。如果差异不是正态分布的,我们就需要使用非参数检验(Wilcoxon检验)。在选择使用哪种检验方法之前,我们必须首先计算配对之间的差异,然后再用Shapiro-Wilks正态性检验来检查差异是否呈正态分布。具体操作如下:

https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-14.png
https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-15.png

  • 点击顶部栏中的转换->计算变量
  • 创建一个名为差异(Difference)的目标变量,可通过数值表达式进行计算,使用前-使用后(BeforeBIM-AfterBIM)
  • 检查数据试图以查看新变量
https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-16.png

进行Shapiro-Wilks检验,看看变量差异是否呈正态分布。具体操作上一节已做详细展示,故不在此再次重复了。下图为检验结果。

https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-17.png

根据Shapiro-Wilks检验的无效假设H0和替代假设HA,如果p<0.05则拒绝H0,表明数据不是正态分布的。本次检验结果表明,我们在讨论该公司的生产力表现时,可以拒绝无效假设H0。因此我们接受替代假设HA,即当p值<0.05时,数据不是呈正态分布的。这意味着参数检验不合适,必须使用非参数Wilcoxon检验。

在正式进行假设检验之前,我们最好进行一些探索性数据分析(EDA),以探索数据中的趋势并帮助我们形成对数据的主观印象。在之前我们进行正态检验时,SPSS也生成了一些描述性的统计数据,如下图所示。

https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-18.png
https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-19.png

描述显示数据的中位数为-1.65,这表明实施前的测量值低于实施后的测量值,因为我们的差异变量计算的是实施前减去实施后。从箱型图中可以看出,中位数以上的差值比中位数以下的差值分布更广,但0以上的差值很少。并且中位数周围的分布也相当狭窄。这些观察表明,有一些视觉证据表明BIM改变了该公司的生产力。

最后,Wilcoxon检验将假设建立在中位数而不是均值的基础上,这是因为Wilcoxon检验的过程是将样本差异的实际测量值转换为等级,并使用等级计算检验统计量所决定的。我们进行的Wilcoxon检验测试的无效假设和替代假设是:

H0:实施BIM之前的平均生产效率等于实施BIM后的平均生产效率

HA:实施BIM之前的平均生产效率与实施BIM后的平均生产效率不同

为了在SPSS中进行配对Wilcoxon符号秩检验,我们需要在SPSS中进行如下操作:

https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-20.png
https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-21-1.png

  • 点击分析->非参数检验->旧对话框->2个相关样本
  • 检验对变量框中的变量1下选择实施前(BeforeBIM),在变量2下选择实施后(AfterBIM),并在检验类型下选择威尔科克森(Wilcoxon)
  • 点击确定并检查结果
https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-22.png

配对Wilcoxon测试结果:

检验结果显示双侧近似P值(Asymp.Sig.(2-tailed))=0.012,即在5%对的水平上显示了显著性(p=0.012<0.05),这意味着我们可以拒绝无效假设H0,并接受实施BIM前后生产效率不同的替代假设HA。并且由于测试统计值Z=-2.511为负值,所以我们可以确认BIM的引入提高了该公司的生产效率。


4.  曼·惠特尼秩和检验(The Mann-Whitney U test)

又称曼·惠特尼U检验,该检验是独立样本t检验的非参数替代方法,用于比较不符合正态假设的两个独立样本。下文是关于两种文件类型(JPEG和JPEG-2000)的压缩时间的研究。

算法压缩时间研究:

某游戏制作公司需要对一批美术资源打包,目前库里共有标准的96幅图像,它们具有一系列不同的RGB颜色深度。工程师随机抽取了48张图像并使用JPEG和JPEG-2000图像压缩算法进行压缩。下图是不同算法下的压缩时间(单位:毫秒)

https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-49.png

JPEG和JPEG-2000的压缩时间有区别吗

首先我们应该检查数据集以选择测试,选择参数检验还是非参数检验取决于我们的数据集是否是正态分布的。所以我们需要先对下图数据进行Shapiro-Wilks检验,看看变量压缩时间是否呈正态分布。具体操作如下:

https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-23.png
https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-24.png

  • 点击顶部栏中的分析->描述统计->探索
  • 将压缩时间放置到因变量列表,将算法放置到因子列表
  • 点击确定,检查生成的图像
https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-25.png

测试结果表明,我们可以拒绝无效假设H0,并接受替代条件HA,即当p值<0.05时,数据不是呈正态分布的。

然后在我们进行假设检验之前,我们还需要进行一些探索性的数据分析,帮助我们形成对数据的主观印象。当我们进行Shapiro-Wilks检验的时候,SPSS也生成了一些描述性的统计数据。

https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-26.png
https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-27.png

描述显示数据的算法1和算法2中位数分别为87.5和78,算法1的中位数高于算法2的中位数。从箱型图中可以看出,两者具有非常相似的范围,但两者的分布范围存在仍有一部分不重合的区域。算法1的箱型图表明其在中位数以下的范围更大,而算法2则正相反,在中位数以上的范围更大。Mann Whitney假设检验的结果将表明,随着压缩次数的增多,观察到的压缩时间区别是否显著。

最后,我们需要进行Mann Whitney U检验来检验我们的猜想是否正确。Mann Whitney U检验将假设建立在中位数而不是平均数的基础之上,这是因为Mann Whitney U检验在计算检验统计量之前已经将实际测量值转换为等级(有序数据)了。在这种情况下,测试的无效假设和替代假设是:

H0:两种算法的中位数是一样的

HA:两种算法的中位数是不同的

为了在SPSS中进行Mann Whitney U检验,我们需要在SPSS中进行如下操作:

https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-28.png
https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-29.png

  • 点击分析->非参数检验->旧对话框->2个独立样本
  • 将压缩时间放置到检验变量列表下,将算法放置到分组变量下
  • 在定义组中依次输入组别的编号
  • 点击继续,确定检验类型为曼-惠特尼U检验,并检查输出结果
https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-30.png

曼-惠特尼U检验结果:

测试结果表明,样本数据中没有足够的证据表明JPEG和JPEG的中位数压缩时间在5%的水平上有显著差异。Mann Whitney U=197.5,p=0.062. 当p>0.05时,我们不能拒绝无效假设H0,故得出结论两种算法的中位数相同。


5.  克鲁斯卡尔-沃利斯检验(Kruskal-Wallis test)

又称K-W检验,H检验。是一种替代单向反差分析的非参数假设检验,适用于两组以上的非参数数据。下文将以某公司的网络入侵检测系统性能为例进行解释。

网络入侵检测系统研究:

某公司拥有15个不同的办公室,并使用了四款网络入侵检测系统(Snort、Suricata、Zeek、Sagan)来评估各个办公室的网络环境安全,并记录了每个系统在24小时内侦测到的入侵次数。数据如下图所示:

https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-31.png

判断不同网络入侵检测系统的性能有不同吗?

这项研究的目的是看不同的网络入侵检测系统是否有不同的表现。本研究中包括四个独立的入侵检测系统,因此,如果数据呈正态分布,单向方差检验ANOVA将是一个合适的测试;否则,数据不呈正态分布将使用Kruskal-Wallis检验。

首先我们将使用Shapiro Wilk检验来检查数据的正态分布。测试结果如下图所示:

https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-32.png

测试结果显示Suricata和Zeek的p值均大于0.05,即在5%显著水平下呈正态分布,Suricata:W(15)=0.955,p=0.607;Zeek:W(15)=0.934,p=0.314。但是Snort和Sagan数据不是正态分布的,Snort:W(15)=0.876,p=0.042;Sagan:W(15)=0.859,p=0.023。因此必须使用非参数检验继续进行分析。

然后在我们进行假设检验之前,我们还需要进行一些探索性的数据分析,帮助我们形成对数据的主观印象。当我们进行Shapiro-Wilks检验的时候,SPSS也生成了一些描述性的统计数据。如下图所示:

https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-37.png
           
https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-34.png

Sagan数据集中检测到的入侵数量中位数最高(79.00),Suricata和Zeek数据集检测到的入侵数量中位数最低(73.00),Snort数据集介于两者之间(78.00)且更接近Sagan。这种模式反应在箱型图的数据中。Suricata和Zeek具有相同的IQR(7),Zeek数据集的最大值和最小值都大于Suricata数据集。尽管看起来可能有所不同,但这些方框的大部分还是重叠的。为了验证这些结果是否显著,我们需要对样本使用Kruskal-Wallis检验的方法进行假设检验。对于该网络安全研究的无效假设和替代假设是:

H0:不同的网络入侵检测系统的性能是相同的

HA:不同的网络入侵检测系统的性能是不同的

为了在SPSS中进行Kruskal-Wallis检验,我们需要在SPSS中进行如下操作:

https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-35.png

https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-36.png
https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-37.png

  • 分析->非参数检验->独立样本
  • 字段选项卡中,将入侵次数移动到检验字段中,将系统移动到组列表
  • 设置选项卡中,选择定制检验并选择Kruskal-Wallis框,并在多重比较框中选择全部成对
  • 完成设置运行程序,并检查生成的结果
https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-38.png

Kruskal-Wallis检验的结果告诉了我们两组之间存在差异。p=0.004<0.05,故拒绝H0接受HA,不同系统之间的性能存在差异。但是它没有告诉我们哪组之间存在显著差异。因此,我们还需要进行多重比较的事后检验。

https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-39.png

Kruskal-Wallis检验结果:

测试结果表明,样本在5%的显著性水平上有显著差别,这意味着我们我们可以拒绝无效假设H0并接受替代假设HA,即不同的网络入侵检测系统的性能是不同的。卡方=13.513,df=3,p=0.004。由于各组之间存在显著性差异,所以使用多重比较进行事后分析,以查看哪些系统之间存在显著性差异。

Suricata-Zeek:两组间的平均差异为-0.115,p值为1

Suricata-Snort:两组间的平均差异为1.501,p值为0.8

Suricata-Sagan:两组间的平均差异为-3.212,p值为0.008

Zeek-Snort:两组间的平均差异为1.386,p值为0.995

Zeek-Sagan:两组间的平均差异为-3.097,p值为0.012

Snort -Sagan:两组间的平均差异为-1.711,p值为0.522

从事后检验的结果中我们可以看出,Suricata、Snort、Zeek彼此之间没有差异(p>0.05),但是Sagan与Suricata和Zeek相比时有显著差异。

该分析结果表明,Sagan网络入侵检测优于Suricata和Zeek系统,然而它并没有明显优于Snort系统。


2/ 参数检验(Parametric tests)

1.  单向方差分析(ANOVA)

又称单因子方差分析或F-检验,是一种被广泛使用的参数假设检验,用于检查两个以上组之间平均值的相等性。像所有的参数检验一样,我们必须检查数据集是否呈正态分布。下文以某公司的测试为例,对方差分析方法进行解释

游戏体验研究:

某游戏测试公司开展了一项第一人称射击游戏可玩性的测试。该测试中公司采用了3种不同的FPS游戏,将其分别编号为Game 1, Game 2和Game 3,并将其中一名测试人员的游戏数据整理成下表。具体来说,他们分析了该测试者在三场游戏中每一场游戏的击杀数量,每款游戏玩15次。

https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-40.png

哪个游戏提供了最不具挑战性的游戏体验,即死亡人数最少?

首先,为了确定我们将使用参数检验还是非参数检验,我们需要对这个数据集进行Shapiro-Wilks正态性检验来检查数据是否呈正态分布。具体操作流程上文已重复过多次,此处不做再次介绍。下图为测试结果:

https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-41.png

根据Shapiro-Wilks检验我们可以看到,数据在5%的显著性水平上呈现正态分布。游戏1:W(15)=0.893,p=0.075;游戏2:W(15)=0.917,p=0.172;游戏3:W(15)=0.903,p=0.105。因此我们可以使用参数检验对样本进行分析。

在进行假设检验之前,我们最好进行一些探索性的数据分析,帮助我们形成对数据的主观印象。当我们进行Shapiro-Wilks检验的时候,SPSS也生成了一些描述性的统计数据。

https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-42.png
https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-43.png

我们可以看到,游戏2拥有最高的平均死亡数,游戏3拥有最低的平均死亡数。但游戏3的数据分布范围非常广,在平均数之上的部分略多于平均数之下的部分。游戏1的分布范围适中,比游戏2更广,但比游戏3更窄,且大部分分布区域与游戏3重合。ANOVA假设检验的结果将表明,随着游戏次数的增加,观察到的死亡次数平均值变化是否显著。

最后,我们需要进行ANOVA检验来检验我们的猜想是否正确。在这种情况下,测试的无效假设和替代假设是:

H0:两种游戏死亡的平均次数是相同的

HA:两种游戏死亡的平均次数是不同的

为了在SPSS中进行ANOVA检验,我们需要在SPSS中进行如下操作:

 

https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-44.png
https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-45.png

  • 点击分析->比较平均值->单因素ANOVA分析
  • 将死亡数移动到因变量列表下,将游戏品类移动到因子框中
  • 点击窗口右侧的事后比较(Post Hoc),并选择图基(Tukey)假定等方差方式
  • 点击确定,检查生成的结果图像
https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-46.png
https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-47.png

单向方差检验结果:

测试结果表明,样本在5%的显著性水平上有差别,这意味着我们我们可以拒绝无效假设H0并接受替代假设HA,即游戏之间的平均死亡人数是不同的。F(2,42)=5.156;p=0.01,p值<0.05。由于各组之间存在显著性差异,所以使用Tukey HSD检验进行事后分析,进行多重比较,以查看哪些游戏之间存在显著性差异。

Game1-Game2:两组之间的平均差异为-1.800,p值为0.072

Game1-Game3:两组之间的平均差异为0.667,p值为0.681

Game2-Game3:两组之间的平均差异为2.467,p值为0.009

从事后测试的结果中,我们可以看到只有游戏2和游戏3之间存在着显著性差异,其他组的配对比较之间没有显著不同。结合探索性数据分析的分析结果表明,虽然游戏2具有最大的平均死亡人数,但在所有3场游戏中,它仅显著大于游戏3。游戏2的平均死亡人数最高,参与者之间的方差最小(1.743),但死亡人数与游戏1没有显著差异。游戏3的平均死亡人数明显低于游戏2,但不低于游戏1。并且游戏3在参与者中也有最大的方差(9.067)。该分析的结果表明,因为没有一个游戏的死亡人数明显多于其他两个游戏,所以根据死亡人数,没有一个游戏可以被认为是最具有挑战性的游戏体验。


附录

1. SPSS中常用的检验方法选择流程

https://www.gnt007484.cn/wp-content/uploads/2022/05/spss2-48.png

上图为确定正确的检验方法的决策树。在数据需要比较来确定关系的时候,我们通常可以将检测方法分为参数检验和非参数检验两种。如果数据是来自正态分布的总体,我们就使用参数检验。如果数据不符合正态性假设,我们就可以使用非参数检验。

  1. 如果只有一组数据
  • 如果数据呈正态分布
    • 使用单样本t检验
  • 否则使用单样本威尔科克伦符号秩检验
  1. 如果有两组数据
  • 如果数据是成对的
    • 如果数据是呈正态分布
      • 使用配对t检验
    • 否则,对成对数据使用威尔科克伦检验
  • 如果数据是独立的
    • 如果数据是呈正态分布
      • 使用独立t检验
    • 否则,对成对数据使用曼-惠特尼U检验
  1. 如果有两组以上的数据
  • 如果数据呈正态分布
    • 使用方差分析
  • 否则,使用克鲁斯卡尔-沃利斯检验

2. 非参数检验

我们通常对一组数据描述可以从它的三个角度入手:集中趋势离散程度分布形态。如果有一组数据的总体的分布情况未知,同时样本容量又小。我们就无法运用中心极限定理实施参数检验,并以此推断总体的集中趋势和离散程度的参数情况。这种时候我们就可以使用非参数检验,不对总体分布做假设,直接从样本的分析入手推断总体的分布。由于参数检验的精确度高于非参数检验,因此在数据符合参数检验的条件时,仍优先采用参数检验。但在现实生活中,总体分布情况很多时候都是未知或非正态分布的,各种因素的未知性导致无法使用参数检验,所以非参数检验在现实生活中的应用还是非常广泛的。

发表回复

textsms
account_circle
email

Sunny的小站

SPSS中的常用方法和统计学概论【2】
本文共8465字,预计阅读时间22分钟 0/ 前言 话接上回,我们简单的讲完了SPSS中常用的3种t检验原理和操作方式。但它们仅适用于假设数据总体分布符合正态的条件下。所以本篇内容顺理成…
扫描二维码继续阅读
2022-05-25