SPSS 10.0高级教程十三:非参数检验

2012-04-12 生物谷 生物谷

§12.1  概论 作为二十一世纪统计理论的三大发展方向之一,非参数统计是统计分析的重要组成部分。可是与之很不相称的是他针对一般性统计分析的理论发展远远不及参数检验完善,因而比较完善的可供使用的方法也不多。比如多组均数间的两两比较,虽然已有好几种方法可资利用,但由于在理论上仍存在争议,几种权威的统计软件(如SAS和SPSS)均没有提供这方面的方法。 虽然这些洋统计软件没有提供两两比

§12.1  概论

作为二十一世纪统计理论的三大发展方向之一,非参数统计是统计分析的重要组成部分。可是与之很不相称的是他针对一般性统计分析的理论发展远远不及参数检验完善,因而比较完善的可供使用的方法也不多。比如多组均数间的两两比较,虽然已有好几种方法可资利用,但由于在理论上仍存在争议,几种权威的统计软件(如SAS和SPSS)均没有提供这方面的方法。

虽然这些洋统计软件没有提供两两比较的非参数方法,但国产的统计软件大都是提供了的(国情不同嘛),因此建议大家:如果真的要做这方面的非参数分析,不如直接用PEMS、SPLMWIN、NOSA等国产软件,免得用SPSS等只能做一半。

在SPSS中,几乎所有的非参数分析方法都被放入了Nonparametric Tests菜单中,具体来讲有以下几种:

  • Chi-square test:用卡方检验来检验变量的几个取值所占百分比是否和我们期望的比例没有统计学差异。比如我们在人群中抽取了一个样本,可以用该方法来分析四种血型所占的比例是否相同(都是25%),或者是否符合我们所给出的一个比例(如分别为10%、30%、40%和20%,我随便写的)。请注意该检验和我们一般所用的卡方不太一样,我们一般左的卡方要用crosstable菜单来完成,而不是这里。

  • Binomial Test:用于检测所给的变量是否符合二项分布,变量可以是两分类的,也可以使连续性变量,然后按你给出的分界点一刀两断。

  • Runs Test:用于检验某变量的取值是否是围绕着某个数值随机地上下波动,该数值可以是均数、中位数、众数或人为制定。一般来说,如果该检验P值有统计学意义,则提示有其他变量对该变量的取值有影响,或该变量存在自相关。

  • One-Sample Kolmogorov-Smirnov Test:采用柯尔莫诺夫-斯米尔诺夫检验来分析变量是否符合某种分布,可以检验的分布有正态分布、均匀分布、Poission分布和指数分布。

  • Two-Independent-Samples Tests:即成组设计的两样本均数比较的非参数检验。

  • Tests for Several Independent Samples:成组设计的多个样本均数比较的非参数检验,此处不提供两两比较方法。

  • Two-Related-Samples Tests:配对设计两样本均数的非参数检验。

  • Tests for Several Related Samples:配伍设计多个样本均数的非参数检验,此处同样不提供两两比较。

难道两分类的变量还可能不服从二项分布?是的,比如极端的均一分布(取值都是0或1),负二项分布等。最常见的如传染病的发病,是否发病是绝对不服从二项分布的(因两个观察结果间会有关联)。

由于上述各种统计方法都比较简单,且对话框和结果都比较相似,可以举一反三,我就不准备一一介绍了,只介绍其中有代表性的两个--Kolmogorov-Smirnov Test和Two-Independent-Samples Tests。

其实我是想写详细点的,真正阻止我这样作的原因是我实在太忙了,真的真的太忙了。

§12.2  One-Sample Kolmogorov-Smirnov Test

例12.1 请判断SPSS自带数据集anxity.sav中score的分布是否服从正态分布。

闲言少叙,操作如下:

  1. Analyze==>Nonparametic test==>1-sample K-S

  2. Test variable list框:选入score

  3. Test distribution复选框组:选中normal复选框

  4. 单击OK钮

系统给出的统计分析结果非常简单,具体如下:

NPar Tests

上表给出了所检验变量的常用正态描述指标(即均数、标准差),检验的中间结果和最终结果。从上可见P值为0.652,即score是服从正态分布的。

上表翻译如下:

 

 

变量名Score

样本量

 

48

正态分布参数 均数

10.00

 

标准差

5.17

最极端的差异

绝对值

.106

 

正值

.088

 

负值

-.106

K-S检验的统计量 Z

 

.735

近似P值 (双侧)

 

.652

§12.3  Two-Independent-Samples Tests

例12.2 请用非参数方法检验anxity.sav中第一次和第二次的评分结果是否有差异。

选择Analyze==>Nonparametic test==>Two-Independent-Samples,弹出的对话框和大家最初就接触的t检验对话框非常相似,只是在下面一共给出了四种检验方法,其中第一种Mann-Whitney U检验实际上就是大家都学过的两样本均数比较的秩和检验,只是换了个名称而已。这里我们就用它。本例的具体操作如下:

  1. Analyze==>Nonparametic test==>Two-Independent-Samples

  2. Test variable list框:选入score

  3. grouping variables框:选入trial

  4. 单击Define groups钮

  5.   在group1框和group2框中分别输入1和2

  6.   单击continue钮

  7. Test type 复选框组:选中Mann-Whitney U复选框

  8. 单击OK钮

 

前几天有位网友给我来信,问我在这个例子中只比较第一次和第二次的评分结果有无差异,是不是意味着在做四组间的两两比较?即"成组设计多独立样本非参数检验"可用"两独立样本Mann-Whitney U检验"来作两两比较?我一看这封信就吓了一跳!不好意思,引起了如此大的误会!!在这里我严正声明:我在这里只是为了省事,胡乱拉了一个例子而已。在我看来,"成组设计多独立样本非参数检验"用"两独立样本Mann-Whitney U检验"来作两两比较完全等价于用t检验代替方差分析中的的两两比较,如果一定要做,就必须要对Alpha水准进行调整(具体方法在倪宗瓒老师主编的《医学统计学》第二版里有),否则自然会出问题。

程序给出的分析结果如下:

NPar Tests

Mann-Whitney Test

上表为两组秩次情况的报告,可见第一次检查的智次和为212.5,平均秩次为17.71。第二次检查的则分别为87.5和7.29,显然,差距较大。

上表为统计分析的结果,分别给出了Mann-Whitney U检验值、Wilcoxon W检验值和Z值,以及近似P值和确切概率值。可见P值远小于0.05,因此刚才两组的平均秩次之差是有统计学意义的。

版权声明:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (2)
#插入话题
  1. [GetPortalCommentsPageByObjectIdResponse(id=2045914, encodeId=13e0204591473, content=<a href='/topic/show?id=7e8e99343d4' target=_blank style='color:#2F92EE;'>#非参数检验#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=50, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=99343, encryptionId=7e8e99343d4, topicName=非参数检验)], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=2ba9118, createdName=makuansheng, createdTime=Sun Jul 15 08:27:00 CST 2012, time=2012-07-15, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=2075706, encodeId=0e7920e57064f, content=<a href='/topic/show?id=27dd993421f' target=_blank style='color:#2F92EE;'>#非参数#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=36, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=99342, encryptionId=27dd993421f, topicName=非参数)], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=af68384, createdName=hanhaisha2008, createdTime=Wed Jun 13 03:27:00 CST 2012, time=2012-06-13, status=1, ipAttribution=)]
  2. [GetPortalCommentsPageByObjectIdResponse(id=2045914, encodeId=13e0204591473, content=<a href='/topic/show?id=7e8e99343d4' target=_blank style='color:#2F92EE;'>#非参数检验#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=50, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=99343, encryptionId=7e8e99343d4, topicName=非参数检验)], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=2ba9118, createdName=makuansheng, createdTime=Sun Jul 15 08:27:00 CST 2012, time=2012-07-15, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=2075706, encodeId=0e7920e57064f, content=<a href='/topic/show?id=27dd993421f' target=_blank style='color:#2F92EE;'>#非参数#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=36, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=99342, encryptionId=27dd993421f, topicName=非参数)], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=af68384, createdName=hanhaisha2008, createdTime=Wed Jun 13 03:27:00 CST 2012, time=2012-06-13, status=1, ipAttribution=)]

相关资讯

SPSS 10.0高级教程十:征服一般线性模型(2)

§8.4 多元方差分析 所谓的多元方差分析,就是说存在着不止一个应变量,而是两个以上的应变量共同反映了自变量的影响程度。比如要研究某些因素对儿童生长的影响程度,则身高、体重等都可以作为生长程度的测量因子,即都应作为应变量。 8.4.1 分析步骤 为了方便起见,我们这里直接利用SPSS自带的数据集plastic.sav,假设tear_res、gloss和opacity都使反应橡胶质量的指标(不

SPSS 10.0高级教程十三:分类资料的回归分析(2)

在很久很久以前,地球上还是一个阴森恐怖的黑暗时代,大地上恐龙横行,我们的老祖先--类人猿惊恐的睁大了双眼,围坐在仅剩的火堆旁,担心着无边的黑暗中不知何时会出现的妖魔鬼怪,没有电视可看,没有网可上... 我是疯了,还是在说梦话?都不是,类人猿自然不会有机会和恐龙同时代,只不过是我开机准备写这一部分的时候,心里忽然想到,在10年前,国内的统计学应用上还是卡方检验横行,分层的M-H卡方简直就是超级武器

SPSS 10.0高级教程八:均数间的比较

知道吗?在计算机领域中有个著名的80/20规则,也就是在奔腾及更早的CPU所采用的CISC指令集中,有80%的任务是被20%的最常用指令所完成的;换言之,另外80%的复杂指令只完成20%的不常用任务。 好了,言归正传。现在我要非常高兴的向大家宣布:80/20规则在SPSS的使用中同样有效!仅以Analyze菜单为例,其中最常用的子菜单为: Discriptive Statistics

SPSS 10.0高级教程九:征服一般线性模型

请注意,本章的标题用了一些修辞手法,一般线性模型可不是用一章就可以说清楚的,因为它包括的内容实在太多了。 那么,究竟我们用到的哪些分析会包含在其中呢?简而言之:凡是和方差分析粘边的都可以用他来做。比如成组设计的方差分析(即单因素方差分析)、配伍设计的方差分析(即两因素方差分析)、交叉设计的方差分析、析因设计的方差分析、重复测量的方差分析、协方差分析等等。因此,能真正掌握GLM菜单的用法,会使大家

SPSS 10.0高级教程十一:相关分析

在医学中经常要遇到分析两个或多个变量间关系的情况,有时是希望了解某个变量对另一个变量的影响强度,有时则是要了解变量间联系的密切程度,前者用下一章将要讲述的回归分析来实现,后者则需要用到本章所要讲述的相关分析实现。 SPSS的相关分析功能被集中在Statistics菜单的Correlate子菜单中,他一般包括以下三个过程: Bivariate过程 此过程用于进行两个/多个变量间的参数/非参

SPSS 10.0高级教程十二:多元线性回归与曲线拟合

回归分析是处理两个及两个以上变量间线性依存关系的统计方法。在医学领域中,此类问题很普遍,如人头发中某种金属元素的含量与血液中该元素的含量有关系,人的体表面积与身高、体重有关系;等等。回归分析就是用于说明这种依存变化的数学关系。 §10.1 Linear过程 10.1.1 简单操作入门 调用此过程可完成二元或多元的线性回归分析。在多元线性回归分析中,用户还可根据需要,选用不同筛选自变量的方法(