SPSS教程2:利用SPSS进行统计检验

2012-04-12 生物谷 生物谷

经常需要利用不同的教学媒体或教学资源对不同的对象进行教学改革试验,但教学试验的总体往往都有较大数量,限于人力、物力与时间,通常都采用抽取一定的样本作为研究对象,这样,就存在样本的特征数量能否反映总体特征的问题,也存在着两种不同的样本的数量标志的参数是否存在差异的问题,这就必需对样本量数进行定量分析与推断,在教育统计学中称为“统计检验”。   一、统计检验的基本原理   统计检验是先对总体的分布

经常需要利用不同的教学媒体或教学资源对不同的对象进行教学改革试验,但教学试验的总体往往都有较大数量,限于人力、物力与时间,通常都采用抽取一定的样本作为研究对象,这样,就存在样本的特征数量能否反映总体特征的问题,也存在着两种不同的样本的数量标志的参数是否存在差异的问题,这就必需对样本量数进行定量分析与推断,在教育统计学中称为“统计检验”。

  一、统计检验的基本原理

  统计检验是先对总体的分布规律作出某种假说,然后根据样本提供的数据,通过统计运算,根据运算结果,对假说作出肯定或否定的决策。如果现要检验实验组和对照组的平均数(μ1和μ2)有没有差异,其步骤为:

  1.建立虚无假设,即先认为两者没有差异,用表示;
  2.通过统计运算,确定假设成立的概率P。
  ⒊ 根据P 的大小,判断假设是否成立。如表6-12所示。


  二、大样本平均数差异的显著性检验——Z检验

  Z检验法适用于大样本(样本容量小于30)的两平均数之间差异显著性检验的方法。它是通过计算两个平均数之间差的Z分数来与规定的理论Z值相比较,看是否大于规定的理论Z值,从而判定两平均数的差异是否显著的一种差异显著性检验方法。其一般步骤:

  第一步,建立虚无假设,即先假定两个平均数之间没有显著差异。
  第二步,计算统计量Z值,对于不同类型的问题选用不同的统计量计算方法。
   
  (1)如果检验一个样本平均数()与一个已知的总体平均数()的差异是否显著。其Z值计算公式为:

    其中是检验样本的平均数;
    是已知总体的平均数;
    S是样本的方差;
    n是样本容量。

  (2)如果检验来自两个的两组样本平均数的差异性,从而判断它们各自代表的总体的差异是否显著。其Z值计算公式为:


  其中,1、2是样本1,样本2的平均数;
     是样本1,样本2的标准差;
     是样本1,样本2的容量。

  第三步,比较计算所得Z值与理论Z值,推断发生的概率,依据Z值与差异显著性关系表作出判断。如表6-13所示。

  第四步,根据是以上分析,结合具体情况,作出结论。

  【例6-5】某项教育技术实验,对实验组和控制组的前测和后测的数据分别如表6-14所示,比较两组前测和后测是否存在差异。

  由于n>30,属于大样本,应采用Z检验。由于这是检验来自两个不同总体的两个样本平均数,看它们各自代表的总体的差异是否显著,所以采用双总体的Z检验方法。

  计算前测Z的值

 = -0.658

  ∵=0.658<1.96
  ∴ 前测两组差异不显著。
  再计算后测Z的值

 = 2.16


  ∵  = 2.16>1.96
  ∴ 后测两组差异显著。

 

[1] [2] [3] 下一页

 三、小样本平均差异的显著性检验——t检验
   
  t检验是用于小样本(样本容量小于30)时,两个平均值差异程度的检验方法。它是用t分布理论来推断差异发生的概率,从而判定两个平均数的差异是否显著。其一般步骤如下:

  第一步,建立虚无假设,即先假定两个总体平均数之间没有显著差异。

  第二步,计算统计量t值,对于不同类型的问题选用不同的统计量计算方法。

  (1)如果要评断一个总体中的小样本平均数与总体平均值之间的差异程度,其统计量t值的计算公式为:

  (2)如果要评断两组样本平均数之间的差异程度,其统计量t值的计算公式为:

  第三步,根据自由度df= n-1,查t值表,找出规定的t理论值(见附录)并进行比较。理论值差异的显著水平为0.01级或0.05级。不同自由度的显著水平理论值记为t (df)0.01和t (df)0.05

  第四步,比较计算得到的t值和理论t值,推断发生的概率,依据表6-15给出的t值与差异显著性关系表作出判断。

  第五步,根据是以上分析,结合具体情况,作出结论。

  下面通过两个实例说明如何利用SPSS进行t检验:

  【例6-6】 某班共有50人,随机抽取20人利用多媒体教学软件进行语文教学试验。在期终考试结束后,得知全班语文考试成绩如表6-16所示,其中前20人分数为参加试验的学生成绩。试通过检验样本平均数与总体平均数之间的差异程度判断该试验的效果。

  操作步骤:
  
  1.录入数据

  定义变量“学号”、“样本”和“全班”,分别录入数据,其中“样本”变量对应的是前20人的语文成绩,“全班”变量对应的是全班50人的语文成绩。

  2.统计分析

  (1)选择“Analyze→Compare Means→One-Sample T Test…”命令,弹出“One-Sample T Test”对话框,将“样本”和“全班”选入“Test”框中,对选择的变量进行t检验,如图6-26所示。


  (2)单击“OK”按钮,提交运行,输出结果如表6-17所示。

  3.结果分析

  t检验的结果为t值(t)、自由度(df)、双尾显著性概率(Sig.)、均值差异(Mean Difference)和均值差异的95%置信区间(95% Confidence Interval of the Difference)。

  查t值表可知,t(df)0.05=t(19)0.05=2.093,

  而样本 t = 38.544> t(19)0.05

  所以样本与总体之间存在显著差异,样本平均分高于总体平均分。

  【例6-7】 某班的教学中采用了新的教学方法,进行前测和后测试验,随机抽取8名学生作样本,如表6-18所示,分析两次测试是否有差异,从而判断实验结果。

  操作步骤:

  1.录入数据

  定义变量“编号”、“前测”和“后测”,按照表8的内容录入数据。

  2.统计分析

  (1)选择“Analyze→Compare Means→Paired-Sample T Test”命令,弹出“Paired-Samples T Test”对话框,单击“前测”和“后测”变量,使其分别显示在“Current Selections”框中的“Variable”后,按箭头按钮使成对变量进入“Paired Variables”框中,如图6-27所示。


  (2)单击“OK”按钮,提交运行,输出结果如表6-19所示。


    3.结果分析

  查t值表可知,t(df)0.05=t(7)0.05=2.365,

  而从表13-19中可以看出,样本 t = 38.544 > t(7)0.05

  所以后测与前测之间存在显著差异。

  或者,可以从表6-19中看出,显著性概率(Sig.(2-tailed))为0.022,而当显著性概率小于0.05时,认为配对样本之间存在显著差异,即后测与前测之间存在显著差异。证明该教学方法适合教学要求,能够促进学生提高成绩。

上一页  [1] [2] [3] 下一页

 

  四、检验

  上述Z检验和t检验,通常用于计量资料的分析。但在教育技术研究中,还常遇见按品质分类的资料,如对问题的答案分对、错两种,对能力分优、良、中、差、劣几种,对情绪反应分强、中、弱三种。对这一类计数资料的差异程度检验,就要利用用检验。

   检验属于拟合优度型检验,适用于具有明显分类特征的某种数据,用来检验属于某一类别的对象或反映的个案数与根据零假设所得期望数目之间是否有显著差异。

   检验是对所得到的分类、分等的计数资料与依据某种假设所期望的理论次数之间二者进行差异的显著性检验的方法。其一般步骤如下:

  第一步,建立虚无假设
  第二步,计算统计量值,计算公式为:

  式中是实得次数(观察次数);是理论次数(期望次数)。

  第三步,按类别项目的自由度df= n-1或df=(n1-1)(n2-1)查df(0.01)和df(0.05)的数值表(见附录),找出理论值。

  第四步,比较判断,把计算所得的 值与查表所得的理论 值进行比较,依据 值与差异显著性关系表判断检验结果,如表6-20所示。



  第五步,根据是以上分析,结合具体情况,作出结论。

  下面通过两个例子,说明如何利用SPSS进行检验。

  【例6-8】  随机抽取某学校数学系和中文系学生各100名,对某一英语教学软件的效果进行评价,根据表6-21所示的评价结果测试两系学生的评价态度的差异。

  操作步骤:

  1.转换为SPSS用的变量和数据

  定义三个变量,分别为“态度”、“人数”和“系别”。变量“态度”的值标签为:1=好,2=中,3=差;变量“系别”的值标签为:1=数学系,2=中文系。因此表10可以转换为表6-22的表示形式。

  2.录入数据
  按照表6-22所示,向SPSS中输入数据。

  3.统计分析

  (1)选择“Data→Weight Cases…”命令,弹出“Weight Cases”对话框,激活“Weight Cases by”选项,并将变量“人数”选入“Frequency”框中,如图6-28所示。


  (2)单击“OK”按钮,完成对变量“人数”的加权操作。

  (3)选择“Analyze→Descriptive Statistics→Crosstabs”命令,弹出“Crosstabs”对话框,将变量“系别”指定为“Rows”,将变量“态度”指定为“Columns”,如图6-29所示。


 

  (4)单击图6-29所示对话框中的“Statistics…”按钮,弹出“Crosstabs:Statistics”对话框,激活“Chi-squqre”选项,如图6-30所示。


  (5)单击图6-30所示对话框中的“Continue”按钮,切换到图6-29所示的对话框,单击“OK”按钮,提交运行,输出结果如表6-23所示。


 

  4.结果分析

  查值表可知,(df)0.05 =  (2)0.05 = 5.99

  而从表13-23中可知,=10.667 >  (2)0.05

  所以两系学生的评价态度存在显著差异。

  或者,从Pearson和Likelihood的显著性水平P=0.005和P=0.004来看,可以得知行列变量之间不存在相互独立的关系,即两系学生的评价态度有显著差异。

  【例6-9】某项关于物理实验的多媒体教材开发完成后,送给有关学校的物理教师征询意见并发出问卷,对44位教师的问卷调查部分结果如表6-24所示:

  下面利用SPSS进行统计检验,由于该检验是单样本的检验,每次只对一个问题进行检验。

  操作步骤:

  1.录入数据

  定义变量“问题a”和“人数”,变量“问题a”对应的变量值为1,2,3,4,分别对应四种不同意见。变量“人数”对应的变量值为23,13,6,2。

  2.统计分析

  (1)选择“Data→Weight Cases…”命令,弹出“Weight Cases”对话框,激活“Weight Cases by”选项,将变量“人数”选入“Frequency”框中,如图6-31所示。
 

  (2)单击“OK”按钮,完成对变量“人数”的加权操作。

  (3)选择“Analyze→Nonparametric Tests→Chi-square…”命令,弹出“Chi-square Test”对话框,将变量“问题a”选入“Test Variable List”框中,如图6-32所示。
 

  (4)单击“OK”按钮,提交运行,输出结果如表6-25所示。

  3.问题b的检验。

  与问题a的统计处理相同,定义变量“问题b”和“人数”,变量“问题b”对应的变量值为1,2,3,4,分别对应四种不同意见。变量“人数”对应的变量值为14,14,10,6。

  按照第(2)步,对变量“人数”先进行加权处理,再进行检验。输出结果如表6-26所示。

  4.结果分析

  (1)对于问题A:

  查值表可知,(df)0.05 =  (3)0.05 = 7.81

  而从表6-25中可知,=23.091 >(3)0.05

  所以有关学校的物理教师对于A问题的回答存在显著差异。

  (2)对于问题B:

  查值表可知, (df)0.05 =  (3)0.05 = 7.81

  而从表6-26中可知,=4.000 <  (3)0.05

  所以有关学校的物理教师对于B问题的回答不存在显著差异。

  或者,从表6-25可知,A问题的显著性概率(Asymp.Sig.)为0,要小于0.05,故对于A问题的回答存在显著差异。

  从表6-26可知,B问题的显著性概率为0.261,要大于0.05,故对B问题的回答较均匀,不存在显著差异。

上一页  [1] [2] [3] 

版权声明:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (0)
#插入话题

相关资讯

SPSS 10.0高级教程十三:分类资料的回归分析(2)

在很久很久以前,地球上还是一个阴森恐怖的黑暗时代,大地上恐龙横行,我们的老祖先--类人猿惊恐的睁大了双眼,围坐在仅剩的火堆旁,担心着无边的黑暗中不知何时会出现的妖魔鬼怪,没有电视可看,没有网可上... 我是疯了,还是在说梦话?都不是,类人猿自然不会有机会和恐龙同时代,只不过是我开机准备写这一部分的时候,心里忽然想到,在10年前,国内的统计学应用上还是卡方检验横行,分层的M-H卡方简直就是超级武器

SPSS 10.0高级教程十三:非参数检验

§12.1  概论 作为二十一世纪统计理论的三大发展方向之一,非参数统计是统计分析的重要组成部分。可是与之很不相称的是他针对一般性统计分析的理论发展远远不及参数检验完善,因而比较完善的可供使用的方法也不多。比如多组均数间的两两比较,虽然已有好几种方法可资利用,但由于在理论上仍存在争议,几种权威的统计软件(如SAS和SPSS)均没有提供这方面的方法。 虽然这些洋统计软件没有提供两两比

SPSS教程2:SPSS基本概述与介绍

在教育技术学研究中,常常需要对大量的数据进行统计处理,这是一项细致而繁琐的工作,如果完全依靠手工来进行,工作量较大,且难以保证准确性,也得不到高的精度。为了减轻整理和计算大量数据的负担,提高工作效率,我们必须充分利用现代化的技术手段。随着计算机软件技术的发展,计算机在分析数据方面发挥了相当大的作用,它功能多、速度快、计算精确、较易利用,并且计算机统计软件可以完成更为精确系统的数据分析与统计计算。 

SPSS教程2:利用SPSS进行统计描述

一、统计描述方法   在教育技术研究过程中收集到大量的资料数据,但从这些杂乱无章的资料中,很难对其总体水平与分布状况做出评价判断。因此,必须采用一些适当的方法对这些资料进行处理,使之简约化、分类化、系统化,从中发现它们的分布规律,掌握总体的特征,以便对其水平做出客观的评价。  统计描述方法,是研究简缩数据并描述这些数据的统计方法。将搜集来的大量数据资料,加以整理、归纳和分组,简缩成易于处理和

SPSS 10.0高级教程十四:Survival菜单详解(1)

对于急性病的疗效考核,一般可以用治愈率、病死率等指标来评价,但对于肿瘤、结核及其他慢性疾病,其预后不是短期内所能明确判断的,这时可以对病人进行长期随访,统计一定期限后的生存和死亡情况以判断疗效,这就是生存分析。 生存分析是用于以处理生存时间(survival time)为反应变量、含有删失数据一类资料的统计方法。所谓生存时间,狭义地讲是从某个标准时点起至死亡止,即患者的存活时间。例如,患有某病的

SPSS 10.0高级教程十四:Survival菜单详解(2)

§13.3    Cox Regression过程 上面给大家介绍的是两种生存分析方法,但它们只能研究一至两个因素对生存时间的影响,当对生存时间的影响因素有多个时,它们就无能为力了,下面我给大家介绍Cox Regression过程,这是一种专门用于生存时间的多变量分析的统计方法。 Cox Regression过程主要用于: 1、 用以描述多个变量对生存时间的影响