SPSS教程2:SPSS基本概述与介绍

2012-04-12 生物谷 生物谷

在教育技术学研究中,常常需要对大量的数据进行统计处理,这是一项细致而繁琐的工作,如果完全依靠手工来进行,工作量较大,且难以保证准确性,也得不到高的精度。为了减轻整理和计算大量数据的负担,提高工作效率,我们必须充分利用现代化的技术手段。随着计算机软件技术的发展,计算机在分析数据方面发挥了相当大的作用,它功能多、速度快、计算精确、较易利用,并且计算机统计软件可以完成更为精确系统的数据分析与统计计算。 

在教育技术学研究中,常常需要对大量的数据进行统计处理,这是一项细致而繁琐的工作,如果完全依靠手工来进行,工作量较大,且难以保证准确性,也得不到高的精度。为了减轻整理和计算大量数据的负担,提高工作效率,我们必须充分利用现代化的技术手段。随着计算机软件技术的发展,计算机在分析数据方面发挥了相当大的作用,它功能多、速度快、计算精确、较易利用,并且计算机统计软件可以完成更为精确系统的数据分析与统计计算。

  在教育技术研究资料统计处理中常采用的统计软件有SPSS INC公司的SPSS统计软件系统、SAS统计分析系统和Microsoft公司的Excel软件等。SPSS是Statistics Package for Social Sciences(社会科学统计软件包)的缩写,它是社会科学研究人员首选的统计软件,也是目前世界上最流行的统计软件之一。因而被广泛应用于社会科学和自然科学的各个领域中。

  一、SPSS统计软件概况

  SPSS是专业的通用统计软件包,它是一个组合式软件包,兼有数据管理、统计分析、统计绘图和统计报表功能,界面友好,使用简单,广泛用于教育、心理、医学、市场、人口、保险等研究领域,也用于产品质量控制、人事档案管理和日常统计报表等。

  SPSS对硬件系统的要求较低,普通配置的计算机都可以运行该软件;对运行的软件环境要求宽松,有各种版本可运行在WINDOWS 3X、9X、2000环境下,现在较新的10.0版可运行在WINDOWS 2000中(SPSS早期版本运行于DOS下,这里不再进行介绍,本节以SPSS 10.0版本为例介绍的该软件的使用)。SPSS 10.0有英文版和汉化版两种版本,可运行在中英文平台上。

  SPSS统计软件采用电子表格的方式输入与管理数据,能方便地从其他数据库中读入数据(如Dbase,Excel,Lotus等)。它的统计过程包括描述性统计、平均值比较、相关分析、回归分析、聚类分析、数据简化、生存分析、多重响应等几大类,每类中又下含同类多种统计过程,比如回归分析中又分线形回归分析、非线性回归分析、曲线估计等多个统计过程,而且每个过程中允许用户选择不同的方法及参数进行统计分析,因此除可以实现常规的各种统计外,还可用来做一些不常用的分析处理。

  SPSS采用Sax Basic引擎,允许用户使用类Basic的语言编制脚本,在SPSS中运行用户自定义的过程,增强了SPSS的功能。

  二、SPSS 统计软件的功能特点

  自1985年SPSS INC公司推出的SPSS/PC V1.0以来,SPSS的版本不断更新,软件功能不断完善,操作越来越简便,与其他软件的接口也越来越多。现在的SPSS for Windows具有以下几种功能。

  (一)SPSS的数据编辑功能

  在SPSS的数据编辑器窗口中,不仅可以对打开的数据文件进行增加、删除、复制、剪切和粘贴等常规操作,还可以对数据文件中的数据进行排序、转置、拆分、聚合、加权等操作,对多个数据文件可以根据变量或个案进行合并。可以根据需要把将要分析的变量集中到一个集合中,打开时只要指定打开该集合即可,而不必打开整个数据文件。

  (二)表格的生成和编辑

  利用SPSS可以生成数十种风格的表格,根据功能又可有一般表、多响应表和频数表等。利用专门的编辑窗口或直接在查看器中可以编辑所生成的表格。在SPSS的高版本中,统计成果多被归纳为表格和(或)图形的形式。

  (三)图形的生成和编辑

  利用SPSS可以生成数十种基本图和交互图。其中基本图包括条形图、线图、面积图、饼图、高低图、帕累托图、控制图、箱图、误差条图、散点图、直方图、P-P概率图、Q-Q概率图、序列图和时间序列图等,有的基本图中又可进一步细分。交互图比基本图更漂亮,可有不同风格的二维、三维图。交互图包括条形交互图、点形交互图、线形交互图、带形交互图、饼形交互图、箱形交互图、误差条形交互图、直方交互图和散点交互图等。图形生成以后,可以进行编辑。

  (四)与其他软件的联接

  SPSS能打开Excel、DaBase、Foxbase、Lotus 1-2-3、Access、文本编辑器等生成的数据文件。SPSS生成的图形可以保存为多种图形格式。

  现在的SPSS软件支持OLE技术和ActiveX技术,使生成的表格或交互图对象可以与其他同样支持该技术的软件进行自动嵌入与链接。SPSS还有内置的VBA客户语言,可以通过Visual Basic编程来控制SPSS。

  (五)SPSS的统计功能

  SPSS的统计功能是SPSS的核心部分,利用该软件,几乎可以完成所有的数理统计任务。具体来说,SPSS的基本统计功能包括:

 样本数据的描述和预处理
 假设检验(包括参数检验、非参数检验及其他检验)
 方差分析(包括一般的方差分析和多元方差分析)
 列联表
 相关分析
 回归分析
 对数线性分析
 聚类分析
 判别分析
 因子分析
 对应分析
 时间序列分析
 生灭分析
 可靠性分析

  三、利用SPSS进行统计处理的基本过程

  SPSS功能强大,但操作简单,这一特点突出地体现在它统一而简单的使用流程中。SPSS进行统计处理的基本过程如图6-1所示:

  其基本步骤如下:

  (一)数据的录入
   
  将数据以电子表格的方式输入到SPSS中,也可以从其它可转换的数据文件中读出数据。数据录入的工作分两个步骤,一是定义变量,二是录入变量值。

  (二)数据的预分析

  在原始数据录入完成后,要对数据进行必要的预分析,如数据分组、排序、分布图、平均数、标准差的描述等,以掌握数据的基本特点和基本情况,保证后续工作的有效性,也为确定应采用的统计检验方法提供依据。

  (三)统计分析

  按研究的要求和数据的情况确定统计分析方法,然后对数据进行统计分析。

  (四)统计结果可视化

  在统计过程进行完后,SPSS会自动生成一系列数据表,其中包含了统计处理产生的整套数据。为了能更形象地呈现数据,需要利用SPSS提供的图形生成工具将所得数据可视化。如前所述,SPSS提供了许多图形来进行数据的可视化处理,使用时可根据数据的特点和研究的需求来进行选择。

  (五)保存和导出分析结果

  数据结果生成完之后,则可将它以SPSS自带的数据格式进行存贮,同时也可利用SPSS的输出功能以常见的数据格式进行输出,以供其它系统使用。

[1] [2] 下一页

  四、SPSS数据文件的建立

  在使用SPSS软件进行数据分析时,首先要建立数据文件。通常一个数据文件的建立可以包括定义变量、数据输入、数据的简单计算、数据文件的保存和输出等内容。

  (一)变量的定义

  输入数据前要定义变量,包括定义变量名、变量类型、变量宽度、变量标签和变量格式。定义变量的步骤如下:

  1.打开定义变量的界面

  启动SPSS,进入主界面,单击图6-2所示的屏幕左下角的“Variable View”选项卡,打开定义变量的表格。

  2.输入变量名

  在“Name”列的第一个单元格输入第一个变量名,如 “编号”。SPSS 10.0支持中文变量名。

  3.确定变量类型

  单击“Type”列的第一个单元格,如图6-3所示,SPSS的默认变量类型为数值型。单击数值型变量后的“”,弹出如图6-4所示的对话框,用户可以从该对话框中选择其他的变量类型。


  在图6-4的对话框中列出了8种可选的基本变量类型:数字型(Numerric)、逗号型(Comma)、句点型(Dot)、科学计数型(Scientific notation)、日期格式型(Date)、美元型(Dollar)、定制货币型(Custom Currency)和字符串型(String)。

  4.设置变量的其他属性

  在图6-3所示的表格中,“Width”表示变量的总宽度,“Decimal”表示小数位数,“Lable”表示变量标签,“Value”表示变量的值,“Missing”表示缺失值,“Alignment”表示对齐方式,“Measurement”表示变量的种类。这些属性如果不是特殊需要,一般不要进行修改。

  (二)数据的输入

  定义好变量后,单击“Variable View”选项卡旁的“Data View”选项卡,进入数据输入窗口,按照SPSS表格直接输入数据即可。

  (三)数据的简单计算

  当输入完数据后,有时要根据已经存在的变量建立新变量,可以使用Compute来完成。

  1.选择“Transform→Compute”命令,弹出“Compute Variable”对话框,如图6-5所示。

  2.在Target Variable框中输入新的目标变量名,用来接收计算的值。

  3.利用Numeric Expression(计算关系板)下面的框中输入计算新变量的数字表达式。方法如下:

  (1)在左侧选择原始变量名进入Numeric Expression

  (2)在Numeric Expression上选择数字或操作符,形成表达式,如“编号>=10”

  (3)在函数框中选择表达式需要的函数,使表达式出现在其后括号中。如图6-6所示。


  

  (4)单击“OK”按钮,生成新的变量。

  (四)保存数据文件

  在查看器窗口中,进行以下操作,保存数据内容:

  1.单击主菜单中的File菜单,打开File菜单条。

  2.单击Save选项,弹出“Save Data As”对话框。

  3.输入文件名称,SPSS保存的文件类型为“*.sav”,单击“保存”按钮。

  (五)数据与统计结果的输出

  SPSS的文件输出是指将统计分析后的数据与结果以表格或图形的形式显示出来。如图6-7所示,为SPSS的输出窗口。在窗口的右侧以图表的形式显示输出结果。


  SPSS可以对输出的文件进行保存,保存的类型为“*.spo”。

  如果要单独保存表格或是图形,就在其上单击鼠标右键,选择相应的复制命令,将表格或图形输出。SPSS支持的表格或图形的输出格式有很多种,根据选择的输出方式不同,输出文件的格式也不同,一般可以保存为:*.htm、*.jpg、*.tif、*.bmp、*.png等。

  在本章中,结合教育技术学研究中常用的统计方法,介绍SPSS在统计描述、统计检验和统计分析等方面的应用,供学习者和教育技术研究人员参考使用。

上一页  [1] [2] 

版权声明:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (0)
#插入话题

相关资讯

SPSS 10.0高级教程十三:分类资料的回归分析(2)

在很久很久以前,地球上还是一个阴森恐怖的黑暗时代,大地上恐龙横行,我们的老祖先--类人猿惊恐的睁大了双眼,围坐在仅剩的火堆旁,担心着无边的黑暗中不知何时会出现的妖魔鬼怪,没有电视可看,没有网可上... 我是疯了,还是在说梦话?都不是,类人猿自然不会有机会和恐龙同时代,只不过是我开机准备写这一部分的时候,心里忽然想到,在10年前,国内的统计学应用上还是卡方检验横行,分层的M-H卡方简直就是超级武器

SPSS 10.0高级教程十三:非参数检验

§12.1  概论 作为二十一世纪统计理论的三大发展方向之一,非参数统计是统计分析的重要组成部分。可是与之很不相称的是他针对一般性统计分析的理论发展远远不及参数检验完善,因而比较完善的可供使用的方法也不多。比如多组均数间的两两比较,虽然已有好几种方法可资利用,但由于在理论上仍存在争议,几种权威的统计软件(如SAS和SPSS)均没有提供这方面的方法。 虽然这些洋统计软件没有提供两两比

SPSS 10.0高级教程十四:Survival菜单详解(1)

对于急性病的疗效考核,一般可以用治愈率、病死率等指标来评价,但对于肿瘤、结核及其他慢性疾病,其预后不是短期内所能明确判断的,这时可以对病人进行长期随访,统计一定期限后的生存和死亡情况以判断疗效,这就是生存分析。 生存分析是用于以处理生存时间(survival time)为反应变量、含有删失数据一类资料的统计方法。所谓生存时间,狭义地讲是从某个标准时点起至死亡止,即患者的存活时间。例如,患有某病的

SPSS 10.0高级教程十四:Survival菜单详解(2)

§13.3    Cox Regression过程 上面给大家介绍的是两种生存分析方法,但它们只能研究一至两个因素对生存时间的影响,当对生存时间的影响因素有多个时,它们就无能为力了,下面我给大家介绍Cox Regression过程,这是一种专门用于生存时间的多变量分析的统计方法。 Cox Regression过程主要用于: 1、 用以描述多个变量对生存时间的影响

SPSS 10.0高级教程十一:相关分析

在医学中经常要遇到分析两个或多个变量间关系的情况,有时是希望了解某个变量对另一个变量的影响强度,有时则是要了解变量间联系的密切程度,前者用下一章将要讲述的回归分析来实现,后者则需要用到本章所要讲述的相关分析实现。 SPSS的相关分析功能被集中在Statistics菜单的Correlate子菜单中,他一般包括以下三个过程: Bivariate过程 此过程用于进行两个/多个变量间的参数/非参

SPSS 10.0高级教程十二:多元线性回归与曲线拟合

回归分析是处理两个及两个以上变量间线性依存关系的统计方法。在医学领域中,此类问题很普遍,如人头发中某种金属元素的含量与血液中该元素的含量有关系,人的体表面积与身高、体重有关系;等等。回归分析就是用于说明这种依存变化的数学关系。 §10.1 Linear过程 10.1.1 简单操作入门 调用此过程可完成二元或多元的线性回归分析。在多元线性回归分析中,用户还可根据需要,选用不同筛选自变量的方法(