SPSS 10.0高级教程六:SPSS统计绘图功能详解

2012-04-12 生物谷 生物谷

在常用的统计软件中,SAS绘制的统计图不太美观;而SPSS绘制的统计图较为美观,可以满足大多数情况下的要求;STATA绘制的统计图形最为精美,但由于它采用命令行方式操作,美观的图形需要添加大量选项,普通人不易掌握;而S-PLUS、MATHLAB等偏数理统计的软件虽然绘图能力也非常强,但由于自身的定位问题,并不为大多数人所熟悉。因此,在各种统计软件中,以SPSS制作的统计图应用最为广泛。 EXE

在常用的统计软件中,SAS绘制的统计图不太美观;而SPSS绘制的统计图较为美观,可以满足大多数情况下的要求;STATA绘制的统计图形最为精美,但由于它采用命令行方式操作,美观的图形需要添加大量选项,普通人不易掌握;而S-PLUS、MATHLAB等偏数理统计的软件虽然绘图能力也非常强,但由于自身的定位问题,并不为大多数人所熟悉。因此,在各种统计软件中,以SPSS制作的统计图应用最为广泛。

EXECL的统计绘图功能非常的强,我们还有必要学习SPSS的绘图功能吗?
这个问题我的看法是:EXCEL由于它的纯中文界面和简单而强大的绘图功能,使得可以用它来直接绘制各种简单的统计图,但是,EXCEL可以直接绘制的统计图种类有限,象误差条图、自回归图等它就无能为力,即是它支持的线图、条图等,如果过于复杂,如叠式条图、累计条图等也无法作出,而这些图在统计中是经常会碰到的,此时就只有采用统计软件来绘制,SPSS就是其中的佼佼者。

§5.1 常用统计图

在SPSS 10.0版中,除了生存分析所用的生存曲线图被整合到ANALYZE菜单中外,其他的统计绘图功能均放置在graph菜单中。该菜单具体分为以下几部分:

  • Gallery:相当于一个自学向导,将统计绘图功能做了简单的介绍,初学者可以通过它对SPSS的绘图能力有一个大致的了解。

  • Interactive:交互式统计图,这是SPSS 9.0版新增的内容。

  • Map:统计地图,这是SPSS 10.0版新增的内容。

市面上所能见到的SPSS 10.0 D版由于执照不全,并不能安装统计地图模块。

  • 下方的其他菜单项是我们最为常用的普通统计图,具体来说有:

条图

散点图

线图

直方图

饼图

面积图

箱式图

正态Q-Q图

正态P-P图

质量控制图

Pareto图

自回归曲线图

高低图 

交互相关图

序列图

频谱图

误差线图

 其中后面几种图形用于时间序列分析。我们的讲解将这些常规统计图为主,对交互式统计图和统计地图只举例介绍,就不再全面讲述了。

我们所用的数据集为SPSS自带的anxiety.sav,本章的大多数例子都将围绕该数据集展开。

5.1.1  操作界面介绍(条图)

5.1.1.1  条图的通用界面

由于不同图形的绘图对话框有相当强的共性,下面我们通过一个简单的例子来看看绘图菜单的大致界面是怎么样的,通过这个例子大家可以举一反三。

例5.1:在数据集anxiety.sav中分不同的subject对变量score值(之和)绘制条图。

选择graphs==>bar后,系统首先会弹出一个简单的导航对话框如下所示:

绘制简单条图(单式条图)
绘制复式条图
绘制堆积条图(分段条图)

定义统计图中数据的表达类型:

条图反映了同一变量若干条记录的分组汇总
条图反映了不同变量的汇总
条图反映了个体观察值

在该对话框中,SPSS将条图进行了大致的分类,对话框的上半部分用于选择条图类型,下半部分的Data in Chart are单选框组用于定义条图中数据的表达类型。这里根据我们所需绘制条图的类型,应该选择简单条图,在表达类型中则应选择"Summaries for groups of cases"。选好后单击DEFINE钮,系统开启正式的条图定义对话框如下:

对话框左侧为通用的侯选变量列表框,右侧的对话框元素依次解释如下:

Bars Represent单选框组

用于定义条图中直条所代表的含义,可以是样本例数、样本数所占的百分比、累计样本例数、累计样本数所占的百分比或其余汇总函数,在例5.1中我们要对变量score的值绘图,因此选择最后一项"Other summary function",系统开启summary function对话框如下所示:

该对话框中列出了更多的统计汇总函数,可以满足绝大多数情况的需要。具体有:

  • 上部:包括大多数常用统计汇总函数,如均数、标准差、中位数、方差、众数、最大、最小值、样本例数、变量值之和、累计变量值。

  • 中部:可对各记录按大小进行筛选,如上侧百分之多少,或者只选择小于某个数值的记录。具体的数值在value框中输入。

  • 下部:可按数值大小值选择取值在某个范围内的记录,具体的范围在low和high框中输入。

注意上面的一些函数是和前面重复的,如样本例数。

此外,对话框最下侧还有一个Values are grouped midpoints复选框,当选中median of values或percentile单选框时该框变为可选,选中则表明数据为频数表格式,所输入的数值为组中值。

根据我们的目的,这里选择sum of values单选框,单击continue后系统回到上一个对话框。

Category Axis框

用于选择所需的分类变量,此处必选。这里根据要求,将subject选入,可以见到此时OK已经变黑可用了。

Template框

用于选择绘制条图的模板,一般较少用。

Titles钮

用于输入统计图的标题和脚注,最多可以输入两行主标题,一行副标题,两行脚注。

Options钮

弹出Options对话框,用于定义相关的选项,有:

  • Confidence Interval框 输入需要计算的均数差值可信区间范围,默认为95%。如果是和总体均数为0相比,则此处计算的就是样本所在总体均数的可信区间。

  • Missing Values单选框组 定义分析中对缺失值的处理方法,可以是具体分析用到的变量有缺失值才去除该记录(Excludes cases analysis by analysis),或只要相关变量有缺失值,则在所有分析中均将该记录去除(Excludes cases listwise)。默认为前者,以充分利用数据。

现在,我们已经完成了绘制该图所需的工作,单击OK,系统绘出统计图如下:

至于Data inChart Are中的另两种情况Summaries of separate variables和Values of individual cases,其对话框界面极为简单,可以说是一目了然,这里不再多讲,只指出以下几点:

  • 在Summaries of separate variables的对话框中,可以用Change summary钮更改汇总函数。

  • 在Values of individual cases的对话框中,下方category labels的选择并不影响做出直条的多少,只会影响X轴表示的内容,默认是记录号。

5.1.1.2  复式条图与分段条图的界面

复式条图与分段条图的界面并非全新的东西,只是在前面的简单界面上增加了一些元素,让我们再通过一个例子来看看:

例5.2:在数据集anxiety.sav中分不同的subject对变量score值(之和)绘制条图,并且按变量trial的不同取值堆积(分段):

由于要按变量trial的不同取值分段,因此在导航对话框中就不能选simple,而应根据目的选择stacked,单击define后系统开启的条图定义对话框和我们前面所用的略有不同,具体来说在Category Axis框附近不同,现在Category Axis框下面多了些东西如下所示:

选择stacks时的情况

选择clusters时的情况

显然,当需要做复式条图时,将所需的分类变量选入stacks框中即可,做分段条图的情况也与此类似。

以例 5.2为例,其操作步骤如下:

  1. Graphs==>bar
  2. Clustered:选中
  3. Summarizes for groups of variables单选框:选中
  4. 单击Define
  5.   Bars repesent框:选入score。
  6.   Other summary function单选框:选中
  7.   Variable框:选入subject
  8.   Change summary钮:单击
  9.     Sum of values单选框:单击
  10.     单击continue钮
  11.   Category Axis框:选入subject
  12.   Define stacks by框:选入trial
  13.   单击OK

绘出的条图如下所示:

但是,在Values of individual cases的对话框中情况有些不同,原先Bars repersent框只能选入一个变量,做复式条图和分段条图时该框中可以选入多个变量了,其他的内容不变。

5.1.2  其他常用统计图

5.1.2.1  散点图

散点图是各种统计图中比较简单的一种,共分为simple、matrix(以矩阵的形式显示多个变量间两两的散点图)、overlay(将多个变量间两两的散点图同时做在一张图上)和3D(将X、Y、Z三个变量间的相关散点图做在一个立体空间中)四种,其中需要解释的比较特殊的内容有:

  • Set marks by框:选入一个标记变量,根据该变量取致的不同对同一个散点图中的各点标以不同的颜色(或形状),例如在数据cars中我们以horse和weight做图,如果用orgion的大小来做marks,则两次做出的图如下:

没有mark变量时的情况

用orgion做mark变量时的情况

  • Label cases框:当编辑图形在图形选项中选择显示labels时,图形默认显示记录号,如果在这里选择了label变量,则显示该变量的取值。

  • 做出的3D图形可以在编辑时进行三维旋转,从多个角度进行观察。

5.1.2.2  线图

线图实际上和条图是一回事,可以认为它就是条图的变形,条图是用直条的高低表示多少,而线图是用点的高低来表示,然后又用直线将各点连接而成。

5.1.2.3  饼图

饼图的做法简直太简单了,不值一提!

5.1.2.4  面积图

面积图的做法是和线图、饼图类似的,比如堆积面积图是将各个指标值相加而成,和分段式条图非常类似。

5.1.2.5  直方图

直方图用于观察某个变量的分布情况,如果选择了display normal curve复选框,则会同时做出一条当前变量理想状况的正态分布曲线来,和该曲线相比,你就可以知道变量的实际分布究竟差了多远。

5.1.2.6  其他

P-P图和Q-Q图都是用来观察变量是否服从正态分布的;质量控制图则用来观察个体值是否有超过正常值范围的情况出现;箱式图的作用和它类似,只是换了一种表达方式;其余的几种图几乎都是用与时间序列模型的。

5.1.3  常用统计图编辑方法详解

该部分内容请参见4.5节:图片编辑方法详解。

§5.2 交互式统计图

交互式统计图是SPSS 8.0版新增的绘图类型,包括了交互式条图、线图、面积图、饼图、散点图、箱式图、误差限图和和直方图共七种类型,那么,这种新的统计图类型和普通的统计图相比有什么优越性,或者说,它的主要卖点--交互性都体现在哪里呢?

在我看来,“交互式”这三个字主要体现在以下几个方面:

  • 对话框的交互。它的对话框全部采用拖方式操作,并且每一个元素的可操作性都大大强于普通对话框,以前需要两至三层对话框才能完成的工作,现在在一层对话框中就可以完成了。

  • 图形内容的交互。在技术上,普通统计图存储的是图形元素,因此编辑时只能就图形元素的特征,如颜色、线型等加以修改;而现在的交互式统计图完全不同,它存储的是原始数据或者绘图用的中间结果(如均数、标准差等),因此当图形绘制完毕后仍能对图形进行彻底更改,如加入锌的变量(在散点图中加入标示变量,甚至二维变三维)、删除某一部分数据、甚至改变所会图形的基本类型,如将条图改绘为线图等,只要所需信息相同,随你如何转换!不但如此,由于这个存储特点,现在我们还可以绘出以前无法直接得到的图形,如将一个数据透视表的内容用图形来表示!

哈哈,统计表,我们要拿你来做图!

这就是做出的交互式统计图

把它转成三维怎么样?

  • 增强的图形编辑能力。同样由于它的存储特点,现在交互式统计图的图形编辑能力达到了有恃无恐的地步!几乎任何东西都可以拿来改,也可以往里添加许多辅助线,如下面所示的一样:

朴素的美

削尖脑袋的模样

墙上长满了爬山虎

太阳照在红墙内外

反客为主的蓝飘带

我没有放倒!

请注意,最后一幅图是在三维实时旋转时截取的(三维实时旋转也是交互式统计图新增的功能之一),因为如果我不这样做,它可能会那样一直旋转下去,我这样也算是挽救了他吧!

§5.3 统计地图

统计地图是 SPSS 10.0的新增功能,如果用时髦的说法就应该是“地球物理信息系统”,不过我喜欢用朴素的名称。该功能可以将收集到的数据和地图相联系,从而绘出统计地图来。该功能共分为区域值统计地图、渐近符号统计地图、点密度统计地图、个体值统计地图、分类计数条图统计地图、饼图统计地图和多主题统计地图七种。但是,如同我在SPSS 10.0抢鲜报道中提到过的一样,该地图集关于中国的部分简直就是一塌糊涂,所以对国内用户来说它更多的使用来玩,而不是工作。

统计地图在操作上和交互式统计图完全一致,实际上,它就是一类特殊的交互式统计图。它所用的数据集应该和所选的地图相对应,否则会给出错误信息,并停止做图。这是用SPSS附带的亚州数据集做出的亚洲国家人口点密度图:

SPSS 在根目录下的MapData目录中放有许多绘制统计地图用的数据集,有兴趣的朋友可以自己做几个图试试。

版权声明:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (2)
#插入话题
  1. [GetPortalCommentsPageByObjectIdResponse(id=19938, encodeId=fffa19938d1, content=好东西,学习了!, beContent=null, objectType=article, channel=null, level=null, likeNumber=116, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=6a6f1377716, createdName=shawuque, createdTime=Wed Apr 08 10:42:00 CST 2015, time=2015-04-08, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=1745805, encodeId=a1881e458059f, content=<a href='/topic/show?id=80f8e895229' target=_blank style='color:#2F92EE;'>#统计绘图#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=43, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=78952, encryptionId=80f8e895229, topicName=统计绘图)], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=538e35589094, createdName=gongliu, createdTime=Tue May 01 15:27:00 CST 2012, time=2012-05-01, status=1, ipAttribution=)]
    2015-04-08 shawuque

    好东西,学习了!

    0

  2. [GetPortalCommentsPageByObjectIdResponse(id=19938, encodeId=fffa19938d1, content=好东西,学习了!, beContent=null, objectType=article, channel=null, level=null, likeNumber=116, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=6a6f1377716, createdName=shawuque, createdTime=Wed Apr 08 10:42:00 CST 2015, time=2015-04-08, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=1745805, encodeId=a1881e458059f, content=<a href='/topic/show?id=80f8e895229' target=_blank style='color:#2F92EE;'>#统计绘图#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=43, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=78952, encryptionId=80f8e895229, topicName=统计绘图)], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=538e35589094, createdName=gongliu, createdTime=Tue May 01 15:27:00 CST 2012, time=2012-05-01, status=1, ipAttribution=)]

相关资讯

SPSS教程第十六课:统计图的绘制

 统计图是用点的位置、线段的升降、直条的长短或面积的大小等来表达资料的内容。它可以把资料所反映的变化趋势、数量多少、分布状态和相互关系等形象直观地表现出来,以便于读者的阅读、比较和分析。     本章将介绍SPSS在绘制常用统计图方面的功能。由于计算机绘图具有快速、清晰、规范、可修正以保证准确无误等特点,故在论文、报告等写作中有着十分重要的应用价值。

SPSS 10.0高级教程二:数据文件的管理(2)

2.2.1.2 从原有变量计算新变量 从头定义变量的情况多数在建立数据集时出现。但是,当数据集已经建立,需要整理、转换变量时,碰到的更多情况是需要根据某种条件从原有变量计算新变量。下面我们将按菜单条目的顺序依次讲解他们的功能。但是,首先我们需要了解一下所用的对话框界面的情况。 【SPSS对话框元素介绍】 下面是我们在第一章曾经见过的两样本t检验对话框: 这是一个非常典型的SPSS对话框

SPSS 10.0高级教程四:程序编辑窗口用法详解

某年某月的某一天,你和你的另一半正在街上为地球表面的平整而贡献自己的绵薄之力。突然(也许是必然),你觉得有些饿了。这是一个问题,当然,不用说大家也知道解决问题的方法就是--吃。不过就是吃也有讲究,可以随便找个面馆简单的填饱肚子;要求高的话还可以去几星级的地方享受一下;当然还有的人觉得自己回去做口味也合适,花费也不多;更有些超级美食家,星级水准也不满意,需要亲自给一级厨师露一手,指点他们一下,才会吃

SPSS 10.0高级教程五:SPSS结果窗口用法详解

§4.1 结果窗口元素介绍 SPSS实际上提供了两个结果窗口--结果浏览窗口和结果草稿浏览窗口。前者最为常用,显示美观,但非常消耗系统资源;后者实际上是一个RTF格式文档,显示简单朴素,但节省资源。我们可以根据所用计算机的情况选择使用哪一种窗口。 结果草稿浏览窗口的内容虽然是RTF格式,但由于中、英文兼容性的问题,其中的表格读入WORD以后会变的面目全非,因此对我们不是很适用。 4.1.1

SPSS 10.0高级教程一:SPSS概览--数据分析实例

欢迎加入SPSS使用者的行列,首先祝贺你选择了权威统计软件中界面最为友好,使用最为方便的SPSS来完成自己的工作。由于该软件极为易学易用(当然还至少要有不太高的英语水平),我们准备在课程安排上做一个新的尝试,即不急于介绍它的界面,而是先从一个数据分析实例入手:当你将这个例题做完,SPSS的基本使用方法也就已经被你掌握了。从下一章开始,我们再详细介绍SPSS各个模块的精确用法。 我们教学时是以SP

SPSS 10.0高级教程二:数据文件的管理(1)

不言而喻,一切统计分析都是以数据为基础的,因此统计软件的数据管理能力非常重要。SPSS以其豪华的界面为依托,为用户提供的便捷的数据管理功能,下面我们就来具体看一下。 §2.1 建立与保存数据文件 和大多数应用软件相同,SPSS中数据文件的管理功能基本上都集中在了File菜单上,该菜单的组织结构和WORD等也极为相似,因此这里我们只介绍比较有特色的几个菜单项。 SPSS 10.0有三个主要窗