第一章 统计软件中的数据录入格式

2012-04-17 生物谷 不详

第一章  统计软件中的数据录入格式 统计分析是科研中的必要环节,统计软件则是进行统计分析的利器。但是,在计算机已逐渐普及的今天,统计软件却仍让人感到几分神秘:除了大型统计软件都还没有中文版这一原因,统计软件在许多小的方面也有自己的特点,往往就是这些小地方就会让许多人深入宝山而空返。今天我们就来谈谈使用统计软件时一个最基本而又非常重要的问题--数据录入格式。 简言之,我们平时往往用表格

第一章  统计软件中的数据录入格式

统计分析是科研中的必要环节,统计软件则是进行统计分析的利器。但是,在计算机已逐渐普及的今天,统计软件却仍让人感到几分神秘:除了大型统计软件都还没有中文版这一原因,统计软件在许多小的方面也有自己的特点,往往就是这些小地方就会让许多人深入宝山而空返。今天我们就来谈谈使用统计软件时一个最基本而又非常重要的问题--数据录入格式。

简言之,我们平时往往用表格的形式来记录数据,这并无不妥。问题在于当进行统计分析时,如果我们直接将数据按平时记录的格式来进行分析,那就很可能不得其门而入--因为大多数统计软件对数据格式都有着特定的格式要求,下面我们就举一些常见的情况来解释这一问题。

1. 单组或多组数据  平时我们多记录成" 第1组、第2组、第3组... " 等等,如表一左侧所示。样本含量相等或不等。主要用于成组资料比较的t、F或秩和检验等。这种记录格式姑且称为统计表格格式,在各种统计软件中,该数据通用的分析格式如表一右侧所示,我们把这种格式称为统计分析格式。

表 一
①统计表格格式

序号

第1组

第2组

第3组

1

0.1

0.4

0.6

2

0.2

0.5

0.7

3

0.3

0.8

4

0.9

样本量

3

2

4

②统计分析格式

1 , 0.1
1 , 0.2
1 , 0.3
2 , 0.4
2 , 0.5
3 , 0.6
3 , 0.7
3 , 0.8
3 , 0.9

看出来区别了吗?统计分析格式中第一列为“分组变量”,指示所在的组号;第二列为原始数据。现在再回到SPSS等统计软件的菜单去,做one-way ANOVA(成组的方差分析)知道怎么选变量了吧!

2. 配伍组数据   平时的记录格式同上面相似。主要用于配伍组资料比较或秩和检验等。见表二:

表 二
①统计表格格式

序号

第1组

第2组

第3组

1

0.1

0.3

0.5

2

0.2

0.4

0.6

样本量

2

2

2

②统计分析格式

1 , 1 , 0.1
1 , 2 , 0.2
2 , 1 , 0.3
2 , 2 , 0.4
3 , 1 , 0.5
3 , 2 , 0.6

统计分析格式中第一列为“第一分组变量”,指示所在的组号;第二列为“第二分组变量”,指示在该组的序号,第三列为原始数据;

3. 单组成对数据  变量名分别为:X、Y,要求样本含量相等。主要用于配对计量资料比较的t、秩和检验;直线回归与相关;曲线拟合等,格式见表三。

表三
①统计表格格式

序号

X

Y

1

0.1

0.4

2

0.2

0.5

3

0.3

0.6

样本量

3

3

②统计分析格式

0.1 , 0.4
0.2 , 0.5
0.3 , 0.6

两种格式没有区别,但请注意,如果配对资料转用方差分析来处理,则相应的也要变换格式。

4. 多组成对数据 主要用于协方差分析,格式见表四。

表 四
①统计表格格式

序号

X1

Y1

X2

Y2

1

0.1

0.3

0.5

0.8

2

0.2

0.4

0.6

0.9

0.7

1.0

样本量

2

2

3

3

②统计分析格式

1 , 0.1 , 0.3
1 , 0.2 , 0.4
2 , 0.5 , 0.8
2 , 0.6 , 0.9
2 , 0.7 , 1.0

在统计分析格式中,第一列为对子组号,第二列与第三列分别为该组的对子X、Y。

版权声明:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (1)
#插入话题
  1. [GetPortalCommentsPageByObjectIdResponse(id=2075779, encodeId=8b8a20e5779f6, content=<a href='/topic/show?id=8948e895323' target=_blank style='color:#2F92EE;'>#统计软件#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=38, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=78953, encryptionId=8948e895323, topicName=统计软件)], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=b30d401, createdName=huangshifeng, createdTime=Tue Jun 19 09:14:00 CST 2012, time=2012-06-19, status=1, ipAttribution=)]

相关资讯

第四章 多组资料均数比较的SAS编程实现

多组资料均数比较我们一般采用方差分析的方法,SAS中方差分析的功能非常全面,能实现方差分析功能的过程有anova过程和glm过程。 一、anova过程和glm过程简介 1. anova过程 anova过程存在于stat模块,主要的功能就是进行方差分析。anova过程用以对平衡实验设计资料(各分组因素各水平的所有组合具有相同的样本量或观察值)进行分析,不能用于对非平衡实验设计资料的方差分析。它

第二章 计量资料的统计描述

一、计量资料的统计描述 计量资料统计描述的内容主要包括平均指标和变异指标的计算、资料分布形态(或特征)的图形表现等。 (一)实现描述性统计功能的几个过程 描述性统计指标的计算可以用四个不同的过程来实现,它们分别是means过程、summary过程、univariate过程以及tabulate过程。它们在功能范围和具体的操作方法上存在一定的差别,下面我们大概了解一下它们的异同点。 相同点:他

第五章 多个率比较的SAS编程实现

两个率或多个率的比较,我们非常熟悉的就是采用卡方检验的方法。除此之外,在特定条件下还可根据正态近似的原则采用u检验的方法进行分析。在SAS中,卡方检验的功能包含在freq过程之中,下面我们先熟悉一下freq过程的基本内容和功能。 一、freq过程的语句和功能 freq过程包含在SAS的BASE模块中,它可以执行描述性统计以及假设检验的功能,能产生从1维到n维的表格,即频数表以及列联表。对于单因

第一章 SAS编程操作预备知识

一、SAS系统简介 SAS是一个庞大的系统,它目前的版本可以在多种操作系统中运行。当前在国内被广泛使用的最新版本是8.2版,功能很强大,我深有体会。 据说9.0版已在国外面世,已经有一些有关它的抢先报道在网络上广为流传,说它如何如何美妙,令人不禁充满期待。 SAS8.2的完整版本包含以下数十个模块。 BASE,GRAPH,ETS,FSP,AF,OR,IML,SHARE,QC,STAT,IN

二、计数资料的统计描述

二、计数资料的统计描述 计数资料的描述性统计量,最为主要的是相对数,即率、构成比、相对比等。统计图形表述方式有圆图和百分条图等。下面我们将例2-1的数据转换为计数资料的形式,用以展示计数资料统计描述的SAS编程实现方法。 例2-3  我们假设甘油三酯水平高于1.5者为异常,将160名女子划分为正常和异常两组。分别计算正常组和异常组占总人数的构成比,并用圆图和百分条图展示其构成情况。

第三章 两组资料均数比较的SAS编程实现

一、均数差别比较的t检验 1. 样本均数和总体均数比较的t检验 样本均数和总体均数差别的比较可以直接进行比较,也可以将其看成每个测量值和总体均数差值的均数和0的比较,均为单变量分析的形式,可用前面介绍的三个执行描述性统计分析功能的过程来完成。这里我们用univariate过程和means过程分别演示这种分析的SAS编程实现方法,summary过程的操作方法各位可以自己试着练习一下。 以Mea