SPSS教程第十课:对数线性模型

2012-04-12 生物谷 生物谷

对数线性模型是用于离散型数据或整理成列联表格式的计数资料的统计分析工具。在对数线性模型中,所有用作的分类的因素均为独立变量,列联表各单元中的例数为应变量。对于列联表资料,通常作χ2 检验,但χ2 检验无法系统地评价变量间的联系,也无法估计变量间相互作用的大小,而对数线性模型是处理这些问题的最佳方法。   第一节 General过程   9.1.1 主要功能 &nbsp

对数线性模型是用于离散型数据或整理成列联表格式的计数资料的统计分析工具。在对数线性模型中,所有用作的分类的因素均为独立变量,列联表各单元中的例数为应变量。对于列联表资料,通常作χ2 检验,但χ2 检验无法系统地评价变量间的联系,也无法估计变量间相互作用的大小,而对数线性模型是处理这些问题的最佳方法。

 

第一节 General过程

 

9.1.1 主要功能

       调用该过程可对一个或多个二维列联表资料进行非层次对数线性分析。它只能拟合全饱和模型,即分类变量各自效应及其相互间效应均包含在对数线性模型中。

      

9.1.2 实例操作

    [9-1]在住院病人中,研究其受教育程度与对保健服务满意程度的关系,资料整理成列联表后如下所示。

 

对保健服务满意程度

(%)

受教育程度

满意

不满意

65 (91.5)

6 (8.5)

272 (93.8)

18 (6.2)

41 (97.6)

1 (2.4)

 

       按一般情形作χ2检验,结果显示不同受教育程度的住院病人其对保健服务满意程度无差别。但从百分比分析中可见,随受教育程度的提高,满意程度有下降的趋势;且我们还想了解受教育程度与满意程度有无交互作用和交互作用的大小。对此,必须采用对数线性模型加以分析。

 

9.1.2.1  数据准备

    激活数据管理窗口,定义变量名:实际观察频数的变量名为freq,受教育程度和满意程度作为行、列分类变量(即独立变量),变量名分别为educ、care。输入原始数据,结果如图9.1所示。如同第四章Crosstab过程中所述,为使列联表的频数有效,应选Data菜单的Weight Cases...项,弹出Weight Cases对话框(图9.2),激活Weight cases by项,从变量列表中选freq点击Ø钮使之进入Frequency Variable框,点击OK钮即可。

 

9.1  原始数据的输入

9.2  频数的加权定义

 

9.1.2.2  统计分析

    激活Statistics菜单选Loglinear中的General...项,弹出General Loglinear Analysis对话框(图9.3)。从对话框左侧的变量列表中选care,点击Ø钮使之进入Factor(s)框,点击Define Range...钮,弹出General Loglinear Analysis: Define Range对话框,定义分类变量care的范围,本例为12,故可在Minimum处键入1,在Maximum处键入2,点击Continue钮返回General Loglinear Analysis对话框。同法将变量educ选入Factor(s)框,并定义其范围为13。本例要求计算各分类变量主效应和交互作用的参数估计,故点击Contrast...钮,弹出General Loglinear Analysis:Contrasts对话框,选择Display parameter estimates项,点击Continue钮返回General Loglinear Analysis对话框,最后点击OK钮即完成分析。

 

9.3  非层次对数线性模型分析对话框

 

9.1.2.3  结果解释

       在结果输出窗口中将看到如下统计数据:

       首先显示系统对403例资料进行分析,共有二个分类变量:CARE2水平,EDUC3水平。分析的效应有三类:满意程度(CARE)、教育程度(EDUC)和两者的交互作用(CARE BY EDUC)。系统经2次叠代后即达到相邻二次估计之差不大于规定的0.001

 

DATA   Information

          6 unweighted cases accepted.

          0 cases rejected because of out-of-range factor values.

          0 cases rejected because of missing data.

        403 weighted cases will be used in the analysis.

 

FACTOR Information

   Factor       Level  Label

   CARE        2

   EDUC        3

 

DESIGN Information

   1 Design/Model will be processed.

Correspondence Between Effects and Columns of Design/Model 1

 

   Starting    Ending

   Column   Column   Effect Name

      1        1       CARE

      2        3       EDUC

      4        5       CARE BY EDUC

Note: for saturated models   .500 has been added to all observed cells.

 This value may be changed by using the CRITERIA = DELTA subcommand.

 

*** ML converged at iteration 2.

Maximum difference between successive iterations = .00000

 

 

       由于本例对Model(模型)未作定义,故系统采用默认的全饱和模型,因而期望例数(EXP.count)与实际例数(OBS. count)相同,进而残差(Residual)、标准化残差(Std.Resid)和校正残差(Adj.Resid)均为0

 

Observed, Expected Frequencies and Residuals

Factor  Code  OBS. count & PCT.  EXP. count & PCT.  Residual  Std. Resid.  Adj. Resid.

CARE    1

 EDUC   1    65.50 (16.13)        65.50 (16.13)       .0000     .0000     .0000

 EDUC   2   272.50 (67.12)       272.50 (67.12)       .0000     .0000     .0000

 EDUC   3    41.50 (10.22)        41.50 (10.22)       .0000     .0000     .0000

CARE    2

 EDUC   1     6.50 ( 1.60)         6.50 ( 1.60)        .0000     .0000     .0000

 EDUC   2    18.50 ( 4.56)        18.50 ( 4.56)        .0000     .0000     .0000

 EDUC   3     1.50 ( .37)          1.50 ( .37)         .0000     .0000     .0000

 

 

       最后输出参数估计的结果。为了唯一地估计参数,系统强行限定同一分类变量的各水平参数之和为0,故根据下列结果可推得各参数为:

       λ满意 = 1.386724028

       λ不满意 = -1.386724028

       λ高教育程度 = -0.091477207

       λ中教育程度 = 1.144301306

       λ低教育程度 = -1.052824099

       λ满意.高教育程度 = -0.231600045

       λ满意.中高教育程度 = -0.041790087

       λ满意.低教育程度 = 0.273390132

       λ不满意.高教育程度 = 0.231600045

       λ不满意.中教育程度 = 0.041790087

       λ不满意.低教育程度 = -0.273390132

       λ值为正,表示正效应;反之为负效应;零为无效应。分析提供的信息是:①对保健服务的满意程度高于不满意程度;②中等教育程度者的满意程度>高等教育程度者的满意程度>低等教育程度者的满意程度;③通过受教育程度与对保健服务满意程度的交互作用研究,结果表明高、中等教育未能增加人们对现有保健服务状况的满意程度。

 

Estimates for Parameters

 CARE

  Parameter     Coeff.    Std. Err.    Z-Value   Lower 95 CI   Upper 95 CI

      1     1.386724028  .15965     8.68589     1.07381       1.69964

 EDUC

  Parameter     Coeff.    Std. Err.     Z-Value  Lower 95 CI   Upper 95 CI

      2     -.091477207   .19895     -.45980    -.48142        .29847

      3     1.144301306  .17407     6.57393     .80313       1.48547

 CARE BY EDUC

  Parameter     Coeff.    Std. Err.     Z-Value  Lower 95 CI   Upper 95 CI

      4    -.231600045    .19895    -1.16410     -.62154       .15834

      5    -.041790087    .17407     -.24008     -.38296       .29938

 

 

 

第二节 Hierarchical过程

 

9.2.1 主要功能

       调用该过程可对多维列联表资料进行分层对数线性分析。所谓分层即并可根据用户指定的条件,对某一或某些主效应与交互作用进行剔除,从而形成包含特定层次阶项的各种模型。

 

9.2.2 实例操作

    [例9-2] 为了研究Colles骨折在不同性别中的年龄分布情况,以说明不同性别者骨折的年龄差异及其年度变化,某地收集了1978--1981年的骨折资料,数据见下表。请作对数线性模型的分析。

 

年龄

1978

1979

1980

1981

0—19

20--59

60--89

55

165

50

17

260

94

43

101

29

9

233

115

89

104

56

20

202

95

140

137

54

41

278

153

 

9.2.2.1  数据准备

    激活数据管理窗口,定义变量名:实际观察频数的变量名为freq,年份、性别和年龄为分类变量,变量名分别为year、sex和age。输入原始数据,其中年份1978至1981依次为1、2、3、4,性别男为1、女为2,年龄分组依次为1、2、3。之后选Data菜单的Weight Cases...项,在Weight Cases对话框中激活Weight cases by项,从变量列表中选freq点击Ø钮使之进入Frequency Variable框,点击OK钮完成对频数的权重定义。

 

9.2.2.2  统计分析

    激活Statistics菜单选Loglinear中的Hierarchical...项,弹出Hierarchical Loglinear Analysis对话框(图9.4)。从对话框左侧的变量列表中选age,点击Ø钮使之进入Factor(s)框,点击Define Range...钮,弹出Hierarchical Loglinear Analysis: Define Range对话框,定义分类变量age的范围,在Minimum处键入1,在Maximum处键入9,点击Continue钮返回Hierarchical Loglinear Analysis对话框。同法将变量sex选入Factor(s)框,定义其范围为12

版权声明:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (0)
#插入话题

相关资讯

SPSS教程第七课:方差分析

方差分析是R.A.Fister发明的,用于两个及两个以上样本均数差别的显著性检验。由于各种因素的影响,研究所得的数据呈现波动状,造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。方差分析的基本思想是:通过分析研究中不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。     方差分析主要用于:1、均数

SPSS教程第八课:相关分析

任何事物的存在都不是孤立的,而是相互联系、相互制约的。在医学领域中,身高与体重、体温与脉搏、年龄与血压等都存在一定的联系。说明客观事物相互间关系的密切程度并用适当的统计指标表示出来,这个过程就是相关分析。     值得注意,事物之间有相关,不一定是因果关系,也可能仅是伴随关系。但如果事物之间有因果关系,则两者必然相关。     SPS

SPSS教程第九课:回归分析

 回归分析是处理两个及两个以上变量间线性依存关系的统计方法。在医学领域中,此类问题很普遍,如人头发中某种金属元素的含量与血液中该元素的含量有关系,人的体表面积与身高、体重有关系;等等。回归分析就是用于说明这种依存变化的数学关系。   第一节 Linear过程  8.1.1 主要功能     调用此过程可完成二元或多元的线性回归分析

第四课:SPSS文本文件的编辑

上一章介绍了SPSS数据管理窗口的使用方法。在第一章中,我们还提到过SPSS的其他窗口,如结果输出窗口(图3.1)和命令编辑窗口(图3.2),这两个窗口是系统用于接收或输出文本的。用户经常在实际工作中需要对之进行必要的编辑。SPSS的文本编辑是借助于主窗口的File、Edit等菜单完成的,本章介绍SPSS的文本编辑方法。       第一节 文本文件

第五课:摘要性分析

 摘要性分析是对原始数据进行描述性分析,这是统计工作的出发点。统计学的一系列基本描述指标,不仅让人了解资料的特征,而且可启发人们对之作进一步的深入分析。通过调用摘要性分析的诸个过程,可完成许多统计学指标,对于计量资料,可完成均数、标准差、标准误等指标的计算;对于计数和一些等级资料,可完成构成比、率等指标的计算和χ2 检验。本章将介绍其操作方法。  第一节 Frequenci

SPSS教程第六课:平均数的比较

 在正态或近似正态分布的计量资料中(如临床常见的体温、血压、脉搏、身高、体重等测量值,几乎均为此类资料),经常在使用前一章计量资料描述过程分析后,还要进行组与组之间平均水平的比较。本章将分四节分别介绍这一统计方法:即常用的t检验和单因素方差分析。   第一节 Means过程   5.1.1 主要功能     &nbs