重复测量资料的统计分析方法

2013-11-30 MedSci MedSci原创

" valign="top"> <p style=" ">m0+b2+b3+b5 <td style=" " valign="top"> 两组差异为 <td style=" " valign="top">

在临床医学研究中,一些干预研究和纵向研究都经常会涉及到同一研究对象的多次观察,而同一个对象的多次观察的记录资料称为重复测量的资料。由于同一对象不同时间点的观察往往存在相关的问题,也就是存在不独立性的问题,而大多数的医学统计方法都要求资料是独立,所以这些资料的统计分析需要比较特殊的统计方法进行分析。本节将先举例介绍常见的重复测量资料,并介绍相应的重复测量资料的统计分析方法。

一、单个样本的重复测量资料

例1  为了考察某药物减肥的作用,现考察5个身高为160cm、服用该药的女性肥胖者,疗程为3个月,这5名女性肥胖者在服用该药前后的体重测量值(kg)如下:

肥胖者编号

1

2

3

4

5

服药前体重Y0i

50

52

49

55

46

服药后体重Y1i

48

51

49

52

45

这是一组观察对象的资料,每个观察对象有两个时间点的测量资料,因此这是最简单的重复观察测量资料(也可以认为配对设计的资料)。

由于各个观察对象在服药前的体重不全相同,所以其体重含有服药前的体重个体变异成分,而在服药后,各个观察对象的体重下降幅度也不全相同,故存在体重下降幅度的个体变异成分,因此观察对象在服药后的体重中不仅含有体重下降幅度的个体变异成分,而且还含有服药前的体重个体变异成分,故服药前后的体重资料不独立。对于这种不独立资料的统计分析一般采用变异成分的分解或消除某一个体变异成分的方法进行统计处理的。如配对t检验和符号秩检验就是采用服药前后资料相减作为统计分析数据,因而消除了服药前体重的个体变异,使进入统计分析的资料仅含有体重下降幅度的个体变异,但这种消除某种不独立的变异成分的统计方法无法对比较复杂的重复测量资料进行统计分析。因而本节将借助统计软件Stata,介绍应用混合模型(Mixed Model)对重复测量资料进行统计分析。

设观察对象体重的总体均数为m0,服药后体重总体均数为m1,即服药前后的体重改变量的总体均数为b=m1-m0。若b=0说明服药前后的体重平均变化为0,即无疗效;若b<0,说明服药后的人群平均体重低于服药前的平均体重,即该药物减肥是有效的;若b>0,说明服药后的平均体重高于服药前的平均体重,即该药对减肥有不利的作用。针对本例服药前后的体重总体均数的变化关系,引入自变量t,建立下列服药前后的体重总体均数表达式(即混合模型的确定性部分表达式)。

(12-1)

t=0时,m为服药前的体重总体均数m0;t=1时,m为服药后的体重总体均数m1。应用混合模型可以对本例资料进行统计分析,其中b和m0的参数估计一般采用限制的最大似然法,然而计算相当复杂,故我们将借助Stata软件对上述资料用混合模型进行统计分析,相应的Stata软件的数据格式如下。

t

y

no

0

50

1

0

52

2

0

49

3

0

55

4

0

46

5

1

48

1

1

51

2

1

49

3

1

52

4

1

45

5

其中y为体重测量值,t为服药时间的自变量,no为观察对象的编号,相应的Stata操作命令如下:

Random-effectsGLS regression Numberof obs      =        10

Groupvariable (i) : no      Number of groups   =         5

R-sq:  within = 0.6533      Obs per group: min =         2

       between =      .    avg=       2.0

       overall = 0.0612    max=         2

Randomeffects u_i ~ GaussianWald chi2(1)       =      7.54

corr(u_i,X)       = 0 (assumed)       Prob > chi2        =   0.0060

------------------------------------------------------------------------------

  y |      Coef.  Std. Err.      z    P>|z|    [95% Conf. Interval]

-------------+----------------------------------------------------------------

  t |       -1.4   .509902    -2.75   0.006   -2.399389   -.4006105

       _cons |       50.4  1.371131    36.76   0.000    47.71263    53.08737

-------------+----------------------------------------------------------------

     sigma_u | 2.9580399

     sigma_e | .80622577

         rho | .93085106   (fraction of variancedue to u_i)

------------------------------------------------------------------------------

b估计值为-1.4,m0估计值为50.4,而m1的估计值=50.4-1.4=49。

H0:b=0  即无减肥疗效

H1:b¹0   即服药前后的人群平均体重不同

a=0.05

相应的P值=0.006,因此服药前后平均体重的差异有统计学意义,故可以认为该药物有减肥疗效。

例2  为了考察某药物在疗程为6个月中的持续减肥作用,现考察5个服用该药的女性肥胖者并且身高为162cm的,这5名女性肥胖者在服用该药前、服药3个月和服药6个月的体重测量值(kg)如下:

1

2

3

4

5

肥胖者编号

服药前

3个月

6个月

48

46

42

53

51

47

52

52

48

52

51

48

53

52

49

这是一组观察对象的多个测量时间点的重复观察测量资料,因此同一对象的不同观察时间点的观察资料是相关的。(也可以视为配伍区组设计的观察资料,用随机区组设计的方差分析或Friedman秩检验的统计方法检验该药物的减肥作用),因此可用混合模型进行统计分析。

设观察对象在服药前的体重总体均数为m0、服药3个月时的体重总体均数m0+b1,服药6个月时的体重总体均数为m0+b2,即:b1为服药3个月时的体重平均改变量,b2为服药6个月时的体重平均改变量。针对本例服药前后的体重总体均数的变化关系,引入自变量t1和t2,建立下列服药前后的体重总体均数表达式

(12-2)

若t1=t2=0时,m为服药前的体重总体均数m0;t1=1,t2=0时,m为服药3个月时的体重总体均数m0+b1。若b1<0,说明服药3个月时的服药人群平均体重低于服药前的平均体重,即该减肥药有效,反之无疗效;t1=0,t2=1时,m为服药6个月时的体重总体均数m0+b2,而b2<0和b2>0同样反映该减肥药有效或无效。若b2

no

y

t1

t2

1

48

0 0

2

53

0 0

3

52

0 0

4

52

0 0

5

53

0 0

1

46

1

0

2

51

1

0

3

52

1

0

4

51

1

0

5

52

1

0

1

42

0

1

2

47

0

1

3

48

0

1

4

48

0

1

5

49

0

1

其中t1和t2为服药时间的自变量,其他与例12-1相同,相应的Stata操作命令如下:

Stata 命令为 xtreg  y  t1  t2 ,i(no)

相应输出结果如下:

Random-effectsGLS regression Numberof obs      =        15

Groupvariable (i) : no      Number of groups   =         5

R-sq:  within = 0.9551      Obs per group: min =         3

       between =      .    avg=       3.0

       overall = 0.4602    max=         3

Randomeffects u_i ~ GaussianWald chi2(2)       =    170.18

corr(u_i,X)       = 0 (assumed)       Prob > chi2        =   0.0000

------------------------------------------------------------------------------

  y |      Coef.  Std. Err.      z    P>|z|    [95% Conf. Interval]

-------------+----------------------------------------------------------------

t1 |       -1.2  .3829708    -3.13   0.002   -1.950609   -.4493909

t2 |       -4.8  .3829708   -12.53   0.000   -5.550609   -4.049391

       _cons |       51.6  1.104536    46.72   0.000    49.43515    53.76485

-------------+----------------------------------------------------------------

     sigma_u |  2.394438

     sigma_e | .60553007

         rho | .93989071   (fraction of variancedue to u_i)

------------------------------------------------------------------------------

3个月时的体重与6个月时的体重比较的Stata命令和输出结果如下:

test  t1=t2  (H0:b2=b1)

 ( 1)  t1- t2 = 0.0

  chi2(  1) =  88.36

         Prob > chi2 =    0.0000

b1估计值为-1.2(kg), b2估计值为-4.8(kg),服药前体重总体均数m0的估计值为51.6(kg);服药3个月时的体重总体均数m0+b1的估计值为51.6-1.2=50.4(kg);服药6个月时的体重总体均数m0+b2的估计值为51.6-4.8=46.8(kg)。

H0:b1=0  即服药3个月时减肥无效

H1:b¹0   即服药3个月时与服药前的人群平均体重不同

a=0.05

相应的P值=0.002,因此差异有统计学意义,故可以认为该药物在服药3个月时有减肥疗效。

H0:b2=0  即服药6个月时减肥无效

H1:b2¹0   即服药6个月时与服药前的人群平均体重不同

a=0.05

相应的P值<0.001,因此差异有统计学意义,故可以认为该药物在服药6个月时有减肥疗效。

H0:b2=b1  即从服药3个月至6个月时,没有继续减肥

H1:b2¹b1   即服药6个月时与服药3个月的人群平均体重不同

a=0.05

相应的P值<0.001,因此差异有统计学意义,故可以认为服药3个月至6个月期间,继续有减肥疗效。

多个样本多个时间点重复观察资料

例12-3  为了比较A药和B药在疗程为6个月中的持续减肥的疗效,现有10个身高为160cm的女性肥胖者志愿参加这项研究。随机分成2组,每组各5人。分别考察这2组肥胖者在服药前、3个月和服药6个月的体重变化。这2组肥胖者在服用该药前、服药3个月和的体重测量值(kg)如下:

A药组1号

A药组2号

A药组3号

A药组4号

A药组5号

B药组1号

B药组2号

B药组3号

B药组4号

B药组5号

组别和肥胖者编号

服药前

3个月

6个月

52

49

42

51

50

46

50

49

41

51

49

44

49

47

40

51

54

53

49

47

46

50

47

44

49

48

41

52

50

48

 

这是两组观察对象的多个测量时间点的重复观察测量资料,同样对于同一对象的不同观察时间点的观察资料是相关的,但由于需要比较两个药的减肥疗效,所以两因素方差分析,随机区组设计的方差分析或Friedman秩检验的统计方法都不适用于本例的数据统计分析,但仍可用混合模型对本例资料进行统计分析。

由于这是两组观察对象的多个测量时间点的重复观察测量资料,所以仍可以借用上例的总体均数表达式(12-2)分别描述每一组体重变化规律,因此可以得到下列总体均数表达式:

A组

(12-3)

B组

(12-4)

由于应用混合模型进行统计分析需要建立两组统一的总体均数表达式,因此引入统一参数b3=m10-m0,b4=b11-b1,b5=b12-b2,代入(12-4)式,得到B组总体均数表达式

B组

(12-5)

引入分组变量g=0表示A组,g=1表示B组,因此两组的总体均数表达式均可表示为

(12-6)

用g=0,1;t1=0,1和t2=0,1代入(12-6)式,得到相应两组各个时间点的总体均数:

A组(g=0)

m0

m0+b1

m0+b2

B组(g=1)

m0+b3

m0+b1+b3+b4

m0+b2+b3+b5

两组差异为

b3

b3+b4

b3+b5

组别

服药前(t1=0,t2=0)

服药3个月(t1=1,t2=0)

服药6个月(t1=0,t2=1)

若b4和b5不全为0,则称两种药物与服药时间对疗效有交互作用。两组在3个时间点的总体均数差异分别为b3,b3+b4和b3+b5,因此只需检验H0:b3=0、H0:b3+b4=0和 H0:b3+b5=0就可以推断两组总体均数差异。反之若b4和b5全为0,则称两种药物与服药时间对疗效无交互作用,并且两组各个时间点的总体均数差异均为b3,因此只需检验H0:b3=0就可以推断两组的总体均数差异。我们同样借助Stata软件对上述资料用混合模型进行统计分析,相应的Stata软件的数据格式如下。

y

g

no

t1

t2

 

续左侧底部数据

52

0

1

0

0

 

51

1

6

0

0

49

0

1

1

0

 

54

1

6

1

0

42

0

1

0

1

 

53

1

6

0

1

51

0

2

0

0

 

49

1

7

0

0

50

0

2

1

0

 

47

1

7

1

0

46

0

2

0

1

 

46

1

7

0

1

50

0

3

0

0

 

50

1

8

0

0

49

0

3

1

0

 

47

1

8

1

0

41

0

3

0

1

 

44

1

8

0

1

51

0

4

0

0

 

49

1

9

0

0

49

0

4

1

0

 

48

1

9

1

0

44

0

4

0

1

 

41

1

9

0

1

49

0

5

0

0

 

52

1

10

0

0

47

0

5

1

0

 

50

1

10

1

0

40

0

5

0

1

 

48

1

10

0

1

Stata操作命令如下:

gen gt1=g*t1 产生交互作用项变量g´t1

gen gt2=g*t2 产生交互作用项变量g´t2

xtreg  y t1  t2  g gt1  gt2,i(no)

Random-effectsGLS regression Numberof obs      =        30

Groupvariable (i) : no      Number of groups   =        10

R-sq:  within = 0.8288      Obs per group: min =         3

       between = 0.0973    avg=       3.0

       overall = 0.5927    max=         3

Randomeffects u_i ~ GaussianWald chi2(5)       =     78.32

corr(u_i,X)       = 0 (assumed)       Prob > chi2        =   0.0000

------------------------------------------------------------------------------

  y |      Coef.  Std. Err.      z    P>|z|    [95% Conf. Interval]

-------------+----------------------------------------------------------------

t1 |       -1.8  1.053565    -1.71   0.088     -3.86495   .2649502

t2 |         -8  1.053565    -7.59   0.000   -10.06495    -5.93505

  g |        -.4  1.612452    -0.25   0.804   -3.560347    2.760347

         gt1 |         .8  1.489966     0.54   0.591   -2.120281    3.720281

         gt2 |        4.2  1.489966     2.82   0.005    1.279719    7.120281

       _cons |       50.6  1.140175    44.38   0.000     48.3653     52.8347

-------------+----------------------------------------------------------------

     sigma_u | 1.9300259

     sigma_e | 1.6658331

         rho | .57307692   (fraction of variancedue to u_i)

------------------------------------------------------------------------------

由此得到(12-6)式中的m0估计值为50.6,b1的估计值为-1.8,b2的估计值为-8,b3的估计值为-0.4,b4的估计值为0.8和4.2。两组各个时间的总体均数估计如下

 

A组(g=0)

B组(g=1)

B组-A组

两组差异检验

 

总体

均数

总体均数

估计值

 

总体

均数

总体均数

估计值

 

总体

均数

总体均数

估计值

 

P值

服药前

(t1=0,t2=0)

m0

50.6

m0+b3

50.2

b3

-0.4

0.804

服药3个月时

(t1=1,t2=0)

m0+b1

48.8

m0+b1+b3+b4

49.2

b3+b4

0.4

0.804

服药6个月时

(t1=0,t2=1)

m0+b2

42.6

m0+b2+b3+b5

46.4

b3+b5

3.8

0.018













注:表中均数估计值是参数估计值和总体均数参数表达式计算所得。如:服药3个月时A组的总体均数估计值=50.6-1.8=48.8。

3个时间点的两组平均体重比较的Stata统计检验命令和输出结果如下

设a=0.05

服药前两组平均体重比较就是检验H0:b3=0,相应的P值=0.804>a,差别无统计学意义,故没有充足证据推断两组在服药前的体重总体均数不等。

服药3个月时的两组平均体重比较的Stata命令和输出结果如下:

test  g+gt1=0  (H0:b3+b4=0 即服药3个月时的两组体重总体均数相等)

( 1)  g + gt1 =0.0

 chi2(  1) =    0.06

         Prob >chi2 =    0.8041

相应的P值=0.8041>a,差异无统计学意义,故无证据显示两组总体均数不等。

服药6个月时的两组平均体重比较的Stata命令和输出结果如下:

test  g+gt2=0  (H0:b3+b5=0)

( 1)  g + gt2 =0.0

 chi2(  1) =    5.55

         Prob > chi2 =    0.0184

相应的P值=0.0184

版权声明:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (2)
#插入话题
  1. [GetPortalCommentsPageByObjectIdResponse(id=13211, encodeId=cbf713211e2, content=非常好谢谢, beContent=null, objectType=article, channel=null, level=null, likeNumber=112, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=f605106987, createdName=keoufang, createdTime=Thu Dec 18 20:23:00 CST 2014, time=2014-12-18, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=12227, encodeId=9a931222edf, content=用SPSS能做吗?, beContent=null, objectType=article, channel=null, level=null, likeNumber=94, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=09e466554, createdName=guodaima11, createdTime=Thu Oct 16 20:44:00 CST 2014, time=2014-10-16, status=1, ipAttribution=)]
    2014-12-18 keoufang

    非常好谢谢

    0

  2. [GetPortalCommentsPageByObjectIdResponse(id=13211, encodeId=cbf713211e2, content=非常好谢谢, beContent=null, objectType=article, channel=null, level=null, likeNumber=112, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=f605106987, createdName=keoufang, createdTime=Thu Dec 18 20:23:00 CST 2014, time=2014-12-18, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=12227, encodeId=9a931222edf, content=用SPSS能做吗?, beContent=null, objectType=article, channel=null, level=null, likeNumber=94, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=09e466554, createdName=guodaima11, createdTime=Thu Oct 16 20:44:00 CST 2014, time=2014-10-16, status=1, ipAttribution=)]
    2014-10-16 guodaima11

    用SPSS能做吗?

    0

相关资讯

方差分析中深层次统计学问题

1、关于正态性检验的问题     正态性检验是统计学分析中非常基础的一个问题,但也很关键,它牵扯到你应该使用什么样的方法,数据是否满足正态性决定了你是否应采用参数方法还是非参数方法。所谓正态性检验,也就是看你的数据是不是满足正态分布,也就是说,如果把你的数据做个频数图,是不是看起来像个钟形。    正态性检验最简单的就是直接

美国的精神障碍诊断与统计手册(DSM-5)的变化要点

美国的精神障碍诊断与统计手册(The diagnostic and statistical manual of mental disorders,DSM)自颁布以来,一直都受到国际的广泛关注,影响面很大。2000年DSM-IV-TR颁布后,美国精神医学协会就开始收集、整理并启动DSM-5的修订工作。历时14年,吸收了

Origin制作柱状频率统计图

Origin制作柱状图频率统计图,柱状图,柱形图,直方图,column, histogram Use Origin to make histogram count figure  柱状频率统计图在Origin中有两种方法实现。 ========【方法一】====== 一种是Statics>Descriptive Statics>Statics on Colu

Pearson,Kendall和Spearman三种相关分析方法的比较

     在SPSS软件相关分析中,pearson(皮尔逊), kendall(肯德尔)和spearman(斯伯曼/斯皮尔曼)三种相关分析方法有什么异同      两个连续变量间呈线性相关时,使用Pearson积差相关系数,不满足积差相关分析的适用条件时,使用Spearman秩相关系数来描述. &n

采用SPSS进行Two-way ANOVA统计分析

Two-way ANOVA统计在临床应用中并不多,但偶然能遇到。在老版本的SPSS中容易处理,但是在最新的SPSS中,如SPSS 19.0后,找不到Two-way ANOVA选项。到底如何处理呢?有时投稿时,审稿人也会要求进行Two-way ANOVA,如:“Since treatment and time course was investigated, two way ANOVA follo

李卫:以PLATO研究为例看如何从统计学角度解读大型临床研究

对于一个统计学家而言,如何判断一个临床研究的优劣?首先,要看该项研究的设计是否良好。研究项目的设计对于整个研究很关键,它如同一座建筑的地基,设计 不好,就相当于地基有问题,最后建成房子的坚固性一定让人质疑。就研究而言,设计存在问题,后期的优效与否就是无稽之谈,统计学家也不会去关心研究的最终 结果。其次,看研究项目的实施过程,设计方案很好,但是在具体实施过程中,如果研究者没有严格按照设计方案来实