阶梯整群随机试验的统计分析方法介绍

2024-03-16 董昱, 黄闪闪, 赵梦娇, 张侨, 曾婧纯, 陆丽明 中国循证医学杂志 发表于威斯康星

1 阶梯整群随机试验概述

1   阶梯整群随机试验概述

阶梯整群随机试验(stepped wedge cluster randomised trials,SW-CRT)是一种特殊类型的整群随机试验(cluster randomized trials,CRT),其原理类似于“交叉设计”。试验对象在干预开始前会被分为若干群组,不同的群组在不同的时间点接受从对照状态切换至干预状态的单向交叉处理[1]。在初始阶段(基线期)没有任何群组接受干预,随后每隔一段时间或步骤,一个群(或一组群)会被随机抽取接受干预,同一时间点可能有一个或多个群组开始接受干预,但这些群组开始接受干预的时间是随机的,这一过程会依次进行,直至所有的群组都接受了干预[2,3](图1)。SW-CRT依据不同的分类标准分为了不同的试验类型,Hemming等[1]依据在不同的步骤或阶段中集群数量及数据收集的差异,将其分为完整阶梯设计和不完整阶梯设计。而Copas等[4]依据不同的研究对象,将试验分为固定队列阶梯设计(closed cohort design)、开放队列阶梯设计(open cohort design)和连续入组短期暴露阶梯设计(continuous recruitment with short exposure)。

图1 标准阶梯整群随机试验示意图

SW-CRT主要用来评估在日常实施过程中干预措施的有效性,特别是对于那些在更可控的研究环境中被证明有效的干预措施,或缺乏明确利大于弊的干预措施的有效性证据[5]。阶梯整群随机试验的应用最早出现于20世纪80年代开展的一项冈比亚肝炎的干预研究[6]。流行病学调查表明,在发展中国家SW-CRT常用于针对HIV的干预措施的评估,其中,最常见的干预措施有疫苗接种、筛查、教育计划出台等[7]。近年来这一试验方式的逐渐推广,其使用领域也多种多样,涉及癌症、艾滋病、医疗保健、卫生政策制定等方面[57]。就采取SW-CRT试验方式的动机而言,多数研究都考虑到了试验协调的灵活性、人力财力资源的限制、人群对于有利的干预方式的可接受性、伦理、干预措施在试验多个集群中实施的难易程度、受试者失望效应(受试者因未被分配到干预组而产生的脱落)等[58]。

随着对SW-CRT试验数量的增多,Hemming等学者使用Delphi调查和共识会议制定方法,制定了专门针对阶梯整群随机试验的报告条目规范(reporting of stepped wedge cluster randomised trials: extension of the CONSORT 2010 statement with explanation and elaboration)[9],它作为临床试验报告规范(consolidated standards of reporting trials,CONSORT)声明的扩展版,旨在为平行随机对照试验提供统一标准。目前,国内仅在急性冠脉综合征患者[10]和自闭症患儿[11]中开展了阶梯整群随机试验,且仍缺乏对其统计分析方法和样本量计算的介绍与解读。本文将阐述SW-CRT的主要应用、辨析与传统随机对照试验的区别,并着重从数据收集与分析方法、样本量估算等统计学层面介绍SW-CRT。

2   SW-CRT与传统随机对照试验

顾名思义,SW-CRT的名称来源于图1中明显的阶梯式楔形,它与传统的(平行)整群随机试验和随机对照试验存在差异。传统的(平行)整群随机试验是对群组随机分组后,群组一直留在干预组或对照组直至研究结束。而SW-CRT扩展了试验设计,每个集群均能提供观察前后的数据,且会在不同的时间点从对照组切换到干预组[2],是一种交叉设计的方式。与传统的随机对照试验不同,SW-CRT是以群组而非个体为研究对象,每个群组都会依次接受干预。需要特别注意的是,SW-CRT与以上两种试验方式都存在样本量估算与统计学分析方法上的差异,表1对其进行了总结[12-14]。

表1 阶梯整群随机试验与传统(平行)整群随机试验、随机对照试验的异同

表1可见,SW-CRT在临床试验的实际应用中具有如下优势:① 不需要专门设置对照组,减少了人力物力财力的投入;② 每个群组均会接受干预,受试者公平性得到保障,符合医学伦理要求,是真实世界研究中的重要试验方法之一;③ 以自身群体作为对照依据,减少了不同组别群体间个体化的差异对结果造成的影响,结论有更高可靠性。SW-CRT作为一种新兴的定量研究设计方法,可以在真实世界研究中实施应用,作为一种循证实践策略,能够发挥真实世界中干预措施最大限度的效果[15]。

3   样本量估算

3.1   样本量估算方法

SW-CRT是聚类试验的形式之一,故分析和设计需要考虑这种“聚类”属性。SW-CRT的试验过程是“单向转换”的,即由对照状态逐渐向干预状态转化。SW-CRT的受试者暴露于干预的集群比例会随着时间的推移而逐渐增加。这些试验设计的特点决定了SW-CRT的样本量计算方式和参数并非是由个体的随机对照试验简单修改而来的,而更需要将聚类效应、时间效应、重复测量几项关键要素考虑在内。目前对已发表的SW-CRT样本量估算情况的统计分析发现[12]:大多数研究考虑了聚类;但33项研究中只有15项研究考虑了时间效应;大多数研究未明确报告设计类型(队列设计或横断面设计);在队列设计的样本量计算中,只有少数提及了重复测量。SW-CRT样本量计算方法普遍存在质量较低、关键要素缺失的问题,亦没有统一的计算方法。

样本量估算与试验的检验水准和检验效能密切相关,故必须设置合理的检验水准和检验效能[16]。检验水准为控制Ⅰ类错误的能力,用α表示,在多重检验中,为了减少假阳性错误,通常都需要设定检验水准在0.05以下;检验效能反应了根据当前的样本量获得组间有统计学差异的能力,用1-β来表示,实际中通常设置为0.8,当检验效能越高时,则所需的样本量越多。SW-CRT涉及多个群组、多次的随机分配和治疗间隔时间,试验过程相较其他传统随机对照试验更为复杂,且SW-CRT样本量易受集群大小影响,故本文将区分集群规模,从群间相关性、随机化步骤、测量次数等对检验效能的影响来把握样本量估算水平。

3.1.1   假设集群大小相同时的样本量估算及检验效能影响因素

Hussey[3]等针对SW-CRT设计了样本量计算的效能,并研究了不同的群间相关性、随机化步骤数量和治疗延迟对试验效能的影响,发现试验的效能受集群间相关性的影响相对较少,而测量次数的减少则会引起效能的损失。随着SW-CRT在卫生服务评价中的应用越来越广泛,目前已有SW-CRT的试验设计大多数为横断面研究,即在某一时间段随机分配相同数量的集群,在固定的时间段统一收集数据,假设纳入研究的样本在每个时间点都与其他时间点的样本不同。基于此,Hemming等[1]从常规的SW-CRT中延伸了不同类型的试验设计方式—完整阶梯设计(传统的阶梯整群随机设计)和不完整阶梯设计(具有过渡周期的阶梯整群随机设计),且计算出试验效能与群内相关性(intra-cluster correlation,ICC)没有线性关系。对于较小的ICC值,试验效能会随着ICC的增加而降低;但对于较大的ICC值,试验效能会随着ICC值的增加而增加。

在平行的CRT中,常用设计效应(design effect,DE)进行样本量估算,一些学者进而提出了基于DE推导的SW-CRT样本量计算方法。Woertman等[17]假设结果测量是在多个离散时间点从每个集群获得的,并且在每个交叉点测量的参与者数量在不同的时间和集群中是相同的,得出总样本量计算公式为:

nRCT:相应的平行RCT所需要的样本量;B:基线测量次数;J:集群切换交叉到干预状态的交叉点数量;T:每次交叉转换期间的测量次数;CF:校正因子(correction factor)。

其中CF即为DE,受3个主要因素影响:每步的测量次数、基线测量次数和步数,任意一个因素的增加都会引起DE的降低。这一公式与Hussey等的模型相似,仅适用于横断面设计,每次测量都来自不同的个体参与者。然而公式中每次交叉转换的集群数是相同的,每次交叉后的测量次数也不变。

随后Hemming等又依据Hussey等建立的模型,调整了DE进行样本量的估算,从而能够计算集群数量给定时所需的集群大小[18],探索了样本量计算的功效及其相关性。基于以上研究的理论框架和不同的情景设定,整理所得样本量计算公式如下[19]:

① 当阶梯步数(t)、每个观察期每个集群的样本量(m)以及集群内相关性ICC(ρ)已知,求总样本量(N)

N1:两组等样本随机对照试验所需样本量。

② 当阶梯步数(t)、总群数(k)、以及集群内相关性ICC(ρ)已知,求总样本量(N)

为了更好理解在集群大小相同时,样本量的计算方式,本文运用赞比亚一项关于疟疾预防工作的阶梯整群随机试验案例[20],改编其中的数据,对样本量估算进行演示。

示例:为了评估大规模检测和治疗(MTAT)干预对疟疾患病率和卫生机构门诊病例发病率的影响,赞比亚南部省开展了一项社区阶梯整群随机试验。研究共设置了10个干预阶梯,观察时点为11个,以每个卫生设施集水区所在的家庭数量为一个群组,假设干预后干预组疟疾门诊病例发生率较对照组下降10%,ICC(ρ)为0.01,检验水准α=0.05,检验效能(1-β)为0.9,在两个情景下分别计算需要的样本量:

情况一:阶梯步数t=10,ρ=0.01,假设每个群组的平均家庭数量数为50个(m=50),利用PASS软件可计算出初步样本量N1为1 038人,依据DE公式可得,DE=2.69,计算总样本量N约为2 792人;集群数k为总样本除以观察时点数(t+1)和每个群组平均家庭数量(m),即k=N/[(t+1)m],此时,m=50,计算可得集群数k=5。

情况二:当阶梯步数t=10,ρ=0.01,假设每个群组的平均家庭数量数为50个(m=50),集群数量(k)设置为5时,由公式2可计算出,总样本量N约为2 750人。

3.1.2   假设集群大小不同时的样本量估算及检验效能影响因素

在实施横断面研究的SW-CRT中,研究者可能会面临所纳入的集群大小不等的情况,曾有学者对101个SW-CRT的系统评价发现,48%的研究包括大小不同的集群[21],而忽略这一问题所带来的影响尚不清楚。虽然在Hemming[1]构建的模型框架中说明了集群的大小变化不会导致连续结果较为显著的效能损失,但这是基于只检验了一小部分参数得来的结果。基于此,Martin等研究了SW-CRT中不同集群大小的含义[22],发现横断面SW-CRT实际的功效可能较估计值并不稳定,尤其是当集群数量较少或集群大小的可变性很大时。Harrison等[23]推导了不同集群大小的横断面SW-CRT与单个随机试验相比的DE,计算了不同集群大小的横断面SW-CRT的预期相对效率(relative efficiency,RE)和校正样本量计算的CF,提供了与集群大小变化相关的平均功率损失的公式,发现当集群数量较小或集群大小变异系数(coefficient of variation,CV)大于1时平均功效的损失更大。如果集群的数量足够大,并在每一步均随机分配几个集群开始治疗,其随机分配的所有集群的总大小不会有明显的不平等,则可以减少功效的损失[24]。

3.2   样本功效的软件实现方法

相较于SW-CRT复杂的样本量计算,确定样本功效相对容易,也有相应的软件实现方式。而基于前期对于样本量功效的计算理论,选择合适的功效计算软件,调整相应的参数值,能够得出适合自身研究的样本量。表2中总结了几种常见的软件实现方式及其优点与局限性。

表2 样本量功效计算软件特点

3.2.1   Stata软件中的样本量估算

Hemming等在Stata软件中开发了Steppedwedge命令[25],可计算完整和不完整的SW-CRT的可检测差异和功效,包含一个访问命令的对话框。可实现在双侧检验下的连续性变量、二分类变量和率(近似正态)的比较。在Stata软件中,选择结局变量的类型后(连续型数据、二分类型数据、比例型数据),输入检验水准(α)、ICC、每步的阶梯数、集群数量、时间点(不包含基线时期)、两组值的比较(均数与标准差、比例、率),可完成功效的估算。

该命令存在优点与局限性。Steppedwedge命令可在Stata软件中实现,且操作步骤简单易懂,可实现性与可操作性强;与整群试验的样本量计算方法类似,都以ICC作为输入参数。但该命令的假设前提基于集群大小相等,仅可计算固定样本量的功效和可检测差;命令和模型仅限于横断面研究,而不能用于队列研究。

3.2.2   R软件与SAS软件的样本量计算

Baio等[26]采用R软件中分析和模拟训练的函数,在假设横断面设计和封闭队列设计,结局指标为连续和二分类变量的情况下,确定SW-CRT的样本量。结局指标为连续型或二分类变量时,样本的功效与ICC、集群交叉点、时间效应、随机效应的关系也不尽相同。

Voldal等[27]运用R软件开发了一个“swCRTdesign”程序包和一个shiny程序开发的基于web的图形用户界面(graphical user interface,GUI)。该程序使用随机效应模型来解释SW-CRT的数据相关性,来源包括集群、集群内的时间和集群内的治疗。swCRTdesign包含了5个主要功能,其中swDsn(定义SW-CRT设计)和swPwr(计算功效)可实现功效的计算,GUI可以将功效的计算可视化。

Chen等[28]为不同结局变量类型、横断面研究和队列研究、不同集群大小设置下的SW-CRT提供了适用的功效计算软件swdpwr和Shiny应用程序,swdpwr可在SAS和R两个平台下实现,此外,Shiny应用程序还允许不能使用SAS或R的用户直接在线实现功效的估算。该方法无需依赖于Hussey和Hughes[3]中的近似方法,而是采用了其他可提高计算效率的方法,如采用Fortran语言开发,保证了计算效率,还通过外部函数接口与SAS和R连接。此外,“CRTpowerdist”[29]也可以对连续、计数和二分类变量进行功效计算,但侧重于横断面研究设计。

这些程序包应开发使功效的计算、数据的模拟绘制以及汇总SW-CRT数据变的更加容易,且对于不同的设计类型和不同的数据类型都进行了分析说明,不同背景的研究人员都能很好运用。

3.2.3   基于网络的样本量估算与功效计算

Hemming等[30]开发了一项基于网络的样本量估算工具Shiny CRT Calculator,用于集群试验功效的计算,包括平行试验、前后测量的平行设计、两期交叉设计、多期交叉设计和阶梯设计,研究者还可以上传csv格式的文件,文件可以包含缺少的群集周期单元格,从而实现SW-CRT与其他高效试验设计的结合。使SW-CRT的样本量估算方法更加简便,从而提升了试验的完成效率。

4   统计学检验方法

SW-CRT的样本量估算有多种方法,其统计检验方法也多种多样。在SW-CRT中,所采取的统计分析原则为意向性分析(intention-to-treat,ITT),还需要考虑时间因素、重复测量、群组内沾染、治疗效果与时间的交互作用等关键方法学问题。其一,干预采用群组随机分组的顺序依次进行介入,而这项过程是“单向交叉”的,即在试验开展的这段时间,接受干预的集群比例逐渐增加,因此,在对照条件下收集到的观测结果平均来说比在干预条件下收集到的观测结果更早,在进行长期反复的结果测量时,受试者的健康状况可能在研究期间变化,在统计分析时应考虑到时间的混杂影响。其二,SW-CRT针对每个群组都在随时间进行一系列的测量,测量时会针对相同或不同的受试者,在分析时应考虑到数据并非是独立的,而是随着时间的变化而变化。其三,若群组暴露时间过长,部分受试者可能同时暴露对照和干预状态下,此时为了避免群组沾染的产生,应尽早进行结局指标的评估。最后,SW-CRT可以评估许多不同形式的干预,包括一次性的干预和多次干预,分析时还应检验治疗效果随时间的改变。在SW-CRT中,由于每个集群是在随机抽样后产生的,必要时还需要对用于完全校正分析的重要预后因素进行预先指定(以减轻由于抽样变异造成不平衡的可能性),并在适当的地方进行小样本校正。

基于以上影响因素的考虑,目前,SW-CRT的统计分析方法主要包括以横断面研究为主的分析方法和更为复杂的混合模型,涉及了多水平回归模型来考虑聚类和协变量问题(如时间延迟和长期趋势)。多数研究者采用了广义线性混合模型(generalised linear mixed model,GLMM)和广义估计方程(generalized estimating equations,GEE),其余的分析方法包括卡方检验、Manne Whitney U检验、t检验、一般估计方程、Cox比例风险回归模型、McNeMar检验、重复测量方差分析等[513]。表3总结了SW-CRT几种统计分析方法及示例[3,31-37]。

表3 SW-CRT统计分析方法及示例

Moulton等[37]在一项目的为减少艾滋病毒门诊人群中结核病的发病率的SW-CRT中,比较所有研究诊所在任何时间点的结局,在考虑诊所内相关性的情况下合并随时间推移的结果,统计分析采用Cox比例风险回归模型。这一分析方法利于探讨干预方式的长期趋势变化。

广义线性混合模型可以看作广义线性模型(generalized linear model,GLM)和线性混合模型(linear mixing model,LMM)的扩展,它可以将随机效应和固定效应结合起来。通过在集群大小相同和集群大小不同模拟验证,广义线性混合模型[3]、广义估计方程中的时间可作为每个步骤的固定效应被包括在内。对于连续性变量(符合正态分布)的结局数据,采用线性模型,集群具有随机效应,每步具有固定效应;对于二分类结局,则采用聚类随机效应、每步固定效应的logistic回归模型,然而这一方法只适用于横断面研究。Twisk等[31]扩展了4种SW-CRT的线性混合模型分析方法(见表3),建议研究者应结合试验特点选择相应方法:当比较所有干预时间点与对照时点的数据时选择方法1;当干预效果与时间无关时选择方法3;分析结果不受时间影响时选择方法2;比较受试者从对照期转换为对照期、被试者从对照期转换为干预期以及被试者从干预期转换为干预期3种转换期之间的差异选择方法4[32]。

虽然多个学者均推荐使用GLMM和GEE的方法,但对于固定效应和随机效应模型的运用仍存在不同的观点。Fok等[38]提出了随机截距模型,解释了个人或群体水平单位内重复测量的聚类,当多个单位被分配在同一时间“步骤”或干预转换时,时间的随机效应可能包含在内,时间和干预之间的交互项作为固定效应。而Wyman等[39]则认为应该在随机截距模型之外使用时间随机效应。在实际分析过程中,应该依据试验设计的具体方案选择合适的分析方法。

5   总结

SW-CRT是一种实用的研究设计方法,对于涉及利益相关者持不同观点的研究、或想减少因传统试验对声誉带来的不利影响和由于干预措施复杂不能整体实施时,SW-CRT凸显了其在真实世界环境下“利大于弊”的研究特点,避免因资源不足而难以开展临床研究的问题。在SW-CRT中,每个群组均会接受干预,不但可以评估干预效果,还可以评估干预时间的早晚对于干预有效性的影响,相同群组下的对比也减少了个体差异性对结果造成的影响。当研究者面临着有开展大范围试验的需求却又受资金、人力等限制的情况时,SW-CRT无疑是一个最优研究方式,它往往可以满足偏向真实世界环境下所开展的研究,如公共卫生调查、卫生经济学评估等。然而SW-CRT也存在缺点,由于试验集群的复杂性、时间因素与干预措施之间的关联性,在试验设计和分析阶段调整时间效应可能会导致统计损失效能;且它比传统的研究更为复杂,试验对象的群组较多、所涉及的试验周期更长、统计学分析处理也更为复杂,研究者在完成试验设计时需要全面考虑潜在的混杂因素。

本文主要总结了SW-CRT的样本量估算和统计分析方法及其实现方式。检验效能与是样本量估算中的一项重要参数,通过对样本功效的计算进而可得出样本量结果,对样本量估算推荐以Stata软件为主,操作简便灵活,而由于目前样本量估算仍以横断面研究为主,由此计算出的样本量数量往往高于实际所需。SW-CRT受时间、集群的影响较大,故统计分析方法一般以广义线性混合模型为主,可满足受时间影响、非正态数据及集群大小不同的数据分析。

然而,样本量估算及统计分析方法多为横断面研究或集群大小相同、结局为连续型数据时应用的模型,对于队列设计、集群大小不等和二分类结局数据的情况却鲜有涉及,未来还需要更多的精力投入其中。以期为这类试验的开展和提高试验的完整性及规范性提供参考。

声明 所有作者均声明不存在任何利益冲突。

参考文献:

  1. 1. Hemming K, Lilford R, Girling AJ. Stepped-wedge cluster randomised controlled trials: a generic framework including parallel and multiple-level designs. Stat Med, 2015, 34(2): 181-196.
  2. 2. Hemming K, Haines TP, Chilton PJ, et al. The stepped wedge cluster randomised trial: rationale, design, analysis, and reporting. BMJ, 2015, 350: h391.
  3. 3. Hussey MA, Hughes JP. Design and analysis of stepped wedge cluster randomized trials. Contemp Clin Trials, 2007, 28(2): 182-191.
  4. 4. Copas AJ, Lewis JJ, Thompson JA, et al. Designing a stepped wedge trial: three main designs, carry-over effects and randomisation approaches. Trials, 2015, 16: 352.
  5. 5. Mdege ND, Man MS, Taylor Nee Brown CA, et al. Systematic review of stepped wedge cluster randomized trials shows that design is particularly used to evaluate interventions during routine implementation. J Clin Epidemiol, 2011, 64(9): 936-948.
  6. 6. The Gambia Hepatitis Study Group. The Gambia hepatitis intervention study. Cancer Res, 1987, 47(21): 5782-5787.
  7. 7. Brown CA, Lilford RJ. The stepped wedge trial design: a systematic review. BMC Med Res Methodol, 2006, 6: 54.
  8. 8. Beard E, Lewis JJ, Copas A, et al. Stepped wedge randomised controlled trials: systematic review of studies published between 2010 and 2014. Trials, 2015, 16: 353.
  9. 9. Hemming K, Taljaard M, McKenzie JE, et al. Reporting of stepped wedge cluster randomised trials: extension of the CONSORT 2010 statement with explanation and elaboration. BMJ, 2018, 363: k1614.
  10. 10. Wu Y, Li S, Patel A, et al. Effect of a quality of care improvement initiative in patients with acute coronary syndrome in resource-constrained hospitals in China: a randomized clinical trial. JAMA Cardiol, 2019, 4(5): 418-427.
  11. 11. So WC, Cheng CH, Law WW, et al. Robot dramas may improve joint attention of Chinese-speaking low-functioning children with autism: stepped wedge trials. Disabil Rehabil Assist Technol, 2023, 18(2): 195-204.
  12. 12. Martin J, Taljaard M, Girling A, et al. Systematic review finds major deficiencies in sample size methodology and reporting for stepped-wedge cluster randomised trials. BMJ Open, 2016, 6(2): e010166.
  13. 13. Barker D, McElduff P, D'Este C, et al. Stepped wedge cluster randomised trials: a review of the statistical methodology used and available. BMC Med Res Methodol, 2016, 16: 69.
  14. 14. Thompson J, Davey C, Hayes R, et al. Swpermute: permutation tests for stepped-wedge cluster-randomised trials. Stata J, 2019, 19(4): 803-819.
  15. 15. 谢润生, 徐东, 李慧, 等. 医疗卫生领域中实施科学的研究方法. 中国循证医学杂志, 2020, 20(9): 1104-1110.
  16. 16. 冯国双. 临床研究中样本量估算的影响因素. 慢性病学杂志, 2022, 23(5): 687-690.
  17. 17. Woertman W, de Hoop E, Moerbeek M, et al. Stepped wedge designs could reduce the required sample size in cluster randomized trials. J Clin Epidemiol, 2013, 66(7): 752-758.
  18. 18. Hemming K, Taljaard M. Sample size calculations for stepped wedge and cluster randomised trials: a unified approach. J Clin Epidemiol, 2016, 69: 137-146.
  19. 19. 闫翔宇, 苏鹤轩, 张波, 等. 阶梯整群随机对照试验的样本量和功效计算方法. 现代预防医学, 2019, 46(23): 4229-4232,4246.
  20. 20. Larsen DA, Bennett A, Silumbe K, et al. Population-wide malaria testing and treatment with rapid diagnostic tests and artemether-lumefantrine in southern Zambia: a community randomized step-wedge control trial design. Am J Trop Med Hyg, 2015, 92(5): 913-921.
  21. 21. Kristunas C, Morris T, Gray L. Unequal cluster sizes in stepped-wedge cluster randomised trials: a systematic review. BMJ Open, 2017, 7(11): e017151.
  22. 22. Martin JT, Hemming K, Girling A. The impact of varying cluster size in cross-sectional stepped-wedge cluster randomised trials. BMC Med Res Methodol, 2019, 19(1): 123.
  23. 23. Harrison LJ, Chen T, Wang R. Power calculation for cross-sectional stepped wedge cluster randomized trials with variable cluster sizes. Biometrics, 2020, 76(3): 951-962.
  24. 24. Girling AJ. Relative efficiency of unequal cluster sizes in stepped wedge and other trial designs under longitudinal or cross-sectional sampling. Stat Med, 2018, 37(30): 4652-4664.
  25. 25. Hemming K, Girling A. A menu-driven facility for power and detectable-difference calculations in stepped-wedge cluster-randomized trials. Stata J, 2014, 14(2): 363-380.
  26. 26. Baio G, Copas A, Ambler G, et al. Sample size calculation for a stepped wedge trial. Trials, 2015, 16: 354.
  27. 27. Voldal EC, Hakhu NR, Xia F, et al. swCRTdesign: an R package for stepped wedge trial design and analysis. Comput Methods Programs Biomed, 2020, 196: 105514.
  28. 28. Chen J, Zhou X, Li F, et al. swdpwr: a SAS macro and an R package for power calculations in stepped wedge cluster randomized trials. Comput Methods Programs Biomed, 2022, 213: 106522.
  29. 29. Ouyang Y, Xu L, Karim ME, et al. CRTpowerdist: an R package to calculate attained power and construct the power distribution for cross-sectional stepped-wedge and parallel cluster randomized trials. Comput Methods Programs Biomed, 2021, 208: 106255.
  30. 30. Hemming K, Kasza J, Hooper R, et al. A tutorial on sample size calculation for multiple-period cluster randomized parallel, cross-over and stepped-wedge trials using the Shiny CRT Calculator. Int J Epidemiol, 2020, 49(3): 979-995.
  31. 31. Twisk JW, Hoogendijk EO, Zwijsen SA, et al. Different methods to analyze stepped wedge trial designs revealed different aspects of intervention effects. J Clin Epidemiol, 2016, 72: 75-83.
  32. 32. 司华新, 乔晓霞, 金雅茹, 等. 阶梯设计试验研究方法及报告规范. 中国公共卫生, 2022, 38(4): 503-509.
  33. 33. Due TD, Thorsen T, Kousgaard MB, et al. The effectiveness of a semi-tailored facilitator-based intervention to optimise chronic care management in general practice: a stepped-wedge randomised controlled trial. BMC Fam Pract, 2014, 15: 65.
  34. 34. Grunewaldt KH, Løhaugen GC, Austeng D, et al. Working memory training improves cognitive function in VLBW preschoolers. Pediatrics, 2013, 131(3): e747-e754.
  35. 35. Viera AJ, Garrett JM. Preliminary study of a school-based program to improve hypertension awareness in the community. Fam Med. 2008, 40(4): 264-270.
  36. 36. Skrøvseth SO, Årsand E, Godtliebsen F, et al. Data-driven personalized feedback to patients with type 1 diabetes: a randomized trial. Diabetes Technol Ther, 2015, 17(7): 482-489.
  37. 37. Moulton LH, Golub JE, Durovni B, et al. Statistical design of THRio: a phased implementation clinic-randomized study of a tuberculosis preventive therapy intervention. Clin Trials, 2007, 4(2): 190-199.
  38. 38. Fok CC, Henry D, Allen J. Research designs for intervention research with small samples Ⅱ: stepped wedge and interrupted time-series designs. Prev Sci, 2015, 16(7): 967-977.
  39. 39. Wyman PA, Henry D, Knoblauch S, et al. Designs for testing group-based interventions with limited numbers of social units: the dynamic wait-listed and regression point displacement designs. Prev Sci, 2015, 16(7): 956-966.

董昱, 黄闪闪, 赵梦娇, 张侨, 曾婧纯, 陆丽明. 阶梯整群随机试验的统计分析方法介绍. 中国循证医学杂志, 2024, 24(3): 355-363. doi: 10.7507/1672-2531.202307125

版权声明:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (1)
#插入话题
  1. [GetPortalCommentsPageByObjectIdResponse(id=2193530, encodeId=050f2193530e8, content=<a href='/topic/show?id=cfd19846697' target=_blank style='color:#2F92EE;'>#随机试验#</a> <a href='/topic/show?id=84a7e893169' target=_blank style='color:#2F92EE;'>#统计#</a> <a href='/topic/show?id=4989e8938c9' target=_blank style='color:#2F92EE;'>#统计学#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=20, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=78931, encryptionId=84a7e893169, topicName=统计), TopicDto(id=78938, encryptionId=4989e8938c9, topicName=统计学), TopicDto(id=98466, encryptionId=cfd19846697, topicName=随机试验)], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=cade5395722, createdName=梅斯管理员, createdTime=Sat Mar 16 08:47:49 CST 2024, time=2024-03-16, status=1, ipAttribution=威斯康星)]
    2024-03-16 梅斯管理员 来自威斯康星

相关资讯

JCO:Tax-PF诱导化疗治疗局部晚期头颈癌结局较好

部分针对局部晚期头颈癌(LAHNC)进行的随机试验曾对顺铂-氟尿嘧啶(PF)诱导化疗方案与紫杉类(多西他赛或紫杉醇)、顺铂及氟尿嘧啶(Tax-PF)方案进行过比较。在2013年7月8日在线出版的《临床肿瘤学杂志》(Journal of Clinical Oncology)上,法国古斯塔夫·鲁西研究所Jean-Pierre Pignon博士等人对相关研究进行了一项荟萃分析,该分析对Tax-PF与PF

患者对针灸非特异性作用的看法?

近几十年来,越来越多的随机对照试验的证据表明,与不治疗相比,针灸和假针灸对治疗结果都有显着的治疗效果。

四国开展卡介苗对新冠病毒的随机试验

今年3月24日,是第25个世界防治结核病日。

World Allergy Organ J:青蒿舌下免疫疗法治疗季节性过敏性鼻炎:一个多中心的随机试验

青蒿是中国北方最常见的户外过敏原。然而,到目前为止还没有多中心研究调查舌下免疫疗法(SLIT)作为青蒿诱导的过敏性鼻炎(AR)治疗方案的情况。最近,有研究人员评估了一种创新的SLIT治疗青蒿相关AR的

Lancet Neurology:帕金森病患者α-突触核蛋白活性免疫治疗PD01A的安全性和免疫原性:一项随机、单盲、1期试验

α-突触核蛋白是一种在中枢神经系统突触前及核周表达的可溶性蛋白质,强有力的证据支持α-突触核蛋白病理学作为帕金森病神经元功能障碍的驱动因素的作用。

Am J Obstet Gynecol:左炔诺孕酮宫内缓释系统治疗子宫内膜不典型增生较口服孕激素更优

    我们试图探讨左炔诺孕酮宫内缓释系统(LNG-IUS)与口服孕激素(EH)治疗非典型性子宫内膜增生的疗效。进行PubMed,Scopus和中央数据库检索,到2014年8月为止,以及对相关的参考文献进行筛选。搜索仅限于人和女性的文献。本研究包括七个随机对照试验(n=766名女性)。主要观察指标为3、6、12、24个月后的治疗效果(组织学反应),不规则阴道出血率及子

系统评价及荟萃分析:复方甘草酸苷注射液可改善小儿急性黄疸型肝炎肝功能

急性黄疸型肝炎(AIH)是由甲、乙、丙、丁和/或戊型肝炎病毒引起的急性肝炎的临床亚型之一,以胆红素的不良变化为主要特征。AIH发展迅速,传染性强。儿童容易感染肝炎病毒,导致器官发育不完善、免疫系统功能

JAMA Cardiol:PCI术后抗血小板治疗结论不一致,强调随机试验的重要性

近期有研究表明,PCI术后抗血小板治疗的安全性和有效性数据在不同分析技术中差异很大,突出随机试验的重要性。研究人员比较了PCI术后普拉格雷(Effient, Daiichi Sankyo/Eli Lilly) vs. 硫酸氢氯吡格雷的有效性和安全性,使用两种分析技术(治疗权重校正的逆概率和工具变量方法)。Jerome J. Federspiel博士和同事对11784例患者(平均年龄60岁;女性占2