2. 400038 重庆, 陆军军医大学(第三军医大学): 军事预防医学系军队健康教育学教研室;
3. 400038 重庆, 陆军军医大学(第三军医大学): 军事预防医学系系办公室;
4. 400037 重庆, 陆军军医大学(第三军医大学)第二附属医院神经内科
2. Department of Health Education, Army Medical University (Third Military Medical University), Chongqing, 400038;
3. Dean′s Office, Faculty of Military Preventive Medicine, Army Medical University (Third Military Medical University), Chongqing, 400038;
4. Department of Neurology, Second Affiliated Hospital, Army Medical University (Third Military Medical University), Chongqing, 400037, China
针对发病4.5 h内急性前循环大血管闭塞,阿替普酶静脉溶栓是一把双刃剑,是否有必要在血管内治疗前给予阿替普酶静脉溶栓治疗(桥接取栓)是当前卒中介入治疗领域的焦点[1-4]。为此,目前有6个高水平团队正在积极进行随机对照临床试验,旨在比较直接取栓与桥接取栓的有效性与安全性。由于这些临床试验在研究人群、入组标准、比较类型、非劣效界值设置、样本量计算等研究设计方面存在较大差异,因此导致研究结果也存在差异。
本文将从统计设计的角度出发,比较这6个临床试验设计的科学性和合理性,以期提高临床研究者对临床试验设计方法的认识。
1 材料与方法 1.1 资料来源资料来源于6个临床试验。DIRECT-MT由上海长海医院组织完成,Proposal发表在International Journal of Stroke 2019.08[5],论文发表在The New England Journal of Medicine 2020.06[6]。SKIP由日本东京的日本医学院组织完成,Proposal发表在International Journal of Stroke 2019.01[7],论文发表在JAMA 2021.01[8]。DEVT由重庆陆军军医大学附属第二医院组织完成,Proposal发表在International Journal of Stroke 2020.04[9],论文发表在JAMA 2021.01[10]。MR CLEAN-NO Ⅳ由荷兰阿姆斯特丹医学中心组织完成,Proposal发表在BMC Trials 2021.02[11],论文发表在Abstract at the International Stroke Congress 2021.02。SWIFT DIRECT由瑞士伯尔尼大学附属医院神经内科组织完成,Proposal发表在International Journal of Stroke 2021.06[12],论文发表在Abstract at the European Stroke Organization Congress 2021.09。DIRECT SAFE由澳大利亚神经科学研究所组织完成,Proposal注册发表在ClinicalTrials.gov Identifier: NCT03494920[13],论文发表在Abstract at the World Stroke Congress 2021。后面3个团队的数据正在处理中,还没有正式发表论文。
1.2 数据提取由2位统计专家对收集的文献进行仔细阅读,当意见不一致性时,由第3位专家共同商讨后确定。收集的信息包括临床设计情况和试验结果,设计情况包括:研究人群(年龄、部位和疾病的严重程度),对照选择(试验组和对照组的治疗方式、随机化和盲法),主要指标(计算方法,评价标准),比较类型(非劣效、优效),样本含量估计(需要输入的初始参数、临床界值、显著性检验标准)。试验结果包括:针对主要疗效指标的假设检验结果,即基于率差的比较结果和基于OR值的比较结果。
1.3 评价方法主要评价6个临床试验设计的科学性和合理性,主要包括以下几个方面:
研究人群:是否体现了研究目的,在疗效方面是否偏向于试验组或对照组?
对照、随机化与盲法:在对照明确的基础上,是否采用中心随机化?网络数据管理(EDC)?盲法设计是否科学?
主要疗效指标和比较类型的选择:是否体现了研究目的?定义和计算方法是否科学?
样本含量估计:初始参数是否恰当?临床界值选取是否科学?显著性检验标准是否合理?
同时,结合临床试验的结果,进一步阐述设计缺陷带来的不良影响。
2 结果 2.1 各试验人群和纳入标准这里,研究对象是针对发病4.5 h内急性前循环大血管闭塞患者,同时必须对年龄、部位和疾病的严重程度进行限定,这样便于确定今后的应用范围以及指南的制定。见表 1。
项目 | 地区来源 | 纳入标准 | ||||
年龄 | mRS评分 | 部位 | NIHSS评分 | 发病时间 | ||
DIRECT-MT 2020 | 中国(单国多中心) | ≥18岁 | mRS 0 or 1 ICA | 大脑中动脉M1、M2段闭塞 | 无限制 | 发病4.5 h内急性颅内大血管闭塞 |
SKIP 2021 | 日本(单国多中心) | ≥18且 < 86 | mRS 0-2 ICA | 大脑中动脉M1段闭塞 | ≥6 | 发病4.5 h内急性颅内大血管闭塞 |
DEVT 2021 | 中国(单国多中心) | ≥18岁 | mRS 0 or 1 ICA | 大脑中动脉M1段闭塞 | 无限制 | 发病4.5 h内急性颅内大血管闭塞 |
MR CLEAN-NO Ⅳ 2021 | 欧洲(多国多中心) | ≥18岁 | mRS 0 or 1 ICA | 大脑中动脉M1、M2段闭塞 | ≥2 | 发病4.5 h内急性颅内大血管闭塞 |
SWIFT DIRECT 2021 | 北美和欧洲(多国多中心) | ≥18岁 | mRS 0 or 1 ICA | 大脑中动脉M1段闭塞 | ≥5且 < 30 | 发病4.25 h内急性颅内大血管闭塞 |
DIRECT SAFE 2021 | 澳大利亚, 新英格兰, 中国, 越南(多国多中心) | ≥18岁 | mRS 0-3 ICA | 大脑中动脉M1、M2段闭塞 | 无限制 | 发病4.25 h内急性颅内大血管闭塞,到达医院进行穿刺≤90 min |
虽然6个临床试验基于同一目的“针对发病4.5 h内急性前循环大血管闭塞,是否有必要在血管内治疗前给予阿替普酶静脉溶栓治疗?”,因此,在入组标准上应该基本一致,但实际情况却存在一定的差异。在地区来源方面,6个研究来自于不同国家地区,基本涵盖了全球各个种族,研究结果具有广泛的适用性。在年龄方面,SKIP限定小于86岁,但实际入组的平均年龄最大;在mRS评分方面,SKIP和DIRECT SAFE限定在0-3;在部位方面,6个试验均包括M1段闭塞,其中3个试验还增加了M2段闭塞,由于对较小的大脑中动脉M2段闭塞患者,该部位闭塞时血栓负荷较小,对阿替普酶静脉溶栓的反应较好,因此纳入该部位会提高对照组的疗效;在NIHSS评分方面,SKIP,MR CLEAN-NO Ⅳ和SWIFT DIRECT有一定限定。
因此,在主要疗效指标分析时,应该考虑以上因素的影响,或采用分层分析方法,或采用协变量调整的方法。
2.2 临床试验设计要点比较 2.2.1 对照、随机化与盲法在对照设计方面,6个试验基本相同,只是SKIP采用Alteplase, 0.6 mg/kg溶栓,与入组病例年龄偏大有关。SWIFT DIRECT强调使用支架回收器,DIRECT SAFE强调近端先用Trevo支架回收器;在随机化方面,由于是多中心且跨国研究,所以均采用网络随机化和竞争入组方式;在盲法方面,均采用图像盲评的方式,成立了独立的评价中心。在期中分析方面,DEVT采用了序贯设计,进行5次期中分析;SWIFT DIRECT先进行样本含量的初步估计,然后在期中进行样本含量的再估计,其他4个试验未进行期中分析。见表 2。
项目 | 对照方式 | 随机化 | 盲法 | 期中分析 | |
试验组 | 对照组 | ||||
DIRECT-MT 2020 | 直接取栓 | 阿尔替普酶, 0.9 mg/kg | 基于网络系统1∶1分配 | 由独立图像评价中心进行盲态评价 | 无 |
SKIP 2021 | 直接取栓 | 阿尔替普酶, 0.6 mg/kg | 基于网络系统1∶1分配 | 由独立图像评价中心进行盲态评价(2位专家) | 无 |
DEVT 2021 | 直接取栓 | 阿尔替普酶, 0.9 mg/kg | 基于网络系统1∶1分配 | 由独立图像评价中心进行盲态评价(2位专家) | 5阶段序贯设计 |
MR CLEAN-NO Ⅳ 2021 | 直接取栓 | 阿尔替普酶, 0.9 mg/kg | 基于网络系统1∶1分配 | 由独立图像评价中心进行盲态评价 | 无 |
SWIFT DIRECT 2021 | 直接取栓,使用支架回收器 | 阿尔替普酶, 0.9 mg/kg | 基于网络系统1∶1分配 | 由独立图像评价中心进行盲态评价 | 期中样本含量重估计 |
DIRECT SAFE 2021 | 直接取栓,先用Trevo支架回收器 | 阿尔替普酶, 0.9 mg/kg OR特奈特普酶0.25 mg/kg | 基于网络系统1∶1分配 | 由独立图像评价中心进行盲态评价 | 无 |
总之,在对照、随机化与盲法的设计方面,6个研究具有高度一致性和高质量的设计。
2.2.2 评价标准与比较类型在主要指标的评价标准方面,共有3种方式,cOR值、OR值和率差。采用何种方式,主要基于研究者前期掌握的资料和对疗效的直观理解。但是,不同定义方式,在样本含量估计时有一定的差异。在比较类型方面,5个研究认为试验组与对照组在疗效方面基本一致,只是安全性方面可能更具有优势,因此,采用非劣效比较类型。需要注意的是,MR CLEAN-NO Ⅳ认为试验组疗效优于对照组,因此先采用优效设计,然后在优效不成立时,进行非劣效分析。但是,MR CLEAN-NO Ⅳ设计思路是有缺陷的,因为优效设计不能转化为非劣效。见表 3。
项目 | 主要指标 | 评价标准 | 比较类型 |
DIRECT-MT 2020 | cOR值* | 评价2组mRS(0-6)等级分布的整体成比例cOR迁移变化情况(shift analysis) | 非劣效 |
SKIP 2021 | OR值 | 评价2组良好率[即mRS(0-2)占比]的比值比 | 非劣效 |
DEVT 2021 | 率差 | 评价2组良好率[即mRS(0-2)占比]的差值 | 非劣效 |
MR CLEAN-NO Ⅳ 2021 | cOR值 | 评价2组mRS(0-6)等级分布的整体成比例cOR迁移变化情况(shift analysis) | 先优效/非劣效 |
SWIFT DIRECT 2021 | 率差 | 评价2组良好率[即mRS(0-2)占比]的差值 | 非劣效 |
DIRECT SAFE 2021 | 率差 | 评价2组良好率[即mRS(0-2)占比]的差值 | 非劣效 |
* common odds ratio(cOR) |
2.2.3 样本含量估计方法
在样本含量估计方面6个研究存在较大差异。DIRECT-MT和MR CLEAN-NO Ⅳ是基于主要指标等级分布的cOR,但预估值分别为cOR=1.16和cOR=1.54,差别很大,其原因是前者认为两组非劣效,后者认为两组优效。最后结果显示,MR CLEAN-NO Ⅳ的假设存在问题;SKIP虽然采用非劣效,但是初始参数试验组=48.6%,对照组=35.2%,试验组远远高于对照组,显然与实际情况相差甚远。同时,非劣效界值为OR=0.74,显然太低,不符合临床最低要求;其余3个试验采用率差方法,但是SWIFT DIRECT初始参数试验组=62.0%,对照组=62.0%,疗效偏高,且非劣效界值Δ=-12%,显然太低,也不符合临床最低要求。见表 4。
项目 | 需要输入的已知参数 | 临床界值 | 显著性检验判断标准 | 计算方法 |
DIRECT-MT 2020 | ①对照组mRS分布(%) (3, 9, 21, 18, 22, 6, 21) ②cOR=1.16 |
非劣效界值cOR=0.80 | cOR的95%CI下限>0.80 | 两组等级资料检验(比例Odds) |
SKIP 2021 | ①对照组=35.2% ②试验组=48.6% |
非劣效界值OR=0.74 | OR的95%CI下限>0.74 | 两组率OR值非劣效检验 |
DEVT 2021 | ①对照组=43.0% ②试验组=43.0% ③序贯循环=5 |
非劣效界值Δ=-10% | (Z-值, P-值)界值 (2.35826, 0.00918) (2.45230, 0.00710) (2.35290, 0.00931) (2.41629, 0.00784) (2.36354, 0.00905) |
基于序贯设计两组率非劣效检验 |
MR CLEAN-NO Ⅳ 2021 | ①对照组mRS分布(%) (3, 9, 21, 18, 22, 6, 21) ②cOR=1.54 |
①优效界值cOR=1 ②非劣效界值cOR=0.80 |
①优效界值cOR的95%CI下限>1 ②非劣效界值cOR的95%CI下限>0.80 |
两组等级资料检验(比例Odds) |
SWIFT DIRECT 2021 | ①对照组=62.0% ②试验组=62.0% |
非劣效界值Δ=-12% | 率差的95%CI下限>-12% | 两组率差的非劣效检验 |
DIRECT SAFE 2021 | 不详 | 非劣效界值Δ=-10% | 率差的95%CI下限>-10% | 两组率差的非劣效检验 |
2.3 基于率差的分析结果
由表 5可知,基于cOR的样本含量最大,DIRECT-MT为636例,MR CLEAN-NO Ⅳ为540例;基于率差,且采用序贯设计的DEVT样本含量最少194例。若按照6个试验的国际合作团队IRIS_WSC_2021假设的率差界值Δ=-10%,仅有DIRECT-MT和DEVT非劣效检验成立。
项目 | 分析方法 | 样本含量 | 入组例数 | 功能良好率(n, %) | 率差的95%CI | 和临床界值Δ比较 | |||
试验组 | 对照组 | 试验组 | 对照组 | ||||||
DIRECT-MT 2020 | 有序logistic回归 | 636 | 327 | 329 | 119(36.39%) | 121(36.78%) | 0.4[-7.8; 7.0] | -7.8>-10% 非劣效成立 | |
SKIP 2021 | logistic回归 | 200 | 101 | 103 | 60(59.41%) | 59(57.28%) | 2.1[-11.4; 15.7] | -11.4 < -10% 非劣效不成立 | |
DEVT 2021 | 序贯设计分析 | 194 | 116 | 118 | 63(54.31%) | 55(46.61%) | 7.7[-5.1; 20.5] | -5.1>-10% 非劣效成立 | |
MR CLEAN-NO Ⅳ 2021 | 有序logistic回归 | 540 | 273 | 266 | 134(49.08%) | 136(51.13%) | -2.0[-10.5; 6.4] | -10.5 < -10% 非劣效不成立 | |
SWIFT DIRECT 2021 | Mantel-Haenszel风险差 | 400 | 201 | 207 | 114(56.72%) | 135(65.22%) | -8.5[-17.9; 0.9] | -17.9 < -12% 非劣效不成立 | |
DIRECT SAFE 2021 | logistic回归 | 296 | 148 | 147 | 80(54.05%) | 89(60.54%) | -5.7[-17.0; 5.5] | -17.0 < -10% 非劣效不成立 |
2.4 基于OR的分析结果
由表 6可知,若按照6个试验的国际合作团队IRIS_WSC_2021假设的OR界值=0.80,只有DIRECT-MT的非劣效成立。其余试验的OR值下界为0.53~0.71均小于0.80,非劣效不成立。
项目 | 分析方法 | median(IQR | cOR的95%CI | 和临床界值OR比较 | |
试验组 | 对照组 | ||||
DIRECT-MT 2020 | 有序logistic回归 | 3(2-5) | 3(2-5) | 1.07 [0.81; 1.41] | 0.81>0.80非劣效成立 |
SKIP 2021 | logistic回归 | 2(1-4) | 2(1-4) | 0.97 [0.60; 1.57] | 0.60 < 0.74非劣效不成立 |
DEVT 2021 | 序贯设计分析 | 2(1-4) | 3(1-4) | 1.13 [0.71; 1.79] | 0.71 < 0.80非劣效不成立 |
MR CLEAN-NO Ⅳ 2021 | 有序logistic回归 | 3(2-5) | 2(2-5) | 0.84 [0.62; 1.14] | 0.62 < 0.80非劣效不成立 |
SWIFT DIRECT 2021 | Mantel-Haenszel风险差 | 2(1-4) | 2(1-3) | 0.75 [0.53; 1.06] | 0.53 < 0.80非劣效不成立 |
DIRECT SAFE 2021 | logistic回归 | 2(1-4) | 2(1-4) | 0.85 [0.56; 1.28] | 0.56 < 0.80非劣效不成立 |
3 讨论
临床试验设计的科学性和合理性,对试验是否成功起着至关重要的作用。通过对以上6个临床试验设计方案的比较分析,我们将特别需要注意的设计要点归纳如下:
3.1 关于纳入人群和标准关于纳入人群和标准,应该充分根据研究目的进行确定,一个临床试验最好仅针对一个适应证或一个部位。因此,在制定纳入标准时,应谨慎确定适用范围,不能太宽泛,否则会引入太多的混杂因素。在上述6项试验中,DIRECT-MT、MR CLEAN-NO Ⅳ和DIRECT SAFE在纳入M1段闭塞患者的同时,增加了管径相对较小的大脑中动脉M2段闭塞患者。由于该M2部位闭塞时血栓负荷较小,对阿替普酶静脉溶栓的反应较好,因此,在对项目DIRECT-MT、MR CLEAN-NO Ⅳ和DIRECT SAFE进行非劣效分析时,试验组相对于对照组,更难达到显著性标准,这是一个很重要的混杂因素。本研究认为由于部位M1和M2的疗效具有较大差异,因此,纳入标准应限定在一个部位,样本选取应该更严格一些,保证来自于一个总体。
3.2 关于对照、随机化与盲法目前,前瞻性随机对照临床试验仍是临床研究的“金标准”,6项试验均采用多中心随机对照试验设计。在大型临床研究中,如何保证随机化是一个重要问题,6项试验均采用了“动态随机”方法,并基于Web-based系统进行随机号动态分配和数据全程管理。双盲是临床试验最科学的设盲方式,在双盲临床试验中,受试者、研究者(对受试者进行筛选的人员、终点评价人员以及对方案依从性评价人员)、与临床有关的申办方人员对处理分组均应处于盲态,但是上述6项试验中,由于试验组和对照组治疗方式差异太大,无法对研究者和受试者进行设盲。因此,只能成立独立的评价中心,由2位处于盲态的神经生物学家,对mRS进行独立盲态评价。
3.3 关于主要疗效指标和比较类型的选择主要指标又称主要终点,是与试验主要研究目的有本质联系的,能确切反映药物有效性或安全性的观察指标。主要指标应根据试验目的选择易于量化、客观性强、重复性高,并在相关研究领域已有公认标准的指标。同一个研究的主要疗效指标可以有不同的评价标准和计算方法,上述6项试验中,共有3种方式,采用何种方式没有统一的标准,主要基于研究者对前期掌握资料的深入理解。但是,不同定义方式,在样本含量估计时有一定的差异。
临床试验中比较的类型,按统计学中的假设检验可分为优效性检验、等效性检验和非劣效性检验。在临床试验方案中,需要明确试验的目的和比较的类型。比较类型的选择基于对主要疗效指标的基本判定,上述5项试验的主要目的是:在验证疗效基本一致的基础上,探讨试验组比对照组具有更好的安全性,所以对主要疗效指标应该采用非劣效假设。但MR CLEAN-NO Ⅳ首先假设试验组相对于对照组具有“优效性”,然后推测非劣效性,这种研究思路存在一定的问题。
3.4 关于样本含量估计的合理性样本含量估计时,需要注意2个方面的问题:
在初始参数的设计方面,首先应该根据原有研究(或采用meta分析)和预试验结果,给出主要疗效指标的初始参数。如果是优效试验,那么试验组初始值应该高于对照组初始值,如果是非劣效则试验组初始值就不能高于对照组初始值。上述6项试验中,DIRECT-MT(试验组: 对照组的优势比cOR=1.16),SKIP 2021(①对照组=35.2%,②试验组=48.6%),MR CLEAN-NO Ⅳ(试验组: 对照组的优势比cOR=1.54),试验组疗效均好于对照组,所以若采用非劣效假设就不太合理。
在界值的确定方面,所有6项试验统计设计中对非劣效界值的确定存在不足之处。从临床的角度看,对非劣效界值取值太宽泛(如Δ=-10%或OR < 0.80)。IRIS_WSC_2021研究团队根据6个试验最终的临床结果,进行了meta分析,从模拟结果来看,当Δ=-6.5%或OR=0.85时比较合理。所以,满足临床疗效的界值最低要求是必须遵循的规则。
综上所述,在科研设计时,必须慎重考虑以上几个方面的科学性和合理性。从而,保证临床试验达到预期的结果。
[1] |
BERKHEMER O A, FRANSEN P S S, BEUMER D, et al. A randomized trial of intraarterial treatment for acute ischemic stroke[J]. N Engl J Med, 2015, 372(1): 11-20. |
[2] |
JOVIN T G, CHAMRO A, COBO E, et al. Thrombectomy within 8 hours after symptom onset in ischemic stroke[J]. N Engl J Med, 2015, 372(24): 2296-2306. |
[3] |
SAVER J L, GOYAL M, BONAFE A, et al. Stent-retriever thrombectomy after intravenous t-PA vs. t-PA alone in stroke[J]. N Engl J Med, 2015, 372(24): 2285-2295. |
[4] |
GOYAL M, MENON B K, VAN ZWAM W H, et al. Endovascular thrombectomy after large-vessel ischaemic stroke: a meta-analysis of individual patient data from five randomised trials[J]. Lancet, 2016, 387(10029): 1723-1731. |
[5] |
PENGFEI YANG, KILIAN M TREURNIET, LEI ZHANG, et al. Direct Intra-arterial thrombectomy in order to Revascularize AIS patients with large vessel occlusion efficiently in Chinese tertiary hospitals: A multicenter randomized clinical Trial(DIRECT-MT)-Protocol[J]. Int J Stroke, 2019, 0(0): 1-10. |
[6] |
YANG P F, ZHANG Y W, ZHANG L, et al. Endovascular thrombectomy with or without intravenous alteplase in acute stroke[J]. N Engl J Med, 2020, 382(21): 1981-1993. |
[7] |
SUZUKI K, KIMURA K, TAKEUCHI M, et al. The randomized study of endovascular therapy with versus without intravenous tissue plasminogen activator in acute stroke with ICA and M1 occlusion(SKIP study)[J]. Int J Stroke, 2019, 14(7): 752-755. |
[8] |
SUZUKI K, MATSUMARU Y, TAKEUCHI M, et al. Effect of mechanical thrombectomy without vs with intravenous thrombolysis on functional outcome among patients with acute ischemic stroke: the SKIP randomized clinical trial[J]. JAMA, 2021, 325(3): 244-253. |
[9] |
QIU Z M, LIU H S, LI F L, et al. DEVT: a randomized, controlled, multicenter trial of direct endovascular treatment versus standard bridging therapy for acute stroke patients with large vessel occlusion in the anterior circulation—Protocol[J]. Int J Stroke, 2021, 16(2): 229-235. |
[10] |
ZI W J, QIU Z M, LI F L, et al. Effect of endovascular treatment alone vs intravenous alteplase plus endovascular treatment on functional independence in patients with acute ischemic stroke: the DEVT randomized clinical trial[J]. JAMA, 2021, 325(3): 234-243. |
[11] |
TREURNIET K M, LECOUFFE N E, KAPPELHOF M, et al. Mr clean no iv: Intravenous treatment followed by endovascular treatment versus direct endovascular treatment for acute ischemic stroke caused by a proximal intracranial occlusion study protocol for a randomized clinical trial[J]. Trials, 2021, 22(1): 141. |
[12] |
FISCHER U, KAESMACHER J, S PLATTNER P, et al. SWIFT DIRECT: solitaireTM with the intention for thrombectomy plus intravenous t-PA versus DIRECT solitaireTM stent-retriever thrombectomy in acute anterior circulation stroke: methodology of a randomized, controlled, multicentre study[J]. Int J Stroke, 2021, 2021O. |
[13] |
Neuroscience Trials Australia. DIRECT-SAFE: A Randomized Controlled Trial of DIRECT Endovascular Clot Retrieval Versus Standard Bridging Thrombolysis With Endovascular Clot Retrieval. ClinicalTrials. gov Identifier: NCT03494920[EB/OL]. (2021-07-29)[2022-06-07]. https://clinicaltrials.gov/ct2/show/NCT03494920.
|