外科技术和器械的快速创新是外科临床研究和实践的重要内容,其评价总体思路与药物干预类似,但具体方法学存在很大差异。2009 年 IDEAL 协作网提出一套适用于外科创新干预的方法学框架—IDEAL 框架,将外科创新技术发展分为 5 个阶段,涵盖从概念提出到推广应用的全生命周期。2019 年,协作网更新 IDEAL 框架,在原有基础上增加临床前评价(Pre-IDEAL),梳理明确各阶段研究目的、核心问题和伦理依据。作为 IDEAL 框架和推荐系统的首篇文章,本文将详细介绍 IDEAL 推荐和框架的产生、发展、具体内容、应用推广现状,旨在促进该方法在国内外科临床研究领域的应用和传播。
引用本文: 喻佳洁, 陕飞, PeterMcCulloch, AllisonHirst, 胡建昆, 孙鑫, 李幼平, 刘伦旭, 刘雪梅, 董念国, 陈寄梅, 乔贵宾, 李鹤成. 外科创新技术/器械临床研究方法学—IDEAL 框架与推荐系列文章之一:IDEAL 框架与推荐介绍. 中国胸心血管外科临床杂志, 2021, 28(2): 131-136. doi: 10.7507/1007-4848.202011088 复制
1996 年,《Lancet》发表题为“外科研究还是喜剧表演”的文章,尖锐地指出外科研究过分依靠医生经验和手术记录的现状,建议外科领域尽快与流行病学专家合作开展临床研究[1]。近 20 年来,外科临床研究数量有明显增长,但其质量仍亟待提高,一方面外科干预过程复杂,其结果易受术者经验偏好、操作熟练程度、患者意愿等的影响[2];另一方面,外科技术和器械的快速创新也增加了外科临床研究的难度[3]。
与药物干预不同,外科创新技术可能是长期发展和推进的结果,也可能是某次操作的意外结果,因此,其研究和实践方法还有待补充完善,尤其是那些无法借鉴其它非药物干预评价方法解决的问题。如随机对照试验(randomized controlled trial,RCT)中,因患者和医生对已有手术操作的强烈偏好导致入组困难、无法确定开展随机对照试验的最佳时间点、无法对患者和医生实施盲法影响结局测量等[4-6];非随机对照试验中的学习曲线、不同组间不同干预措施对主要干预结果的影响等问题[7-9]。随着循证医学发展和强调基于证据临床实践环境的改变,如何根据外科创新干预评价特殊性,生产外科临床研究高质量证据成为外科发展必须解决的问题。
1 IDEAL 框架与推荐的产生
2007~2009 年,全球顶尖外科医生、临床流行病学家、统计学家、学术编辑等齐聚牛津大学 Balliol 学院,组织并参加了系列提高外科临床研究质量的会议讨论,并于 2009 年在上述讨论基础上发展形成 IDEAL 框架与推荐(Idea,Development,Exploration,Assessment,and Long-term follow up,IDEAL framework and recommendations)[10]。2009 年 IDEAL 协作网在牛津大学成立,旨在传播和推广 IDEAL 框架与推荐。IDEAL 框架(IDEAL framework)将外科创新技术发展分为 5 个阶段,涵盖从概念提出到推广应用的全生命周期,同时就学术期刊、资助方、监管方及专业学会等特定群体如何使用 IDEAL 框架提高临床研究质量、改善发展环境提出系列建议[11-13]。
2 IDEAL 框架与推荐的发展
之后,IDEAL 协作网又相继针对医疗器械研究、放疗、物理治疗提出 IDEAL for device(IDEAL-D)[14],IDEAL for radiation oncology(R-IDEAL)[15]和 IDEAL-Physio[16]。2015~2016 年 IDEAL 协作网组织国际专家完成 IDEAL 框架与推荐的更新,在原有 5 个阶段的基础上增加临床前评价(Pre-IDEAL),梳理明确各阶段核心问题和伦理依据,并根据其它复杂干预措施进行了适用性调整,使该框架可用于手术外的干预措施[17]。
3 IDEAL 框架与推荐的内容
本文主要基于更新后 IDEAL 进行介绍,表 1 为具体内容[10, 17-18]。
3.1 临床前评价(Pre-IDEAL)
即外科创新的临床前研究阶段,其主要内容是评价创新技术在非人体阶段的可行性、安全性和潜在获益。该阶段在伦理上应注意尽量减少使用动物模型,仅建议在有充分证据表明所用动物模型适用于人类时使用。
3.2 设计阶段(1 期-设想)
即外科创新首次应用于人体的阶段,其主要内容是完整详细地描述外科创新技术最早的临床应用。本阶段的核心问题是如何定义外科创新技术的概念及说明创新的必要性。在伦理方面要注意尽量确保患者安全和知情同意权,团队成员间需充分沟通技术创新细节并管理利益冲突。IDEAL 协作组还强烈建议所有首次开展的人体研究应提前注册并公开所有不涉及专利或商业利益的相关信息,尤其是那些干预失败的研究,以避免后来的研究者重蹈覆辙。
3.3 开发阶段(2a 期-开发)
即创新技术不断改良的阶段,其主要内容是确定外科创新稳定成熟的技术方案,研究者需完整正确地报道干预技术演进的全过程,包括技术调整的具体时间和原因。该阶段的核心问题是创新技术是否具备足够的技术稳定性和可重复性。伦理方面需注意保证患者风险最小化,知情同意书中应包括 1 期研究结果,并说明目前研究阶段可能存在无法预测或量化的风险。
3.4 探索阶段(2b 期-探索)
即创新技术通过持续开发、不断优化达成共识,并探索开展下一阶段研究可行性的阶段。其主要内容是基于大样本短期结局估计效应预测值,比较不同人群可能存在的结局差异,评价创新干预的学习曲线和质量控制,并通过定性研究了解医生和患者参与 RCT 的意愿及可能的障碍。该阶段的核心问题是外科创新的适应证,技术方案和质量措施是否已达成一致,能否开展下一阶段研究。伦理方面应加强医生培训指导并计算学习曲线,最大程度地减少学习曲线给患者带来的潜在风险。
本阶段完成后外科医生应对外科创新达成以下技术共识:① 技术方案及可接受的技术调整;② 质量评价;③ 学习曲线评价。若能开展3期 RCT 研究,还需共识:① 目标人群及纳入排除标准;② 对照组治疗措施;③ 主要终点指标;④ 医患双方开展随机化的可能性。
3.5 评价阶段(3 期-评价)
即确证外科创新的疗效和安全性的阶段,本阶段的核心问题是与目前的标准治疗相比,该外科创新的疗效及安全性如何。由于该阶段以多中心 RCT 设计为主,其设计、报告及伦理要求可参照现有RCT的各种报告规范和评价工具。
3.6 长期随访阶段(4期-长期随访)
即对创新技术开展长期监测和随访的阶段,核心问题是确定是否存在长期或罕见不良反应,适应证和干预质量是否发生变化。本阶段主要以观察性研究为主,也可通过真实世界数据(如:基于特定研究目的的患者调查、患者注册登记、医院电子病历、医保理赔数据库等)获取长期随访数据。IDEAL 协作网建议若研究者需通过专门的患者登记数据库获取长期随访数据,则应在进入第 4 期前建立,以提高研究效率。伦理方面仍需获得知情同意并考虑隐私保护问题。
4 IDEAL 框架与推荐的应用
2009 年 IDEAL 框架与推荐推出后,引用数量逐年上涨。加拿大和荷兰在卫生技术评估领域引入 IDEAL 指导医疗技术和器械评估[19-20];国际 EXCITE(Excellence in Clinical Innovation and Technology Evaluation)协助组(该组织主要为器械生产商提供创新产品评估)将 IDEAL 作为评估核心方法学[21];英国国立卫生研究院(National Institute of Health and Research,NIHR)多次指定资助 IDEAL 2b 期研究,并多次与英国国家健康服务体系(National Health Service,NHS)和英国国家临床诊治和服务优化研究所(National Institute for Clinical Excellence,NICE)商讨 IDEAL 在 NHS 委托评估项目中的实际应用[22]。
但与其它新方法一样,短时间内 IDEAL 框架与推荐在实践中应用有限。现状调查(1 期、2a 期、2b 期)结果显示[23]:2009~2017 年共检索到 790 篇与 IDEAL 相关研究,但仅 38 篇为前瞻性研究,严格评估 38 篇纳入文献后发现,尽管作者将研究标识为使用 IDEAL,但缺少对 IDEAL 关键特征的描述,如 1 期中缺少背景或资助信息,2a 期中缺少技术迭代优化的信息,2b 期中缺少质量控制、亚组分析、学习曲线等的信息,更缺少能否开展下一阶段的建议。为帮助研究者更好理解 IDEAL 每个阶段的核心问题和关键特征,2018 年协作网召集各行业专家开始 IDEAL 报告规范(IDEAL reporting guidelines)的制定工作,并于 2020 年发表[24-25]。
作为外科临床研究方法学的探路者,IDEAL 框架和推荐率先提出评估外科干预、侵入性医疗设备和其它复杂治疗干预的方法学框架,并在不足和挑战中不断发展完善。2003 年,IDEAL 加入英国外科研究合作组织,为实习外科医生提供参与研究的实践机会[26]。2016 年,IDEAL 中国中心成立,成为继英国、美国后的第三个国家中心。2019 年,创办了首本聚焦外科创新性研究的杂志 BMJ Surgery,Interventions & Health Technologies(
利益冲突:无。
作者贡献:喻佳洁提出设想,撰写论文;李幼平、刘伦旭、刘雪梅提出设想,修改论文;陕飞、Peter McCulloch、Allison Hirst、胡建昆、孙鑫、董念国、陈寄梅、乔贵宾、李鹤成修改论文。
1996 年,《Lancet》发表题为“外科研究还是喜剧表演”的文章,尖锐地指出外科研究过分依靠医生经验和手术记录的现状,建议外科领域尽快与流行病学专家合作开展临床研究[1]。近 20 年来,外科临床研究数量有明显增长,但其质量仍亟待提高,一方面外科干预过程复杂,其结果易受术者经验偏好、操作熟练程度、患者意愿等的影响[2];另一方面,外科技术和器械的快速创新也增加了外科临床研究的难度[3]。
与药物干预不同,外科创新技术可能是长期发展和推进的结果,也可能是某次操作的意外结果,因此,其研究和实践方法还有待补充完善,尤其是那些无法借鉴其它非药物干预评价方法解决的问题。如随机对照试验(randomized controlled trial,RCT)中,因患者和医生对已有手术操作的强烈偏好导致入组困难、无法确定开展随机对照试验的最佳时间点、无法对患者和医生实施盲法影响结局测量等[4-6];非随机对照试验中的学习曲线、不同组间不同干预措施对主要干预结果的影响等问题[7-9]。随着循证医学发展和强调基于证据临床实践环境的改变,如何根据外科创新干预评价特殊性,生产外科临床研究高质量证据成为外科发展必须解决的问题。
1 IDEAL 框架与推荐的产生
2007~2009 年,全球顶尖外科医生、临床流行病学家、统计学家、学术编辑等齐聚牛津大学 Balliol 学院,组织并参加了系列提高外科临床研究质量的会议讨论,并于 2009 年在上述讨论基础上发展形成 IDEAL 框架与推荐(Idea,Development,Exploration,Assessment,and Long-term follow up,IDEAL framework and recommendations)[10]。2009 年 IDEAL 协作网在牛津大学成立,旨在传播和推广 IDEAL 框架与推荐。IDEAL 框架(IDEAL framework)将外科创新技术发展分为 5 个阶段,涵盖从概念提出到推广应用的全生命周期,同时就学术期刊、资助方、监管方及专业学会等特定群体如何使用 IDEAL 框架提高临床研究质量、改善发展环境提出系列建议[11-13]。
2 IDEAL 框架与推荐的发展
之后,IDEAL 协作网又相继针对医疗器械研究、放疗、物理治疗提出 IDEAL for device(IDEAL-D)[14],IDEAL for radiation oncology(R-IDEAL)[15]和 IDEAL-Physio[16]。2015~2016 年 IDEAL 协作网组织国际专家完成 IDEAL 框架与推荐的更新,在原有 5 个阶段的基础上增加临床前评价(Pre-IDEAL),梳理明确各阶段核心问题和伦理依据,并根据其它复杂干预措施进行了适用性调整,使该框架可用于手术外的干预措施[17]。
3 IDEAL 框架与推荐的内容
本文主要基于更新后 IDEAL 进行介绍,表 1 为具体内容[10, 17-18]。
3.1 临床前评价(Pre-IDEAL)
即外科创新的临床前研究阶段,其主要内容是评价创新技术在非人体阶段的可行性、安全性和潜在获益。该阶段在伦理上应注意尽量减少使用动物模型,仅建议在有充分证据表明所用动物模型适用于人类时使用。
3.2 设计阶段(1 期-设想)
即外科创新首次应用于人体的阶段,其主要内容是完整详细地描述外科创新技术最早的临床应用。本阶段的核心问题是如何定义外科创新技术的概念及说明创新的必要性。在伦理方面要注意尽量确保患者安全和知情同意权,团队成员间需充分沟通技术创新细节并管理利益冲突。IDEAL 协作组还强烈建议所有首次开展的人体研究应提前注册并公开所有不涉及专利或商业利益的相关信息,尤其是那些干预失败的研究,以避免后来的研究者重蹈覆辙。
3.3 开发阶段(2a 期-开发)
即创新技术不断改良的阶段,其主要内容是确定外科创新稳定成熟的技术方案,研究者需完整正确地报道干预技术演进的全过程,包括技术调整的具体时间和原因。该阶段的核心问题是创新技术是否具备足够的技术稳定性和可重复性。伦理方面需注意保证患者风险最小化,知情同意书中应包括 1 期研究结果,并说明目前研究阶段可能存在无法预测或量化的风险。
3.4 探索阶段(2b 期-探索)
即创新技术通过持续开发、不断优化达成共识,并探索开展下一阶段研究可行性的阶段。其主要内容是基于大样本短期结局估计效应预测值,比较不同人群可能存在的结局差异,评价创新干预的学习曲线和质量控制,并通过定性研究了解医生和患者参与 RCT 的意愿及可能的障碍。该阶段的核心问题是外科创新的适应证,技术方案和质量措施是否已达成一致,能否开展下一阶段研究。伦理方面应加强医生培训指导并计算学习曲线,最大程度地减少学习曲线给患者带来的潜在风险。
本阶段完成后外科医生应对外科创新达成以下技术共识:① 技术方案及可接受的技术调整;② 质量评价;③ 学习曲线评价。若能开展3期 RCT 研究,还需共识:① 目标人群及纳入排除标准;② 对照组治疗措施;③ 主要终点指标;④ 医患双方开展随机化的可能性。
3.5 评价阶段(3 期-评价)
即确证外科创新的疗效和安全性的阶段,本阶段的核心问题是与目前的标准治疗相比,该外科创新的疗效及安全性如何。由于该阶段以多中心 RCT 设计为主,其设计、报告及伦理要求可参照现有RCT的各种报告规范和评价工具。
3.6 长期随访阶段(4期-长期随访)
即对创新技术开展长期监测和随访的阶段,核心问题是确定是否存在长期或罕见不良反应,适应证和干预质量是否发生变化。本阶段主要以观察性研究为主,也可通过真实世界数据(如:基于特定研究目的的患者调查、患者注册登记、医院电子病历、医保理赔数据库等)获取长期随访数据。IDEAL 协作网建议若研究者需通过专门的患者登记数据库获取长期随访数据,则应在进入第 4 期前建立,以提高研究效率。伦理方面仍需获得知情同意并考虑隐私保护问题。
4 IDEAL 框架与推荐的应用
2009 年 IDEAL 框架与推荐推出后,引用数量逐年上涨。加拿大和荷兰在卫生技术评估领域引入 IDEAL 指导医疗技术和器械评估[19-20];国际 EXCITE(Excellence in Clinical Innovation and Technology Evaluation)协助组(该组织主要为器械生产商提供创新产品评估)将 IDEAL 作为评估核心方法学[21];英国国立卫生研究院(National Institute of Health and Research,NIHR)多次指定资助 IDEAL 2b 期研究,并多次与英国国家健康服务体系(National Health Service,NHS)和英国国家临床诊治和服务优化研究所(National Institute for Clinical Excellence,NICE)商讨 IDEAL 在 NHS 委托评估项目中的实际应用[22]。
但与其它新方法一样,短时间内 IDEAL 框架与推荐在实践中应用有限。现状调查(1 期、2a 期、2b 期)结果显示[23]:2009~2017 年共检索到 790 篇与 IDEAL 相关研究,但仅 38 篇为前瞻性研究,严格评估 38 篇纳入文献后发现,尽管作者将研究标识为使用 IDEAL,但缺少对 IDEAL 关键特征的描述,如 1 期中缺少背景或资助信息,2a 期中缺少技术迭代优化的信息,2b 期中缺少质量控制、亚组分析、学习曲线等的信息,更缺少能否开展下一阶段的建议。为帮助研究者更好理解 IDEAL 每个阶段的核心问题和关键特征,2018 年协作网召集各行业专家开始 IDEAL 报告规范(IDEAL reporting guidelines)的制定工作,并于 2020 年发表[24-25]。
作为外科临床研究方法学的探路者,IDEAL 框架和推荐率先提出评估外科干预、侵入性医疗设备和其它复杂治疗干预的方法学框架,并在不足和挑战中不断发展完善。2003 年,IDEAL 加入英国外科研究合作组织,为实习外科医生提供参与研究的实践机会[26]。2016 年,IDEAL 中国中心成立,成为继英国、美国后的第三个国家中心。2019 年,创办了首本聚焦外科创新性研究的杂志 BMJ Surgery,Interventions & Health Technologies(
利益冲突:无。
作者贡献:喻佳洁提出设想,撰写论文;李幼平、刘伦旭、刘雪梅提出设想,修改论文;陕飞、Peter McCulloch、Allison Hirst、胡建昆、孙鑫、董念国、陈寄梅、乔贵宾、李鹤成修改论文。