绿色药业出口:浓缩异形片、浓缩丸、颗粒剂、饮片和中医药器具等
中国中医药 我要投稿
临床试验中针刺方案充分性评价:现状与建议
来源:中国针灸杂志 2019-03-05 [科技] [中国中医药]

临床试验中针刺方案充分性评价:现状与建议*

岗卫娟,孟  醒,景向红*

(中国中医科学院针灸研究所,北京100700)

 

随机对照试验(randomized controlled trials,RCTs)被公认为是评价医学干预措施疗效的金标准,是循证临床实践的主要证据来源。随着针刺在世界范围内的广泛传播,国际上越来越重视针灸的临床证据质量。因此,国外越来越多的学者试图通过随机对照试验验证针刺疗效。然而,近年来国外的针刺临床试验结果却不甚理想,研究结果不时得出针刺疗效相当于安慰剂效果[1-3],由此引起国际针灸学界广泛关注与争论[4],焦点集中在针刺方案治疗是否充分足以达到最佳疗效和对照组是否完全无效两方面[4-5]。虽然有学者提出对临床试验中针刺方案充分性进行评价并尝试制定评价方法[6-7],但因其研究方法或研究内容存在一定局限性,目前尚未达成共识。针灸治疗是一个复杂的干预过程,其中合理的针刺方案是针刺疗效的关键环节[8],对照组类型是临床试验结果效应量的重要影响因素[9]。因此,笔者拟对临床试验中针刺方案充分性(包括真针刺方案和假针刺方案)评价相关研究进行简要梳理,并对未来研究提出建议,以期为针灸临床研究方法学的完善奠定基础。

1  临床试验中针刺方案充分性的概念

临床试验包括解释性随机对照试验(explanatory randomized controlled trial,ERCT)和实效性随机对照试验(pragmatic randomized controlled trial,PRCT)。解释性随机对照试验是在理想条件下完成,干预措施要达到最佳治疗效应,对照组采用安慰剂,主要用于验证干预措施的效力(efficacy)。而实效性随机对照试验是在接近临床实践情况下完成,干预措施接近临床实践而不要求达到最佳治疗效应,对照组采用另一种临床实践常用的治疗方法,主要用于评价干预措施的效果(effectiveness)[10-11]。验证干预措施效力的研究一般采用ERCT,国际上关于针刺疗效是否是安慰剂效应的争论也主要源于这类试验的结果。因此,本文中的临床试验特指ERCT。本文中针刺方案充分性,指真针刺方案在多大程度上达到最佳治疗效应和假针刺对照多大程度上降低物理治疗效应。

针刺是多因素组成的复杂干预措施,其疗效受诸多因素影响,如穴位特异性、针刺手法、针感、留针时间及治疗频次等针刺相关因素[12-14],个体化诊断及治疗[15-16],以及针刺治疗师资历[17]等。同时,由于针刺干预的这些特点,其假针刺对照的设计成为困扰研究者难题,常见的浅刺或非穴针刺对照并非完全无效[18],且不同类型对照组对结果的影响不同[19],难以设计无物理治疗效应同时便于对患者实施盲法的安慰剂对照组。

鉴于上述因素的影响,在系统评价/meta分析或对针刺RCTs结果解读时,如不对针刺方案和假针刺对照方案进行评价,可能得不出可靠的结论,可能出现:针刺RCTs方法学质量很高,即随机、盲法、失访及结果报告均很规范,但由于不充分的针刺干预(针刺方案治疗未达到最佳治疗效果)与不充分的对照干预(假针刺对照组有一定的物理治疗效应),从而导致二者之间差异无统计学意义,出现假阴性结果。依据这种假阴性结果来否定针刺疗效甚至对针灸理论提出质疑是不合理的[20]。

2  临床试验中针刺方案充分性评价的研究现状及其局限性

2.1  系统评价/meta分析中针刺方案充分性评价的研究现状及其局限性

系统评价/meta分析一般有7个步骤:①提出并形成问题;②检索并选择研究;③对纳入研究的质量进行评价;④提取资料;⑤分析并形成结果;⑥对结果的解释;⑦系统综述的改进与更新[21]。目前,临床试验中针刺治疗方案和对照组方案变异较大,且二者直接影响临床试验结果。因此,除了上述7个步骤之外,有些针刺系统评价/meta分析还开展了针刺方案充分性评价。由于目前该类评价尚未达成共识,方法各异,笔者将从评价时点、评价形式、评价内容、评价标准、评价者、盲法评价、评价方法的制定依据和评价结果的应用等方面对其进行简要综述。

针刺系统评价/meta分析中,对针刺方案充分性评价常见于以下两个环节:①纳入研究的质量评价[22-32]:多数研究在该环节进行针刺方案充分性评价;②数据分析:制定针刺方案充分性标准作为纳入meta分析[33]或开展亚组分析/异质性检验界值的标准[34]。

针刺方案充分性评价方法以4种形式呈现:①作为方法学质量评价量表的一部分[22-24,27],如Ter等[22]针刺治疗慢性痛的meta分析,以方法学质量评价量表评价针刺RCTs质量,该量表包括4个方面:预后可比性、充分干预、充分的结局测量及资料完整性。其中,“充分干预”是对针刺方案充分性的评价。②针刺方案总体质量评价[25-26,30,32];③对针刺方案的某些组成部分进行评价:如从穴位选择、治疗次数、针刺技术和针灸师经验等方面评价针刺方案充分性[28-29,31]。④异质性检验界值标准,即制定一定的针刺方案标准作为针刺维度异质性检验的界值标准[34]。

针刺方案充分性评价内容主要是影响针刺疗效的因素,内容涉及:①针刺治疗方案类型:标准化针刺治疗方案(所有患者采用同一治疗方案)还是个体化针刺治疗方案(辨证治疗方案)[25];②针刺治疗方案细节:穴位选择[22-24,28-29,31,33]、腧穴位置[25]、针刺深度[25]、针刺技术[25,28-29,31]、留针时间[22-25]、得气[25,33]、治疗间隔时间[22-24,33]、治疗次数[22-24,28-29,31,33]、治疗周期[31];③针灸师经验[28-29,31];④对照组:日常治疗作为对照组[22-24]、类型(非治疗腧穴、非穴位)[25]、安慰剂对照及其描述和合理使用[27]、假针刺合理性[28-31]。

现有研究中针刺治疗方案充分性的评价标准多由研究者自行拟定,主要有以下几种:①按照拟定的评价内容,评价者根据自己经验和知识判定,给予一定评分或充分性评价[27-28,30-31];②以是否报告相应内容作为评价标准,不涉及治疗方案充分性的评价[22-24,27];③根据与评价者针刺治疗方案的相似度进行评价[32]。

多数研究中针刺方案充分性评价由有经验的针灸师[25-26,28-32]开展,少数为系统评价作者进行[27]。有研究采用盲法评价,即仅给评价者提供研究对象和针刺干预措施相关信息,而不提供研究结果和文献基本信息[29-31]。

针刺方案充分性评价方法的制定依据各不相同,有依据临床试验研究设计、实施和报告原则[22-24];有修改已有研究方法者[27-29,31-32];有依据文献研究结果者[33-34];有的为自拟[25,32]。针刺方案充分性评价结果多用于亚组分析[26,28,30-31,34]或敏感分析[29]的依据,或作为纳入meta分析的标准[33]。

上述研究的开展足以说明在针刺系统评价/meta分析过程中进行针刺方案充分性评价的必要性和重要性。

2.2  针刺方案充分性(质量)评价方法的制定现状及其局限性

1998年,有学者开始尝试制定RCTs中针刺治疗充分性评价方法,此后鲜有研究,直至2011年,澳大利亚学者采用德尔菲法制定临床试验中针刺质量评价量表。然而,这两种评价方法由于其研究方法或研究量表内容的局限性,至今尚未能进行推广应用。

1998年,White等[6]制定了背痛试验中针刺方案充分性的评价方法,包括3步:①制定评价清单,包括13个条目:患者姿势;针刺数目;针具规格及厂家;穴位选择的理论与依据;标准穴位(国际标准穴名),非标准穴位则需详细描述部位;单双侧;针刺深度;刺激(如手针,电针,灸法)强度和持续时间;针感;留针时间;频次和总次数;合并治疗;治疗后变化。②根据上述评价清单,评价者判断是否有足够信息。③如有足够信息,评价者采用视觉模拟评分法(VAS)进行评价。该研究的局限性不仅在于其研究方法不规范,即该评价方法由研究者自拟,未采用系统的量表制定方法,而且其评价者间一致性较低(评定者间信度ρ=0.33),评价清单内容未涉及针灸师资历和对照组评价。

2011年,Smith等[7]采用德尔菲法制定临床试验中针刺质量评价量表,该量表包括14个维度,26个条目,涉及研究设计、针刺细节、穴位定位、针刺操作等方面。经信度[35]检验发现:该量表各条目信度得分变异较大且评价者之间一致性程度不高,经对原量表删除合并后变为11个维度,16个条目,并给每个条目赋予一定分值,合计23分。该研究采用的量表制定方法规范,但该评价量表内容存在如下局限性:①该量表的前5个条目(清楚描述研究对象、清楚描述干预措施、清楚描述对照组、清楚描述结局指标和研究设计适合研究问题),不属于针刺方案质量评价内容,属于报告规范范畴及对研究设计合理性的评价;②不涉及对照组效应评价;③留针时间、治疗频次及电针参数等影响针刺疗效的条目均由于未达成共识而被删除;④共识范围较小,参与共识的专家人数较少,其结果影响了量表的代表性。

综合上述两类研究可见,对临床试验中针刺方案充分性(质量)进行评价已得到学者们的广泛认可。但临床试验中针刺方案充分性的评价方法及其制定方法,目前尚未达成共识。

3  思考与建议

以往关于临床试验中针刺方案充分性评价主要囿于针刺方案细节,如固定方案/个体化方案、穴位选择、得气、频次、治疗次数等,而较少关注针刺方案制定的依据、方法及其成熟度。针刺方案充分性评价的关键在于判断真针刺方案是否达到最佳治疗效应,假针刺对照方案是否最大程度降低物理性治疗效应,仅是单纯安慰剂作用。真针刺方案能否达到最佳治疗效应,除了针刺方案本身外,还涉及针刺方案的制定及针刺方案实施两个方面。如何针对上述内容开展评价,笔者根据目前针刺临床试验中存在问题及评价研究现状提出以下建议。

3.1  根据不同针刺类型分类评价

虽然针刺起源于中国,随着其在世界各地发展,逐渐分化为日本针刺、西医针刺等,如日本针刺具有浅刺的特点,西医针刺选穴重视神经节段分布或扳机点选穴,所据理论及其治疗特点与传统中医针刺有异。Price等[36]提出,中医针刺与西医针刺相比,二者在理论基础、病因、诊断、治疗原则及治疗机制,治疗方式及结局指标等方面不同。因此,对针刺RCTs进行评价时,应参考STRICTA针刺类型的报告条目[37],按照中医针刺、日本针刺、韩医针刺、西医针刺、五行针刺及耳针等类型,分类评价针刺RCTs,不应将其笼统地归为针刺疗法。同时,针刺RCTs的结论,应针对研究中的针刺类型而得出限定性结论,如西医针刺或中医针刺本方案对某病有效/无效,而非泛化为针刺有效或无效[16]。至今鲜见有临床试验验证传统针刺疗效[38],但在结论中却通常将其扩展至针刺疗法,从而否定穴位特异性和针刺技术等传统针刺理论。

3.2  依据不同针刺类型的治疗特点进行评价

针对不同针刺类型,应采用反映其自身治疗特点的方法进行评价。比如,在中医针灸临床实践中,通常根据中医诊断进行个体化选穴和采用不同针刺补泻方法,评价时应体现该特点[39]。Price等[36]认为采用明确的针刺类型的临床研究,更有可能得出令人满意的研究结论,研究报告中要提供足够信息以证明其使用针刺类型以便他人对其进行评价,并根据中医针刺与西医针刺不同特点,尝试制定了判断有效中医针刺与西医针刺类型的指南。

然而,Vickers等的单个病例数据meta分析[9,40]结论是针刺治疗效应与针刺特征无关。该研究结论有悖于针刺临床实践,原因主要在于纳入原始研究存在一定问题,如纳入原始研究没有辨证治疗者,治疗频次没有超过每周2次者,治疗次数多为6~15次,这些与临床实践不符。然而,该meta分析中,针刺RCTs的质量评价仅对分配隐匿和盲法进行评价,未对针刺方案充分性进行评价。这种情况下,其研究结论不具有外推性,应仅局限于这些研究条件下。因此,在进行针刺meta分析时,若采用反映针刺类型治疗特点的评价工具对针刺RCT进行评价,则其结论更能反映临床实践。

3.3  对针刺治疗方案的成熟度进行评价

药物临床试验一般按照Ⅰ、Ⅱ、Ⅲ期的顺序实施,而针灸临床研究尚无广泛推行的相应规定。若针刺临床试验在未开展相应前期研究基础(Ⅰ、Ⅱ期试验)时,直接开展大样本验证性RCT研究(Ⅲ期试验),其针刺治疗方案可能尚未成熟,以此用于评价针刺疗效,其研究结果则值得商榷。如,2018年发表在JAMA上的针刺对体外受精患者活产率效果的RCT研究[41],其研究结论是“不支持使用针刺改善体外受精患者活产率”,该研究所采取的治疗方案虽是通过专家共识取得,但其前期的预试验结果[42]及专家共识[43]均提示3次针刺治疗方案的剂量不足,该研究并未增加治疗剂量而继续开展大样本研究,不可避免地得出阴性结果。针对类似研究进行质量评价时,若仅评价研究的方法学质量而忽略治疗方案成熟度的评价,则不能反映针刺临床实践。因此,针刺治疗方案成熟度的评价是针刺方案充分性评价的重要方面。

2014年,中国针灸学会发布了《针灸临床研究管理规范》,提出针灸临床研究应采取阶梯递进的研究方法,依据针灸干预方案的成熟度,将针灸临床研究分为干预方案的临床发现阶段、优化完善阶段、验证阶段与临床推广应用与再评价阶段[44]。目前,国外大样本针刺RCTs多为验证针刺效力,但其针刺治疗方案尚未经过临床发现和优化完善阶段,而直接开始验证疗效,这有悖于临床研究一般规律。劳力行等[45]明确提出验证针灸效力,应遵循美国食品药品监督管理局(FDA)的分期临床试验方法,通常先开展Ⅰ、Ⅱ期临床试验,基本明确针刺方案后,再开展大样本针刺临床试验验证其疗效。

如何开展针刺RCT治疗方案成熟度评价,目前尚未见有关的评价方法。根据《针灸临床研究管理规范》[44]及针灸临床研究设计相关研究[45],对于验证针刺效力的RCTs,成熟度评价应判断治疗方案是否有临床实践基础、观察性研究和/或小样本研究支持,是否开展了治疗剂量、结局指标、随访时间及安全性研究。这些判断基于针刺RCTs研究报告或其方案报告内容,因此也对针刺RCTs研究报告或其方案报告提出新的要求,应将相应内容进行规范报告。

3.4  根据研究目的评价对照组合理性

对照组选择是针刺RCTs研究设计的难题之一,研究中常出现对照组设计不合理的问题[46]。针刺临床试验中对照组分类方式繁复多样,如:非治疗组、非刺入假针刺组、刺入假针刺组、阳性治疗组[19,47]。研究表明,物理性安慰剂效应大于药物安慰剂效应[48],且不同类型的针刺对照组产生不同效应量从而影响研究结论[9]。不同类型对照组适用于不同研究设计,研究问题决定了对照组的选择[49]。因此,对针刺RCTs方案充分性评价时,对照组合理性评价也是重要方面。

如何开展对照组合理性评价,目前尚未见相关评价方法。既然研究问题决定了对照组的选择,对照组合理性评价应基于此进行判断。首先,明确研究问题;其次,判断对照组的类型、效应、作用及其适用条件;最后,判断对照组的设置是否与研究问题相符。

3.5  评价方法的形式应基于维度评估

针刺治疗是受多因素影响的技术性很强的复杂干预,同时由于疾病种类及考察结局指标的不同,很难对治疗穴位的数量、治疗频次及疗程等影响因素逐一进行定量评价。因此,临床试验中针刺方案充分性评价工具的制定原则及形式可参考Cochrane偏倚风险评估工具的制定[50],遵照以下原则:①不采用量表或清单形式,而是基于维度评估,即对影响针刺方案的不同方面进行严格独立评估。②只纳入影响针刺方案疗效的因素,不考虑内部真实性和外推性。③制定各维度或条目的判断依据及判断用语。④维度选择基于针刺治疗理论和实证证据。

总之,临床试验中针刺方案充分性评价工具的制定是亟待开展的研究,评价内容及形式可从上述方面考虑,具体的制定方法可参考现有比较成熟的报告规范[51]和评价工具的制定方法。(选自《中国针灸》杂志2019年第三期)

扫一扫即可下载客户端APP