条文本

下载PDF

食道炎药物治疗试验中使用的症状结果的系统回顾
免费的
  1. N沙玛1
  2. C唐纳兰2
  3. C普雷斯顿2
  4. B德莱尼3.
  5. G Duckett1
  6. P Moayyedi13.
  1. 1英国伯明翰温森格林达德利路市医院消化内科
  2. 2消化系统疾病中心,利兹总医院,大乔治街,利兹,英国
  3. 3.英国伯明翰大学初级护理临床科学大楼
  1. 通信:
    P Moayyedi教授
    麦克马斯特大学消化病学分部,hsc 4W8, 1200 Main Street West, Hamilton, Ontario, Canada L8N 3Z5;evanslmcmaster.ca

摘要

症状是胃食管反流病临床试验测量的重要结果,但症状评估的最佳方法尚未正式评估。作者进行了一项系统综述,以评估如何评估反流症状,以及这些症状与食管炎愈合和复发的相关性。

  • 胃食管反流病
  • 食管炎的愈合
  • 胃灼热
  • 症状的频率
  • 症状严重程度
  • 胃食管反流病
  • PGWBI,心理总体幸福指数
  • SF-36,简称36

数据来自Altmetric.com

请求的权限

如果您希望重用本文的任何或全部内容,请使用下面的链接,该链接将带您到版权清除中心的RightsLink服务。您将能够快速获得价格和即时许可,以多种不同的方式重用内容。

总结

检索了Cochrane对照试验登记、MEDLINE、EMBASE和CINAHL电子数据库,以寻找反流性食管炎药物治疗的随机对照试验。我们联系了该领域的专家和制药公司,以获取任何未发表的合格试验的信息。预先定义的适格性和效度标准决定了本分析中纳入的研究。根据所使用的症状评估方法提取数据,包括量表、数据收集方法、评估持续时间、评估的个体和整体症状、主要结果衡量指标是症状减轻还是无症状、评估的症状类型以及症状的频率和严重程度。根据这些不同的症状措施,成功治疗的患者比例与食管炎治愈的患者比例(初始治疗研究)或食管炎未复发的患者比例(维持研究)进行了比较。结果主要以L 'Abbé图的形式进行评估。

数据可从140个合格试验中提取。无症状或轻微症状与维持治疗期间食管炎愈合和无症状相关,而症状减轻则高估了治疗效果。在规定的时间段内测量症状的试验表明,症状状态与食管炎愈合和复发的相关性优于那些没有定义时间段的试验。胃灼热是预测食管炎愈合最有用的症状,但L 'Abbé图提示反流和吞咽困难也可获得额外的信息。

已发表的反流性食管炎药物治疗试验使用了广泛的症状结局指标。与食管炎状况的比较表明,所使用的一些措施是次优的。用于获取症状数据的方法也各不相同,并且经常与从症状评估过程的正式研究中得出的一般原则不一致。

介绍

评估药物治疗对反流性食管炎患者疗效的试验以食管炎的愈合作为主要结果衡量标准。虽然存在许多食管炎分类,但最近在食管炎严重程度分级的关键评估和标准化方面取得了进展,以便可以比较不同研究的结果。1最近,反流引起的症状的主要影响得到了更好的认识,确实,这些是内窥镜检查阴性反流疾病试验的主要结局指标。2不幸的是,在胃食管反流病(GORD)的评估中,还没有尝试优化和标准化症状评估方法。因此,比较研究是困难的。试验测量了单一症状,如胃灼热,或评估了整体上消化道症状。治疗成功被定义为主观症状减轻或完全没有症状。在评估症状的时间段、使用的量表以及信息是否来自日记卡、自我填写的问卷或调查员访谈等方面也存在差异。这些问题与评估GORD初始治疗和缓解期患者后续维持治疗效果的试验有关。

我们目前正在进行科克伦系统评价3.4对GORD的药物治疗效果进行了研究。这些综述的主要目的是确定最有效的治疗反流疾病。在本研究中,我们使用这些数据库来获得这些试验中使用的结果测量的全面概述,并检查其中哪些似乎是最合适的。为此,我们将不同症状评估方法的结果与食管炎愈合和预防复发的参考结果进行了比较,这是目前成功治疗GORD的最客观终点。

方法

本研究使用了两项关于反流性食管炎短期治疗的系统综述收集的数据3.并对食管炎患者进行长期维持治疗。4尽管后一篇评论4还整理了内窥镜检查阴性反流疾病患者的数据,该患者组的数据未用于本分析。

随机对照试验来自Cochrane对照试验注册、MEDLINE(1966-2000)、EMBASE(1988-2000)和CINAHL(1982-2000)。使用的搜索词已在其他地方概述。3.

由搜索策略确定的论文由两名研究人员使用预定义的标准进行资格审查(见下文)。研究人员最初的判断对他们的同事得出的合格性结论是盲目的。两位研究人员之间的任何分歧都可以通过讨论论文来解决。符合条件的试验使用预先设计的数据提取表格进行数据提取,由第二位审查员进行检查。

短期试验

食管炎患者的初始治疗试验如果在治疗开始后2-12周评估症状,则有可能符合条件。评估的干预措施为质子泵抑制剂、H2受体拮抗剂,原动力学,或蔗糖酸盐,这些相互比较或与安慰剂比较,有或没有抗酸剂。

长期或维护试验

长期试验符合纳入条件,前提是在初始治疗已治愈反流性食管炎的患者中进行维持治疗的随机对照试验。4允许使用与初始治疗相同的药物治疗,患者必须接受至少12周的连续治疗。症状评估必须在12周和52周内进行。

统计分析

根据所使用的症状量表、数据收集方法、评估持续时间、是否使用个别症状或整体症状、症状减轻或无症状是主要结果衡量标准、评估的症状类型、是否评估频率和/或严重程度,以及是否使用生活质量和患者满意度衡量标准来提取数据。根据这些不同的症状措施,成功治疗的患者比例与食管炎愈合的患者比例进行了比较,或者在维持治疗的情况下,与食管炎未复发的患者比例进行了比较。结果以L 'Abbé图的形式表示5(图1),一种主要用于探索试验间异质性的技术。在本研究中,该技术已被用于图形显示症状测量和无食管炎之间的关系。每个方框代表每次试验中的单一干预。例如,一项评估安慰剂与质子泵抑制剂疗效的试验将在图上生成两个方框。盒子的大小与愈合比例的标准误差的倒数有关,因此,代表了研究的大小。对角线代表等值线。如果一个方框落在这条等值线上,则表明两种结果在每个干预组中所占比例相同。如果一个方框在线以下,则表明对照参考结果(总是在纵轴上绘制-例如,食管炎状况)进行测试的结果测量高估了治疗效果。相反,如果方框出现在等值线上方,与参考结果相比,该特定结果低估了治疗效果——例如,食管炎状况。

图1

L 'Abbé食管炎愈合和无全面反流症状图。

结果

短期试验

在167项可能相关的试验中,126项符合条件。数据提取自1086 -113本次综述的论文。在未纳入的试验中,有8项试验所需的数据无法从原始文本中提取。其他10个试验被排除在外,因为它们在写作时没有作为英文文本发表。只有11/108篇(10%)的论文在方法中明确陈述了主要症状结局。9,21,25日,26日,49岁,64年,65年,81年,85年,88年,107从论文中可以推断出的主要结果如表1所示。只有一篇论文21使用一份有效的问卷作为主要症状结局评估的一部分。单独评估或作为整体症状评分的一部分,最常见的症状是胃灼热(n = 93)、反流(n = 69)、吞咽困难(n = 55)和胃脘痛(n = 39)。其他症状包括呕吐(n = 22)、咽痛(n = 20)、恶心(n = 19)和打嗝(n = 15)。

表1

主要症状结局*由本系统综述中收录的论文推断

在71项试验中,用改良李克特量表评估症状严重程度和/或频率。最常用的是4点修正李克特量表(n = 53),其次是5点量表(n = 12),然后是3点量表(n = 4), 6点和7点量表各只在一次场合使用。7项试验使用序号标度,12项试验使用视觉模拟标度(均使用100 mm长度标度)。53项试验提到了使用患者日记卡,但研究者访谈也经常被暗示,不清楚报告的最终结果是与患者有关还是与研究者评估有关。

六项试验正式评估了生活质量,其中两项没有使用有效的问卷。两项试验测量了一般生活质量,一项是心理一般幸福指数(PGWBI),另一项是简短形式36 (SF-36)问卷。两项试验报告了患者满意度。

作为结果衡量指标,整体症状减轻与无症状

二十五次试验7,12,32,33岁的37岁的42 -46岁,48岁的53岁,55岁,57岁的63年,64年,71年,89年,96年,99 -102年,106年,112报告无全面症状和食管炎愈合。作者通常没有在他们的整体评估中定义哪些上消化道症状被评估。这些症状都包括胃灼热和至少一种其他上消化道症状(通常是反流)。根据L 'Abbé图(图1),有相似比例的患者无症状且食管炎愈合(图1),尽管在治疗效果较小时存在整体症状缺失低估食管炎愈合的趋势(图1)。我们还确定了13项试验33岁的37岁的41岁的51岁,55岁,63年,88年,91年,94年,96年,101年,102年,105据报道,总体症状减轻和食管炎治愈。与食管炎愈合相比,整体症状缓解高估了对治疗的反应,因为大多数试验位于l 'Abbé图“等值”线的下方和右侧(图2)。因此,根据该分析,整体症状消失比症状减轻更能预测食管炎愈合。

图2

L 'Abbé报告症状减轻和食管炎愈合的试验图。

个体反流症状作为结局指标

我们确定了31个试验26日,31日,32,35岁,39 -41岁的46 -49岁,51岁,58 -62年,64年,65年,67 -72年,90年,93年,96年,97年,99年,102报告无胃灼热和食道炎愈合。在广泛的治疗效果中,胃灼热和食管炎愈合的患者比例非常相似(图3)。在20项试验中,无反流也显示出与食管炎愈合的良好相关性26日,31日,39岁,40岁,46岁,47岁的50岁,61年,64年,65年,68 -72年,90年,93年,96年,97年,99报告了这两种结果(图4)。然而,无反流倾向高估了食管炎的愈合(图4),这一发现与20项试验相似26日,31日,39岁,40岁,46岁,47岁的50岁,61年,64年,65年,68 -72年,90年,93年,96年,97年,99其中,无胃灼热可与无反流进行比较,因为后者倾向于略微高估对治疗的反应(图5)。然而,与反流相比,有少数试验中胃灼热的测量高估了对治疗的反应,因此后一种症状可能在某些情况下有用(图5)31日,39岁,46岁,47岁的60岁,62年,69年,70年,72年,90年,97年,99年,102评估无吞咽困难和胃灼热作为结果。当使用无吞咽困难时,与无胃灼热相比,这高估了治疗反应(图6)。

图3

L 'Abbé报告无食管炎和胃灼热的试验图。

图4

L 'Abbé报告食管炎愈合和无反流的试验图。

图5

L 'Abbé报告胃灼热和反流缺失的试验图。

图6

L 'Abbé报告胃灼热和吞咽困难缺席的试验图。

比较症状的频率和严重程度作为结局指标

关于症状频率或严重程度是否是GORD治疗的最佳衡量标准,目前缺乏相关信息。我们确定了两个试验35岁,38报告了症状频率、症状严重程度和食管炎愈合情况。与食管炎愈合相比,单是症状频率低估了治疗的疗效(图7)。症状严重程度与食管炎愈合密切相关(图8)。

图7

L 'Abbé报告症状频率和食管炎愈合的试验图。

图8

L 'Abbé报告胃灼热严重程度和食管炎愈合的试验图。

长期试验

在157篇可能相关的论文中,48篇是合格的,其中37篇可以提取数据。8,21,106年,107年,113 -145不合格的主要原因是研究只招募了内窥镜检查阴性的反流疾病患者。生活质量结果在三个试验中进行评估,其中两个使用PGWBI,第三个使用SF-36问卷。疾病特异性生活质量未被测量。只有一项试验记录了患者满意度。

符合条件的长期试验也用于评估症状复发的最佳定义。目前尚不清楚是否应在规定的时间内评估症状。关于复发是否应定义为任何症状的存在或中度甚至严重症状的发生,也很少有数据。我们确定了七个试验116 -122复发定义为出现任何症状(单独胃灼热或整体症状);这一指标与食管炎复发患者的比例有很好的相关性(图9)。所有这些试验还将症状评估的时间定义为1-7天。总共有六次试验8,115年,122 -125复发定义为在一段不确定的时间内出现中度至重度症状。这些试验低估了与食管炎复发相比的复发率(图10)。四个试验126 -129将复发定义为1-7天出现中度或重度症状;与无食管炎的患者相比,采用这一定义的患者缓解的比例相似(图11)。

图9

L 'Abbé维持试验图报告无症状和预防食管炎复发。

图10

L 'Abbé维持试验图,将中度/重度症状定义为复发(未说明评估时间),并预防食管炎复发。

图11

L 'Abbé维持试验图,将中度/重度症状定义为复发(在规定的时间内)和预防食管炎复发。

讨论

这是第一个调查和评估随机对照试验中用于获取症状数据的症状结局测量和方法的综述。这种全面、系统的文献综述为症状的最佳评估提供了新的见解。迄今为止,试验中使用的方法差别很大。在某些情况下——最重要的是,提供给患者的应对方案的数量——目前的做法并没有反映出被认为是最佳做法的做法。数据表明,在短期试验中,无反流症状比症状减轻更能预测食管炎的愈合。在长期试验中,症状的消失也与食管炎的缓解密切相关,尽管评估症状的时间周期似乎也很重要。在少量试验的基础上,测量反流症状的严重程度和频率似乎还有一个额外的优势。这些数据表明,最佳的评估将在一段时间内评估症状,并将治疗成功定义为不超过轻微症状(例如,在1周内评估反流症状,治疗成功定义为不超过1天/周的轻微症状)。

GORD药物治疗的临床试验通常选择内镜检查时胃灼热和/或食管炎为主的患者。因此,参与试验的患者的症状可能与初级保健中未选择的GORD患者无法完全相提并论。在对此类队列的数据进行全范围反流症状评估时,必须牢记这一点。有了这个警告,胃灼热似乎是最重要的症状,令人高兴的是,这与食管炎的愈合密切相关。没有胃灼热预示着没有其他反流症状,如反流和吞咽困难,尽管在少数试验中,这些症状存在于治疗后不再有胃灼热的患者中。因此,对反流和可能的吞咽困难的单独评估可能提供额外的信息。这种可能性得到了我们的数据的支持,这些数据表明,整体反流症状也与食管炎的愈合有关,并且可能是一种更保守的治疗成功的衡量标准,适用于低疗效的治疗。

大多数研究使用日记卡来评估症状,这可能是收集主观症状信息的最佳方法(见McColl页iv49-iv54147但是,通常情况下,没有提供关于这些数据中哪些是被利用的信息。当使用日记卡和研究者管理的症状问卷时,作者应该明确报告的是哪一种评估。改良李克特量表几乎总是用于收集症状严重程度的信息;这似乎也是最合适的方法。然而,重要的是,所使用的改良李克特量表的结构通常是次优的,因为在绝大多数研究中使用了4点量表,而数据表明6至7点量表更合适(见Wyrwich & Staebler Tardino页iv45-iv48148很少有研究评估生活质量,更少的研究包括对患者满意度的衡量。这些结果指标与患者、GORD的经历及其治疗有很大的相关性。未来的随机对照试验应解决疾病负担的这些方面。

我们的研究结果表明,与研究者评估相比,针对反流疾病的试验设计往往未能考虑患者自我报告症状的优越性。更多地使用稳健的、经过验证的、带有6到7个回答选项的自我报告问题,可以显著提高临床试验数据的质量。

一些注意事项适用于反流性食管炎临床试验综述。虽然我们评估了随机对照试验,但在分析中没有使用随机化过程,每个治疗组分别考虑。因此,所提供的信息是观察性的,而不是随机的、受控的数据。结果是在患者群体而不是个体中评估的,因此这种生态分析可能会受到生态谬误的影响。146例如,如果在一组患者中,50%的患者食管炎愈合,50%的患者没有胃灼热,这两种结果似乎完全一致。然而,有可能50%的食管炎愈合的病例都是在继续有胃灼热的患者中。当成功的结果在群体中所占比例很高时,这就不是什么问题了。因此,我们可以假设我们看到的基本上是同一个人。此外,个别患者的数据表明,症状消失是食管炎愈合的一个很好的预测指标,尽管两种结果之间存在10-20%的差异。42

食管炎的愈合被作为治疗成功的参考标准,与症状结果进行比较。这可能不是最好的评估结果,因为一些患者可以在没有糜烂性食管炎的情况下保持症状。149然而,食管炎是GORD的一个非常具体的标志,也是目前最客观的结果衡量标准。这一系统综述无法确定所有相关论文,因为它所依据的搜索只延伸到2000年。从那以后发表的论文不太可能对我们的结论产生任何重大影响。

尽管有其局限性,本系统综述提供了在药物治疗的随机对照试验中使用的症状结局测量的全面总结。我们的研究结果表明,有相当大的减少潜力,并指出了如何实现这一目标。

参考文献

相关的文章