条文本

下载PDF

新方法提高返流性疾病的诊断的准确性
免费的
  1. P Moayyedi1,
  2. J达菲2,
  3. B德莱尼2
  1. 1胃肠病学部门,麦克马斯特大学,加拿大安大略省
  2. 2初级保健部门& General实践,伯明翰大学,英国伯明翰
  1. 通信:
    P Moayyedi教授
    胃肠病学部门,麦克马斯特University-HSC 4 w8,西方主要街1200号,汉密尔顿,安大略省,加拿大L8N 3 z5;evanslmcmaster.ca

文摘

症状诊断的准确性gastro-oesophageal反流病(GORD)是由缺乏复杂的黄金标准测试。统计技术等潜在的类和贝叶斯分析可以估算准确率没有金本位的症状。这两种技术都需要三个独立的诊断测试。潜在类别分析没有假设的性能测试。贝叶斯分析是有用的,当其他测试的准确性。应该使用这些统计技术在未来验证GORD症状问卷与内镜相比,食管pH值监控和应对质子泵抑制剂治疗。研究评估GORD症状通常是在二级护理。普遍的GORD在初级保健会降低,这可以减少症状的阳性预测值。会有一些偏见的类型的病人被诊断和这通常会减少症状的特异性诊断。

  • 诊断准确性
  • 贝叶斯分析
  • gastro-oesophageal返流性疾病
  • 潜在类别分析
  • 阳性预测值
  • GORD gastro-oesophageal返流性疾病
  • LCA,潜类别分析

来自Altmetric.com的统计

请求的权限

如果你想重用任何或所有本文的请使用下面的链接,这将带你到版权税计算中心的RightsLink服务。你将能够获得快速的价格和即时允许重用内容在许多不同的方式。

总结

等症状的胃灼热和返流被认为是重要的诊断gastro-oesophageal反流病(GORD)。这些症状可以被视为一个诊断测试的GORD和招募病人一些试验的基础和回流的流行疾病的流行病学调查。反流症状的诊断准确性对这些研究的解释很重要。本文将讨论相关问题的评估诊断GORD症状的疗效。

表达式的诊断准确性

诊断测试的准确性可以表示为敏感性和特异性,或作为阳性和阴性预测值。的方法计算这些指标表1中给出。敏感性问:“如果一个病人的疾病,测试将会积极的概率是多少呢?“而特异性是问:“如果病人没有疾病,测试负”的概率是多少?然而是临床医生想知道:“如果测试是积极的,病人在疾病的的概率是多少?”或“如果测试是负的,什么是患者没有疾病的概率”?这些问题是由阳性和阴性预测值分别回答。这些诊断指标统一使用的积极和消极的可能性比来自测试的敏感性和特异性(表1),可以用来计算阳性和阴性预测值是否已知疾病的患病率。1

表1

计算不同的诊断指标

不同人群的诊断准确性

流行疾病的诊断准确性的影响

流行疾病的不同在不同的设置。通常一种疾病是罕见的在普通人群中变得越来越普遍,病人从初级到二、三级保健设置。阳性和阴性预测值是最相关的临床诊断指标,但这些变化与疾病的患病率。阳性预测值减少疾病的发病率下降和阴性预测价值减少疾病的发病率上升的人口。返流症状有一个假想的例子的敏感性和特异性为80%,阳性预测值从94%人群患病率为80%的GORD GORD人群患病率为20%的50%(图1)。反流症状可能,因此,会有较高的阳性预测值比初级保健在二级护理,相反,没有这些症状会有更高的阴性预测值一般人群相比,医院设置。

图1

变化阳性预测值(PPV)以及阴性预测值(NPV)患病率的GORD返流症状与假想的敏感性和特异性为80%。

重要的是要注意,回流的敏感性和特异性症状不会改变任何的流行疾病,提供的是没有偏见的GORD病人的转诊和评价。因此,理论上反流症状的敏感性和特异性源于一个无偏二级护理研究可以应用于初级保健或普通人群。的阳性和阴性预测值在这些人口会有所不同,但这些可以使用似然比率计算如果GORD的患病率在这些设置。

频谱和选择性偏差的影响

回流的敏感性和特异性症状可以应用到不同的设置无论GORD的流行,是没有偏见的招募病人提供研究。然而,偏见是一个问题与许多流行病学研究和诊断准确性。有一长串的偏见会影响诊断结果的准确性研究2但其中最重要的是频谱和选择偏见。

光谱偏差发生在一个诊断测试是验证在一个人口,然后应用到另一个不同临床表现的疾病。3例如,反流症状评估的准确性在二级护理可能比初级保健或在普通人群中,病人被医院往往更严重的症状。通常是容易区分“疾病”和“无病”如果病人有更多的极端表现的障碍。这是不同于疾病患病率的变化。患者的绝对比例GORD不是问题,那么是轻微还是严重的分布GORD患者的疾病。如果患者更严重的症状被称为二级护理和症状的诊断准确性评估评估在这个环境中,这将增加灵敏度,减少反流症状的特异性诊断的GORD。4积极的和消极的可能性比率也将减少。4关于敏感性和特异性光谱偏见的影响通常不一样的流行对阳性和阴性预测值的影响,在极端情况下除外。例如,如果胃灼热的诊断效用评估患者只有显然可定义的典型症状,这可能有一个假想的敏感性为74%,特异性为90%。如果心痛是评估患者在一群不明确的症状,据估计,灵敏度会增加85%,特异性降至83%。4

选择性偏差发生在有一个协会之间的测试结果和被包括在研究的概率是验证测试。例如,如果初级保健医生诊断GORD只有感兴趣的病人出现上腹部/胸骨后的症状和患者的基础上罗马ⅱ标准,然后研究人口的大多数主要的心痛。从光谱偏差,这是微妙不同的患者有一个有意识的决定引用一个特定的症状而非现象,疾病通常是更严重的光谱在二级初级护理。如果有明显的选择病人的基础上占主导地位的心痛,这将会稍微增加灵敏度,但将大大降低这个症状的特异性诊断的GORD。4,5例如,右下腹压痛的特异性的诊断急性阑尾炎在初级保健从89%下降到16%,三级护理。5因此,有反流症状的诊断价值的危险可能是沿着转诊路径“使用”。

是很重要的需要注意的频谱和选择性偏差的影响在GORD返流症状的准确性,但这必须保持在透视图。是完全可以接受的评价反流症状选择数量来评估他们的诊断准确性。病人愿意接受内镜和pH监测可能不同于一般人群,但务实,几乎没有可以纠正这个问题。最好是仔细评估反流症状诊断的敏感性和特异性的GORD选择组比不这样做。结果可以应用于一般人群,尽管敏感性可能增加和特异性可能减少在此设置。进一步研究反流症状的效用评估病人的结果(例如,响应质子泵抑制剂治疗)就可以进行。最后,有必要注意,即使成功地识别GORD症状,有些病人仍将被称为二级护理。如果转诊过程很大程度上基于反流症状的特异性将大幅下降。这未必是一件坏事如果返流症状的诊断价值最大化。如果医院临床医生只提到病人的症状并不是有用的疾病的预测,这是一个适当的过滤,因为它通道病人需要更多侵入性测试只能在转诊中心,如内镜和pH值24小时监控。

“黄金标准”的问题

到目前为止,我们已经假定我们可以比较反流症状的“黄金标准”测试和具体100%敏感。这种类型的测试很少存在于临床实践,但往往有一个单独的测试充分准确的作为参考标准。即使这不是用于诊断的GORD,内镜和pH监测不够敏感和特定的使用作为一个参考标准。缺乏至少一个参考测试评估的准确性受反流症状诊断GORD,然而,这不是一个独特的问题。精神病医生作出诊断,没有实验室的好处,x射线或病理报告。缺乏任何参考标准的精神克服了使用技术,避免需要与一个准确的测试。这些技术可以大致分为潜在类别分析(LCA)6和贝叶斯分析。7已经广泛应用于精神病学8和其他学科一样,9但是,到目前为止,还没有应用于评价的GORD症状评估的准确性。

潜在类别分析

传统的回归技术描述之间的关系观察到的变量。例如,逻辑回归模型可能表明吸烟与肺癌之间的关系独立于其他变量的模型中,如饮酒、性、或社会阶层。任何变化的数据在这个模型中,假设不是解释这些观察到的变量随机发生。LCA假设的存在未被注意的分类变量,将人口的利益划分为类(因此“潜在的阶级”这个词)。10与一组观察到的变量成员的人口会有不同的反应取决于它们所属的潜在的类。这种技术可以应用于问题的诊断测试,未被注意的分类变量是“疾病”或“缺席”。观察到的变量通常可以诊断测试的结果,没有一个人是一个黄金标准。LCA可以应用,试图将人口划分为“true”的优势与不足。这种方法已被证明至少需要三种不同类型的诊断测试。11LCA可以应用于获得病人的比例在每个潜在的类(即估计病变或免费的疾病),和每个诊断试验的敏感性和特异性。计算机密集的统计方法用于获得标准的错误估计参数和数据的鲁棒性,在一定程度上依赖于样本量。

LCA假定诊断测试产生的结果之间的联系只从个人的疾病状态。因此,重要的是应该没有其他形式的变量之间的依赖关系进入一个LCA模型。12这种依赖的一个例子是当一个测试的存在与否关系到一个特定的症状,而另一个其严重性或频率。这些测试将不适合一起进入到LCA。

这种类型的分析被应用到这些不同的问题,抑郁症的诊断,8内脏利什曼病,13沙眼衣原体,14和遗传病的疾病,15但是我们只知道一个应用程序与胃肠病学有关。16本文应用LCA的诊断幽门螺杆菌感染和报道的敏感性和特异性组织学大约95%。16这个结果随后同意从黄金标准的其他四个测试结果。17

贝叶斯分析

标准的统计检验假设没有之前预期的研究结果,在坚持科学的原则是目标。统计分析数据以这种方式被称为频率论的。这种方法受到质疑,因为在大多数科学实验,有一个期望的结果将从先验知识,应纳入分析。18流行病学研究表明吸烟与肺癌之间没有联系,例如,不会动摇信念的科学界的两个密切相关。托马斯·贝叶斯在200年前提出的一个理论,试图解决这个问题。贝叶斯定理是一个公式描述了我们现有的信仰(描述为概率分布)改变了新的研究数据。19信仰在新信息的分布可用被称为先知先觉,这些新信息同化后的后验。20.先验分布可以从现有的研究证据,获得专家意见,或将不提供信息的“(平面分布,并不影响分析)。后验分布是描述为手段(或比例)和可信区间。可信区间是贝叶斯置信区间。

绝大多数的频率论的而非贝叶斯统计学家,直到最近,后者需要极其复杂的计算。强大的计算机的出现,给了贝叶斯新生,因此软件,如WinBUGS(贝叶斯分析使用吉布斯抽样,MRC生物统计学,剑桥,英国;http://www.mrc-bsu.cam.ac.uk/bugs/winbugs/contents.shtml),开发执行这种类型的分析。这个软件使用一个迭代“重采样”技术构建“后”分布。这个周期的采样值重复成千上万次,直到“收敛”,也就是稳定新估计基于新的数据。

贝叶斯分析诊断测试评价的优点是,不需要参考标准。先验和后验分布之间的关系形成允许不完美的参考标准以同样的方式对LCA如前所述。又一组观测数据组成的至少三个不同的,独立的,需要测试相同的主题。在LCA贝叶斯分析的优点是,先前知识的诊断测试的准确性GORD可以合并。非常高的特异性与灵敏度相对较低(),也因此,被分配到内镜和80 - 90%的敏感性和特异性pH监测。贝叶斯统计的缺点是计算是复杂的。如果对其他诊断方法的准确性,LCA会给类似的答案,更简单。

结论

周围有一个很大的困惑在诊断GORD返流症状的准确性。未来的研究应该运用LCA或贝叶斯分析克服没有黄金标准的问题。这将给一个更现实的估计的准确性回流GORD诊断的症状。

引用

相关的文章