条文本
文摘
目标检查预后可能重复的粪便血红蛋白浓度(F-Hb)测量在粪便免疫化学测试(合适)的筛查结直肠癌(CRC)。
设计预后模型。
设置荷兰二年生利用筛选计划在2014 - 2018。
参与者265 881名参与者配合完成三轮,负面测试结果(F-Hb < 47µg Hb / g粪便)轮1和2。
干预措施结肠镜检查随访参与者积极配合(F-Hb≥47µg Hb / g粪便)。
主要的结果我们评估预后模型检测先进瘤(一个)和CRC在第三轮,与预测,参与者的年龄、性别、F-Hb轮1和2,类别/组合/ F-Hb的非线性转换。主要评估标准包括:风险预测精度(校准)歧视的参与者和没有或CRC (optimism-adjusted C-statistics,区间0.5 - -1.0),危险分层的程度和C-statistics外部验证。
结果在研究参与者中,8806例(3.3%)有一个积极的健康结果,3254例(1.2%)有一个发现,557(0.2%)患了癌症。F-Hb浓度轮1和2是最强的预测结果,调整口服补液盐高达9.4 (95% CI 7.5 - 11.7) F-Hb最高的一类。风险预测与观察到的风险对于大多数参与者(校准拦截−0.008−0.099;坡0.982 - -0.998),和歧视的参与者和没有一个CRC C-statistics为0.78 (95% CI 0.77 - 0.79)和0.73 (95% CI 0.71 - 0.75),分别。预测风险的范围从0.4%到36.7%,从0.0%到5.5%的CRC的参与者。在外部验证,模型保留类似歧视的准确性(C-statistic 0.77, 95%可信区间0.66到0.87)和CRC (C-statistic 0.78, 95%可信区间0.66到0.91)。
结论参与者在较低和较高风险的未来或CRC可以准确地确定基于他们的年龄、性别和特别,之前F-Hb浓度。危险分层应考虑基于这些信息。
- 结直肠肿瘤
- 筛选
- 凳子上标记
数据可用性声明
数据可能会从第三方获得,不公开。本研究的数据不能公开,但访问可以要求通过Bevolkingsonderzoek荷兰语(BVO-NL)。分析脚本作者可以共享的要求。
这是一个开放的分布式条依照创作共用署名非商业性(4.0 CC通过数控)许可证,允许别人分发,混音,适应,建立这个工作非商业化,和许可他们的衍生产品在不同的协议,提供了最初的工作是正确地引用,给出合适的信用,任何更改表示,非商业使用。看到的:http://creativecommons.org/licenses/by-nc/4.0/。
来自Altmetric.com的统计
本研究的意义
已知在这个问题上是什么?
之前的两项研究发现消极的粪便血红蛋白浓度(F-Hb)之间有着紧密的联系在粪便免疫化学测试(适应)和随后的结直肠癌(CRC)。然而,没有研究正式评估性能和预后的临床效用模型包括来自多个负面的结果符合。
有什么新发现吗?
我们先进的肿瘤预后评估模型(一个)和基于参与者的年龄、性别和CRC F-Hb浓度从两届双年展轮。我们证明了,后续的模型准确地预测风险和CRC,歧视这些结果具有高度的一致性和允许临床有意义的危险分层。
它会如何影响临床实践在可预见的未来吗?
Risk-stratified健康筛查应考虑基于这些信息。
介绍
免疫化学粪便隐血试验,或者只是粪便免疫化学测试(合适)的粪便血红蛋白(F-Hb),是推荐的结直肠癌(CRC)的筛检试验。1F-Hb浓度在粪便样本建立诊断CRC的标志。2大多数利用每1或2年筛查项目邀请符合条件的个人,并使用测试定性:只有个人F-Hb浓度高于一个预定义的截止被称为后续结肠镜检查。3
在过去的十年里,几项研究使用定量符合挑战这种放之四海而皆准的方法。4 - 6这些研究报道剂量反应关系测量F-Hb浓度低于先进的积极性截止和检测结直肠肿瘤在随后的年。理论上,筛查项目使用定量符合可能提高了个性化的间隔和基于先验F-Hb浓度的否决。7然而,这种方法的成功取决于那些过去的结果预测未来的结果。误分类的个体较低vs先进的病变可以呈现个性化的筛选效率低下的风险更高。8
预测模型的性能通常是评估的准确他们估计风险(校准),以及在多大程度上他们歧视患者与不相关的结果(歧视)。然而,风险预测模型的预测性能使用之前F-Hb浓度是未知的。通知医生和政策制定者,我们评估这些模型的性能和潜在的临床效用在以人群为基础的情况下,使用信息从两轮双年展适合预测第三轮的筛选结果。
方法
筛查项目
这项研究是在荷兰进行CRC检查计划。该项目推出了从2014年到2019年,详细描述了其他地方。9总之,55 - 75岁年龄段的成年人接受适合邮寄(FOB-Gold;哨兵诊断,意大利米兰)。参与者消极的结果,也就是说,F-Hb浓度< 47µg血红蛋白每克粪便(µg / g), 2年后再次邀请。参与者积极适应结果(≥47µg / g)被称为结肠镜检查的摄入量。那些被认为有资格(见主要研究人口部分)收到一个邀请接受后续结肠镜检查的参与内镜中心。在结肠镜检查中,息肉切除和活检诊断为癌症不服从内镜切除。相关研究成果在项目被定义为性腺瘤(≥10毫米大小和/或绒毛组织学≥25%和/或高档发育不良)和CRC。参与者在结肠镜检查中发现的病变可能接受进一步治疗和监测根据荷兰指南;参与者没有相关病变10年后再次邀请符合筛选。
过程和结果质量保证
在当前的项目,评估适合包返回四个适合实验室之一。参与者的样本是不可靠的邮寄一个新的工具包。参与者通常7天内收到结果的信。参与者通常与一个积极的结果进行后续结肠镜检查进气的内镜中心15天内。通过认证的英国结肠镜检查的质量是有保证的,潜在的复审在肠道准备不充分的情况下。10损伤检测和去除在结肠镜检查被审查的病理学家训练区分相关的CRC前兆。所有适合实验室、内镜中心和病理学实验室认可,每年审计客观的质量标准。相关的计划跟踪性能数据ScreenIT,一个中央仓库这商店邀请日期、合适的结果,后续的结肠镜检查预约,和结肠镜检查和病理结果。
主要研究人群
在这项研究中,我们包含了个人参与连续3轮筛选从2014年1月1日到2018年12月31日(邀请日期),与消极适应第一和第二轮和第三轮的消极或积极的配合。我们排除了参与者积极适应第三轮在他没有完成后续进行结肠镜检查。通过国家筛查项目的设计,任何age-eligible个人被排除在筛查项目和研究先验。然而,最近的一次结肠镜检查,患者虚弱或高CRC风险(例如,那些与炎症性肠病,一个家庭或个人的历史CRC)被建议在信息信与他们的初级护理医师讨论筛选参与并为后续结肠镜检查通常被排除在外。
数据
本研究主要数据从ScreenIT检索。数据时间间隔后crc -适合(用于敏感性分析)检索从荷兰癌症登记处。先进的主要研究结果预测检测瘤(一个)或CRC在第三轮的筛选。一个是一个复合的结果包括先进的腺瘤和/或CRC。在这些病例中,有93.7%是组织学证实;人失踪后病理报告和分类是endoscopist审查。考虑因素包括参与者的年龄、性别和F-Hb浓度测量轮1和2,在µg / g。
分析
统计预测和结果之间的联系被表示为口服补液盐,使用皮尔逊的χ检测意义2口服补液盐测试原油(调整)和学生的t multivariate-adjusted口服补液盐(即那些从风险预测模型)。一般来说,统计关联和差异被认为是显著的低于5%概率阈值。
多元逻辑回归被用来预测结果符合第三轮的筛选。主要预测(F-Hb浓度),我们也认为是对数转换,平方,结合(总结),离散条件(类别的0,0.1 - -2.5,2.6 - -9.9,10 - 19.9,…,40 - 46.9µg / g),和与年龄和性别的交互,以允许非线性关系。类别包括0.1 - -2.5µg / g(加上0或2.6 - -9.9)检查是否浓度低于2.6µg / g (检测极限)预测,尽管浓度> 5%的误分类的概率为0µg / g。11选择不同的模型规范是独立制作一个和CRC主要结果和基于(1)统计模型规范测试,(2)模型的预测性能和(3)的临床有效性。更多细节的模型选择过程在线补充附录。
整体模型规范相比在统计学上使用了嵌套模型的似然比检验和考克斯non-nested试验模型。12
的预测性能被评估的模型校准和歧视的标准。13模型校准是评估使用校准块图形,显示预测的协议与100年观察到的风险人口子组排名下令风险评分(百分位数)。歧视是衡量接收机操作曲线下的面积或一致性统计(C-statistic)。C的价值- - - - - -统计的范围可以从0.5到1,0.5表示一个模型识别没有比机会,1代表完美的歧视的和不相关的结果。C-statistic > 0.75被认为有良好的区别的能力。调查不同预测的相对价值,我们比较C-statistics从完整的模型与简化模型包括年龄、性别和()的非线性转换第一或第二F-Hb浓度。模型内部验证使用引导和r = 500个样本,纠正了乐观的理由。14日15独联体也派生使用引导(r = 500)。
的临床面临有效性模型的预测评估通过检查绝对风险预测的分布按年龄,性别和F-Hb浓度,使用风险评分矩阵。预测已知被认为是有效的在展示积极的联系随着年龄的增长,男性性和F-Hb。
评估临床实用程序的第一步,我们检查危险分层提供了便利的程度预测模型。我们策划,为每个风险评分百分位,观察到的相对速度或CRC的检测与整体研究人群。此外,我们使用决策曲线分析定义的范围预测风险与潜在效用从risk-stratified筛选。16
敏感性分析
一些筛选学员目前的临床与CRC尽管负面的健康。17虽然我们的主要目的是预测结果在检查中发现,我们进行了灵敏度分析,包括这些间隔CRC病例(微分跟踪)。间隔crc在第三轮被定义为例诊断≤24个月之前从第二个适合邀请和第三邀请参与者否则会议研究入选标准;那些在第三轮被诊断≤24个月从第三适合评估日期(中位随访190天)。我们重新评估模型的歧视。我们还将这些情况下的风险分数与控制和筛查出CRC情况下使用箱线图和成对Wilcoxon测试,和比较所有CRC患者的风险分数通过解剖子站和诊断阶段。近端位置被定义为任何CRC近端结肠左曲,和早期被定义为阶段i ii。
外部验证
我们外部验证模型和CRC重新评估预后的预测性能和危险分层中一个独立的群体。数据来自两年一次的健康检查飞行员在荷兰进行的研究在2006年6月到2012年2月,先前所描述的其他地方。18我们至少包括个人参加第三轮的飞行员。我们排除了个人与一个积极的结果在前几轮或积极的结果在第三轮,没有完成后续结肠镜检查。增加力量的分析,缺少合适的结果在前两轮被允许和估算使用多个归责。飞行员使用不同的符合品牌和默认截止(OC-Sensor;Eiken化学、日本东京;截止≥10µg / g)。因此,我们验证了模型与连续F-Hb浓度预测而不是不兼容的F-Hb类别(规范8;在线补充表1)。的验证,我们增加了截止≥47µg / g在第三轮主要分析类似,把每个人都F-Hb较低浓度作为一个负面。
软件
所有使用V.4.0.3 R统计软件分析。
机构董事会审查
这项研究是免除制度委员会审查。许可证国家人群中筛查项目是整合筛选法。筛查项目参与者可以选择对象数据共享,在这种情况下,他们被排除在研究。
资金来源的角色
资助者没有参与研究设计、收集、分析和解释数据,或者写作。资助者进行审核和批准的报告发表之前。
结果
研究人群
有299 315名参与者在第三轮荷兰利用筛选计划到2018年(图1)。排除参与者后失踪(n = 733) 31日或之前积极适合第三轮(n = 75),和没有完成后续结肠镜检查或失踪发现参与者记录(n = 1626)积极配合第三轮后,共265 881名参与者被包括在分析中。包括参与者中,8806年有一个积极的配合在第三轮(3.3%)、2697年(1.2%)histology-confirmed先进腺瘤在随访结肠镜检查和557 (0.2%)CRC。
组由138年的860名(52.2%)妇女和127名021人(47.8%),平均年龄为69.0岁(SD±1.9年)(表1)。测量F-Hb浓度0µg / g在77.8%的参与者在第一轮(患病率轮)和第二轮的91.1%。F-Hb浓度在第一或第二轮接近截止是相对罕见(表1)。
统计协会
F-Hb浓度密切相关,结果(表1口服补液盐),未经调整的为21.8 (95% CI 17.6 - 27.0)的最高F-Hb类别(40 - 46.9µg / g)与0µg / g。浓度低于检测极限(< 2.6µg / g)有关的口服补液盐5.0 (95% CI 3.6 - 7.0),尽管潜在的合并与0µg / g。年龄和性别更弱相关的结果(表10.9和2.3之间),口服补液盐。
模型规范
预测模型评估的检测和CRC在第三轮,多个规格类似的拟合优度和歧视性的性能(在线补充附录)。一个模型包括年龄、性别和离散F-Hb类别表现最好的所有标准,只有这个模型的结果报告如下(规范3;在线补充表1)。
在这最后的模型(表2),男性爱和不同F-Hb类别都统计上的显著预测因子。年龄是一个显著的预测只对CRC。F-Hb浓度测量在第一轮,multivariate-adjusted口服补液盐的变化从2.8 (95% CI 2.6 - 3.1), 9.4(95%可信区间7.5%到11.7%)在F-Hb类别的0.1 - -9.9µg 40.0 - -46.9µg / g / g。口服补液盐对CRC变化从2.5 (95% CI 2.0 - 3.2), 6.3(95%可信区间3.5到11.1)。同样,F-Hb浓度测量的第二轮,multivariate-adjusted口服补液盐增加从4.8 (95% CI 4.3 - 5.3), 8.6(95%可信区间7.0到10.5)类别、浓度和口服补液盐CRC增加从3.0 (95% CI 2.2 - 4.0), 4.9(95%可信区间2.8到8.4)。
预测性能
最终的模型校准的检测和CRC (在线补充图1)。预测检出率比较观察利率的风险评分百分位数(校准拦截-0.008到-0.099,边坡0.982 - -0.998)。
模型也歧视参与者之间有或没有相关结果。的optimism-corrected C-statistics分别为0.78 (95% CI 0.77 - 0.79)和0.73(95%可信区间0.71到0.75)CRC (图2)。假设早期筛查的风险阈值或结肠镜检查等于平均检出率(≥1.2%),64.6%的参与者,可以检测到早些时候邀请只有18.8%的其他参与者。相反,82.2%的其他参与者可以筛选不集中。类似地对CRC,平均风险阈值(≥0.2%),62.5%的病例可以早些时候确认邀请只有23.5%的其他参与者。
完整的模型相比,模型只包括年龄、性别和第一轮和第二轮F-Hb低浓度导致C-statistics 0.72 (95% CI 0.71 - 0.73)和0.67 (95% CIs 0.65到0.70和0.64到0.69)CRC。模型只包括年龄和性别导致C-statistics更低,而模型不包括年龄和性别但包括测量F-Hb浓度C- - - - - -统计数据接近完整的模型(规范12;在线补充附录)。
临床面临有效性
像预期的那样从预测模型系数(表2),风险评分图演示了一个更高的风险,随着年龄增长,男性和女性,F-Hb浓度较高的第一和第二轮筛选(图3)。大多数参与者(73.5%)零F-Hb浓度在两轮,这是与较低的预测0.4% - -0.6%的风险,不论年龄和性别。而预测的风险仍然< 6%的参与者与一个非零F-Hb浓度(20.0%),参与者有两个非零的风险迅速增加浓度(4.5%),36.7%为男性75岁之前有两个F-Hb浓度≥40µg / g。CRC的预测风险也更高的男性和老年年龄,但更多的变量在F-Hb类别,范围从0.0%到5.5% (在线补充图2)。
讨论
在这项研究中,我们表明,预后模型将年龄、性别、和特别,结果从两个消极的符合之前,可以准确地识别个体较低和未来一个或CRC的风险更高。预测风险密切匹配观察到的风险,和歧视的参与者和没有或CRC moderate-to-high程度的一致性(C- - - - - -统计到0.78)。观察到的风险与风险预测和CRC也显著增加。模型证明了外部有效性尽管差异筛选的主要组织和验证队列。
我们的研究有一些局限性。之前首先,敏感性分析表明,消极适应结果可能对crc错过少预测在接下来的配合,也就是说,第三轮后的间隔crc发生在我们的研究(在线补充图5)。这种情况下可以预测第三轮的时候,当附加F-Hb信息。因此,我们的模型需要进一步发展和在未来几年内进行验证。第二,之前的预后潜力F-Hb浓度必须进一步建立与年度筛查项目,适合不同品牌和碎屑。3 19在我们的模型展示了良好的外部效度,性能可能会受到截止在我们的研究中。在一些设置,比如英国,标准的否决高于47µg / g,而在其他人,比如美国,否决也更低。即使很小的浓度预测是可靠持续的预后价值无论截止。尽管我们发现高口服补液盐浓度在0µg / g和检测极限测试制造商不保证这样测量的可靠性。因此,这一结果进行解释时应特别谨慎和在未来进一步研究分析。研究优势包括研究人口的大尺寸,我们广泛的模型验证和一致的结论设置纵向F-Hb结果协会,所有提供鲁棒性的信心之前F-Hb浓度预测的未来CRC的结果。
的开发和评估预后模型是一个重要的一步个性化的基于多个危险因素的筛查。13前几项研究相关F-Hb浓度与未来CRC的结果。4 - 6 -据我们所知,其他一些研究正式评估CRC在以人群为基础的环境风险预测模型;更少的评估预测精度(校准);只有一项研究评估F-Hb的歧视性的性能,结合结果后积极的和消极的23;并没有研究评价F-Hb当作一个纯粹的预后标记后多个-适合。先前的研究评估现有模型使用参与者人口学、身体、行为和遗传风险因子C- - - - - -CRC的统计数据在0.60到-0.70之间。24 - 27日相比之下,我们发现的值包括F-Hb更高,尽管过度拟合校正。这突显出F-Hb作为预后标志物的潜在价值。
歧视相对较好的模型可以解释为个人与一个有温和的粪便隐血损失的时间更长。显然,很多流血水平低于健康积极至少2 - 4年被发现之前通过一个积极健康的结果。在我们的分析中,第一和第二F-Hb测量是一个的独立预测指标。虽然F-Hb浓度较高的风险增加,即使浓度在0到2.6之间µg / g,低于2.6µg / g的检测极限,11被预测。相反,参与者连续0µg / g浓度较低的风险。因此,强烈的可能性与出血倾向和一致性。
在时间窗口的存在但不发现,一些病变可能进步更先进和更少的治疗阶段。虽然早期发现病变的较低的适合截止所有可能无法接受增加假阳性的结果,我们的研究表明,重复F-Hb测量信号可以帮助那些参与者最有可能或CRC的现在和未来。因此,积累的信息可以帮助谁,尽管连续消极适应的结果,可能会受益于结肠镜检查,或者短筛查间隔。相反,筛选deintensification可能被认为是低风险的参与者。
有许多可能性裁剪利用筛选参与者的风险,所有这些导致长期健康结果的不同取舍,负担,成本和所需的资源。评估长期risk-stratified筛选的结果超出了目前的研究。我们的研究表明,大多数参与者平均或低于平均水平的风险,只有15%的风险增加-25%的参与者或CRC检测到在不久的将来。结果,采用早期二次筛分或结肠镜检查前的平均风险阈值确定> 60%的参与者或CRC,而加重参与者整体相对较少。决策分析模型可以帮助阐明筛选强度是否应该减少对于大多数参与者和增加的风险增加或不同的故障是否更好。28有利的harms-benefits比率也需要通过临床试验进一步证实。与此同时,之前的建模研究8和决策曲线分析(在线补充图3)支持的潜在临床效用risk-stratified筛选基于这些预测,尤其是对相对“敏感”的策略。建议权衡每接受一个真实的积极的5个或5个以上参与者邀请似乎可以接受的早些时候考虑高CRC负担,提高潜在的临床影响。
应用基于风险的健康筛查和随访可以在设置或有限的情况下特别有价值的筛选能力。例如,在新流行浪潮、筛选邀请或结肠镜检查后续可以优先考虑参与者连续F-Hb浓度高,优化产量和医疗资源需求。这样的应用程序是有可能的,然而,发达模型应该占信息缺失和/或由于间歇筛选变量筛选区间长度。此外,数字基础设施需要自动更新风险评估和适应项目的邀请。虽然这可能存在于一些有组织的计划,这将不会立即实现无处不在。在一些设置,简单的邀请算法可以认为,例如,只使用最后一次测定F-Hb浓度。最后,还需要关注公众的可接受性的基于风险的筛查,问题如何组织监测和评价。在荷兰,一个试点研究解决这些问题的准备。
最后,本研究建立了F-Hb浓度测量在合适的筛选有价值的预后标记为未来的筛选结果。筛查项目应该考虑如何利用这个组织更有效地分配有限的资源在参与者根据他们的历史。未来的建模研究和随机试验应该评估潜在的改善负担,收益和成本等更多个性化的健康筛查方法。
数据可用性声明
数据可能会从第三方获得,不公开。本研究的数据不能公开,但访问可以要求通过Bevolkingsonderzoek荷兰语(BVO-NL)。分析脚本作者可以共享的要求。
伦理语句
病人同意出版
伦理批准
本研究涉及人类参与者,但这项研究是免除机构董事会审核。许可证国家筛查程序纳入人口筛查行动。筛查项目参与者可以选择对象数据共享,在这种情况下,他们被排除在研究。参与者给知情同意参与这项研究之前的部分。
确认
我们承认Mirjam Harmsen、虹膜Seriese和阿扬锁有帮助的反馈我们的分析。我们也承认托马斯博士Imperiale早期手稿草案有用的反馈。
引用
补充材料
-
补充数据
仅这个web文件已经由英国医学杂志出版集团从一个电子文件提供的作者(年代)和没有对内容进行编辑。
脚注
贡献者作者作者满足国际标准。RGSM导致了设计、数据分析、数据解释,起草和修订手稿的重要知识内容。HSV和DN导致了数据分析和修改的手稿。ETZ,, AIK队效力ECHB, LJ, CR、调幅波,FJK, ED导致的数据解释和修订手稿。梅尔和ILV导致了工作的概念,数据解释和修改的手稿。RGSM acceps全部责任的工作,对数据的访问,决定发布控制。
相互竞争的利益没有宣布。
病人和公众参与病人和/或公众没有参与设计、实施、报告或传播计划的研究。
出处和同行评议不是委托;外部同行评议。
补充材料此内容已由作者(年代)。尚未审查由BMJ出版集团有限公司(BMJ)和可能没有被同行评议。任何意见或建议讨论仅代表作者(年代)和不了BMJ的支持。和责任起源于BMJ概不负责任何依赖的内容。内容包括任何翻译材料,BMJ并不保证翻译的准确性和可靠性(包括但不限于当地法规、临床指南,术语,药物名称和药物剂量),和不负责任何错误或遗漏引起的翻译和改编或否则。