条文本

下载PDF

原文
实时自动检测系统提高结肠镜检查息肉和腺瘤检出率:一项前瞻性随机对照研究
  1. 聚氨酯王1,
  2. 泰勒M Berzin2,
  3. 杰里米Romek Glissen布朗2,
  4. Shishira巴拉2,
  5. Aymeric Becq2,
  6. 荀肖1,
  7. Peixi刘1,
  8. 梁平李1,
  9. 燕歌1,
  10. Di张1,
  11. 易李1,
  12. Guangre徐1,
  13. Mengtian涂1,
  14. 于宁波刘1
  1. 1美国胃肠病学,四川省医学科学院&四川省人民医院,成都,中国
  2. 2先进的内镜中心,贝斯以色列女执事医疗中心和哈佛医学院,波士顿,麻萨诸塞州美国
  1. 对应到胃肠病学部门于宁波Liu四川省医学科学院、四川省人民医院,成都,中国;Gary.samsph在}{gmail.com

文摘

客观的结肠镜检查对大肠癌死亡率的影响是有限的几个因素,其中一定错过率,导致有限的腺瘤检出率(adr)。我们调查了一个自动息肉的效果检测系统基于深度学习息肉检出率和ADR。

设计连续在一个开放的、破盲试验中,患者前瞻性随机接受结肠镜检查的诊断有或没有帮助的同时实时自动息肉检测系统提供了一个视觉和声音报警通知息肉检测。主要结果是ADR。

结果536包括1058例患者,随机标准的结肠镜检查,,522人随机与计算机辅助诊断结肠镜检查。人工智能(AI)系统显著增加美国存托凭证(vs20.3% 29.1%, p < 0.001),平均每个病人数量的腺瘤(0.53 vs0.31, p < 0.001)。这是由于更多的小腺瘤发现(185 vs102;p < 0.001),而无统计差异在较大腺瘤(77 vs58, p = 0.075)。此外,增生性息肉的数量也显著增加(114 vs52, p < 0.001)。

结论在低流行ADR人口,自动在结肠镜检查中,息肉检测系统导致显著增加小腺瘤检测到的数量,以及增加的速度增生性息肉。这种影响的成本效益比率进一步确定。

试验注册号码chictr - ddd - 17012221;结果。

  • 结肠镜检查
  • 结直肠癌筛查
  • 计算机图像分析

这是一个开放的分布式条依照创作共用署名非商业性(4.0 CC通过数控)许可证,允许别人分发,混音,适应,建立这个工作非商业化,和许可他们的衍生产品在不同的协议,提供了最初的工作是正确地引用,给出合适的信用,任何更改表示,非商业使用。看到的:http://creativecommons.org/licenses/by-nc/4.0/

来自Altmetric.com的统计

请求的权限

如果你想重用任何或所有本文的请使用下面的链接,这将带你到版权税计算中心的RightsLink服务。你将能够获得快速的价格和即时允许重用内容在许多不同的方式。

本研究的意义

已知在这个问题上是什么?

  • 结直肠腺瘤检出率(ADR)被认为是一个主要的质量指标(筛选)结肠镜检查和已被证明与间隔癌症。减少腺瘤率增加ADR小姐一直是许多研究关注的目标成像技术和机械方法。

  • 人工智能已经最近推出了息肉和腺瘤检测以及分化,在初步研究已经显示出可喜的成果。

有什么新发现吗?

  • 这是第一个前瞻性随机对照试验考察在结肠镜检查中,息肉自动检测和显示了ADR的增加了50%,从20%降至30%。

  • 这种效应主要是由于较高的小腺瘤。

  • 增生性息肉的检出率也显著增加。

它会如何影响临床实践在可预见的未来吗?

  • 自动息肉和腺瘤检测可以诊断结肠镜检查的未来为了实现稳定的腺瘤检出率高。

  • 然而,对最终结果的影响还不清楚,等进一步提高息肉分化必须实现。

介绍

结直肠癌(CRC)是第二和第三大癌症相关死亡原因分别为男性和女性。1结肠镜检查是筛查CRC的黄金标准。2 3筛查允许减少发病率和死亡率的CRC通过腺瘤息肉的检测和清除。4 - 8此外,有证据表明每增加1.0%腺瘤检出率(ADR),有一个关联的间隔CRC的风险降低3.0%。9日10与报道,然而,息肉可以错过错过率高达27%的由于息肉和运营商的特点。11日12

未被发现的息肉视野中是一个重要的问题来解决。11多项研究表明,第二次观察者援助增加了息肉检出率(PDR),但这种策略方面仍有争议,提高ADR。13 - 15

理想情况下,实时自动息肉检测系统,性能接近英国专家,可以协助endoscopist检测可能对应于腺瘤病变更一致和可靠的方式比人类的助理。尽管几个息肉自动检测系统已经发展在过去的十年里,16日17证据的能力这一技术来定位和跟踪息肉在临床实践生活缺乏结肠镜检查。

本研究的目的是调查是否高性能实时自动息肉检测系统18可以增加息肉和腺瘤检出率在实际临床设置。

材料和方法

研究设计

实时自动息肉检测系统

实时自动息肉探测系统(上海Wision AI有限公司)开发深度学习架构(图1)与英国的援助和建模。18

在我们小组的初步研究,算法验证,发现有一个每图像敏感性94.38%每图像特异性为95.92%,一个接受者操作特征曲线下面积为0.984。通过使用多线程处理系统,系统处理至少每秒25帧的延迟76.80±5.60女士在实时视频分析。18此外,英国的检测延迟并不明显。系统监控固定相邻,与原来的内窥镜监视器。

未来的比较研究

前瞻性研究设计作为一个随机对照试验进行调查的影响一个息肉自动检测系统,作为一个助理endoscopist PDR和ADR。本研究是在内镜中心进行四川省人民医院,中国。连续接受结肠镜检查的患者从2017年9月到2018年2月入学资格(图2)。常规肠道准备由4 L的聚乙二醇,在拆分剂。结肠镜检查和高清晰度进行结肠镜(奥林巴斯CF-Q260 CF-H260)和高清监控。我们排除了患者炎症性肠病(IBD)的历史,CRC,结直肠手术的禁忌症患者活检。之前失败的结肠镜检查患者和高涉嫌息肉病症状,炎症性肠病和先进典型的CRC也排除在外。基本人口学特征包括性别、年龄、结肠镜检查表明,手术时间(上午/下午),类型的镇静,结肠息肉的风险因素包括糖尿病、冠状动脉疾病,身体质量指数,结肠瘤或癌家族史,使用阿司匹林或其他非甾体类抗炎药,二甲双胍、叶酸、钙或激素替代疗法,酒精和烟草使用结肠镜检查前记录。在程序的任何并发症或复苏也记录下员工助理。八个医生从胃肠病学的部门参与了这项研究,其中包括两名高级英国(> 20 000结肠镜检查),两个中层英国(3000年至000年和10个结肠镜检查)和四个小英国(100年至500年间,结肠镜检查)。每个病人的前瞻性随机分成两组助理使用数字随机数字生成器在结肠镜检查过程。在对照组,常规结肠镜检查。 In the research group (computer-aided detection (CADe) group), the real-time automatic polyp detection system was used to assist the endoscopist. The system was connected to the endoscopy generator, and the video stream was captured synchronously. Furthermore, the system processed each frame and displayed the detected polyp location with a hollow blue tracing box on an adjacent monitor with a simultaneous sound alarm (图1)(请参阅在线补充文件1)。系统退出时打开。endoscopist主要关注主要的监测过程中,提示看声音报警系统监控。endoscopist被要求检查每一个息肉位置检测系统。这是没有护士的帮助下,学员或员工助理。在两组中,助理记录使用何种类型的结肠镜(CF-H260 / CF-Q260),插入时间、提取时间和波士顿肠道准备endoscopist规模(bbp)作为描述。发现息肉时,护士协助执行冷钳活检组织学和助理记录位置、大小和形态特征分类根据巴黎。在凯德集团错过息肉假警报系统和系统也被记录下来。错过了息肉被定义为一个息肉经endoscopist但系统未被发现的。假警报被定义为发现病变,不断追踪系统,认为由endoscopist不是息肉。 It was registered with Chinese Clinical Trial Registry.

图1

深度学习的体系结构。检测算法是一种基于SegNet深卷积神经网络(CNN)的体系结构。数据流从左到右:结肠镜检查图像顺序扭曲成一个二进制图像,1代表息肉像素和0表示没有息肉在概率地图。这是然后显示,显示在输出中,与一个空心跟踪框凯德监视器。

所有作者都对研究数据的访问和审阅和批准最终的手稿。

统计分析

我们前瞻性设计本研究允许功率80%以上检测差异(30% vs 20%), 10%在腺瘤检出率,用双官能团χ结肠镜检查过程2测试一个双边α水平为0.05。需要702个参与者的样本大小,和整体参与招生的目标是1130年允许潜在的例外或辍学。

统计分析了R工作室V.3.4.0或更高。凯德之间比较的基线临床和人口特征和对照组使用χ进行2测试分类变量和连续变量使用两个示例t检验。关于腺瘤息肉检出率,逻辑回归进行评估的影响计算机辅助诊断的结肠镜检查腺瘤息肉检出率。响应变量的二进制结果腺瘤/息肉是否检测到。协变量是组织变量指示病人是否属于计算机辅助组。关于数量的发现腺瘤息肉,泊松回归应用于评估对结肠镜检查计算机辅助诊断的影响。一个双边p值0.05是用作统计显著性阈值。在发生任何基线临床和人口特征显示两个比较组之间的统计上的显著差异,其他协变量调整物流/泊松回归模型建立应对可能的混杂效应通过添加这些显著特征模型作为协变量。主要结果是ADR。二次结果PDR、息肉的平均数量每结肠镜检查发现,平均每结肠镜检查发现腺瘤和假阳性和假阴性率。

结果

病人的入学率和基线数据

共有1130个连续的患者资格报名。在这些患者中,72例(31日在例程集团41在凯德集团)被排除在外结肠镜检查由于会议期间排除标准(图2)。共有1058个符合条件的患者进行分析,536例患者随机前瞻性进入对照组和522年进入凯德集团。介绍了基线特征表1(见在线补充文件2)。两组之间没有显著差异的人口数据和腺瘤检测危险因素。没有并发症的报道。总撤军时间的控制和凯德集团6.39分钟,6.89分(p < 0.001),分别。二百二十九年更多的活检是凯德集团。撤军时候活组织检查时间被排除在分析6.07分钟,6.18分钟的控制和凯德组,分别(p = 0.15)。

图2

登记流程图。1130名患者入选标准,其中72被排除,因为失败的过程,诊断炎症性肠病或CRC。CRC,结直肠癌;炎症性肠病、炎症性肠病。

表1

基准信息

息肉的特点,意味着每个案例和PDR的息肉数量

总共767息肉被检测到。有422(55.02%)腺瘤和31例(4.04%)无柄锯齿状腺瘤。总的来说,269年息肉(35.07%)被发现在对照组和498年(64.93%),凯德集团(表2)。平均每个结肠镜检查的发现息肉数量控制和凯德集团分别为0.51和0.97,分别(p < 0.001)。有一个平均数的1.89倍增加两组之间发现息肉(95% CI 1.63 - 2.192, p < 0.001) (表3)。控制和凯德的PDR组分别为0.29和0.45,分别(或= 1.995,95%可信区间1.532到2.544,p < 0.001) (表3)。之间没有统计上的显著差异,两组的基线临床和人口统计学变量。因此,协变量调整模型并不认为解决潜在的混杂效应。

表2

息肉和腺瘤特征

表3

息肉和腺瘤检测

腺瘤的特点,意味着每个案例的腺瘤数和ADR

422发现了腺瘤(表2)。平均每个结肠镜检查的发现腺瘤数量控制和凯德组分别为0.31和0.53,分别(p < 0.001)。有1.72倍增加平均数之间的腺瘤检测实验和对照组(95% CI 1.419 - 2.084, p < 0.001) (表3)。控制和凯德的ADR组分别为0.20和0.29,分别(或= 1.61,95%可信区间1.213到2.135,p < 0.001) (表3)。

发现息肉的数量明显高于凯德组与对照组相比在考虑non-pedunculated息肉时,息肉大小从0厘米到1厘米不等,在所有段结肠息肉。发现腺瘤的数目也明显高于凯德集团在考虑non-pedunculated息肉时,息肉小于0.5厘米,结肠息肉在所有领域除了盲肠和升结肠(表3)。

结果良好的肠道准备(bbp≥7)

在良好的肠道准备的情况,ADR凯德组的趋势优于常规组增加6%。然而,由于亚组分析的样本量不足,未能显示出统计上的显著差异。其他结果,包括发现腺瘤的平均数,意思是发现息肉和PDR凯德组显著增加(表4)。

表4

结果良好的肠道准备(bbp≥7)

假阳性息肉自动检测系统

总共有39个假警报(假阳性)凯德集团平均为0.075每结肠镜检查假警报(表5)。

表5

统计结果的假警报,错过了息肉

的发现息肉凯德集团,没有错过了息肉自动检测系统(表5)。

讨论

CRC是一个重大的公共卫生问题由于其高发病率和死亡率。此外,最近发表的一项研究报告年度百分比变化显著增加的发病率CRC在年轻的成年人。19CRC在成人的死亡率和发病率大幅下降(分别为51%和32%),在过去的半个世纪,主要由于CRC筛查和腺瘤息肉的切除。20.结肠镜筛查也允许提高5年生存率在CRC,早期检测的结果以及切除癌前腺瘤。20.鉴于结肠镜检查对CRC发病率和死亡率的影响,技术的进步等全谱结肠镜检查,逆行查看附件,气球结肠镜和介绍了endocuff-assisted结肠镜检查,提高ADR通过扩大视野。21 - 25日等方法,旨在提高结肠镜检查的质量最小的撤军时间,split-dose肠道准备和翻转的结肠也增加了ADR。26 - 30日尽管有这些进展,息肉仍然可以错过。研究也报道,一些息肉由endoscopist尽管错过了在视野之内。31日32提出了几种假说来解释息肉的机制可能会有遗漏。这些包括endoscopist技术水平的差异,差异endoscopist跟踪模式,“无意视盲”,其中一个观察者失败处理图像在屏幕上由于分心,和“改变失明”,改变是错过了眼movements13期间在视觉扫描或中断。33-37干扰引起的疲劳或情绪因素也可能造成。乙方如护士或实习观察可能改善PDR。几项研究表明,这增加PDR,争议仍然对ADR。13 - 15添加额外的观察者可能超出一个不会完全克服这些局限性。

人工智能与最近的突破,尤其是深度学习在计算机视觉,计算机辅助诊断(CADx)在结肠镜检查中,息肉引起增加的关注和被证明允许结肠息肉组织学分类。38 39虽然光活检仍然是一个有前途的领域,组织活检仍然是黄金标准,和人工智能在光学切片诊断的准确性取决于表面微观结构可以反映病变的组织学特性。在没有损伤的情况下,没有进一步的诊断,会计的研究领域的计算机辅助检测(凯德)胃肠道(GI)内窥镜检查,旨在提高腺瘤在白光内镜实时自动检测。

高保真和一致的自动结肠息肉检测一直是一个有吸引力的研究课题在过去的十年中,目的是增加ADR。然而,据我们所知,目前的技术还没有产生足够的诊断性能为了被认为是临床应用。40 41为了自动息肉探测系统被认为是真实的临床应用,它必须有一个非常高的敏感性和特异性,足够的实时标准处理时间和一个屏幕报警系统。41 42特异性不足会造成假阳性。相反,一个灵敏度不会增加PDR不足。此外,实时检测是有效的,分析时必须迅速,没有明显推迟endoscopist。由于这些先决条件,目前大多数研究自动息肉检测是小规模的,非临床调查,尽管与迅速增长的兴趣领域和深度学习的出现,预计在未来几年巨大进步。41

在这项研究中,ADR的显著增加,PDR和平均每结肠镜息肉和腺瘤被发现在凯德组与对照组相比;然而,增加整体腺瘤检测主要是由于小腺瘤的增加。最小型的腺瘤凯德系统检测到的,然而,小,支持小息肉的传统观点更有可能错过在视野内,而不是更大、更突出的息肉。虽然身材矮小的腺瘤授予少患恶性肿瘤与大腺瘤相比,增加整体腺瘤检出率可能最终有助于减少间隔CRC的风险。进一步的研究应该解决凯德递减区间癌症的作用,这是任何筛查的主要目标。9

结果还显示一个身材矮小的增生性息肉的主要检测增加,这可能会带来额外的不必要的息肉切除术和增加工作量。在未来,这个凯德系统可能结合CADx系统支持检测,诊断和漠视43策略,以避免过度的工作负载。

高重现性、保真度和均匀性的凯德系统优势相比,人类的帮助。然而,自动息肉之间的直接比较不同经验水平的检测系统和医务人员援助也值得进一步研究。

系统可能的原因未能协助endoscopist检测更多的腺瘤在盲肠和升结肠可能是由于更高的结肠镜在这些地区的不稳定,从而减少视野。此外,在直肠也没有显著的差异可能是由于良好的可视化和结肠镜在这段的稳定。

这项研究是第一个前瞻性随机对照试验使用高性能凯德系统基于深度学习协助英国检测结肠息肉与大量的病人。结果表明,先前未被发现的息肉可能由一个人工智能系统有效地加以解决。然而,息肉,保持在视野之外仍然是一个主要问题不解决当前凯德系统。未被发现的和non-visualised息肉可能解决一起在未来不同技术的结合。

本研究也有一些局限性。首先,考虑到endoscopist不能盲目,系统的具体贡献可能难以评估。被观察到的行为可能也影响了ADR的实验组,因为“竞争精神”。13这种机制可以解释一个潜在的凯德集团“endoscopist可能是已知的观测更细心的设置。在这项研究中,我们从每个相应的减去活检手术的时候撤军时间作为一个间接的标志注意力(表1)。相似的撤军时间(6.07分钟vs 6.18分钟,p = 0.15)在两组之间,这可能代表类似的观察注意力。凯德的假警报系统,每结肠镜检查0.075实例,并没有导致戒断时间更长。

在未来,双盲的研究可以用来研究这个系统的具体贡献的增加腺瘤检出率。这样的研究也可以帮助确定一个息肉检测同时endoscopist和系统或最初endoscopist错过的一个问题,当前的研究并不是设计来解决。

第二个限制是缺乏外部有效性。基线腺瘤息肉检出率,这项研究没有高达从西方国家报道。13 44-48多种因素可能导致这一发现,包括遗传、饮食、生活方式和中国和西方人群体质差异,以及结肠息肉和腺瘤的发病率的差异在两组。因此,这项研究的结果可能不是generalisable的地区,那里基线ADR较高。还需要进一步的研究来调查这个系统的适应性和有效性等领域。

第三,虽然假阳性利率很低,一些假阳性发生意想不到的系统的设计者和由于检测药物胶囊,当地网站的出血或未消化的碎片,在手术过程中造成潜在的分心。这可能是通过添加足够的训练数据来修正当前系统。

第四,本研究没有控制参与英国的疲劳程度,这可能是一个独立的因素影响ADR。未来的研究需要调查这个凯德系统在不同疲劳的有效性水平。

第五,由于结肠镜检查由初级英国样本量不足,还需要进一步的研究来显示这个凯德系统的作用和有效性在不同级别的培训。

最后,研究使用奥林巴斯结肠镜检查设备。因此,系统的适应性对设备制造的其他公司也应该探索。

总之,这项研究表明,基于深度学习的实时凯德系统导致显著增加在结直肠息肉和腺瘤检出率ADR在低流行地区。由于其精度高、忠诚和稳定,当前凯德系统可能是适用于当前临床实践更好的检测结肠息肉。

引用

脚注

  • 贡献者PW和XL研究概念和设计。PW, XL,噢,PL, XX, y, DZ, GX、MT、YL导致采集的数据。PW,三甲,JRGB,某人和AB贡献分析,解读数据,起草的手稿和统计分析。所有作者阅读和批准最终的手稿。

  • 资金作者并没有宣布具体资助这项研究从任何公共资助机构,商业或非营利部门。

  • 免责声明凯德系统是由上海Wision AI有限公司,有限公司,为本研究提供了免费。员工在公司没有以任何方式参与临床试验,包括研究设计、统计分析或手稿写作

  • 相互竞争的利益没有宣布。

  • 伦理批准本研究机构审查委员会批准的四川省医学科学院&四川省人民医院。这是与中国临床试验注册中心注册(ChiCTR)标识符ChiCTR (ddd) 17012221。

  • 出处和同行评议不是委托;外部同行评议。

  • 病人同意出版不是必需的。