条文本

溃疡性结肠炎的毕加索组织学缓解指数(PHRI):用于监测粘膜愈合和预测临床结果的新型简化组织学评分的开发及其在人工智能系统中的适用性
  1. 相对Gui1
  2. Alina Bazarova23.
  3. Rocìo del Amor4
  4. 迈克尔Vieth56
  5. Gert de Hertogh7
  6. Vincenzo Villanacci8
  7. 大卫。Zardo9
  8. 托马索·洛伦佐·帕里吉1011
  9. Elin Synnøve Røyset12
  10. Uday N Shivaji213
  11. 梅丽莎·安娜特蕾莎·莫妮卡8
  12. 朱里奥铜质把手8
  13. Pradeep班达里14
  14. 西尔维奥•Danese1516
  15. Jose G Ferraz17
  16. Bu 'Hussain Hayee18
  17. 马克?纳扎勒夫19
  18. 阿道夫•Parra-Blanco20.
  19. 卢卡Pastorelli2122
  20. 雷莫Panaccione17
  21. Timo Rath23
  22. Gian Eugenio Tontini24
  23. 拉尔夫Kiesslich25
  24. 英国皇家空军Bisschops26
  25. 恩里科Grisan2728
  26. 瓦莱里·Naranjo4
  27. Subrata Ghosh229
  28. 玛丽埃塔Iacucci21330.
  1. 1病理华盛顿大学医学院西雅图佤邦美国
  2. 2转化医学研究所伯明翰大学伯明翰、英国
  3. 3.生物物理研究所科隆大学科隆、德国
  4. 4Instituto de Investigación e Innovación en Bioingeniería, I3B瓦伦西亚理工大学瓦伦西亚、西班牙
  5. 5病理研究所Klinikum Bayreuth GmbH拜罗伊特、德国
  6. 6病理研究所Friedrich-Alexander-Universitat埃埃朗根、德国
  7. 7病理学系鲁汶大学鲁汶医院鲁汶、比利时
  8. 8病理学系布雷西亚市政高级助理署长布雷西亚、意大利
  9. 9细胞病理学系伯明翰大学医院NHS基金会信托伯明翰、英国
  10. 10生物医学科学系Humanitas大学米兰、意大利
  11. 11免疫学和免疫治疗伯明翰大学伯明翰、英国
  12. 12医学与健康科学学院临床与分子医学系挪威科技大学特隆赫姆、挪威
  13. 13胃肠病学国家健康研究所伯明翰生物医学研究所伯明翰、英国
  14. 14消化内科亚历山德拉皇后医院朴茨茅斯、英国
  15. 15消化内科及内窥镜科Università Vita Salute San Raffaele米兰、意大利
  16. 16消化内科及内窥镜科圣拉斐尔医院米兰、意大利
  17. 17消化内科卡尔加里大学卡明医学院卡尔加里阿尔伯塔省、加拿大
  18. 18国王健康合作伙伴治疗内窥镜研究所国王学院医院NHS基金会信托基金伦敦、英国
  19. 19医学系约翰霍普金斯大学巴尔的摩马里兰美国
  20. 20.消化内科诺丁汉大学医院NHS信托诺丁汉、英国
  21. 21胃肠病学单位IRCCS polilinico San Donato圣多纳多米兰、意大利
  22. 22米兰大学健康科学系米兰、意大利
  23. 23肠胃科埃尔兰根大学纽伦堡校区纽伦堡、德国
  24. 24米兰大学病理生理学和移植学系IRCCS Ca’granda Ospedale Maggiore Policlinico基金会米兰、意大利
  25. 25消化内科Helios HSK威斯巴登、德国
  26. 26消化内科鲁汶大学鲁汶医院鲁汶、比利时
  27. 27工程学院伦敦南岸大学伦敦、英国
  28. 28信息工程系Università degli Studi di Padova帕多瓦、意大利
  29. 29APC微生物组,爱尔兰,科克大学软木塞、爱尔兰
  30. 30.消化内科伯明翰大学医院NHS基金会信托伯明翰、英国
  1. 对应到伯明翰大学转化医学研究所Marietta Iacucci博士,伯明翰B15 2TT,英国;M.Iacucci在{}bham.ac.uk;美国西雅图华盛顿大学医学院病理学系桂宪勇博士;xgui在}{uw.edu

摘要

组织学缓解逐渐成为UC的一个重要治疗靶点。我们的目标是开发一个简单的组织指标,与内镜检查一致,与临床结果相关,并适用于人工智能(AI)系统来评估炎症活性。

方法利用一组来自307名UC患者的614份活检,我们加入了一项前瞻性多中心研究,开发了帕丁顿国际虚拟色内窥镜评分(PICaSSO)组织学缓解指数(PHRI)。评估了与多个其他组织指标的一致性和阅读器间重复性验证。最后,为了将PHRI实现到计算机辅助诊断系统中,我们训练和测试了一种基于CNN架构的新型深度学习策略,该策略用于检测中性粒细胞,计算PHRI,并使用138个活检组织的子集从静止UC中识别活跃的UC。

结果PHRI与内镜评分(Mayo内镜评分、UC内镜严重程度指数和毕加索)和临床结果(住院、结肠切除和因UC复发而开始或改变药物治疗)密切相关。PHRI评分为1可以在12个月内准确地对患者不良结局的风险(住院、结肠切除术和因复发而优化治疗)进行分层。我们的读者之间的一致性很高(类内相关性0.84)。我们初步的AI算法区分活跃和静止UC的灵敏度为78%,特异性为91.7%,准确性为86%。

结论PHRI是UC中一个简单的组织学指标,与内镜活动和临床结果的相关性最高。基于phri的AI系统在预测组织学缓解方面是准确的。

  • 组织病理学
  • 溃疡性结肠炎
  • 炎症性肠病
  • 计算机图像分析

数据可用性声明

根据合理的要求提供数据。计算机算法代码可根据合理要求提供。

http://creativecommons.org/licenses/by-nc/4.0/

这是一篇开放获取的文章,按照创作共用署名非商业性(CC BY-NC 4.0)许可发布,该许可允许其他人以非商业性的方式发布、混编、改编、构建本作品,并以不同的条款授权他们的衍生作品,前提是原创作品被正确引用,给予适当的荣誉,任何更改都被注明,且使用是非商业性的。看到的:http://creativecommons.org/licenses/by-nc/4.0/

统计数据来自Altmetric.com

请求的权限

如果您希望重用这篇文章的任何部分或全部,请使用下面的链接,它将带您访问版权清除中心的RightsLink服务。您将能够快速获得价格和以多种不同方式重用内容的即时许可。

本研究的意义

  • 我们开发了一种新的简单的UC组织学指标——帕丁顿国际虚拟色素内镜评分组织学缓解指数(PHRI),该指标可以成功地实现在人工智能(AI)模型中检测组织学缓解。

关于这个问题,我们已经知道了什么?

  • UC的组织学活性与不良预后相关,组织学缓解已被提出作为UC的治疗靶点。

  • 多种组织学指标已被用来定义疾病活动性,但由于其复杂性,在临床实践中尚未广泛采用。

  • 机器学习模型是强大的工具,可以补充和支持病理学家的组织病理学评估。

新的发现是什么?

  • PHRI是一个基于中性粒细胞是否存在(是/否)的新评分,它提供了优秀的诊断准确性,在几个组织学评分中与内窥镜活性的相关性最强,评分者之间的差异最小,对长期临床结果的预测效果极好。

  • 基于PHRI的AI算法能够准确地确定组织学缓解。

本研究的意义

在可预见的未来,它会对临床实践产生怎样的影响?

  • PHRI可以以最实用和简单的方式帮助UC的组织学评估标准化。

  • 基于PHRI的机器学习模型可以进一步促进组织学阅读和提高诊断性能。

简介

在UC中,组织学评估在确定炎症活性和监测治疗反应方面起着关键作用。组织学缓解(HR)(也称为组织学愈合)是一个新兴的治疗靶点,是UC临床试验的一个重要结果,因为它与有利的结果相关。1 - 10然而,如何将组织学纳入临床实践仍然存在挑战,主要原因是:(1)缺乏一个统一的HR定义来指导病理学家;(2)缺乏一个敏感的、易于应用的组织学评分/指标。理想情况下,该指标应:(a)提供疾病活动性内镜评估的信息并与之相关,(b)代表受损黏膜的恢复/愈合状态,(c)预测疾病结局。

UC的组织病理学特征是慢性活动性结肠炎的复发和缓解过程,包括三个基本组成部分:(1)活动性炎症('活动’),即隐窝上皮和固有层中的中性粒细胞浸润;(2)慢性炎症,特征是固有层内单个核细胞(淋巴细胞和浆细胞)浸润扩张,常伴有基底浆细胞增多和嗜酸性粒细胞增多。(3)隐窝结构/结构扭曲('慢性’),其特征是隐窝在大小、形状、方向和隐窝间距离上的不规则和变化,这是隐窝重复损伤和再生混合的结果。

在过去的几十年里,>30组织学评分已经发展起来,尽管其在临床实践中的应用仍然有限。11日12同样,HR的不同定义和标准也被提出,从“粘膜溃疡/糜烂的消除”到“组织学完全正常化”。13 13-18几乎所有的研究者现在都同意中性粒细胞浸润(“无中性粒细胞”黏膜)的缺失是HR定义的关键,因为它与良好的临床结果相关。2 4 5 19-22事实上,两个独立的国际专家小组最近建议将HR定义为无中性粒细胞浸润(即组织学活动消除)。22日23日

随着数字病理学的出现,人工智能(AI)算法越来越多地应用于组织病理学的评估和诊断,正如在医学中许多以图像为重点的领域所见。例如,利用基于卷积神经网络(CNN)的学习,它被广泛引入到肿瘤病理学中。24但是,到目前为止,据我们所知,还没有开发出计算机辅助诊断(CAD)系统来进行组织学评分和评估UC的HR。部分原因是现有组织学评分的复杂性和混合主观性,使得构建和训练深度学习算法(有监督和无监督)非常困难。

最近,我们进行了一项前瞻性的国际多中心研究,以开发帕丁顿国际虚拟色内窥镜评分(毕加索)内窥镜评分,25日- 27日利用高清虚拟电子色内窥镜(HD-VCE)评估UC患者的内窥镜活动和缓解的新工具。毕加索内镜评分优于Mayo内镜评分(MES)和UC内镜严重程度指数(UCEIS)与多种组织学评分的相关性。27当前的研究与我们之前发表的所有关于毕加索内窥镜评分的研究不同,而且更进一步,因为它专注于创建一个新的UC组织学评分组织病理学家可以在临床实践和试验中快速、轻松地使用它,并可以整合到AI算法中。在本研究中,我们以PICaSSO项目为平台,仔细分析了从内镜下评估的相同结肠区域采集的粘膜活检,重点是确定与组织学-内镜相关性相关的特定组织病理学成分,以及不良临床结果的风险。最终,我们的目标是开发一种简化的、新颖的组织学评分,它能准确反映显微黏膜炎症和愈合,预测临床结果,对治疗产生反应,并易于实现到机器学习算法中,从而易于应用到临床实践和试验中。创建一个简化的组织学评分,PHRI,这是一个客观的组织学仪器是主要目的,因为目前在临床实践中使用组织学评分是有限的。PHRI的主要目的是创建一个简单的“仅中性粒细胞”组织学评估,预测特定的临床结果。另一个目的是理想的组织学指标应超过内镜评价的限度。

患者和方法

研究人群、内窥镜评估和临床随访

来自欧洲和北美11个中心的307名UC患者被前瞻性地纳入了国际多中心毕加索研究。内窥镜和组织学评估的方案已在以前的出版物中详细描述。27简单地说,每位患者都接受了白光HD肠镜检查,以确定MES和UCEIS,28 29其次是VCE (iSCAN, Pentax,日本),以确定毕加索评分,包括黏膜和血管评分(毕加索黏膜评分(PMS)和毕加索血管评分(PVS))。25 27在评估的直肠和乙状结肠的相同区域,并在内窥镜上记录视频,至少进行了两次靶向粘膜活检,结果共614次活检用于组织病理学分析。靶向活组织检查取自炎症最严重的区域或毕加索确定的内镜缓解(ER)最具代表性的特征。26随后,所有患者接受了至少12个月的定期临床随访,记录了以下预先指定的不良临床结果:(1)UC复发后住院,(2)结肠切除术,(3)UC复发的药物治疗开始或改变,包括类固醇、免疫抑制剂和生物制剂(在排除不良反应、免疫原性或低药物水平后)。

第一阶段:深入组织学分析和组织学-内镜-临床结果的相关性

使用Aperio数字病理扫描系统(Leica Biosystem, Illinois, USA)以40× (0.25 μm /像素)扫描结直肠活检切片的h&e染色玻片。高清数字化切片由6名有IBD经验的GI病理学家(XG, MV, VV, DZ, GdH, ESR)集中托管和阅读,他们对内镜数据是盲目的。对于每个切片的每个活检,采用五种不同的组织学评分方案对最糟糕的特征进行评分——geboes评分(GS),30.罗氏组织指数(RHI),31南希组织指数(NHI),32程度,慢性,活动和+ (ECAP)评分33 34Villanacci简化评分(VSS)。35分别分析直肠和乙状结肠各评分及子评分的平均值。

通过多步骤分析内窥镜与组织学的相关性,以确定具体对应于疾病活动和缓解的不同内窥镜特征/模式的组织病理学特征/成分,并预测随访时特定临床结果的风险。

第二阶段:开发和评估毕加索组织学缓解指数

基于我们在I期研究中多步骤和全面的组织学-内窥镜-临床结果相关性分析的可靠结论,并在病理专家之间经过改进的德尔菲圆桌讨论后,存在中性粒细胞浸润被确定为UC组织病理学中决定疾病活动性、粘膜愈合和临床结果的关键因素。随后,提出了一种新的简化组织学评分方案——毕加索组织学缓解指数(PHRI),详见表1.这个指标只考虑了上皮和固有层中的中性粒细胞浸润,如在线补充图1.溃疡和糜烂不包括在内,因为溃疡和/或糜烂的组织学特征可能不总是明显的活组织检查,由于采样的差异。我们特别标准化了"cryptitis(任何数量的中性粒细胞浸润到任何数量的隐窝/腺的上皮)和隐窝脓肿’(任何数量的中性粒细胞流入隐腔和任何程度的隐窝上皮细胞损伤的隐窝炎),鉴于隐窝炎和隐窝脓肿仍然缺乏清晰和标准化的组织学标准。病理学家还完成了一个标准化的训练模块,该模块包含多个组织学图片,显示所有组织学特征,然后对切片进行评分。

表1

毕加索组织学缓解指数(PHRI)

然后使用新的PHRI重新分析上述组织学-内镜相关性,将其与其他5个组织学指标进行比较,并预测12个月随访的临床结果。我们还探讨了PHRI在进一步分层已处于MES为0的ER患者的疾病复发风险方面的额外预后益处。直肠和乙状结肠的PHRI评分单独考虑,也合并考虑总分(PHRI_total,即直肠和乙状结肠PHRI评分之和)或最高评分(PHRI_max即直肠和乙状结肠分值较高)。选择了后者PHRI_max。如果没有特别说明,术语PHRI指的是检查区域的最高分,PHRI_max。

第三阶段:PHRI的验证

为了验证PHRI,同样的病理学家评估了50个数字切片(大约一半是静止的UC,一半是活动的UC),并对PHRI和其他五个选择的指标进行评分。验证病例由来自同一研究组的非病理学研究者随机选择并重新标记。病理学家不了解临床和内窥镜信息,独立进行组织学评分。

第四阶段:AI算法开发

在这项探索性研究中,我们从研究收集中随机选择了138份活检,它们代表了整个研究中收集的614份不同级别的炎症。我们开发了一个CNN分类器来检测整个幻灯片图像(WSIs)中的中性粒细胞,并根据中性粒细胞的存在将其分为组织学缓解或非缓解。在人工智能中介绍了CNN的详细设计在线补充附录.简单地说,第一个模型识别了含有中性粒细胞的斑块(WSI区域),而第二个模型使用多实例学习方法,将幻灯片中每个斑块的特征结合到PHRI (图1).

图1

提出的深度学习方法的框架。该框架由两个具有不同但相关任务的模型组成。第一个模型使用组织图像中的预训练结构预测中性粒细胞斑块。第二个模型使用第一个模型使用的特征提取和特征细化来预测患者层面的UC。GAP,全球平均池;SE,挤压和激励(特征细化)。

统计数据

统计软件R (R核心团队,https://www.R-project.org/)。用斯皮尔曼(ρ)相关系数测量连续变量和分类变量的相关强度。系数0.8-1.0被认为是“非常强”,0.6-0.79被认为是“强”,0.4-0.59被认为是“中等”,0.2-0.39被认为是“弱”。通过为每对变量抽取100个bootstrap样本并计算相应的分位数来比较斯皮尔曼的相关性。Wilcoxon和Fisher精确检验分别用于确定连续分布和二元分布之间的差异。对于接收机工作特性曲线下面积分析,我们使用R-package pROC (https://CRAN.R-project.org/package=pROC).预测模型采用R-package CARRoT (https://CRAN.R-project.org/package=CARRoT).详细情况在统计中报告在线补充附录

采用Cox比例风险模型计算PHRI不同截点无明确临床结果的生存概率。采用HR试验和r -包生存分析评估各组间的差异(https://CRAN.R-project.org/package=survival).

为了评估评分者之间对组织学评分的一致性,我们使用R包irr (http://cran.r-project.org/package=irr).为了检验ICC为>0.5相对于替代方案的假设,我们需要至少40张组织学图像,以达到0.8的幂,I型误差为0.05。36根据兰迪斯和科赫的基准,37ICC <0.2、0.2 ~ 0.4、>0.4 ~≤0.6、>0.6 ~ 0.8和>0.8分别被认为是“较差”、“一般”、“中等”、“良好”、“相当”和“近乎完美”。所有统计检验结果均被认为p<0.05有显著性。统计力量计算在最近发表的毕加索内窥镜和组织学研究27根据毕加索内窥镜评分和组织学评分与标准MES的相关性,以及指定的临床转归率,确定了302个样本量。

报告了AI CAD检测活动性UC的诊断性能,包括灵敏度(SE)、特异性(SP)、阳性预测值(PPV)、阴性预测值(NPV)和准确性(ACC)。

结果

对307例UC患者的614例活检进行了分析。168例(54.7%)患者处于MES 0定义的ER,而其他患者在研究时存在内窥镜活动性疾病。所有患者均未接受局部治疗或患有蒙特利尔E1病。270例(88%)患者完成了12个月的随访。研究对象的详细人口统计数据载于表2

表2

研究对象的人口统计数据

I期:中性粒细胞是组织学-内窥镜-临床相关性的关键决定因素

所有5个组织学指标(VSS, RHI, NHI, GS和ECAP)与肠道相同区域(直肠和乙状结肠)的所有内镜评分密切相关(斯皮曼ρ= 0.55-0.78),如热图所示(图2).所有组织学指标也显示出在12个月时与预先指定的不良临床结果的弱至中等相关性(ρ= 0.34-0.42) (图2).

图2

毕加索组织学缓解指数(PHRI)的相关性。热图显示了直肠(A)和乙状结肠(B)不同组织学和内镜评分之间的Spearman相关系数,以及内镜组织学评分与12个月时指定的临床结果之间的相关性(0.8-1.0:非常强相关性,0.6-0.79:强相关性,0.40-0.59:中等相关性,0.2-0.39:弱)(与PHRI相比,同类别相关分析的相关强度*p<0.05)。ECAP、程度、慢性、活动性及+;PHRI,毕加索组织学缓解指数;毕加索,帕丁顿国际虚拟色内窥镜评分;Robarts组织指数;UCEIS, UC内镜严重程度指数。

进一步研究不同组织病理成分之间的相关性(在线补充表1)和内镜评分(用毕加索评分的黏膜和血管分值表示)、固有层和上皮内的中性粒细胞浸润,特别是固有层和两者的结合,通常表现出最强的相关性(ρ= 0.60-0.76),而其他组织学特征也表现出一定程度的相关性(中等到强烈,ρ= 0.43-0.64) (p<0.05) (图3).同样,中性粒细胞浸润也显示出较强的相关性,尽管总体上弱/中等(ρ= 0.40-0.45),与其他组织学特征相比,12个月时的临床结果(ρ= 0.24-0.37) (p<0.05) (图3).

图3

组织病理学成分的相关性。热图显示组织病理成分与毕加索内窥镜评分和所有患者12个月不良转归率的相关性。直肠(A)和乙状结肠(B)活检(0.8-1.0:极强相关性,0.6-0.79:强相关性,0.40-0.59:中等相关性,0.2-0.39:弱相关性)(*p<0.05与固有层中性粒细胞比较,!p<0.05与总中性粒细胞浸润比较,#p<0.05与上皮中性粒细胞浸润比较,参照同一类相关性分析的相关性强度)(中性粒细胞总数:固有层和上皮中性粒细胞浸润)。毕加索,帕丁顿国际虚拟色内窥镜评分。

第二阶段:PHRI的组织学-内窥镜和临床结果的相关性

PHRI与内镜下疾病活动性相关性最好

PHRI与内镜评分相关性强,相关性在所有组织学指标中最强(p<0.05) (图2).

PHRI与特定临床结果和复发风险的相关性

对于整个队列,PHRI在12个月时显示出与指定的不良临床结果类似的中等相关性(ρ值约为0.4)。此外,在12个月时出现特定不良临床结果的患者的PHRI平均评分显著高于无不良临床结果的患者(在线补充表2在线补充图4).

此外,我们进行了多变量logistic回归,以探索其他组织学特征(慢性炎症、基础浆细胞增多症和嗜酸性粒细胞增多症)是否可以改善PHRI对特定临床结果的预测。我们发现,这些组织学特征的添加都没有进一步改善PHRI的预后能力(图4).

图4

受试者工作特征(ROC)曲线和帕丁顿国际虚拟色内窥镜评分组织学缓解指数(PHRI)阈值预测特定的临床结果和组织学缓解(HR)。AUROC,接收器工作特性曲线下的面积;CI,慢性炎症;neul - lp,固有层中性粒细胞浸润;neui - epi,上皮细胞中性粒细胞浸润;PHRI_rec,直肠PHRI评分;PHRI_sig, sigmoid的PHRI评分。

与PHRI=0的患者相比,在12个月时,PHRI >患者的不良临床事件(结局)明显更多(48.65% (54/111)vs 13.91% (21/151), p<0.00001),如在线补充图4C.此外,通过受试者工作特征(ROC)曲线进行分析,如图所示在线补充表3A,整个队列中用于预测12个月特定临床结果的最佳PHRI临界值为1(≤1 vs >1)。

PHRI的Cox比例风险曲线预测特定临床结果

我们进一步分析Cox比例危险曲线,以0或1值作为PHRI(或直肠或乙状肌的个别PHRI)的截止评分,患者在12个月随访期间特定临床结果的事件率显著分层,如图5A及B.任何形式的PHRI的预测能力几乎相同。

图5

帕丁顿国际虚拟色内窥镜评分组织学缓解指数(PHRI)在特定临床结果风险分层中的Cox比例风险曲线,随访12个月。A和B为所有患者,C为Mayo内镜评分为0的患者。(A)使用PHRI=0(蓝色)vs >0(红色)。(B)使用PHRI≤1(蓝色)vs >1(红色)。(C)随访12个月,使用PHRI=0(蓝色)vs >0(红色)。

图6

原始图像(第一栏),病理学家注释(第二栏)和类激活图(CAMs)(第三栏)。注意,在本例中,第一行对应固有层,而第二行对应上皮表面。

亚组分析仅内镜缓解患者

当我们筛选出MES为0的急诊患者时,组织学-内镜-临床结果的相关性在所有方面都变得很弱。在研究的I期,对于这一特定亚群患者,其中只有少数在结直肠活检中残留轻度中性粒细胞浸润(5.7%在固有层中有中性粒细胞浸润,5.4%在上皮中),组织学评分和内窥镜评分(用毕加索粘膜评分和毕加索血管评分表示)之间的相关性(ρ<0.30)以及组织学评分和特定临床结果(在这一特定患者群体中指示复发)之间的相关性都变得很弱或接近于零(ρ= 0-0.12) (在线补充图2).然而,中性粒细胞浸润是唯一相关的组织学特征,尽管相关性较弱(略高于0.1)(在线补充图3).

在研究的II期,在ER (MES 0)患者中,只有10.9%的患者PHRI >(存在中性粒细胞浸润),89.1%的患者PHRI为0(无中性粒细胞浸润),PHRI与内镜评分之间的相关性也变得弱得多(ρ= 0.24-0.36) (在线补充表4).然而,PHRI仍然表现出总体上优于大多数其他组织学指标(p<0.05),其与毕加索评分及其黏膜和血管评分的相关性(在线补充图2).此外,PHRI评分与预先指定的临床结果之间的相关性也很弱,但仍优于其他组织学评分(p<0.05) (在线补充图2而且在线补充表4).与此一致的是,与PHRI >组患者相比,PHRI >组患者12个月的疾病复发率似乎更高(11.76% (2/17)vs 9.3%(12/129),尽管差异没有达到统计学意义(p>0.05) (在线补充图4D).最后,对于急诊患者12个月复发的预测,PHRI的最佳临界值似乎是1(≤1 vs >1),尽管Cox比例风险曲线的进一步分析未能令人满意地对患者的复发风险进行分层(图5 c).

第三阶段:PHRI的效度和信度

病理学家对所有组织学评分的评分者之间的一致性非常好,如ICCs所反映的:RHI 0.77 (95% CI 0.69至0.85),NHI 0.85 (95% CI 0.79至0.90),GS 0.82 (95% CI 0.75至0.88),ECAP 0.87 (95% CI 0.82至0.92),VSS 0.77 (95% CI 0.71至0.86)和PHRI 0.84 (95% CI 0.78至0.90)。各指标的ICCs差异无统计学意义。总体而言,观察者对PHRI的一致性几乎是完美的,尽管不一定显著优于其他组织学指标。我们还分析了不同组织学指标各组织学成分的ICC分解。对于任何给定的组织学评分,我们对中性粒细胞相关参数的评估有最佳的一致性,如图所示在线补充表5

第四阶段:能够检测中性粒细胞的卷积神经网络分类器

我们将我们的队列分为两组,训练组和测试组,患者特征相似,以避免过度拟合我们的系统,并确保其普遍性。70%的活组织检查用于训练模型,30%用于测试模型。为了训练所提出的模型并优化相关的超参数,15%的训练集被用作验证。在试验集中,我们检测中性粒细胞的CAD的SE为0.71,SP为0.95,PPV为0.85,NPV为0.89,准确性为0.88,这些结果与验证队列的结果一致(见表3).图6显示类激活映射,以突出显示补丁级别的感兴趣区域,提出的模型集中在其中预测样本。突出显示的区域与含有中性粒细胞的区域相匹配。对于组织学缓解预测,以相同特征表达的诊断性能分别为0.78,0.92,0.88,0.85和0.86表3).

表3

中性粒细胞识别模型验证和试验阶段的分类结果及UC预测活性

讨论

我们开发了一个新颖而简单的UC HR指数PHRI,它与内镜下疾病活动和临床结果密切相关,可以很容易地实现到CNN模型中。该组织学指标的发展过程与现有评分的发展过程不同。PHRI是病理学家和内窥镜医生联合合作的结果,旨在开发与内窥镜评分一致的组织学评分,并超越内窥镜评价。27我们的工作有几个优点。首先,组织学研究是一项大型国际多中心前瞻性研究的一部分,其重点是内窥镜-组织学-临床相关性。我们纳入了大量匹配的活检,这些活检都是在内镜评估完成后立即进行的,并且完全来自相同的区域,而不是将比较限制在患者水平。其次,我们没有像其他组织学指标那样包含多个诊断特征,而是将PHRI限制为仅一个参数,中性粒细胞浸润(活动性炎症),通过多次比较分析确定的单一因素,与内窥镜特征和临床结果最相关。我们的独立研究结果与Pai的研究结果相呼应21这与中性粒细胞在定义疾病活度和HR中的重要性的共识一致。

PHRI最显著的优点是它的简单。PHRI只需要以“是或否”(存在或不存在)的直接二分法确定固有层和腺上皮内浸润中性粒细胞的存在或不存在。它还避免了通常的活动分级(如轻度、中度和重度),通过任意的视觉尺度或百分比值估计,这有点主观。正如其他研究者所发现的和我们自己的评分者间协议数据所显示的,对中性粒细胞的评估一直是最具可重复性的特征。38 39溃疡/糜烂的存在通常包含在其他指标中,但在PHRI中被剔除,因为我们认为这是一个潜在的可变性来源,对评分的准确性贡献不大。事实上,在活检组织学上可能看不到糜烂/溃疡,22两者之间的区别并不总是可能的,更重要的是,无论如何,糜烂/溃疡患者不可避免地有更广泛的中性粒细胞浸润。采用这个简化的'neutrophil-only的方法,我们期望组织学读数将是最大限度的客观和可重复性。从实用的角度来看,其他对内窥镜特征和/或临床结果也有一定影响的组织学成分的添加并没有增加显著的好处,反而会使AI算法的开发复杂化。我们认为,与目前可用的其他组织学评分相比,PHRI是最容易在日常实践中应用的UC疾病活动性的通用组织学指标和定量测量(分级工具)。表1

另一个优势是,PHRI使得对广泛结肠炎患者结肠不同部位的多个活检进行组织学评分更加容易,从而实现整个评估,并生成每个结肠的全局(总分、最大值或平均值)评分。这种方法将提高组织学评估的全局性和整体准确性。

在我们的分析中,我们发现直肠和乙状结肠的PHRI评分在与内镜检查的相关性和对临床结果的预测方面是相似的。此外,PHRI总分(PHRI_max和PHRI_total)与最高分具有相同的应用价值和意义。因此,考虑到不同患者和不同临床医生进行的活检的总数和疾病程度不同,我们倾向于将全局评分设置为所有活检(PHRI_max)中的最高/最差评分,或仅设置为组织学最差活检的评分。最后,基于PHRI的计算机辅助UC组织学诊断和评分系统的成功开发,据我们所知,这是IBD领域的第一个成功开发的系统,支持了简化评分很容易实现到AI模型的概念。这可能补充快速发展的UC内镜评分AI系统,包括由包括我们在内的许多作者通过内镜评分预测组织学。40-48虽然是初步的,但是这些发现在CAD系统快速集成到临床实践中是非常有希望的。这一变化的潜在好处是非凡的,但它们的讨论超出了我们的研究目标。

不可否认,我们的工作有一些局限性。首先,我们的患者随访方案不包括12个月时的内窥镜和组织学重新评估(不是所有中心的护理标准),其次,它只持续了12个月,而一些临床结果甚至在36个月后仍可观察到。49第三,我们没有像其他研究那样使用患者报告的结果对患者进行随访1日15因为症状与组织学或内窥镜检查不太相关。第四,我们还没有充分测试泛结肠炎患者全结肠不同区域的PHRI整体评分,尽管我们在招募了不同队列患者的本研究中纳入了两个部位(直肠和乙状结肠)。我们招募患者作为标准护理的一部分,这包括柔性乙状结肠镜或结肠镜。在特定临床试验背景下的大队列外部验证是必要的,并将作为下一步进行。最后,一些组织学解释具有挑战性,需要进一步讨论(详见组织学附录)。一个未解决的问题仍然是,对于那些到达ER的患者,其当前所有组织学指标的次优表现,因为那里缺乏或缺乏残余的中性粒细胞。在这一特殊的患者群体中,组织学指标,包括我们新的PHRI,与内镜评分或复发率失去相关性。PHRI在评估这些患者复发风险方面的预测能力也很有限,尽管在急诊室的患者活检中发现PHRI >0仍然值得关注。通过使用不同的组织学评分,Narula也未能显示组织活性对该亚群患者复发影响的意义。50造成这一差距的原因可能有几个。首先,少数有组织学但无内镜活性的病例(我们的患者中只有10%有PHRI >0)不足以支持分析。其次,UC治疗后残余炎症的不均一分布可能导致对疾病活动性的低估。第三,UC的复发不是简单的微小残余炎症引起的,而是紊乱的黏膜免疫机制重新激活的结果。

但我们认为,与其他组织学指标相比,PHRI是最简单的指标,也是最客观和敏感的指标。由于病理学家只需要识别中性粒细胞,这是阅读活检切片作为临床组织病理学评估的例行工作的一部分,因此无需额外的努力和花费额外的时间就可以立即获得PHRI评分。因此,PHRI评分也可以很容易地包含到病理报告中,这是目前很少发生的事情。因此,我们相信PHRI可以有效地应用于临床实践。

总之,PHRI是一个简单和可重复的组织学指标,与内镜活动密切相关,并预测UC的临床结果。因此,如果进一步验证满足美国食品和药物管理局或欧洲药品管理局的要求,它非常适合在临床实践中采用,也适合在临床试验和中心读数中考虑。我们建议使用PHRI临界值0来定义HR,并使用临界值1来区分不良结果的低风险与高风险。PHRI的二分性(即中性粒细胞的存在或不存在)使得机器学习算法的发展具有较高的诊断准确性,用于检测UC中的疾病活度和HR。在将基于深度学习的计算机辅助分类器应用于临床之前,还需要进一步的研究对其进行验证。

数据可用性声明

根据合理的要求提供数据。计算机算法代码可根据合理要求提供。

伦理语句

病人同意发表

伦理批准

获得西米德兰兹研究伦理委员会(17/WM/0223)和所有中心的机构伦理委员会的伦理批准。所有患者均知情同意参与研究。

致谢

作者要感谢Zainab Abdawn博士在组织切片检索和数字化方面的帮助。

参考文献

补充材料

脚注

  • 推特@IBDdoc

  • XG、AB、RdA和VV贡献相等。

  • 调整通知这篇文章在Online First发布后进行了修改。更新了作者关系,替换了图2和3。

  • 贡献者XG:研究概念和设计,数据的获取,数据的分析和解释,稿件的起草,对稿件重要的知识内容进行批判性修改。AB, ELS, MATM, GA, RP, RK, EG:数据分析和解释,重要知识内容的关键修改稿件,统计分析。VV:研究概念和设计,数据采集,数据分析和解释,对重要知识内容的稿件进行批判性修改。RdA:研究数据的构思、分析和解释,对重要知识内容的稿件进行批判性修改。MV, GdH, DZ, PB, JGF, MG, BH, ML, AP-B, LP, TR, GET, RB:数据采集,数据分析和解释,对重要智力内容的稿件进行批判性修改。TLP:分析和解释数据,起草稿件,对稿件重要的知识内容进行批判性修改。UNS, GM:数据采集,对重要知识内容的稿件进行批判性修改。对重要的知识内容进行批判性的修改。VN, SG:研究概念和设计,分析和解释数据,起草稿件,对稿件重要的知识内容进行批判性修改。MI:研究的概念和设计,组织评分的AI概念,数据的获取,数据的分析和解释,手稿的起草,重要的智力内容和研究的保证的关键修改手稿。

  • 资金MI和SG由伯明翰大学医院伯明翰生物医学研究中心、NHS基金会信托基金和伯明翰大学资助。

  • 免责声明本文仅代表作者个人观点,不一定代表NHS、国家卫生条例或卫生部的观点。

  • 相互竞争的利益没有宣布。

  • 来源和同行评审不是委托;外部同行评审。

  • 补充材料本内容由作者提供。它没有经过BMJ出版集团有限公司(BMJ)的审查,也可能没有经过同行评审。讨论的任何意见或建议仅仅是那些作者(s)和不被BMJ认可。BMJ放弃从放在内容上的任何依赖产生的所有责任和责任。如果内容包含任何翻译材料,BMJ不保证翻译的准确性和可靠性(包括但不限于当地法规、临床指南、术语、药品名称和药物剂量),并且不对翻译和改编或其他原因引起的任何错误和/或遗漏负责。