条文本

溃疡性结肠炎中的毕加索组织学缓解指数(PHRI):开发一种用于监测粘膜愈合和预测临床结果的新型简化组织学评分及其在人工智能系统中的适用性
  1. 相对Gui1
  2. Alina Bazarova23.
  3. Rocìo del Amor4
  4. 迈克尔Vieth56
  5. Gert de Hertogh7
  6. Vincenzo Villanacci8
  7. 大卫。Zardo9
  8. 托马索·洛伦佐·帕里吉1011
  9. Elin Synnøve Røyset12
  10. 乌代·N·希瓦吉213
  11. 梅丽莎,安娜,特蕾莎,莫妮卡8
  12. 朱里奥铜质把手8
  13. Pradeep班达里14
  14. 西尔维奥•Danese1516
  15. Jose G Ferraz17
  16. Bu 'Hussain Hayee18
  17. 马克?纳扎勒夫19
  18. 阿道夫•Parra-Blanco20.
  19. 卢卡Pastorelli2122
  20. 雷莫Panaccione17
  21. Timo Rath23
  22. Gian Eugenio Tontini24
  23. 拉尔夫Kiesslich25
  24. 英国皇家空军Bisschops26
  25. 恩里科Grisan2728
  26. 瓦莱里·Naranjo4
  27. Subrata Ghosh229
  28. 玛丽埃塔Iacucci21330.
  1. 1病理华盛顿大学医学院西雅图佤邦美国
  2. 2转化医学研究所伯明翰大学伯明翰、英国
  3. 3.生物物理研究所科隆大学科隆、德国
  4. 4研究所de Investigación e Innovación en Bioingeniería, I3B巴伦西亚理工大学瓦伦西亚、西班牙
  5. 5病理学研究所Klinikum Bayreuth有限公司拜罗伊特、德国
  6. 6病理学研究所Friedrich-Alexander-Universitat埃埃朗根、德国
  7. 7病理科鲁汶大学附属医院鲁汶、比利时
  8. 8病理科布雷西亚民事助理法官布雷西亚、意大利
  9. 9细胞病理学系伯明翰大学医院NHS基金会信托伯明翰、英国
  10. 10生物医学科学系Humanitas大学米兰、意大利
  11. 11免疫学与免疫治疗伯明翰大学伯明翰、英国
  12. 12医学与健康科学学院临床与分子医学系挪威科技大学特隆赫姆、挪威
  13. 13胃肠病学国家健康研究所伯明翰生物医学研究所伯明翰、英国
  14. 14消化内科亚历山德拉皇后医院朴茨茅斯、英国
  15. 15消化内科和内窥镜科“,Università向圣拉斐尔致敬米兰、意大利
  16. 16消化内科和内窥镜科“,圣拉斐尔医院米兰、意大利
  17. 17消化内科卡尔加里大学卡明医学院卡尔加里阿尔伯塔省、加拿大
  18. 18国王健康合作治疗内窥镜研究所国王学院医院NHS基金会信托伦敦、英国
  19. 19医学系约翰霍普金斯大学巴尔的摩马里兰美国
  20. 20.消化内科诺丁汉大学医院NHS信托诺丁汉、英国
  21. 21胃肠病学单位IRCCS Policlinico San Donato米兰的圣多纳托、意大利
  22. 22米兰大学健康科学系米兰、意大利
  23. 23肠胃科埃尔兰根大学纽伦堡校区纽伦堡、德国
  24. 24米兰大学病理生理学和移植学系IRCCS Ca'Granda Ospedale Maggiore Policlinico基金会米兰、意大利
  25. 25消化内科Helios HSK威斯巴登、德国
  26. 26消化内科鲁汶大学附属医院鲁汶、比利时
  27. 27工程学院伦敦南岸大学伦敦、英国
  28. 28信息工程系Università degli Studi di Padova帕多瓦、意大利
  29. 29APC微生物组,爱尔兰,科克大学学院软木塞、爱尔兰
  30. 30.消化内科伯明翰大学医院NHS基金会信托伯明翰、英国
  1. 对应到Marietta Iacucci博士,伯明翰大学转化医学研究所,伯明翰B15 2TT,英国;M.Iacucci在{}bham.ac.uk;桂先勇博士,美国华盛顿州西雅图市华盛顿大学医学院病理科;xgui在}{uw.edu

摘要

组织学缓解正逐渐成为UC的重要治疗靶点。我们的目标是开发一种简单的组织学指标,与内窥镜检查相一致,与临床结果相关,适合应用于人工智能(AI)系统来评估炎症活动。

方法利用一项前瞻性多中心研究中纳入的307例UC患者的614例活检,我们开发了帕丁顿国际虚拟色内窥镜评分(PICaSSO)组织学缓解指数(PHRI)。评估了与其他多个组织学指标的一致性以及阅读器间重复性的验证。最后,为了将PHRI实现到计算机辅助诊断系统中,我们训练并测试了一种基于CNN架构的新型深度学习策略,以检测中性粒细胞,计算PHRI,并使用138个活检组织的子集识别活跃的静态UC。

结果PHRI与内镜评分(Mayo内镜评分和UC内镜严重程度指数和PICaSSO)以及临床结果(住院、结肠切除术和因UC发作而开始或改变药物治疗)密切相关。PHRI评分为1可以准确地对患者在12个月内的不良结局(住院、结肠切除术和因突发发作而优化治疗)的风险进行分层。读者之间的一致性很高(类内相关性为0.84)。我们初步的AI算法区分活性UC和静态UC的灵敏度为78%,特异性为91.7%,准确率为86%。

结论PHRI是UC的一个简单的组织学指标,它与内镜活动和临床结果的相关性最高。基于phri的AI系统在预测组织学缓解方面是准确的。

  • 组织病理学
  • 溃疡性结肠炎
  • 炎症性肠病
  • 计算机图像分析

数据可用性声明

应合理要求提供数据。计算机算法代码可在合理的要求。

http://creativecommons.org/licenses/by-nc/4.0/

这是一篇开放获取的文章,根据创作共用署名非商业(CC BY-NC 4.0)许可证发布,该许可证允许其他人以非商业方式分发、混音、改编、在此基础上进行构建,并以不同的条款许可其衍生作品,前提是正确引用原始作品,给予适当的荣誉,任何更改都已注明,并且使用是非商业性的。看到的:http://creativecommons.org/licenses/by-nc/4.0/

数据来自Altmetric.com

请求的权限

如果您希望重用本文的任何或全部内容,请使用下面的链接,该链接将带您到版权清除中心的RightsLink服务。您将能够快速获得价格和即时许可,以多种不同的方式重用内容。

本研究的意义

  • 我们开发了一种新的简单的UC组织学指标,帕丁顿国际虚拟色内窥镜评分组织学缓解指数(PHRI),可以成功地实现到人工智能(AI)模型中来检测组织学缓解。

关于这个问题我们已经知道了什么?

  • UC的组织学活性与不良预后相关,组织学缓解已被提出作为UC的治疗目标。

  • 多种组织学指标已被开发用于定义疾病活动性,但由于其复杂性,在临床实践中尚未被广泛采用。

  • 机器学习模型是强大的工具,可以补充和支持病理学家在他们的组织病理学评估。

新的发现是什么?

  • PHRI是一种仅基于中性粒细胞是否存在(是/否)的新评分,它提供了极好的诊断准确性,在几种组织学评分中与内镜活动的相关性最强,评分者之间的差异最小,并对长期临床结果具有极好的预测能力。

  • 基于PHRI的AI算法能够准确地确定组织学缓解。

本研究的意义

在可预见的未来,它会对临床实践产生怎样的影响?

  • PHRI可以帮助以最实用和简单的方式标准化UC的组织学评估。

  • 基于PHRI的机器学习模型可以进一步促进组织学阅读,提高诊断性能。

简介

组织学评估在确定UC的炎症活动和监测治疗反应中起着关键作用。组织学缓解(HR)(也称为组织学愈合)是一种新兴的治疗靶点,由于其与有利的结果相关,是UC临床试验的重要结果。1 - 10然而,在如何将组织学纳入临床实践方面仍然存在挑战,主要原因是:(1)HR缺乏一个通用的定义来指导病理学家;(2)缺乏一个敏感的、易于应用的组织学评分/指数。理想情况下,该指标应:(a)提供疾病活动的内镜评估信息并与之相关,(b)代表受损黏膜的恢复/愈合状态,(c)预测疾病结果。

UC的组织病理学特征是慢性活动性结肠炎的复发和缓解过程,包括三个基本组成部分:(1)活动性炎症('活动’),即隐窝上皮和固有层的中性粒细胞浸润;(2)慢性炎症,以固有层内单个核细胞(淋巴细胞和浆细胞)浸润扩张为特征,常伴有基底浆细胞增多症和嗜酸性粒细胞增多症;(3)隐窝结构/结构扭曲('慢性’),其特征是隐窝在大小、形状、方向和隐窝间距上不规则和变化,这是隐窝重复损伤和再生混合的结果。

在过去的几十年里,>30组织学评分已经开发出来,尽管其在临床实践中的应用仍然有限。11日12同样,也提出了不同的HR定义和标准,从“粘膜溃疡/糜烂消除”到“组织学完全正常化”。13 13-18几乎所有研究人员现在都同意,中性粒细胞浸润(“无中性粒细胞”粘膜)的缺失是HR定义的关键,因为它与良好的临床结果相关。2 4 5 19-22事实上,两个独立的国际专家小组最近建议将HR定义为中性粒细胞浸润的缺失(即组织学活性的消除)。22日23日

随着数字病理学的出现,人工智能(AI)算法越来越多地应用于组织病理学评估和诊断,正如医学中许多以图像为重点的领域所看到的那样。例如,利用基于卷积神经网络(CNN)的学习,它被广泛引入到肿瘤病理学中。24但是,到目前为止,据我们所知,还没有开发出计算机辅助诊断(CAD)系统来进行组织学评分和评估UC的HR。部分原因是现有组织学评分的复杂性和混合主观性使得构建和训练深度学习算法(有监督和无监督)变得困难。

最近,我们进行了一项前瞻性的国际多中心研究,开发了帕丁顿国际虚拟色内窥镜评分(PICaSSO)内窥镜评分,25日- 27日通过使用高清虚拟电子色内窥镜(HD-VCE)评估UC患者的内窥镜活动和缓解的新工具。与Mayo内镜评分(MES)和UC内镜严重程度指数(UCEIS)相比,PICaSSO内镜评分与多种组织学评分的相关性更好。27目前的研究与我们之前发表的所有关于毕加索内窥镜评分的研究不同,而且更进一步,因为它专注于创造一个新的UC组织学评分组织病理学家可以在临床实践和试验中快速轻松地使用,并可以整合到人工智能算法中。以PICaSSO项目为平台,在本研究中,我们仔细分析了来自内镜下评估的相同结肠区域的粘膜活检,重点是确定与组织学-内镜相关性和不良临床结果风险相关的特定组织病理学成分。最终,我们的目标是开发一种简化和新颖的组织学评分,能够准确反映微观黏膜炎症和愈合,预测临床结果,对治疗的反应,并易于实现到机器学习算法中,从而易于应用于临床实践和试验。创建一个简化的组织学评分PHRI,这是一个客观的组织学仪器是主要目的,因为目前在临床实践中使用组织学评分是有限的。PHRI的主要目的是创建一个简单的“纯中性粒细胞”组织学评估,预测特定的临床结果。另一个目的是理想的组织学指标应超出内镜评价的限度。

患者与方法

研究人群、内镜评估和临床随访

来自欧洲和北美11个中心的307名UC患者被前瞻性地纳入国际多中心毕加索研究。内镜和组织学评估的方案已在以前的出版物中详细描述。27简单地说,每位患者都接受了白光HD结肠镜检查,以确定MES和UCEIS,28 29其次是VCE (iSCAN, Pentax, Japan),以确定PICaSSO评分,包括粘膜和血管亚评分(PICaSSO muc粘膜评分(PMS)和PICaSSO血管评分(PVS))。25 27在评估的直肠和乙状结肠相同区域,并在内窥镜上记录视频,至少进行了两次靶向粘膜活检,共进行了614次活检,用于组织病理学分析。从炎症最严重的区域或显示毕加索确定的内镜缓解(ER)最具代表性的特征的区域进行靶向活检。26随后对所有患者进行了至少12个月的定期临床随访,以记录以下预定的不良临床结果:(1)因UC复发而住院,(2)结肠切除术,(3)UC发作的药物治疗开始或改变,包括类固醇、免疫抑制剂和生物制剂(在排除不良反应、免疫原性或低剂量药物后)。

阶段I:深层组织学分析和组织学-内窥镜-临床结果相关性

用Aperio数字病理扫描系统(Leica Biosystem, Illinois, USA)以40× (0.25 μm / pixel)的速度扫描结直肠活检的h&e染色玻片。HD数字化切片由一组6名有IBD经验的GI病理学家(XG, MV, VV, DZ, GdH, ESR)集中保存和阅读,他们对内窥镜数据不了解。对于每个部分的每个活检,应用五种不同的组织学评分方案对最糟糕的特征进行评分——geboes评分(GS),30.罗氏组织学指数(RHI),31南希组织学指数(NHI),32程度、慢性、活动性和加号(ECAP评分)33 34Villanacci简化评分(VSS)。35分别分析直肠和乙状结肠各分值和子分值的平均值。

内窥镜-组织学相关性分多个步骤进行分析,以确定与疾病活动和缓解的不同内窥镜特征/模式具体对应的组织病理学特征/成分,并预测随访中特定临床结果的风险。

第二阶段:开发和评估毕加索组织学缓解指数

基于我们在I期研究中多步综合组织学-内窥镜-临床结果相关性分析的可靠结论,并在病理专家之间进行了改进的德尔菲圆桌讨论后,存在中性粒细胞浸润在UC组织病理学中被确定为决定疾病活动性、粘膜愈合和临床结果的关键因素。随后,一种新颖的简化组织学评分方案,毕加索组织学缓解指数(PHRI)被提出表1.该指标仅考虑上皮细胞和固有层的中性粒细胞浸润,如图所示在线补充图1.溃疡和糜烂不包括在内,因为溃疡和/或糜烂的组织学特征由于取样差异在活检中并不总是明显。我们特别标准化了"cryptitis(任意数量的中性粒细胞浸润任意数量的隐窝/腺上皮)和隐窝脓肿’(任何数量的中性粒细胞溢入隐管腔的隐窝炎和任何程度的隐窝上皮细胞损伤),考虑到隐窝炎和隐窝脓肿仍然缺乏明确和标准化的组织学标准。病理学家还完成了一个标准化的培训模块,其中包括几张显示所有组织学特征的组织学图片,然后对切片进行评分。

表1

毕加索组织学缓解指数(PHRI)

然后使用新的PHRI重新分析上述组织学-内镜相关性,将其与其他五个组织学指标进行比较,并预测12个月随访时的临床结果。我们还探讨了PHRI在进一步分层已经在ER (MES为0)的患者的疾病复发风险方面的额外预后益处。直肠和乙状结肠的PHRI评分被单独考虑,也被合并到总分中(PHRI_total,即直肠和乙状结肠PHRI评分之和)或最大评分(PHRI_max,即直肠与乙状结肠之间得分较高)。选择了后者,PHRI_max。如果没有特别说明,术语PHRI是指在检查区域的最高分PHRI_max。

第三阶段:PHRI的验证

为了验证PHRI,同样的病理学家评估了50个数字切片(大约一半是静止的,一半是活动的UC),并对PHRI和其他五个选定的指标进行了评分。验证病例由来自同一研究组的非病理学研究者随机选择并重新标记。病理学家不了解临床和内镜信息,独立进行组织学评分。

第四阶段:AI算法开发

在这项探索性研究中,我们从研究收集中随机选择了138个活检组织,这些活检组织代表了整个研究收集的614个不同级别的炎症。我们开发了一种CNN分类器来检测整个幻灯片图像(WSIs)中的中性粒细胞,并根据中性粒细胞的存在将其分为组织学缓解或非缓解。在AI中给出了CNN的详细设计在线补充附录.简单地说,第一个模型识别了含有中性粒细胞的斑块(WSI的区域),而第二个模型,使用多实例学习方法,将幻灯片中每个斑块的特征结合成PHRI之后的最终二分类结果(存在或不存在活动性疾病)(图1).

图1

提出的深度学习方法的框架。该框架由两个具有不同但相关任务的模型组成。第一个模型使用组织学图像中预先训练的结构预测带有中性粒细胞的斑块。第二个模型使用第一个模型使用的特征提取器和特征细化来预测患者水平的UC。GAP,全球平均统筹;SE,挤压和激励(特征细化)。

统计数据

统计软件R (R核心团队,https://www.R-project.org/)。连续变量和分类变量的相关性强度用斯皮尔曼(ρ)相关系数测量。0.8-1.0的系数被认为是“非常强”,0.6-0.79为“强”,0.4-0.59为“中等”,0.2-0.39为“弱”。通过为每对变量绘制100个自举样本并计算相应的分位数来比较斯皮尔曼的相关性。Wilcoxon和Fisher的精确检验分别用于确定连续分布和二元分布之间的差异。对于受试者工作特征曲线下面积分析,我们使用R-package pROC (https://CRAN.R-project.org/package=pROC).预测模型采用R-package CARRoT (https://CRAN.R-project.org/package=CARRoT).详细情况在统计中报告在线补充附录

Cox比例风险模型用于计算不同PHRI临界值下无特定临床结果的生存概率。采用HR测试和r包生存分析(https://CRAN.R-project.org/package=survival).

为了评估评分者之间组织学评分的一致性,我们使用单因素组内相关(ICC)系数,通过R包irr (http://cran.r-project.org/package=irr).为了检验ICC为>0.5与替代的假设,我们需要至少40张组织学图像,以达到0.8的幂,I型误差为0.05。36根据兰迪斯和科赫的基准,37ICC <0.2、0.2至0.4、>0.4至≤0.6、>0.6至0.8和>0.8分别被认为是“差”、“一般”、“中等”、“良好”、“相当”和“几乎完美”。所有统计检验结果均被认为p<0.05为显著性。在最近发表的毕加索内窥镜和组织学研究中计算了统计功率27根据与标准MES相比的毕加索内镜评分和组织学评分的相关性,以及指定的临床转归率,确定了302个样本量。

AI CAD检测活动性UC的诊断性能包括敏感性(SE)、特异性(SP)、阳性预测值(PPV)、阴性预测值(NPV)和准确性(ACC)。

结果

对307例UC患者的614例活检进行了分析。168例(54.7%)患者在MES 0定义的ER中,而其他患者在研究时具有内窥镜活动性疾病。所有患者均未接受局部治疗或患有蒙特利尔E1病。270例(88%)患者完成了12个月的随访。研究对象的详细人口统计数据见表2

表2

研究对象的人口学数据

第一阶段:中性粒细胞是组织学-内镜-临床相关性的关键决定因素

所有5个组织学指标(VSS, RHI, NHI, GS和ECAP)都与肠内相同区域(直肠和乙状结肠)的所有内镜评分密切相关(Spearman ρ= 0.55-0.78),如热图所示(图2).所有组织学指标也显示与12个月时预先规定的不良临床结果存在弱至中度相关性(ρ= 0.34-0.42) (图2).

图2

毕加索组织缓解指数(PHRI)的相关性。热图显示了直肠(A)和乙状结肠(B)不同组织学和内镜评分之间的Spearman相关系数,以及12个月时内镜-组织学评分与指定临床结果之间的相关系数(0.8-1.0:非常强相关性,0.6-0.79:强相关性,0.40-0.59:中等相关性,0.2-0.39:弱)(*p<0.05,与PHRI在同一类相关分析中的相关强度比较)。ECAP、程度、慢性、活动性及+;PHRI,毕加索组织学缓解指数;毕加索,帕丁顿国际虚拟色内窥镜评分;Robarts组织学指数;UCEIS, UC内镜严重指数。

进一步研究不同组织病理学成分之间的相关性(在线补充表1)和内镜评分(用PICaSSO评分的粘膜和血管亚评分表示),固有层和上皮细胞的中性粒细胞浸润,特别是固有层和两者结合的中性粒细胞浸润,通常表现出最强的相关性(ρ= 0.60-0.76),而其他组织学特征也表现出一定程度的相关性(中度至强,ρ= 0.43-0.64) (p<0.05) (图3).同样,中性粒细胞浸润也显示出较强的相关性,尽管总体上弱/中度(ρ= 0.40-0.45),与12个月时的临床结果相比,与其他组织学特征(ρ= 0.24-0.37) (p<0.05) (图3).

图3

组织病理学成分的相关性。热图显示所有患者的组织病理学成分与毕加索内镜评分和12个月不良转归率的相关性。直肠(A)和乙状结肠(B)活检(0.8-1.0:极强相关性,0.6-0.79:强相关性,0.40-0.59:中等相关性,0.2-0.39:弱相关性)(*p<0.05与固有层中性粒细胞浸润比较,!p<0.05与中性粒细胞浸润总量比较,#p<0.05与上皮中性粒细胞浸润比较,在同一类相关分析中相关强度)(中性粒细胞总量:固有层和上皮均有中性粒细胞浸润)。毕加索,帕丁顿国际虚拟色内窥镜评分。

第二阶段:PHRI的组织内窥镜和临床结果的相关性

PHRI与内镜下疾病活动性相关性最好

PHRI与内镜评分相关性较强,在所有组织学指标中相关性最强(p<0.05) (图2).

PHRI与特定临床结果和复发风险的相关性

对于整个队列,PHRI在12个月时与特定的不良临床结果显示出类似的中度相关性(ρ值约为0.4)。此外,在12个月时有特定不良临床结果的患者的PHRI平均评分明显高于无不良事件的患者(在线补充表2在线补充图4).

此外,我们进行了多变量logistic回归,以探索其他组织学特征(慢性炎症、基底浆细胞增多症和嗜酸性粒细胞增多症)是否可以改善PHRI对特定临床结果的预测。我们发现,这些组织学特征的添加都没有进一步改善PHRI预后结果的能力(图4).

图4

受试者工作特征(ROC)曲线和帕丁顿国际虚拟色内窥镜评分组织学缓解指数(PHRI)阈值来预测特定的临床结果和组织学缓解(HR)。AUROC,受试者工作特征曲线下面积;CI,慢性炎症;neun - lp:固有层中性粒细胞浸润;Neu-Epi,上皮中性粒细胞浸润;PHRI_rec,直肠PHRI评分;PHRI_sig, sigmoid的PHRI分数。

PHRI >0的患者与PHRI=0的患者相比,12个月时不良临床事件(结局)显著增加(48.65% (54/111)vs 13.91% (21/151), p<0.00001),如图所示在线补充图4C.此外,采用受试者工作特征(ROC)曲线进行分析,如图所示在线补充表3A,整个队列中PHRI用于预测12个月特定临床结果的最佳临界值为1(≤1 vs >1)。

在预测特定临床结果时,PHRI的Cox比例危险曲线

我们以0或1作为PHRI(或直肠或乙状结肠个别PHRI)的分界值,进一步用Cox比例危险曲线进行分析,患者在12个月随访期间特定临床结局的事件率显著分层,如图图5A及B.PHRI在任何形式下的预测能力几乎相同。

图5

帕丁顿国际虚拟色内窥镜评分组织学缓解指数(PHRI)的Cox比例风险曲线在长达12个月的随访中分层特定临床结果的风险。A和B为所有患者,C为Mayo内镜评分为0的患者。(A) PHRI=0(蓝色)vs >0(红色)。(B)使用PHRI≤1(蓝色)vs >1(红色)。(C)随访12个月,PHRI=0(蓝色)vs >0(红色)。

图6

原始图像(第一列),病理学家的注释(第二列)和类激活图(CAMs)(第三列)。注意,在本例中,第一行对应固有层,而第二行对应上皮表面。

仅内镜下缓解患者的亚组分析

当我们挑选出MES 0定义的急诊室患者时,组织学-内窥镜-临床结果的相关性在所有方面都变得很弱。在研究的I期,对于这一特定亚群患者,其中只有少数患者在结直肠活检中存在轻度中性粒细胞浸润(5.7%在固有层中存在中性粒细胞,5.4%在上皮中存在中性粒细胞),组织学和内窥镜评分(以PICaSSO粘膜评分和PICaSSO血管评分表示)之间的相关性(ρ<0.30)以及组织学评分与特定临床结果(指示该特定患者人群复发)之间的相关性都变得微弱或接近零(ρ= 0-0.12) (在线补充图2).然而,中性粒细胞浸润是保持相关性的单一组织学特征,尽管相关性较弱(略高于0.1)(在线补充图3).

在研究的II期,在ER患者(MES 0)中,只有10.9%的PHRI为>0(存在中性粒细胞浸润),89.1%的PHRI为0(无中性粒细胞浸润),PHRI与内镜评分之间的相关性也变得弱得多(ρ= 0.24-0.36) (在线补充表4).然而,PHRI总体上仍优于大多数其他组织学指标(p<0.05),其与PICaSSO评分及其粘膜和血管亚评分的相关性(在线补充图2).此外,PHRI评分与预定临床结果之间的相关性也很弱,但仍优于其他组织学评分(p<0.05) (在线补充图2而且在线补充表4).与此一致的是,PHRI >0的患者12个月时的复发率似乎高于PHRI 0的患者(11.76% (2/17)vs 9.3%(12/129)),尽管差异无统计学意义(p>0.05) (在线补充图4D).最后,预测ER患者12个月复发的PHRI的最佳临界值似乎是1(≤1 vs >1),尽管Cox比例危险曲线的进一步分析未能令人满意地对患者的复发风险进行分层(图5 c).

第三阶段:PHRI的效度和信度

病理学家对所有组织学评分的评分者之间的一致性非常好,如ICCs所反映的:RHI 0.77 (95% CI 0.69至0.85),NHI 0.85 (95% CI 0.79至0.90),GS 0.82 (95% CI 0.75至0.88),ECAP 0.87 (95% CI 0.82至0.92),VSS 0.77 (95% CI 0.71至0.86)和PHRI 0.84 (95% CI 0.78至0.90)。各指标间ICCs差异无统计学意义。总体而言,PHRI的观察者间一致性几乎完美,尽管不一定显著优于其他组织学指标。还分析了ICC在不同组织学指标的每个组织学成分上的分解情况。对于任何给定的组织学评分,我们对中性粒细胞相关参数的评估达成了最佳共识,如图所示在线补充表5

第四阶段:能够检测中性粒细胞的卷积神经网络分类器

我们将我们的队列分为两组,训练和测试,具有相似的患者特征,以避免过度拟合我们的系统,并确保其概括性。70%的活组织切片用于训练模型,30%用于测试模型。为了训练所提出的模型并优化所涉及的超参数,15%的训练集被用作验证。在测试集中,我们用于检测中性粒细胞的CAD的SE为0.71,SP为0.95,PPV为0.85,NPV为0.89,准确度为0.88,这些结果与验证队列的结果一致(见表3).图6显示类激活图以突出显示补丁级感兴趣的区域,其中所提出的模型集中于预测样本。高亮区域与含有中性粒细胞的区域相匹配。对于组织学缓解预测,以相同特征表达的诊断性能分别为0.78,0.92,0.88,0.85和0.86(见表3).

表3

中性粒细胞识别模型在验证和测试阶段的分类结果和UC活性预测

讨论

我们为UC开发了一种新的、更简单的HR指数PHRI,它与内镜下疾病活动和临床结果有很好的相关性,可以很容易地实现到CNN模型中。该组织学指标的发展过程与现有评分不同。PHRI是病理学家和内窥镜医师联合合作的结果,旨在开发与内窥镜评分一致的组织学评分,并超越内窥镜评估。27我们的工作有几个优点。首先,组织学研究是一项大型国际多中心前瞻性研究的一部分,该研究的重点是内窥镜-组织学-临床相关性。我们纳入了大量匹配的活检,这些活检是在进行内镜评估后立即进行的,并且完全来自相同的区域,而不是将比较限制在患者水平。其次,我们没有像其他组织学指标那样包括多个诊断特征,而是将PHRI限制在一个参数上,中性粒细胞浸润(活动性炎症),通过多种比较分析确定的单一因素,与内镜特征和临床结果最相关。我们的独立发现与Pai的研究相呼应21并且与中性粒细胞在疾病活动性和HR定义中的重要性的共识一致。

PHRI最显著的优点是它的简单性。PHRI只需要确定固有层和腺上皮内浸润性中性粒细胞的存在或不存在,以一种直接的“是或否”(存在或不存在)的二分方法。它还避免了通常的活动分级(如轻度、中度和重度),通过任意的视觉尺度或估计百分比值,这有点主观。正如其他研究人员所发现的和我们自己的评分者间协议数据所显示的那样,中性粒细胞的评估一直是最可重复的特征。38 39溃疡/糜烂通常包含在其他指标中,但PHRI将其排除在外,因为我们认为这是一个潜在的变异来源,对评分的准确性贡献不大。的确,糜烂/溃疡在活检组织学上可能不可见,22两者之间的区别并不总是可能的,更重要的是,糜烂/溃疡患者不可避免地有更广泛的中性粒细胞浸润。采用简化的'neutrophil-only的方法,我们期望组织学读数将最大限度地客观和可重复性。从实用的角度来看,其他对内镜特征和/或临床结果有一定影响的组织学成分的添加并没有带来显著的好处,反而会使AI算法的开发复杂化。我们认为,与目前可用的其他组织学评分相比,PHRI作为UC疾病活动性的通用组织学指标和定量测量(分级工具),在日常实践中最容易应用。表1

PHRI的另一个优点是更容易对广泛结肠炎患者的不同结肠节段的多个活检进行组织学评分,以实现整个评估并生成每个结肠的总体评分(总评分、最高评分或平均评分)。这种方法将欣赏全局和增加组织学评估的整体准确性。

在我们的分析中,我们发现直肠和乙状结肠的PHRI评分与内窥镜检查和预测临床结果的相关性相似。此外,PHRI的最高分和总分(PHRI_max和PHRI_total)具有相同的应用价值和意义。因此,考虑到不同患者和不同临床医生的活检总数和疾病程度不同,我们倾向于将总体评分设置为所有活检中的最高/最差评分(PHRI_max),或仅设置组织学上最差活检的评分。最后,基于PHRI的计算机辅助UC组织学诊断和评分系统的成功开发,据我们所知,这是IBD领域的第一个成功开发的系统,支持简化评分易于实现到人工智能模型中的概念。这可能会补充快速发展的UC内镜评分人工智能系统,包括包括我们在内的许多作者从内镜评分中预测组织学。40-48虽然是初步的,但这些发现在CAD系统快速集成到临床实践中尤其有希望。这种变化的潜在好处是非凡的,但他们的讨论超出了我们研究的目标。

不可否认,我们的工作有一些局限性。首先,我们的患者随访方案不包括12个月的内窥镜和组织学重新评估(不是所有中心的标准护理),其次,它只持续了12个月,而一些临床结果甚至可以在36个月后观察到。49第三,我们没有使用与其他研究相似的患者报告结果对患者进行随访1日15因为症状与组织学或内窥镜检查不太相关。第四,我们还没有充分测试泛结肠炎患者整个结肠不同区域的PHRI总体评分,尽管我们在本研究中纳入了两个部位(直肠和乙状结肠),招募了不同的患者队列。我们招募患者作为标准治疗的一部分,这包括柔性乙状结肠镜或结肠镜。在特定临床试验背景下的大队列外部验证是必要的,将作为下一步进行。最后,一些组织学解释具有挑战性,需要进一步讨论(详情见组织学附录)。一个未解决的问题仍然是,目前所有组织学指标的表现不佳的患者已到达急诊室,残余中性粒细胞缺乏或稀少。在这个特定的患者群体中,组织学指标,包括我们新的PHRI,与内镜评分或复发率失去相关性。PHRI在评估这些患者复发风险方面的预测能力也是有限的,尽管在急诊室的患者中,活检发现PHRI >0仍然是有意义的。通过使用不同的组织学评分,Narula也未能显示组织学活动对该亚群患者复发的影响的意义。50造成这种短缺的原因可能有几个。首先,少量具有组织学但无内镜活性的病例(在我们的患者中只有10%的PHRI >0)不足于分析。第二,在治疗后的UC中残留炎症的不均匀分布可能导致了对疾病活动性的低估。第三,UC的复发不是简单地由微小的残余炎症引起的,而是失调的粘膜免疫机制重新激活的结果。

尽管如此,我们认为PHRI与其他组织学指标相比是最简单的,同时也是最客观和敏感的。由于病理学家只需要识别中性粒细胞,这是阅读活检切片作为临床组织病理学评估的常规部分,因此可以立即获得PHRI评分,而无需额外的努力和花费额外的时间。因此,PHRI评分也可以很容易地纳入病理报告,这在目前是不常见的。因此,我们认为PHRI可以有效地应用于临床实践。

总之,PHRI是一个简单和可重复的组织学指标,与内镜活动密切相关,并预测UC的临床结果。因此,如果进一步验证符合美国食品和药物管理局或欧洲药品管理局的要求,它非常适合在临床实践中采用,也适合在临床试验和中央读数中考虑。我们建议使用PHRI临界值0来定义HR,并使用临界值1来对不良结果的低风险和高风险进行分层。PHRI的二分性(即中性粒细胞的存在或不存在)允许开发具有高诊断准确性的机器学习算法,用于检测UC中的疾病活动性和HR。进一步的研究正在进行中,以验证基于深度学习的计算机辅助分类器,然后才能应用于临床实践。

数据可用性声明

应合理要求提供数据。计算机算法代码可在合理的要求。

伦理语句

患者发表同意书

伦理批准

获得西米德兰兹研究伦理委员会(17/WM/0223)和所有中心的机构伦理委员会的伦理批准。所有患者均知情同意参与研究。

致谢

作者要感谢Zainab Abdawn博士在检索和数字化组织学切片方面的帮助。

参考文献

补充材料

脚注

  • 推特@IBDdoc

  • XG、AB、RdA和VV贡献相同。

  • 调整通知这篇文章在Online First发表后已被更正。作者从属关系已经更新,图2和图3已被替换。

  • 贡献者XG:研究概念与设计,数据采集,数据分析与解释,文稿起草,重要智力内容的稿件批判性修订。AB, ELS, MATM, GA, RP, RK, EG:数据分析和解释,重要智力内容的稿件批判性修订,统计分析。VV:研究概念和设计,数据采集,数据分析和解释,对重要知识内容的手稿进行批判性修订。RdA:研究概念,分析和解释数据,对重要知识内容的手稿进行批判性修订。MV, GdH, DZ, PB, JGF, MG, BH, ML, AP-B, LP, TR, GET, RB:数据采集,数据分析和解释,重要智力内容的稿件批判性修订。TLP:对数据进行分析和解读,起草稿件,对重要的智力内容进行批判性的修改。UNS, GM:数据采集,重要知识内容的稿件批判性修订。SD:对重要的知识内容进行批判性的修改。VN, SG:研究概念和设计,分析和解释数据,起草手稿,对重要知识内容的手稿进行批判性修改。MI:研究概念与设计,组织评分AI概念,数据采集,数据分析与解释,手稿起草,重要智力内容和研究保证的手稿批判性修订。

  • 资金MI和SG由伯明翰大学医院NHS基金会信托的NIHR伯明翰生物医学研究中心和伯明翰大学资助。

  • 免责声明所表达的观点是作者的观点,不一定是NHS、NIHR或卫生部的观点。

  • 相互竞争的利益没有宣布。

  • 出处和同行评审不是委托;外部同行评审。

  • 补充材料此内容由作者提供。它没有经过BMJ出版集团有限公司(BMJ)的审查,也可能没有经过同行评审。讨论的任何意见或建议仅是作者的意见或建议,不被BMJ认可。BMJ不承担因对内容的任何依赖而产生的所有责任和责任。如果内容包括任何翻译材料,BMJ不保证翻译的准确性和可靠性(包括但不限于当地法规、临床指南、术语、药品名称和药物剂量),并且对因翻译和改编或其他原因引起的任何错误和/或遗漏不负责。