条文本

原文
的粪便微生物宏基因组分析工具对目标非侵入性结直肠癌的生物标志物
免费的
  1. 6月于1 __,
  2. 羌族冯2,3 __,
  3. 阳光明媚的黄黑1 __,
  4. 亚东张2 __,
  5. 乔易梁1 __,
  6. 愿秦2,
  7. 隆庆唐2,
  8. 回族赵2,
  9. Jan Stenvang4,
  10. 延利提供李2,
  11. Xiaokai王2,
  12. 小强徐2,
  13. Ning陈2,
  14. 威廉Ka祺吴1,
  15. 朱马纳Al-Aama2,5,
  16. 汉斯Jørgen尼尔森6,
  17. Pia Kiilerich3,
  18. 本杰明Anderschou Holbech詹森3,
  19. 东在邱1,
  20. 周兰2,
  21. Huijue贾2,
  22. Junhua李2,
  23. 梁萧2,
  24. 托马斯袁东林1,
  25. 萧简Ng1,
  26. 阿尔弗雷德Sze-Lok程1,
  27. 文森特Wai-Sun黄1,
  28. 弗朗西斯Ka梁陈1,
  29. 荀勖2,
  30. Huanming杨2,
  31. 丽丝马德森2,3,7,
  32. 基督教Datz8,
  33. 赫伯特Tilg9,
  34. 剑王2,
  35. 尼尔斯·布鲁纳2,4,
  36. 卡斯滕Kristiansen2,3,
  37. Manimozhiyan Arumugam2,10,
  38. 约瑟夫Jao-Yiu唱1,
  39. 6月王2,3,5,11
  1. 1医学系的&治疗消化系统疾病的国家重点实验室,消化疾病研究所路健康科学研究所中大深圳研究所,中国大学香港、香港
  2. 2深圳华大基因研究院,深圳,中国
  3. 3生物学系,哥本哈根大学,哥本哈根、丹麦
  4. 4兽医学系疾病生物学,哥本哈根大学健康和医学科学学院,哥本哈根、丹麦
  5. 5公主Al Jawhara卓越中心的遗传研究的障碍,阿卜杜拉国王大学,吉达沙特阿拉伯
  6. 6外科学系胃肠病学,Hvidovre医院,Hvidovre、丹麦
  7. 7国家营养和海鲜研究所,卑尔根、挪威
  8. 8内科,医院Oberndorf,第三季度的帕拉塞尔苏斯私立大学教学医院萨尔茨堡,Oberndorf、奥地利
  9. 9第一个内科,因斯布鲁克医科大学,因斯布鲁克、奥地利
  10. 10诺和诺德基金会基础代谢研究中心的健康和医学科学,哥本哈根大学,哥本哈根、丹麦
  11. 11澳门科技大学,澳门,中国
  1. 对应到小君王教授,北京基因组研究所深圳,深圳518000年中国;wangj在}{genomics.org.cn教授约瑟夫司法院唱,香港中文大学,香港;jjysung在{}cuhk.edu.hk博士和Manimozhiyan Arumugam,哥本哈根大学,2200年哥本哈根,丹麦;arumugam在{}sund.ku.dk

文摘

客观的评估潜在的诊断结直肠癌(CRC)从粪便基因组。

设计我们执行metagenome-wide协会研究CRC患者粪便样本74和54名来自中国的控制,并验证结果在16个病人和24控制来自丹麦。我们进一步验证了生物标记物在两组发表来自法国和奥地利。最后,我们采用有针对性的定量PCR (qPCR)分析评估选定的生物标志物的诊断潜在的中国独立的47个病人和109个对照组。

结果除了确认已知的协会梭菌属nucleatum消化链球菌属stomatis与CRC、我们发现重大协会与几个物种,包括Parvimonas微米Solobacterium moorei。我们发现20微生物基因标记区分CRC和控制微生物,和验证4标记在丹麦队列。在法国和奥地利军团,这四个基因的CRC基因组与区域控制接受者操作曲线(AUC) 0.72和0.77,分别。qPCR测量两种基因的准确分类CRC患者在中国独立队列和AUC = 0.84或23。这些基因在早期(i ii)病人微生物丰富,强调使用粪便宏基因组的潜在生物标志物CRC的早期诊断。

结论我们现在第一个CRC粪便微生物宏基因组分析的研究发现和验证微生物生物标志物在种族不同的军团,并独立验证选择使用一个负担得起的临床相关的生物标记技术。因此我们的研究需要进一步对负担得起的非侵入性的粪便中CRC的早期诊断的生物标志物。

  • 细菌的相互作用
  • 结肠微生物区系
  • 结肠直肠癌

来自Altmetric.com的统计

请求的权限

如果你想重用任何或所有本文的请使用下面的链接,这将带你到版权税计算中心的RightsLink服务。你将能够获得快速的价格和即时允许重用内容在许多不同的方式。

本研究的意义

已知在这个问题上是什么?

  • 改变肠道微生物组成与结直肠癌(CRC)相关联,但因果关系尚未建立。

  • 梭菌属nucleatum强化肠道肿瘤发生通过招聘通过激活免疫细胞浸润和β-catenin信号。

  • 粪便微生物群持有承诺CRC的早期非侵入性诊断。

  • 然而,一个简单的和可负担得起的有针对性的方法诊断的粪便中CRC仍然缺乏。

有什么新发现吗?

  • 发现重要的小说浓缩的物种,包括Parvimonas微米Solobacterium moorei他们之间,一个强大的共生网络的粪便微生物CRC患者。

  • 20个基因的识别标记显著区分CRC-associated和控制微生物在中国人群和欧洲大陆的验证四个丹麦队列。

  • 进一步验证四个基因标记发布军团从法国和奥地利军团与地区在接受者操作曲线(AUC) 0.72和0.77。

  • 定量PCR的两个基因标记(butyryl-CoA脱氢酶f . nucleatumRNA聚合酶亚基β,rpoB,从p .微米)明确地分离CRC微生物与控制在一个独立的中国群体组成的47例和109名健康对照,AUC = 0.84和优势比23。

它会如何影响临床实践在可预见的未来吗?

  • 四个微生物基因标记之间共享中国,丹麦、奥地利和法国军团表明,尽管不同的人群有不同的肠道微生物群落结构,签名CRC-associated微生物生态失调可能普遍特性。

  • 我们的研究需要进一步对CRC的负担得起的早期诊断有针对性的分析,宏基因组生物标志物在粪便样本。

介绍

结直肠癌(CRC),第三个影响>世界上最常见的癌症,每年有136万人1由于复杂的基因之间的相互作用产生,生活方式和环境因素。尽管巨大的努力在全基因组测序和全基因组关联研究,遗传因素只能解释一小部分疾病的方差2所有的crc遗传可能占到35%,3但只有5%的癌症发生在一个已知的遗传易感性的设置综合症。4这些发现支持生活方式和环境作为附加重大疾病因素。

新兴的证据表明,在人类肠道微生物生态失调可能是CRC的重要环境因素。早期肠道微生物对CRC发病的证据来源Apc分钟/ +CRC的小鼠,基因的小鼠模型,减少老鼠住在无菌条件下显示肿瘤的形成与小鼠相比,小肠安置在特定的无菌条件。5进一步的研究表明,一些细菌,包括脆弱拟杆菌和应变大肠杆菌可能促进结直肠致癌作用。6尺11寸在人类中,细菌培养的研究报道CRC和临床之间的关联等特定细菌感染链球菌宝12梭状芽胞杆菌坏疽抗毒素。13此外,培养自由16 s rrna测序研究粪便微生物组成与CRC有关。14 - 16独立的研究已经确定了梭菌属nucleatum在人类CRC组织更丰富,17,18和后续研究显示f . nucleatum通过招募免疫细胞浸润增强肠道肿瘤发生19和调制β-catenin信号。20.最近的两项研究调查了CRC患者肠道微生物生态失调21,22和报告使用宏基因组测序诊断的潜力。这些可喜的成果仍远未直接翻译为CRC诊断测试,作为一个简单的和负担得起的有针对性的诊断方法的粪便中CRC仍然缺乏。

这里我们第一项研究,(我)使用深的CRC粪便微生物宏基因组分析发现和验证微生物基因生物标记物在种族不同的军团,和(2)独立验证使用一个负担得起的技术,它们可以转化为临床实践。

材料和方法

DNA样本收集和准备

军团C1和C2来自中国香港。C1(见在线补充表S1)由128人:74 CRC患者(15 I期,21个阶段II, 34 III期和4四期;平均年龄67年;26日是女性)和54控件(平均年龄62年;21岁是女性)。C2(见在线补充表S16)由156人:47 CRC患者(4阶段我24 II期15第四阶段III和4阶段;平均年龄69年;22日是女性)和109名对照(中位年龄58年;69是女性)。群D从哥本哈根,丹麦(见S18在线补充表美国),由40个人:CRC患者(n = 16; 1 stage I, 9 stage II, 5 stage III and 1 stage IV; median age 67.5 years; 6 were females) and controls (n=24; median age 65.5 years; 17 were females). Cancer staging in all three cohorts was performed using the tumour, node, metastasis staging system23由美国癌症联合委员会和维护国际癌症控制。收集粪便样本由个人在家里,紧随其后的是立即冻结−20°C。中国样本的DNA提取试剂盒使用QIAamp DNA凳子迷你包(试剂盒)根据制造商的指示。丹麦的DNA样本提取利用以前发布的方法。24综合描述样本收集和DNA的提取以及伦理委员会批准号码,看到在线补充方法。

宏基因组测序和注释

宏基因组测序使用Illumina公司HiSeq 2000平台,使用基因生成基因档案目录,构建宏基因组连锁集团(mlg),生成京都基因和基因组的百科全书(KEGG)直接同源,模块和通道配置文件,都是使用以前公布的方法完成。25了解分子操作分类单元(运动)获得使用莫土语分析软件。26读取被映射到微生物基因组(IMG)参考数据库集成27(v400)生成IMG物种和IMG属概要文件。mlg基因被映射到IMG数据库,和mlg注释一个IMG基因组当> 50%的基因映射。MLG物种是由分组MLG使用该注释。这些过程的综合描述,请参阅在线补充方法。

数据分析

置换多元方差分析(PERMANOVA)被用来评估不同表型的基因资料的影响。充实的基因,KEGG特性、运动IMG物种和MLG物种计算使用Wilcoxon rank-sum测试。在适当的时候,我们调整了混杂效应的样本集合之前/之后结肠镜检查:Wilcoxon rank-sum测试进行使用的结肠镜检查前/后抽样作为分层因素在R使用硬币包,和口服补液盐被估计使用Mantel-Haenszel测试分层后的结肠镜检查前/后取样。我们控制了多个测试Benjamini-Hochberg错误发现率(罗斯福)。Minimum-redundancy maximum-relevancy (mRMR)特征选择方法28是用于选择最佳的基因标记,然后用于构建一个CRC指数。同现网络构造使用斯皮尔曼相关系数(0.5 >或<−0.5)和视觉Cytoscape V.3.0.2。宏基因组序列从法国(F)和奥地利(A)军团从NCBI短阅读下载存档使用标识符ERP005534和ERP008729研究,分别。综合描述生物多样性分析,稀疏分析,识别CRC-associated基因/物种,罗斯福,估计mRMR特征选择框架,CRC指数的定义和验证和接收方运营商(ROC)分析特点,看到在线补充方法。

验证qPCR的基因标记

选择基因标记的丰度估计在粪便样本使用TaqMan probe-based定量PCR (qPCR)。引物和探针序列设计手动,然后测试使用底漆表达V.3.0(应用生物系统公司,培育城市,加利福尼亚,美国)Tm的决心,guanine-cytosine (GC)内容和可能的二级结构。每个探测携带5′记者染料6-carboxy荧光素或4、7、2′-trichloro-7′-phenyl-6-carboxyfluorescein和3′冷却器染料6-carboxytetramethyl-rhodamine。引物和水解探针合成表达载体(美国加利福尼亚州卡尔斯巴德)。核苷酸序列的引物和探针在网上列出S27补充表。qPCR进行一个使用TaqMan ABI7500实时PCR系统普遍PCR大师Mixreagent(应用生物系统公司)。通用16 s rDNA作为内部控制和大量的基因标记表示为16 s rDNA相对水平。

结果

失调的CRC肠道微生物组

我们招募了128名个人CRC和54对照组患者(74)从中国(队列C1;看到网上补充表S1),执行宏基因组测序的粪便样本和7.51亿年生成的宏基因组读取(586万年平均每个别读;看到网上补充表S2)使用Illumina公司HiSeq 2000平台。记录中代谢参数,空腹血糖升高和降低高密度脂蛋白显示显著的关联与CRC地位(Wilcoxon rank-sum测试,q = 0.0014)都同意先前的发现报告的风险因素。29日,30.我们还观察到一个更高的CRC患者样本收集在结肠镜检查比以前(确切概率法、q = 0.0165;看到网上补充表S1)。我们调整混杂因素在适当的时候在随后的分析(参见“材料和方法”的一节)。稀疏分析使用以前公布的肠道微生物基因目录组成的4 267 985个基因25显示一条曲线达到高原,这表明这个目录涵盖最常见微生物的基因存在于群体C1(参见图s1A在线补充)。因此,我们后续的分析基于映射的宏基因组读取这个目录。CRC患者微生物表现出减少基因丰富性(见在线补充图1 a, B;Wilcoxon rank-sum检验,p < 0.01)和基因α多样性(Wilcoxon rank-sum测试香农和辛普森指数:p = 0.075和0.028,分别;参见图就是S1C在线补充,D和表S3)。然而,这些差异表现出p > 0.5纠正了结肠镜检查。

确保强劲的比较内容队列的128基因组中基因C1,我们创建了一个组2 110 489个基因存在于至少128基因丰度谱使用这些主题和生成210万个基因。当我们进行多变量分析使用17日PERMANOVA不同,只有CRC地位和CRC阶段明显与这些基因相关资料(q < 0.06,所有其他因素:q > 0.27;看到网上补充表S4)。因此,数据显示CRC患者肠道菌群的改变基因成分,不能用其他记录的因素来解释。当我们进行了主成分分析(PCA)基于基因图谱,第一个和第五个主成分,这解释了总方差的6.6%和3.2%,分别与CRC状态(有关Wilcoxon rank-sum测试,PC1: p = 0.029;PC5: p = 1×10−6;参见图S2和表S5在线补充)。这些结果表明失调状态CRC患者的肠道微生物组。

肠道微生物与CRC相关的基因

metagenome-wide协会研究(MGWAS)来识别基因导致CRC改变基因成分。从210万个基因,我们确定了140 455个基因与疾病状态(Wilcoxon rank-sum检验p < 0.01,罗斯福11.03%;请参见图S3)在线补充。有趣的是,CRC-enriched基因发生频率较低,在较低丰度与control-enriched基因(见在线补充图S4),这表明微生物生态失调与CRC可能不涉及优势种。这样的频率和模式发生之前曾被观察到在两个宏基因组在2型糖尿病病例对照研究25在中国个人和CRC在奥地利的个体,31日这表明这可能是一个常见的趋势变异肠道微生物生态失调。

我们使用KEGG注释140 455个基因32功能数据库(V.59)调查某些微生物功能是否与CRC有关。没有KEGG通路经过我们的严格的标准(Wilcoxon rank-sum测试,q < 0.05;看到网上补充表S6),这表明细菌代谢途径在KEGG数据库可能不参与CRC发病机理。然而,两个KEGG模块丰富了CRC微生物:亮氨酸退化(q = 0.0148)和鸟嘌呤核苷酸生物合成(q = 0.0241;看到网上补充表S6)。亮氨酸刺激蛋白质合成和降解,33,34亮氨酸的新陈代谢和癌症之间的联系。在基因层面上,几个KEGG同源组显示重要的协会与疾病状态(Wilcoxon rank-sum测试,q < 0.05;看到网上补充表S7)。

分类CRC改变肠道微生物组

我们检查分类差异CRC-associated和控制微生物识别微生物类群造成生态失调。为此,我们使用物种资料来自三个不同methods-IMG物种,了解运动和MLG物种(参见“材料和方法”的一节)——支持来自多个方法将加强关联的证据。我们的分析发现了28个IMG物种,21日运动和85 MLG物种与CRC地位显著相关结肠镜检查是一个混杂因素调整后(Wilcoxon rank-sum测试,q < 0.05;看到网上补充表S8)。真细菌ventriosum一直在所有三种方法控制微生物丰富(IMG: q = 0.002;莫土语:q = 0.0049;MLG: q = 3.33×10−4)。另一方面,Parvimonas微米(q < 7.73×10−6),Solobacterium moorei(q < 0.011)f . nucleatum(q < 0.00279)都浓缩在所有三种方法(CRC患者微生物图1和在线补充图S5),消化链球菌属stomatis(q < 7.73×10−6根据两种方法)是丰富。PERMANOVA分析显示,只有CRC地位从所有三种方法(p≤0.013)和结肠镜检查两种方法(p = 0.079)解释了量变的三CRC-enriched物种。所有其他non-CRC-specific因素无法解释的差异有统计学意义(p > 0.18);看到网上补充表S9)。p . stomatis在最近的研究里它又显示出它与CRC显著关联,22美国moorei之前一直与菌血症有关。35然而,一个非常重要的浓缩p .微米——专性厌氧细菌可引起口腔感染f . nucleatum36——CRC-associated微生物是一个了不起的新发现。

图1

物种参与肠道微生物生态失调与结直肠癌(CRC)有关。(A)微分两个CRC-enriched和一个control-enriched微生物物种的相对多度一致确认使用三种不同的方法:宏基因组连锁群(MLG),分子操作分类单位(莫土语)和微生物基因组(IMG)数据库集成。(B)相对丰富的共生网络推导出21运动与CRC显著相关。物种重新安排在双方基于CRC或控制微生物的富集。斯皮尔曼相关系数值低于−0.5(负相关)表示,红边,和系数值高于0.5(正相关)表示,绿色边。节点大小显示了每个物种的平均相对丰度和节点颜色显示分类注释。

物种共生网络来源于两两相关性的物种丰度显示强阳性之间的联系三个口腔病原体:p .微米,f . nucleatum美国moorei(图1B和在线补充图S6)。先前的报道表明,p .微米常发生在一起f . nucleatum在感染根管,在那里他们可以占到90%的牙髓学的微生物。36有鉴于此,我们的结果可能表明CRC-associated肠道环境中这两个物种之间的合作。

尽管一些细菌属对应CRC-associated物种(包括早些时候确认Parvimonas,梭菌属,Solobacterium消化链球菌属显示显著的关联与CRC地位(见表S10在线补充),我们观察到一些例外。当我们发现的一个重要代表b . fragilisCRC患者(莫土语:q = 0.0158;MLG: q = 3.02×10−4;看到网上补充表S8),没有联系拟杆菌属。门级别的,只有Fusobacteria和担子在CRC-associated大大丰富微生物(q < 0.0002;看到网上补充表S11)。

为了评估这些分类协会的预测能力,我们用随机森林整体学习法37确定17 IMG物种,7了解运动和27 MLG物种高度预测的CRC状态(见表S12在线补充),预测能力为0.86,0.89和0.96在ROC分析中,分别(请参见图S7在线补充)。p .微米被确定为一个关键物种的所有三种方法,在吗f . nucleatum,p . stomatis美国moorei从三分之二的确定方法,为进一步统计支持协会提供CRC的地位。

CRC生物标志物的发现

我们使用了mRMR特征选择方法28识别潜在的CRC生物标记的140 455个基因由MGWAS标识。结肠镜检查的第一,消除干扰,我们执行了独立Wilcoxon rank-sum测试这些基因与结肠镜检查作为分层因素。这导致102 514个基因在p < 0.01的显著性水平(罗斯福≤13%)和24 960个基因在p < 0.001的显著性水平(罗斯福≤5.23%)。然后,从后者,我们确定了组织高度相关的基因彼此(肯德尔的τ> 0.9),每组选择最长的基因生成统计冗余组11 128个重要基因。最后,我们使用mRMR方法和确定一组最优的20个基因与CRC地位密切相关(见图S8和表向在线补充)。PCA 20使用这些基因显示良好的CRC患者分离控制(图2A)。PERMANOVA分析显示,只有CRC地位,舞台和空腹血糖解释了20个标记基因丰度的变化有统计学意义(p≤0.01;看到网上补充表S14系列)。我们计算一个简单的CRC指数基于没有过秤日志的相对丰度这20个标记,它清晰地分离了CRC患者微生物从控制微生物,以及从490年粪便微生物从两个先前的研究在中国个人2型糖尿病25在欧洲的个人和炎症性肠病38(图2B;患者中CRC指数和控制在我们的研究中是7.31−5.56,分别;Wilcoxon rank-sum测试,q < 6×10−11所有五个比较;看到网上补充表S15)。

图2

发现肠道微生物基因标记与结直肠癌(CRC)有关。(一)主成分分析基于20个基因的丰度标记分离CRC病例和控制个体在群体C1。第一和第二主成分与CRC状态(PC1 PC2解释方差的31.9%和13.3%,分别)。比较这个和在线补充图S2基于210万个基因中,可以观察到,没有分离。(B)使用一个简单的没有过秤CRC指数计算的线性组合log-abundance 20 CRC患者基因标记(红色)和控制个体(绿色)从这项研究中,与病人一起显示和控制个体(布朗)在2型糖尿病的早期研究25和炎症性肠病。38CRC指数CRC患者微生物组明显不同(p < 0.001),其余部分表明20 CRC-specific基因标记。盒子里描绘了第一和第三个四分位数之间的差,和里面的线表示中位数。

评估使用目标qPCR CRC生物标志物

翻译我们的基因标记物诊断生物标记需要可靠的测量通过简单,比如qPCR负担得起的和有针对性的方法。来验证是否基因丰度衡量宏基因组测序和qPCR具有可比性,我们随机选择两个case-enriched和两个control-enriched基因标记和测量他们的丰度在队列的一个子集qPCR C1(51例和45控制)。宏基因组测序和qPCR平台的量化显示强烈的相关性(枪兵r = 0.81 - -0.95;看到网上补充图S9),表明测量结果是可靠的。接下来,我们测量了大量的这四个基因标记在一个独立的中国人群使用qPCR C2(156份粪便样本;47例和109控制;看到网上补充表S16)。这两个在C2 control-enriched基因关联不显著(p > 0.31;看到网上补充表肌力表现)。另一方面,CRC-enriched基因标记(m1704941, butyryl-CoA脱氢酶f . nucleatum;m482585 RNA-directed DNA聚合酶,从一个未知的微生物)也大大丰富了CRC的C2调整后样品的结肠镜检查(p = 0.0015和0.045分别看到在线补充表肌力表现)。在这其中,只有基因f . nucleatum表现出一个重要或Mantel-Haenszel测试后调整的结肠镜检查(或18.5,p = 0.0051;看到网上补充表肌力表现)。CRC指数基于四种基因的丰度只有适度分类CRC微生物控制微生物的C2(区域接受者操作曲线(AUC) = 0.73;请参见图S10在线补充),这表明从列表中随机选择20生物标记不是一个有效的策略。然而,基因f . nucleatum现在只有109年4控制微生物,暗示潜力开发的具体诊断测试CRC使用粪便样本。

在独立的宏基因组群基因标记验证

识别健壮的生物标记物,可以有一个更普遍的适用性,我们评估所有20个基因标记使用粪便基因组从队列具有不同遗传背景和生活方式:16 CRC患者和24控制个人从丹麦(群D;看到在线S18补充表美国)。当映射到430万肠道微生物的基因,丹麦基因组表现出明显高于α基因丰富性和多样性,在例(Wilcoxon rank-sum测试,基因数:p = 1.94×10−5;香农指数:p = 5.85×10−5)和控制(基因数:p = 0.0017;香农指数:p = 9.34×10−4;参见图S11在线补充和表S19),同意与最近的一项研究表明肠道微生物群落结构差异中国和丹麦人口。39在102 514个基因在群体C1与CRC地位,只有1498个基因可以在群组验证d .然而,CRC-enriched基因共享两个种群之间的明显多于control-enriched基因(35 1452 735 CRC-enriched vs control-enriched 46 66 779;双尾χ2测试,χ2= 2576.57,p < 0.0001)。超过半数(53.6%)的1452 CRC-enriched基因从三个种类:p .微米(389个基因),美国moorei(204个基因)和symbiosum梭状芽胞杆菌(177个基因)(见在线补充表S20)。在物种水平,p .微米使用这三种方法在CRC微生物丰富,而p . stomatis,Gemella morbillorum美国moorei根据两种方法丰富(Wilcoxon rank-sum测试,q < 0.05;看到网上补充表S21)。值得注意的是,所有物种被至少一个方法被CRC-enriched验证。这些结果表明,在CRC在结直肠环境变化发展和进展可能促进增长相似物种的两个种群,可能导致减少微生物多样性CRC患者中(参见图就是S1C在线补充),符合早期的观察。40CRC指数使用20个基因标记队列中发现C1略微分化丹麦病人微生物控制(Wilcoxon rank-sum测试,p = 0.029),表现出温和的分类潜在(ROC曲线下面积,AUC = 0.71;请参见图S1在线补充2)。只有4个20(两个基因消化链球菌属anaerobius和各一p .微米f . nucleatum)与CRC地位群体D (Wilcoxon rank-sum测试,问≤0.05;所有CRC-enriched;看到网上补充表S22)。在记录的因素,只有CRC状态可以解释这四个基因的变异(PERMANOVA p≤0.0001;看到网上补充表S23)。

额外的无偏验证四个基因的标记,我们使用两个最近出版的宏基因组datasets-an奥地利人口(群)组成的55控制和CRC患者4131日和一个法国人口(群)组成的61控制和53 CRC患者。22当我们发现队列C1只包括癌样本,我们排除了所有患者腺瘤和癌患者相比non-adenoma / non-carcinoma控制,与后者所使用的策略研究22包括小腺瘤在控制和排除大腺瘤。所有四个基因在癌明显丰富粪便样本两个组别(Wilcoxon rank-sum测试q < 0.0035;看到网上补充表S24)。CRC指数使用这四个基因分类CRC患者AUC的0.77和0.72军团和F,分别。当我们检查协会的所有20个标记,军团和F每个可以验证一个额外的基因与CRC(见在线补充表S25)。有趣的是,一个标记浓缩在控制样本队列C1丰富CRC样品在队列。

使用qPCR CRC的准确分类

两个四cross-ethnically验证基因的标记是转座酶p . anaerobius。第三个基因(m1704941 butyryl-CoA脱氢酶f . nucleatum)顺便说一下这两个基因之间成功地验证使用qPCR队列C2。第四个基因p .微米是一个高度保守的rpoB基因编码RNA聚合酶亚基β,通常用作系统发育标记。41我们执行额外qPCR测量rpoBp .微米在队列C2,显示显著富集CRC患者微生物(Wilcoxon rank-sum测试调整的结肠镜检查,p = 8.97×10−8)。Mantel-Haenszel结肠镜检查或调整为20.17 (95% CI 4.59 - 88.6, p = 3.36×10−7)。结合qPCR测量两个基因明显分离的CRC的控制样本群C2 (Wilcoxon rank-sum测试调整的结肠镜检查,p = 1.384×10−8,图3A)和准确分类CRC样品改进AUC为0.84(真阳性率(TPR) = 0.723;假阳性率(玻璃钢)= 0.073;图3B)。精度略比,在最近的一项研究(报告AUC = 0.836, TPR = 0.58,玻璃钢= 0.08),尽管他们使用了22个物种的丰度的组合使用宏基因组测序。22Mantel-Haenszel或者调整的结肠镜检查,检测两个标记的至少一个qPCR CRC患者为22.99 (95% CI 5.83至90.8,p = 5.79×10−8)。当分层队列C2早期(阶段i ii)和晚期癌症患者(阶段iii iv),分类潜力和口服补液盐仍显著(见在线补充表S26)。丰富的这两个基因明显高于与控制样本从CRC(阶段二世图3C, D),同意我们的结果从物种丰度和提供证据的原则,粪便基因组可能含有非侵入性生物标志物早期CRC的识别。

图3

验证的基因标记与结直肠癌(CRC)有关。定量PCR (qPCR)大量的两个基因标记(m1704941: butyryl-CoA脱氢酶梭菌属nucleatumm1696299: RNA聚合酶亚基β,rpoB,从Parvimonas微米)测量组成的队列C2 47例和109名健康对照。两个基因的综合log-abundance明确地分离CRC微生物与控制(A)和分类CRC微生物的接受者操作特征曲线下面积0.84 (B)。这两种标记基因显示较高发病率和丰富CRC阶段II和III与控制和舞台我微生物(C和D)。丰度在log10规模策划,和零富足是策划,−8所示。AUC,接受者操作曲线的面积;玻璃钢,假阳性率;TPR,真阳性。

讨论

我们报道了首次成功跨种族验证CRC的宏基因组的基因标记,特别是包括来自四个国家的数据。最近的两项研究报道了潜在的CRC诊断利用粪便微生物宏基因组测序。第一项研究基于16 s核糖体RNA基因5操作分类单位用于分类CRC从健康样本在一群来自美国。21作为他们不执行任何独立的验证,我们不能把我们的验证准确性与他们的。第二项研究基于猎枪宏基因组测序21种在法国发现队列用于准确CRC在德国患者群进行分类。22精度高的外部验证(AUC = 0.85与0.77和0.72的AUC)可能是因为验证组来自同一民族。实际上,当两个基因标记在中国发现队列C1在中国独立验证队列使用qPCR C2,我们也实现了高精度(AUC = 0.84)尽管我们搬到一个不同的平台。通过这样做,我们也证明,第一次,潜在的CRC诊断通过负担得起的目标检测方法对微生物生物标志物在粪便样本。显著改善qPCR分类潜在(AUC AUC = 0.84 = 0.73)通过使用基因(rpoB基因p .微米)验证组D, F和重申验证新发现的生物标记的重要性独立组具有不同遗传和环境背景。进一步的工作执行高多样性的生物标志物发现军团或者发表军团的荟萃分析可以揭示它是否会导致增加的预测能力。宏基因组标记结合当前临床标准测试(粪便隐血试验(FOBT))已被证明改善TPR从49%降至72%。22这两个标记报道这里已经达到一个比较不使用FOBT TPR。还有待观察是否FOBT结合这些标记将进一步提高精度。

基因标记之间共享群来自中国、丹麦、奥地利和法国表明,尽管不同的人群有不同的微生物群落结构,签名CRC-associated微生物生态失调可能普遍特性。几个重要的观察应该注意:(i) CRC-enriched宏基因组和基因标记有较高相关性qPCR丰度(r = 0.93, = 0.95)相比control-enriched基因(r = 0.81和0.85)队列C1;(ii)在四个基因标记随机测试在队列使用qPCR C2,只有CRC-enriched基因进行验证;(3)所有四个基因标记验证组D,所有5个标记验证在队列的和四个五标记验证在F组CRC-enriched(见表S25在线补充),即使有12 control-enriched标记相比,只有8 CRC-enriched标记;(iv)的唯一标记交换浓缩在验证在不同的军团control-enriched;D (v)队列共享更多比control-enriched基因群C1 CRC-enriched基因;和(vi)所有CRC-associated物种群C1在队列D CRC-enriched进行验证。这些特征表明,CRC-enriched生物标记物有更高的机会跨种群和共享有更好的诊断比control-enriched潜在生物标志物。一种解释可能是,生物标志物的健康很难找到比生物标记为一个特定的疾病,这违背了安娜卡列尼娜原则应用于肠道微生物预测更高数量的特定疾病干扰状态比安静的状态。42虽然是强制性为所有生物标志物在更大的群组研究中进一步验证在不同的人口,我们的研究结果提供证据的原则,开发一个负担得起的诊断测试使用CRC患者粪便微生物基因标记来识别可能确实是可能的。

发现只有两个微生物代谢模块与CRC状态表明微生物病原体的作用可能比这更重要的是在疾病发展的肠道微生物的功能异常。另外,微生物基因的表达水平可能比功能更重要的潜力。进一步研究采用metatranscriptomic微生物基因表达水平的研究将澄清这一点。

这一事实只能验证CRC-enriched基因和物种在军团限制我们的结论在物种枯竭CRC-associated微生物。我们观察到几个口腔病原体——的重要代表p .微米,p . stomatis,美国mooreif . nucleatum在CRC患者的大便,暗示一个oral-gut易位与CRC相关路线。即使我们无法证明这条路没有进一步的实验,基于300年健康个体最近的一项研究报道,口腔和肠道微生物组是彼此的预测,支持这一观点。43尽管有些物种已经与口腔癌相关统计在早先的研究中,21,22,40只有f . nucleatum它可以促进促炎的环境导致肿瘤发生。19现在我们的研究介绍p .微米作为小说细菌候选人参与CRC-associated失调表现出更强的关联与CRC在所有五军团我们调查。强烈的同现模式之间p .微米与革兰氏阴性f . nucleatum44和前增加其能力诱导炎症反应的能力通过绑定从革兰氏阴性细菌脂多糖,45可能意味着合作,无论是殖民策略和在促进促炎致瘤的微环境。浓缩的这些物种早在CRC的第二阶段开始,建议他们可能在CRC的发展发挥作用。进一步的工作描述p .微米在CRC可能阐明其作用。

我们已经表现出一致性CRC粪便微生物变化四个军团,发现小说细菌候选人可能参与CRC的开发和发展,验证基因标记在三组来自三个不同国家和报道两种细菌基因可以作为有效的CRC诊断生物标记。关键物种的系统调查和基因标记识别这里可能会进一步揭示候选人。额外的工作将命令式(i)基准这些观察与当前使用的诊断方法,(2)识别额外的标记与改进的预测价值和(iii)在更大的群组研究中进行最终验证他们。最终目标是确定粪便宏基因组标记,并有很强的预测能力检测CRC的早期阶段,这将大大降低CRC-associated死亡率。

引用

视图抽象

补充材料

  • 补充数据

    仅这个web文件已经由英国医学杂志出版集团从一个电子文件提供的作者(年代)和没有对内容进行编辑。

脚注

  • QF, JuY SHW、DZ QL同样起到了推波助澜的作用。

  • 调整通知本文已经被修正,因为它第一次在网上发布。数据共享声明已纠正。

  • 贡献者QF, JuY SHW、DZ和QL同样起到了推波助澜的作用。项目是由JuW设计,JoJS JuY、NB和马。QF, JuY JoJS JuW管理项目。JuY、玩具、JS、HJN TYTL,视交叉上核,QL,由,VW-SW, WKKW和FKLC导致采集的临床样本,病人的信息和临床资料分析。QL, SHW JuY、ZL PK和BAHJ DNA进行实验。JuW、JuY SHW,妈,KK, QF DYZ设计分析。DYZ,妈,QF, YWQ LQT,葵花籽油,黄,数控,HJJ, JHL LX和ZL进行数据分析。DYZ,妈,QF, YWQ LQT,葵花籽油,黄,数控,HJJ, JHL、LX和ZL metagenomic-wide协会研究工作。QL, JuY和T OY做了实验验证。马、JuY SH W, QF, DY Z和LQT写道。 JuW, KK, LM, JoJS, JuY, NB, JiW, HMY, HJJ, JA-A and XX revised the paper.

  • 资金支持的项目是由中国国家基础研究计划(973计划、2011 cb809203 2013 cb531401), SHHO基金会香港,教案的研究计划香港研究资助局(病人- 403 - 11),广东省引进创新研发团队项目(没有。2009010016),丹麦癌症协会(R72-A4659-13-S2)和中国的深圳市政府(CXB201108250098A)。

  • 相互竞争的利益没有宣布。

  • 病人的同意获得的。

  • 伦理批准联合香港中文大学-新界东集群临床研究伦理委员会(CUHK-NTEC CREC)伦理委员会丹麦和丹麦首都地区的数据保护机构。

  • 出处和同行评议不是委托;外部同行评议。

  • 数据共享声明宏基因组序列数据集已经存入欧洲核苷酸档案加入PRJEB10878数量。