跳转到主页内容gydF4y2Ba
访问键gydF4y2Ba NCBI主页gydF4y2Ba MyNCBI主页gydF4y2Ba 主要内容gydF4y2Ba 主导航gydF4y2Ba
.gydF4y2Ba 2020年3月,579(7800):567 - 574。gydF4y2Ba
doi: 10.1038 / s41586 - 020 - 2095 - 1。gydF4y2Ba Epub 2020 3月11日。gydF4y2Ba

血液和组织的微生物组分析为癌症诊断提供了方法gydF4y2Ba

从属关系gydF4y2Ba
免费PMC文章gydF4y2Ba

血液和组织的微生物组分析为癌症诊断提供了方法gydF4y2Ba

格雷戈里·D·普尔gydF4y2Baet al。gydF4y2Ba 自然gydF4y2Ba.gydF4y2Ba 2020年3月gydF4y2Ba.gydF4y2Ba
免费PMC文章gydF4y2Ba

摘要gydF4y2Ba

癌症微生物组的系统表征为开发利用非人类微生物衍生分子诊断主要人类疾病的技术提供了机会。最近的研究表明,某些类型的癌症显示出大量的微生物贡献gydF4y2Ba1 - 10gydF4y2Ba我们重新检查了《癌症基因组图谱》中的全基因组和全转录组测序研究gydF4y2Ba11gydF4y2Ba(TCGA)对33种未接受治疗的癌症患者(共18,116个样本)的微生物reads进行了分析,并在大多数主要癌症类型的组织和血液中发现了独特的微生物特征。尽管使用了非常严格的去污分析,丢弃了高达92.3%的总序列数据,但当应用于Ia-IIc期癌症患者和目前在两个商业级无细胞肿瘤DNA平台上测量的没有任何基因组改变的癌症患者时,这些TCGA血液特征仍然具有预测性。此外,我们可以区分来自健康、无癌症个体(n = 69)和来自多种类型癌症(前列腺癌、肺癌和黑色素瘤;共100个样品)仅使用血浆来源的,无细胞的微生物核酸。这种潜在的基于微生物的肿瘤诊断工具值得进一步探索。gydF4y2Ba

利益冲突陈述书gydF4y2Ba

相互竞争的利益gydF4y2Ba

E.K的雇主Clarity Genomics没有为这项研究提供资金。公司已联合提交美国临时专利申请编号62/754,696和国际专利申请编号62/754,696。PCT/US19/59647在此基础上进行了研究。gdp、r.k.和S.M.M.成立了一家公司,将知识产权商业化。R.K.是GenCirq, Inc.的SAB成员,持有GenCirq的股权,并可获得高达5,000美元/年的费用报销。r.k., a.d.s.和S.M.M.是加州大学圣地亚哥分校微生物组创新中心的主任,该中心接受了各种微生物组计划的行业研究资金,但没有为这个癌症微生物组项目提供行业资金。gydF4y2Ba

数据gydF4y2Ba

图1:gydF4y2Ba
图1:。TCGA肿瘤微生物组的继续概述。gydF4y2Ba
一个gydF4y2Ba, TCGA研究缩写。gydF4y2BabgydF4y2Ba, Voom归一化数据的主成分分析(PCA),其中颜色代表样本的测序平台,每个点代表一个癌症微生物组样本。gydF4y2BacgydF4y2Ba,连续Voom-SNM监督归一化后的数据的PCA,由测序平台标记。gydF4y2BadgydF4y2Ba, boom归一化数据的PCA,其中颜色代表样本的实验策略,每个点代表一个癌症微生物组样本。gydF4y2BaegydF4y2Ba,连续Voom-SNM监督归一化后的数据的PCA,作为实验策略标记。gydF4y2Ba做减法gydF4y2Ba,在元数据质量控制后,TCGA中所有癌症类型的给定样本类型中的样本数量归一化计数(图1b),包括本文分析的三种主要样本类型(gydF4y2BafgydF4y2Ba)及其他样本类型(gydF4y2BaggydF4y2Ba).注意以下缩写:ANP =附加-新一级;AM =附加转移性;MM =转移性;复发性肿瘤。gydF4y2Ba
图2:gydF4y2Ba
图2:。使用微生物丰度来详细区分TCGA癌症类型之间和内部的性能指标。gydF4y2Ba
fgydF4y2Ba,图1f-h中热图的扩展示例。顶部显示的颜色渐变表示ROC和PR曲线上任意点的概率阈值。使用50%概率阈值截断显示了嵌入的混淆矩阵,该矩阵可用于计算ROC曲线和PR曲线上对应点的灵敏度、特异性、精度、召回率、阳性预测值、阴性预测值等。gydF4y2Bag-hgydF4y2Ba,模型性能的线性回归,特别是AUROC (gydF4y2BaggydF4y2Ba)及AUPR (gydF4y2BahgydF4y2Ba),以一种癌症类型与所有其他癌症类型相比较的方式来区分癌症类型,作为少数群体规模的函数。本文展示了在原发肿瘤中检测到的微生物模型的性能,这些模型有更多的样本(n=13,883)和癌症类型(n=32)进行比较。由于AUROC和AUPR的域为[0,1],且少数类大小从20到1238个样本之间变化,后者在对数上回归gydF4y2Ba10gydF4y2Ba规模。内嵌假设检验和相关p值基于因变量和自变量之间不存在关系的原假设(双面检验)。gydF4y2Ba
图3:gydF4y2Ba
图3:。ML模型管道的内部验证。gydF4y2Ba
一个gydF4y2Ba, TCGA原始微生物计数数据的两个独立的一半归一化,并用于模型训练,使用肿瘤微生物DNA和RNA预测一种癌症类型与所有其他癌症类型;然后将每个模型应用于另一半的规范化数据。该热图将这些模型的性能与完整数据集50% - 50%分割的训练和测试进行了比较。gydF4y2BacgydF4y2Ba,通过跨多个测序中心的原发肿瘤RNA样本(n=11,741)对完整Voom-SNM数据进行分组,以预测一种癌症类型与所有其他癌症类型时的模型性能比较。gydF4y2Bad egydF4y2Ba,通过跨多个测序中心的原发肿瘤DNA样本(n=2142)对完整Voom-SNM数据进行分组以预测一种癌症类型与所有其他癌症类型时的模型性能比较。gydF4y2Ba做减法gydF4y2Ba,当北卡罗莱纳大学(UNC)样本(n=9726)对完整Voom-SNM数据进行分组时,模型性能比较,该样本仅进行RNA- seq,使用原发肿瘤RNA样本预测一种癌症类型与所有其他癌症类型。gydF4y2Ba设定hgydF4y2Ba,当哈佛医学院(HMS)样本(n=898)对完整Voom-SNM数据进行分组时的模型性能比较,该样本只进行了WGS,使用原发肿瘤DNA样本预测一种癌症类型与所有其他癌症类型。中所有型号gydF4y2Bab我gydF4y2Ba:带标准误差的广义线性模型用灰色表示;虚线表示完美的线性关系;对于样本量比较,完整的Voom-SNM数据集包含13,883个原发肿瘤样本。gydF4y2Ba
图4:gydF4y2Ba
图4:。kraken衍生的TCGA肿瘤微生物组谱及其ML性能的正交验证。gydF4y2Ba
a -gydF4y2Ba四种TCGA癌症类型(CESC, STAD, LUAD, OV)通过直接基因组比对(Burrows-Wheeler Aligner, BWA)进行krken分类分配后进行额外过滤。ML性能在标准化、BWA过滤数据和匹配的独立规范化Kraken数据之间进行比较,用于一种癌症类型和所有其他癌症类型,使用原发肿瘤微生物(gydF4y2Baa - bgydF4y2Ba)、肿瘤与正常的鉴别(gydF4y2Bac - dgydF4y2Ba), I期和IV期肿瘤的鉴别使用原发肿瘤微生物(gydF4y2Bae-fgydF4y2Ba),以及使用血液衍生的微生物进行一种癌症类型与所有其他癌症类型的对比(gydF4y2Bag-hgydF4y2Ba)(方法)。gydF4y2Ba我gydF4y2Ba, BWA过滤数据与Kraken“完整”数据之间类群数量的维恩图。gydF4y2Ba启动制冷gydF4y2Ba,一个称为SHOGUN(“SHallow shOtGUN测序”)的正交微生物检测管道,使用直接基因组比对和一个单独的数据库(“生命网络”[WoL];N =10,575个微生物基因组[细菌,古生菌];gydF4y2Ba https://biocore.github.io/wol/gydF4y2Ba)在涵盖每种分析癌症类型(n=32)、样本类型(n=7)、测序平台(n=6)和测序中心(n=8)的TCGA样本子集上运行,并在krken基础分析(n=13,517个样本)中进行分析。shogun衍生的微生物计数数据通过Voom-SNM(类似于Kraken的对应版本)归一化,并用于下游ML分析。gydF4y2BajgydF4y2Ba, shogun衍生微生物分类群和kraken衍生微生物分类群的Venn图。请注意使用单独的数据库,并且WoL不包含病毒,而Kraken数据库包含病毒。gydF4y2Bak-lgydF4y2Ba, Voom的PCA (gydF4y2BakgydF4y2Ba)和Voom-SNM (gydF4y2BalgydF4y2Ba)归一化SHOGUN数据,以测序中心着色。gydF4y2Bam - tgydF4y2Ba,在SHOGUN数据和匹配Kraken数据上训练和测试的模型之间的ML性能比较,使用相同的70%/30%分割,针对单一癌症类型和所有其他使用原发肿瘤微生物的癌症类型(gydF4y2BamngydF4y2Ba)、肿瘤与正常的鉴别(gydF4y2Bao-pgydF4y2Ba), I期和IV期肿瘤的鉴别使用原发肿瘤微生物(gydF4y2Baq rgydF4y2Ba),以及使用血液衍生的微生物进行一种癌症类型与所有其他癌症类型的对比(gydF4y2Bas - tgydF4y2Ba).为了进行公平的比较,匹配的Kraken数据是通过删除Kraken原始计数数据中的所有病毒分配,并将其划分到由SHOGUN分析的相同的13517个TCGA样本来获得的;然后,这些匹配的Kraken数据通过Voom-SNM(与SHOGUN数据(方法)完全相同的方式)独立归一化,并输入下游ML管道。对于所有的ML表演:至少需要20个少数族裔的样本量才有资格。对于回归子图:虚线对角线表示完美的性能对应;给出了带标准误差带的广义线性模型。gydF4y2Ba
图5:gydF4y2Ba
图5:。泛癌症微生物丰度和TCGA癌症微生物组分析和ML模型检查的交互式网站。gydF4y2Ba
一个gydF4y2Ba, Pan-cancergydF4y2Ba梭菌属gydF4y2Ba用单因素方差分析(Kruskal-Wallis)对每种癌症类型的微生物丰度进行标准化检验。样本大小用蓝色表示,TCGA研究名称列在底部。gydF4y2BabgydF4y2Ba根据HMP2数据,TCGA-COAD实体组织正常样本和TCGA-SKCM原发肿瘤样本的粪便贡献的SourceTracker2结果。TCGA-SKCM只有1个实体组织正常样本可用(表S4),因此原发肿瘤被用作预期皮肤菌群的最佳代理。预计结肠样本的粪便贡献应高于皮肤,因此采用单侧Mann-Whitney检验。由于SourceTracker2输出的是每个源(即HMP2)对每个汇聚(即COAD, SKCM样本)的分数贡献的平均值,所以每个条形图的中心值是这些值的平均值,而误差条表示标准误差。样本大小在蓝色柱状图下方。gydF4y2BacgydF4y2Ba, Pan-cancergydF4y2BaAlphapapillomavirusgydF4y2Ba用单因素方差分析(Kruskal-Wallis)对每种癌症类型的微生物丰度进行标准化检验。样本大小用蓝色表示,TCGA研究名称列在底部。TCGA研究的临床测试患者的HPV感染有“阴性”或“阳性”附加根据测试结果。gydF4y2BadgydF4y2Ba,互动网站截图显示绘图gydF4y2BaAlphapapillomavirusgydF4y2Ba用克拉肯衍生的数据标准化微生物丰度。使用shogun衍生的归一化微生物丰度绘图可在网站的另一个选项卡(左侧)。gydF4y2BaegydF4y2Ba, ML模型检验互动网站截图。选择数据类型(例如,清除所有可能的污染物)、癌症类型(例如,浸润性乳腺癌)和兴趣比较(例如,肿瘤vs正常)将自动更新ROC和PR曲线,以及混淆矩阵(使用50%的概率截止阈值)和排序模型特征列表。网页可于gydF4y2Ba http://cancermicrobiome.ucsd.edu/CancerMicrobiome_DataBrowser/gydF4y2Ba.所有箱形图均显示中位数、第25和75个百分位数,且须延伸至1.5×四分位数范围。gydF4y2Ba
图6:gydF4y2Ba
图6:。去污方法及其结果、益处和对癌症微生物组数据的限制。gydF4y2Ba
一个gydF4y2Ba,用于评估、减轻、消除和/或模拟污染源的各种方法。gydF4y2BabgydF4y2Ba, TCGA中经过不同程度去污后残留的类群或微生物的比例。“测序中心”的去污去除了任何一个测序中心中被识别为污染物的所有分类单元(n=8个“批次”);“平板-中心”组合的去污去除了任何一个有超过10个TCGA样本的测序板上被识别为污染物的所有分类单元(n=351个“批次”)。gydF4y2Ba氟gydF4y2Ba,对“可能已清除的污染物”数据集的身体部位归因预测(gydF4y2BacgydF4y2Ba),“盘子中心去污”数据集(gydF4y2BadgydF4y2Ba)、“所有推定污染物已清除”数据集(gydF4y2BaegydF4y2Ba)和“最严格过滤”数据集(gydF4y2BafgydF4y2Ba).gydF4y2Bag-lgydF4y2Ba,所有的模型和伴随的性能值(AUROC和AUPR)是使用上述四个去污染的数据集重新生成的(每个用不同的颜色标记;参见位于上述地块的图例)。从去污染数据集上训练和测试的模型中获得的AUROC和AUPR值与“完整”数据集上的AUROC或AUPR值进行了绘制(如图1f-h所示)。虚线表示一个完美的线性关系。对相应数据集的AUROC和AUPR值拟合了广义线性模型;线性拟合的标准误差由相关阴影区域表示。COAD模型的性能在图中得到了识别。gydF4y2Ba
扩展数据图7:gydF4y2Ba
扩展数据图7:。去除污染对每样本类型平均读数比例的影响。gydF4y2Ba
得了gydF4y2Ba,各主要样本类型(原发肿瘤[gydF4y2Ba一个gydF4y2Ba],固体组织正常[gydF4y2BabgydF4y2Ba],血液来源正常[gydF4y2BacgydF4y2Ba])相加并除以每种样本类型内的样本总数。这个归一化阅读计数(每种样本类型)除以每种癌症类型的所有样本类型的归一化阅读计数之和,从而提供每种癌症类型的每种样本类型的平均阅读比例的估计值。如图例所示,对所有5个数据集重复这一过程,以评估去污是否对某些样本类型和/或某些癌症类型有不同的影响;所示百分比的相对稳定性表明没有差别污染。本文中未通过去污或ML进一步分析的小样本类型(如附加转移病灶;N =4个样本类型;扩展数据图1g)未显示,仅占TCGA总样本的3.80%。注意,在特定的情况下,对于给定的癌症类型(即ACC、MESO、UCS中的原发肿瘤),只有一种样本类型存在,那么所有的柱将显示100%的规范化读取来自于一种样本类型。gydF4y2Ba
扩展数据图8:gydF4y2Ba
扩展数据图8:。在TCGA患者中,测定下游ML模型中附加的伪污染贡献和商用的、基于宿主的、细胞游离DNA (ctDNA)测定的理论敏感性。gydF4y2Ba
a - bgydF4y2Ba使用原发肿瘤微生物DNA或RNA (gydF4y2Ba一个gydF4y2Ba),或使用血液衍生的mbDNA (gydF4y2BabgydF4y2Ba).这些去污数据集在去污和归一化管道之前被添加伪污染物以评估其性能(方法),所示模型的测试集性能分别在扩展数据图6g-h和图3a中给出。模型使用的任何加标伪污染物的特征重要性得分除以该模型中所有特征重要性得分的总和,以估计它们对做出准确预测的贡献百分比;分数越高(满分100分),该模型在生物学上的可靠性就越低。注意,“0”表示模型没有使用添加的伪污染物进行预测;在“平板中心去污”数据上生成的模型中,没有一个模型包括添加的伪污染物作为特征。gydF4y2Bac - dgydF4y2Ba,在FoundationOne上有一个或多个基因组改变的患者的TCGA研究中的百分比分布gydF4y2Ba®gydF4y2Ba液体ctDNA编码基因(gydF4y2BacgydF4y2Ba)或Guardant360gydF4y2Ba®gydF4y2BactDNA编码基因(gydF4y2BadgydF4y2Ba).数据下载自gydF4y2Ba https://www.cbioportal.org/gydF4y2Ba.gydF4y2BaegydF4y2Ba,用于FoundationOne®和Guardant360®ctDNA检测的编码基因的具体列表及其检查的改变(来源列于方法)。gydF4y2Ba
图9:gydF4y2Ba
图9:。支持健康个体和多种癌症类型之间的真实世界、血浆来源、无细胞微生物DNA分析。gydF4y2Ba
一个gydF4y2Ba, TCGA中的歧视性模拟用于实证支持真实世界验证研究(图4;详细方法)和每个分层样本量(每种癌症类型)的理论性能指标,使用三种感兴趣的癌症类型(前列腺癌(PC),肺癌(LC),黑色素瘤(SKCM))的血液样本。每个分层样本量的中心值是性能的平均值,误差条表示标准误差。分层抽样是指每一种癌症的样本量为5个,共15个血液样本用于三级鉴别(方法)。TCGA血液来源的正常样本来自布罗德研究所(Broad)和哈佛医学院(HMS),因此它们来自一个测序中心(即布罗德或HMS),一个测序平台(Illumina HiSeq)和一个实验策略(WGS)。将TCGA中的两种LC (LUAD, LUSC)结合起来,以反映可用于验证研究的样本。所得的Broad和HMS数据集,作为原始微生物计数,然后分别通过Voom-SNM进行归一化,就像在验证研究中一样,并输入一个多类(n=3),遗漏一个(LOO) ML管道。每个癌症类型的分层样本量使用10次排列迭代来估计理论性能估计的标准误差;例如,40个分层样本量将涉及训练和测试1200个ML模型(= 40个样本* 3种癌症类型* 10次迭代),其中每个样本将对120个样本进行10个性能估计,以估计标准误差(详见方法)。所有这些都是在shogun衍生数据中重复的。gydF4y2BabgydF4y2Ba,评估gydF4y2BaAliivibriogydF4y2Ba阳性对照菌属丰度值(原始读数计数)(gydF4y2BaAliivibriogydF4y2Ba)单培养、阴性对照空白和人类样本类型,使用Kraken和shogun派生的分类学分配。注意日志gydF4y2Ba10gydF4y2Ba刻度和0.5伪计数下限,用虚线表示。gydF4y2BacgydF4y2Ba,评估gydF4y2BaAliivibriogydF4y2Ba细菌单培养稀释的属丰度(原始读数计数)。注意日志gydF4y2Ba10gydF4y2Ba刻度和0.5伪计数下限,用虚线表示。gydF4y2BadgydF4y2Ba非癌症健康对照组(“Ctrl”)、分组肺癌(LC)、前列腺癌(PC)和黑色素瘤(SKCM)患者的年龄分布。gydF4y2BaegydF4y2Ba,在非癌症健康对照组、LC、PC和SKCM患者中性别的分布,并进行皮尔逊卡方检验(单侧临界区)。gydF4y2BafgydF4y2Ba, Kraken和SHOGUN之间类群分配的维恩图,Kraken使用为TCGA建立的相同数据库(n=59,974个微生物基因组[细菌,古生菌,病毒]),SHOGUN使用“生命网络”数据库(n=10,575个微生物基因组[细菌,古生菌];gydF4y2Ba https://biocore.github.io/wol/gydF4y2Ba).gydF4y2BaggydF4y2Ba在健康的非癌症患者中,使用Kraken(粉色)或SHOGUN(水)衍生分配的原始微生物计数数据,对宿主年龄进行迭代留一(LOO) ML回归。在Kraken和SHOGUN数据图中显示了在所有样本中评估的平均绝对误差(MAE)。gydF4y2Bah-jgydF4y2Ba,排列年龄的影响(gydF4y2BahgydF4y2Ba)、性(gydF4y2Ba我gydF4y2Ba)、年龄及性别(gydF4y2BajgydF4y2Ba)之前的Voom-SNM的ML性能,以区分健康和分组的癌症患者使用无细胞微生物DNA。每次比较使用100种排列(方法)。gydF4y2BakgydF4y2Ba,对PC组、LC组、SKCM组和健康对照组进行迭代子采样,以匹配SKCM队列规模(n=16个样本),然后对每个下采样癌症类型的下采样健康对照组进行LOO配对ML。使用100次排列迭代估计差别性能分布和标准误差(方法)。对于subfiguresgydF4y2Bab, dgydF4y2Ba而且gydF4y2Bah-kgydF4y2Ba:对所有比较采用双面Mann-Whitney检验进行显著性检验,在检验>2比较时采用多重检验校正;所有箱形图均显示中位数、第25和75个百分位数,且须延伸至1.5×四分位数范围。对于所有箱形图和条形图,样本大小在它们下面用蓝色标注。gydF4y2Ba
图10:gydF4y2Ba
图10:。shogun衍生ML性能,用于使用无细胞微生物DNA区分癌症类型和健康、非癌症受试者。gydF4y2Ba
一个gydF4y2Ba,用于区分分组癌症(n=100)和非癌症健康对照组(n=69)的“引导”性能评估。在栅格化密度图上显示了500次不同训练/测试分割(70%/30%)的ROC和PR曲线数据;均值和95%置信区间估计值被插入到图中。gydF4y2Bab-ggydF4y2Ba, Leave-one-out (LOO)迭代ML性能在两个类之间:PC vs.控件(gydF4y2BabgydF4y2Ba), LC vs. control (gydF4y2BacgydF4y2Ba), SKCM vs. controls (gydF4y2BadgydF4y2Ba)、PC患者与LC患者(gydF4y2BaegydF4y2Ba)、LC与SKCM患者(gydF4y2BafgydF4y2Ba)、PC与SKCM患者(gydF4y2BaggydF4y2Ba).gydF4y2Bah-jgydF4y2Ba,多类(n=3或4),LOO迭代ML表现来区分癌症类型,以及癌症患者与健康非癌症对照组之间的差异。平均AUROC和AUPR,根据一个对所有其他AUROC和AUPR值计算,显示在混淆矩阵的底部。gydF4y2BahgydF4y2Ba、LOO ML在三种癌症类型间的表现。gydF4y2Ba我gydF4y2Ba,少数类样本≥20的三种样本类型之间的LOO ML性能(即TCGA分析中使用的截止值,图1f-h)。gydF4y2BajgydF4y2Ba, LOO ML性能之间的所有四种样品类型的研究。对于所有带有混淆矩阵图的子图:由于样本量小,采用LOO ML代替单个或“引导”训练/测试分组。gydF4y2Ba
图1:gydF4y2Ba
图1:。癌症基因组图谱(TCGA)癌症微生物组分析的方法和总体发现。gydF4y2Ba
一个gydF4y2Ba,棒棒糖图显示Kraken在TCGA数据集中微生物检测管道识别的测序reads的百分比,以及在属水平上解析的reads的数量。gydF4y2BabgydF4y2Ba,显示质量控制过程和剩余样本数量的consortium样式图表。gydF4y2BacgydF4y2Ba, Voom归一化数据的主成分分析(PCA),肿瘤微生物组样本经测序中心着色。gydF4y2BaegydF4y2Ba, Voom-SNM数据的PCA。gydF4y2BafgydF4y2Ba原始分类计数数据、vom归一化数据和Voom- snm数据的主方差分量分析。gydF4y2Baf-hgydF4y2Ba,用于区分TCGA原发肿瘤的分类器性能指标(ROC曲线下的面积,“AUROC”或PR曲线,“AUPR”)从红(高)到蓝(低)的热图(gydF4y2BafgydF4y2Ba)、肿瘤与正常(gydF4y2BaggydF4y2Ba)、I期和IV期癌症(gydF4y2BahgydF4y2Ba),“NA”表示在任何ML类中可用于模型训练的样本<20个。列名为TCGA研究id(扩展数据图1a)。gydF4y2Ba
图2:gydF4y2Ba
图2:。TCGA癌症微生物组数据集中的病毒和细菌读数的生态学验证。gydF4y2Ba
一个gydF4y2Ba, COAD (n=70)实体组织正常样本的平均身体位置归属,使用在人类微生物组项目2(“HMP2”)数据集上训练的SourceTracker2。gydF4y2BabgydF4y2Ba的差异丰度gydF4y2Ba梭菌属gydF4y2Ba常见的胃肠道(GI)癌症的属gydF4y2Ba梭菌属gydF4y2Baspp。gydF4y2Ba,,,gydF4y2Ba.gydF4y2BacgydF4y2Ba的差异丰度gydF4y2Ba梭菌属gydF4y2Ba胃肠道癌症组(n=8)和非胃肠道癌症组(n=24)之间的差异(方法)。gydF4y2Bad egydF4y2Ba, HPV感染的CESC患者的正常HPV丰度(gydF4y2BadgydF4y2Ba)或感染hpv的鼻咽癌(gydF4y2BaegydF4y2Ba),如TCGA所示。gydF4y2BafgydF4y2Ba,归一化gydF4y2BaOrthohepadnavirusgydF4y2Ba大量LIHC患者临床判断的危险因素:既往乙型肝炎(乙肝)感染;大量饮酒;或既往感染丙型肝炎(hec)。gydF4y2BaggydF4y2BaSTAD整合分子亚型:染色体不稳定(CIN)、基因组稳定(GS)、微卫星不稳定(MSI)或EBV感染样本(EBV)中的归一化EBV丰度。所有子图:血液来源法向值和/或实体组织法向值显示为对照阴性对照;> - 2比较采用双侧Mann-Whitney检验,多重检验校正;所有箱线图均显示中位数、第25和第75个百分位,且须延伸至1.5×四分位间范围,样本大小用蓝色标注。gydF4y2Ba
图3:gydF4y2Ba
图3:。使用血液中的微生物DNA (mbDNA)进行癌症鉴别的分类器性能,并作为癌症“液体”活检的补充诊断。gydF4y2Ba
一个gydF4y2Ba,模型性能热图类似于图1f-h,使用右侧为TCGA研究id的血液mbDNA预测一种癌症类型与所有其他癌症类型(扩展数据图1a);每个ML少数类需要≥20个样本才合格。gydF4y2BabgydF4y2Ba使用血液mbDNA预测Ia-IIc期癌症的单一癌症类型与所有其他癌症类型的ML模型性能。gydF4y2Bac - d,gydF4y2BaML模型使用患者的血液mbDNA,没有检测到原发性肿瘤基因组改变,根据Guardant360gydF4y2Ba®gydF4y2Ba(gydF4y2BacgydF4y2Ba)和FoundationOnegydF4y2Ba®gydF4y2Ba液体(gydF4y2BadgydF4y2Ba) ctDNA检测。gydF4y2Ba
图4:gydF4y2Ba
图4:。机器学习(ML)模型的性能,以区分癌症类型和健康的非癌症受试者使用血浆来源,细胞游离mbDNA。gydF4y2Ba
一个gydF4y2Ba,验证研究中分析的样本的人口统计数据。所有癌症患者均为多种亚型的高级别(III-IV期)癌症,并被聚合为前列腺癌(PC)、肺癌(LC)和黑色素瘤(SKCM)组。gydF4y2BabgydF4y2Ba,用于区分分组癌症(n=100)和非癌症健康对照组(n=69)的“引导”性能评估。500次不同训练/测试分段(70%/30%)的ROC和PR曲线数据的栅格化密度图;均值和95%置信区间估计嵌入。gydF4y2Ba碳氢键gydF4y2Ba, Leave-one-out (LOO)两个类之间的迭代ML性能:PC vs.控件(gydF4y2BacgydF4y2Ba), LC vs. control (gydF4y2BadgydF4y2Ba), SKCM vs. controls (gydF4y2BaegydF4y2Ba)、PC患者与LC患者(gydF4y2BafgydF4y2Ba)、LC与SKCM患者(gydF4y2BaggydF4y2Ba)、PC与SKCM患者(gydF4y2BahgydF4y2Ba).gydF4y2Bai (kgydF4y2Ba,多类(n=3或4),LOO迭代ML表现来区分癌症类型(gydF4y2Ba我gydF4y2Ba)以及混合癌症患者与健康非癌症对照组之间的关系(gydF4y2BajgydF4y2Ba,gydF4y2BakgydF4y2Ba).LOO ML的总体表现计算为一个与所有其他比较的表现的平均值(ROC曲线“AUROC”下的面积,或PR曲线;“AUPR”)。gydF4y2Ba

评论gydF4y2Ba

类似的文章gydF4y2Ba

  • 使用污染控制分析框架检测无细胞微生物DNA。gydF4y2Ba
    Zozaya-Valdés E, Wong SQ, Raleigh J, Hatzimihalis A, Ftouni S, Papenfuss AT, Sandhu S, Dawson MA, Dawson SJ。gydF4y2Ba Zozaya-Valdés E,等。gydF4y2Ba 基因组生物学2021年6月23日;22(1):187。doi: 10.1186 / s13059 - 021 - 02401 - 3。gydF4y2Ba 基因组生物学。2021。gydF4y2Ba PMID:gydF4y2Ba34162397gydF4y2Ba 免费的PMC文章。gydF4y2Ba
  • 液体活检的纳米孔测序:肺癌患者无细胞DNA拷贝数变化的分析。gydF4y2Ba
    Martignano F, Munagala U, Crucitta S, Mingrino A, Semeraro R, Del Re M, Petrini I, Magi A, Conticello SG。gydF4y2Ba Martignano F,等。gydF4y2Ba Mol Cancer. 2021 2月12日;20(1):32。doi: 10.1186 / s12943 - 021 - 01327 - 5。gydF4y2Ba Mol Cancer, 2021。gydF4y2Ba PMID:gydF4y2Ba33579306gydF4y2Ba 免费的PMC文章。gydF4y2Ba
  • 微生物组和前列腺癌风险。gydF4y2Ba
    Wheeler KM, Liss MA。gydF4y2Ba Wheeler KM,等。gydF4y2Ba Curr urrol代表2019年9月7日;20(10):66。doi: 10.1007 / s11934 - 019 - 0922 - 4。gydF4y2Ba Curr urrol代表2019。gydF4y2Ba PMID:gydF4y2Ba31493090gydF4y2Ba 审查。gydF4y2Ba
  • 前列腺癌中的微生物群特征。gydF4y2Ba
    Banerjee S, Alwine JC, Wei Z, Tian T, Shih N, Sperling C, Guzzo T, Feldman MD, Robertson ES。gydF4y2Ba Banerjee S,等。gydF4y2Ba 2019年7月6日;40(6):749-764。doi: 10.1093 / carcin / bgz008。gydF4y2Ba 致癌作用。2019。gydF4y2Ba PMID:gydF4y2Ba30794288gydF4y2Ba
  • 利用DNA甲基化面板在血液液体活检中早期发现主要男性癌症类型。gydF4y2Ba
    Constâncio V,努内斯SP,莫雷拉-巴博萨C,弗雷塔斯R,奥利维拉J,普萨I,奥利维拉J,苏亚雷斯M,迪亚斯CG,迪亚斯T,安图内斯L,恩里克R, Jerónimo C。gydF4y2Ba Constâncio V等。gydF4y2Ba 临床表观遗传学2019 12月2日;11(1):175。doi: 10.1186 / s13148 - 019 - 0779 - x。gydF4y2Ba 临床表观遗传学2019。gydF4y2Ba PMID:gydF4y2Ba31791387gydF4y2Ba 免费的PMC文章。gydF4y2Ba

引用的gydF4y2Ba

  • 肝细胞癌肿瘤内细菌与代谢物和遗传改变相互作用。gydF4y2Ba
    薛超,贾娟,顾旭,周磊,卢杰,郑强,苏勇,郑松,李磊。gydF4y2Ba 薛c,等。gydF4y2Ba 信号传导目标Ther. 2022年9月28日;7(1):335。doi: 10.1038 / s41392 - 022 - 01159 - 9。gydF4y2Ba 信号传输目标Ther。2022。gydF4y2Ba PMID:gydF4y2Ba36167691gydF4y2Ba 免费的PMC文章。gydF4y2Ba 没有摘要。gydF4y2Ba
  • 微生物组在胰腺癌中的作用。gydF4y2Ba
    宫林K, Ijichi H, Fujishiro M。gydF4y2Ba Miyabayashi K,等。gydF4y2Ba 癌症(巴塞尔)。2022 9月15日;14(18):4479。doi: 10.3390 / cancers14184479。gydF4y2Ba 癌症(巴塞尔)。2022.gydF4y2Ba PMID:gydF4y2Ba36139638gydF4y2Ba 免费的PMC文章。gydF4y2Ba 审查。gydF4y2Ba
  • 基于血液循环微生物宏基因组的食管腺癌的早期诊断和预后。gydF4y2Ba
    Zaidi AH, Pratama MY, Omstead AN, Gorbonova A, Mansoor R, Melton-Kreft R, Jobe BA, Wagner PL, Kelly RJ, Goel A。gydF4y2Ba Zaidi AH等人。gydF4y2Ba 癌症杂志。2022年9月12日doi: 10.1038 / s41416 - 022 - 01974 - 5。在线先于印刷。gydF4y2Ba 癌症杂志,2022。gydF4y2Ba PMID:gydF4y2Ba36097175gydF4y2Ba
  • 人类胃肠道中的产甲烷古生菌。gydF4y2Ba
    Hoegenauer C, Hammer HF, Mahnert A, Moissl-Eichinger C。gydF4y2Ba Hoegenauer C,等。gydF4y2Ba Nat Rev Gastroenterol Hepatol 2022年9月1日doi: 10.1038 / s41575 - 022 - 00673 - z。在线先于印刷。gydF4y2Ba 2022年。gydF4y2Ba PMID:gydF4y2Ba36050385gydF4y2Ba 审查。gydF4y2Ba
  • 现在我已经从两个方面研究了肠道:胃肠道参与了SARS-CoV-2和HIV/SIV感染的发病机制。gydF4y2Ba
    Pandrea I, Brooks K, Desai RP, Tare M, Brenchley JM, Apetrei C。gydF4y2Ba Pandrea I,等等。gydF4y2Ba 2020年8月12日;13:899559。doi: 10.3389 / fimmu.2022.899559。eCollection 2022。gydF4y2Ba 免疫前沿。2022。gydF4y2Ba PMID:gydF4y2Ba36032119gydF4y2Ba 免费的PMC文章。gydF4y2Ba 审查。gydF4y2Ba

网格计算gydF4y2Ba

LinkOut -更多资源gydF4y2Ba