跳转到主要内容gydF4y2Ba

估计人口大量tissue-infiltrating免疫和基质细胞的人口使用基因表达gydF4y2Ba

一个gydF4y2Ba勘误表gydF4y2Ba这篇文章发表于2016年12月01gydF4y2Ba

文摘gydF4y2Ba

介绍了微环境细胞Populations-counter (MCP-counter)方法,它允许的量化的绝对丰度八免疫和两个异构的基质细胞种群组织转录组数据。我们目前的体外mRNA混合物和体外免疫组织化学定量数据支持我们的方法的有效性的估计。此外,我们表明,MCP-counter克服了之前的一些局限性和缺点提出了计算方法。MCP-counter应用于画一个全球性的免疫浸润在人类健康的组织和non-hematopoietic人类肿瘤和概括microenvironment-based病人集中与总生存期肺腺癌和肠癌和乳腺癌。gydF4y2Ba

背景gydF4y2Ba

丰富的tissue-infiltrating免疫和非免疫基质细胞种群的高度信息类型的炎症,血管生成,多反应发生在病变组织。在癌症,多个研究关注免疫人群数量有限的报道之间的关联程度的免疫细胞浸润和预后(了gydF4y2Ba1gydF4y2Ba])。例如,它已经表明,t细胞浸润与有利的结果在结直肠gydF4y2Ba2gydF4y2Ba,gydF4y2Ba3gydF4y2Ba和许多其他癌症gydF4y2Ba4gydF4y2Ba)和较差的结果在透明细胞肾细胞癌gydF4y2Ba5gydF4y2Ba]。其他免疫细胞类型,如巨噬细胞、B细胞和自然杀伤(NK)细胞(gydF4y2Ba1gydF4y2Ba),以及内皮细胞和成纤维细胞(gydF4y2Ba6gydF4y2Ba,gydF4y2Ba7gydF4y2Ba),已被证明积极的还是消极的影响癌症患者的预后。然而,正如量化只是一个细胞群要求,对如何所有这些细胞群集体预测癌症患者的预后。能够同时量化多个细胞群内组织样本从而出现识别的关键临床相关类根据他们的炎性病变的组织和基质配置文件。gydF4y2Ba

在外围细胞异构组织样本,转录组测量平均信号来自不同的底层细胞群。这些信号可以产生的反褶积估计人口比例的细胞样本(gydF4y2Ba8gydF4y2Ba]。成千上万的转录组配置文件可用的回顾性分析基因表达等公共存储库综合(GEO) ArrayExpress或癌症基因组图谱(TCGA)。不同transcriptome-based计算方法最近提出了描述在白细胞免疫人群的比例,但是忽略的关键参数的总体丰富白细胞在样例(gydF4y2Ba9gydF4y2Ba,gydF4y2Ba10gydF4y2Ba]。其他出版方法缺乏定量验证(gydF4y2Ba11gydF4y2Ba]或仅限于只有两个细胞群(gydF4y2Ba12gydF4y2Ba]。为了克服这些限制,我们引入微环境细胞群(MCP)计数器,强劲transcriptome-based计算方法量化丰富的免疫和非免疫基质细胞的数量在异构组织样本。gydF4y2Ba

MCP-counter作为R包可用。从基因表达矩阵,它为每个样本产生CD3的丰度分数gydF4y2Ba+gydF4y2BaCD8 T细胞,gydF4y2Ba+gydF4y2BaT细胞、细胞毒性淋巴细胞、NK细胞、B淋巴细胞,细胞来源于单核细胞(单核细胞的血统),骨髓树突状细胞,中性粒细胞,以及内皮细胞和成纤维细胞。MCP-counter估计“单一样本”分数,在某种意义上,他们是独立地计算每一个样本。这些分数可以用于直接比较丰富的相应的细胞类型的样品在一个队列。我们表明,我们的方法补充或优于先前发布的方法。我们定量验证MCP-counter体外,通过使用信使rna混合物,和间接体内疗法,通过免疫组织化学细胞量化在石蜡包埋组织部分。我们举例说明其应用评估tissue-infiltration 47健康组织类型和32 non-hematological恶性肿瘤。我们表明,我们的方法是能够重现免疫学和基质预后分类在肺腺癌和肠癌和乳腺癌。gydF4y2Ba

结果gydF4y2Ba

MCP-counter方法的开发和验证过程gydF4y2Ba

我们设计了一个方法,称为MCP-counter,客观的测量inter-sample相对丰度不同的微环境细胞群。开发和验证我们的方法,我们设计了一个(图七步策略。gydF4y2Ba1gydF4y2Ba)。MCP-counter基于方法论的框架(gydF4y2Ba8gydF4y2Ba转录组的标记(TM),定义为基因表达特性表达一个且只有一个细胞群,其表达式显示感兴趣的变化很少直接(步骤1)。它之前,在一个样本由许多不同的细胞群,感兴趣的丰富的人口成正比TM样本的表达相关。鉴于其限制性的定义,TM存在不能保证对所有人群。我们建立了一系列发现组织微环境细胞群(MCP)转录组从81年公共数据集导出使用人类基因组U133 Affymetrix + 2.0微阵列(步骤2)。这些转录组规范化gydF4y2Ba13gydF4y2Ba让他们融入一个大meta-dataset非免疫微环境包括1194免疫或细胞群样本;742年肿瘤细胞系样本作为消极的控制(附加文件gydF4y2Ba1gydF4y2Ba:表S1)。没有包括肿瘤造血细胞系作为负控制这些细胞的转录组密切相关的良性造血细胞(gydF4y2Ba14gydF4y2Ba]。人工管理后,所有的样品都带注释的使用63标签,其中42对应微环境细胞群和21代表从21 non-hematopoietic癌症细胞系(无花果。gydF4y2Ba2gydF4y2Ba)。我们组织了63个细胞群成金字塔形的图根据规则包含(附加文件gydF4y2Ba2gydF4y2Ba:图S1)。我们添加了hematopoiesis-inspired(例如,淋巴和骨髓血统)或功能(例如,细胞毒性淋巴细胞)类别这个金字塔,导致共有67个节点对应于组织微环境中潜在的细胞数量(步骤3)(附加文件gydF4y2Ba2gydF4y2Ba:图S1)。这个组织是由与集群的一致性验证得到transcriptome-based主成分分析(步骤4;额外的文件gydF4y2Ba2gydF4y2Ba:图S2)。gydF4y2Ba

图1gydF4y2Ba
图1gydF4y2Ba

MCP-counter目的和发展的方法。gydF4y2Ba一个gydF4y2Ba比较MCP-counter估计和CIBERSORT-estimated白血球的分数。gydF4y2BabgydF4y2BaMCP-counter框架的开发和验证gydF4y2Ba

图2gydF4y2Ba
图2gydF4y2Ba

转录组标记的识别和定性验证。gydF4y2Ba一个gydF4y2BaMCP发现系列。gydF4y2BapDCgydF4y2Ba血浆树突细胞gydF4y2BaPBMCgydF4y2Ba外周血单核细胞。gydF4y2BabgydF4y2Ba四分位数得分MCP-counter积极的发现和控制样本和验证微环境系列。gydF4y2Ba灰色的gydF4y2Ba表明缺失值。gydF4y2BacgydF4y2Ba代表转录组标记和相应的表达模式在MCP发现系列gydF4y2Ba

确定给定细胞群的TM(一个节点在我们的细胞人口金字塔;步骤5),我们定义为“正面”所包含的样本在这个人口和我们定义为“负面”不包含这一人群的样本。样本包含积极的和消极的细胞都省略了这个节点的分析。三个标准被计算为每个特性(探针组)在发现组:a)意味着日志gydF4y2Ba2gydF4y2Ba积极的和消极的表达差异样本(2的阈值应用);b) ROC曲线下的面积(AUC)特性的正样本的识别(阈值为0.97);和c)的正负样本之间的信号噪声比(1.5)的阈值(“方法”;额外的文件gydF4y2Ba1gydF4y2Ba:表S2)。基因表达特性,同时为三个标准都达到定义的阈值保留为TM相应的细胞群。gydF4y2Ba

因为我们没有先验知识的人群TM可以确定,我们应用为每个样本的非根节点选择过程详尽金字塔(附加文件gydF4y2Ba2gydF4y2Ba:图S1)和选择后验最相关的TM集。识别标记的数量在每一层的锥体图是在附加的文件gydF4y2Ba1gydF4y2Ba:表S3。从67个节点,我们保留TM TM的最精确的人口可能强劲。我们因此丢弃这些适当的负控制没有公开可用(例如,识别TM效应CD4记忆T细胞至少需要负控制中央CD4记忆T细胞和效应等内存CD8 T细胞),一些积极的样本,或那些没有识别标记后选择过程。节点对应于一般人群(例如,淋巴细胞或骨髓细胞)丢弃作为更精确的子细胞种群的TM是可用的(原因丢弃未被选中每个TM集给出了附加的文件gydF4y2Ba1gydF4y2Ba:表S3)。我们因此保留经颅磁刺激特定十不同的人群:8免疫细胞的数量(CD8 T细胞gydF4y2Ba+gydF4y2BaT细胞、NK细胞的细胞毒性淋巴细胞,B细胞谱系,单核细胞的谱系细胞,骨髓树突状细胞和中性粒细胞)和两个无免疫力基质人口(内皮细胞和成纤维细胞)。81数据集从344年发现设置了不同的文化环境,净化方法,和细胞治疗,确保TM的选择对实验条件并不敏感。MCP-counter分数定义为log2 TM的平均表现为每个人口(步骤6)。然后,我们验证MCP-counter(步骤7)。gydF4y2Ba

定性的验证确认TMgydF4y2Ba

确定TM的再现性评估在两个micrenvironment验证一系列的1596个样本杂交Affymetrix U133A数组和3208样品杂交Affymetrix HuGene第1.0数组(附加文件gydF4y2Ba1gydF4y2Ba:表S4和5)。十细胞群,发现系列获得的特定表达模式都复制(附加文件gydF4y2Ba2gydF4y2Ba:图S3),同样的选择标准用于MCP验证系列标识明显重叠TM(额外的文件集gydF4y2Ba1gydF4y2Ba:表S3;gydF4y2BapgydF4y2Ba任何选择TM组p < 0.003)。MCP-counter分数展示一个清晰的分离细胞的发现和验证两个系列(图。gydF4y2Ba2 bgydF4y2Ba),每个签名在4804年的AUC 0.994以上验证样本(附加文件gydF4y2Ba2gydF4y2Ba:图S4)。gydF4y2Ba

知识,虽然他们的识别是数据驱动的,而不是选择TM很大程度上重叠与已知的标记相应的细胞群。例如,它们包括探针集映射到CD3D和T细胞,CD5 CD8B CD8gydF4y2Ba+gydF4y2Ba对细胞毒性淋巴细胞、T细胞、加工和gn NCR1 (NKp46)和吉珥NK细胞的基因,CD19, CD79A, CD79B B细胞,CSF1R为单核细胞的细胞,CD1分子髓系树突状细胞,FCGR3B和CEACAM3 (CD66b)中性粒细胞,VWF(血管性血友病因子)和CDH5 (VE-cadherin)内皮细胞,宽带和TAGLN成纤维细胞(图gydF4y2Ba2摄氏度gydF4y2Ba)。相比之下,筛选过程排除在TM一些基因通常视为特定对于给定的细胞群,比如黑色,我们不仅在B细胞也发现过表达水平较低,在血浆树突细胞,因此它支持数据驱动方法的相关性(附加文件gydF4y2Ba2gydF4y2Ba:图S5)。gydF4y2Ba

对于一个给定的细胞群,TM预计将协调表达,我们检查了相关矩阵的三个MCP的TM数据集。我们观察到高度正相关矩阵中所有人口MCP数据集(附加文件gydF4y2Ba2gydF4y2Ba:图S6)。评估这种方法的再现性,我们减少标记四种群的数量(中性粒细胞、成纤维细胞、内皮细胞、B细胞谱系)曾大TM集(> 90 TM)使用信息从MCP验证系列(“gydF4y2Ba方法gydF4y2Ba”)。我们检查了这些最后TM的关联模式设置在9408年,3548年和6451年肿瘤转录组样品(附加文件gydF4y2Ba1gydF4y2Ba:表S6)获得使用Affymetrix人类基因组U133 + 2.0, Affymetrix 133 a,和Illumina公司HiSeq转录组平台,分别(附加文件gydF4y2Ba1gydF4y2Ba:表S7-S9)。我们观察到主要positive-valued相关矩阵中所有MCP三个肿瘤数据集,在这两个pan-cancer(附加文件gydF4y2Ba2gydF4y2Ba:图S7)和单一的癌症(附加文件gydF4y2Ba2gydF4y2Ba:图S8)数据集。gydF4y2Ba

定量验证MCP-counter丰度估计gydF4y2Ba

我们定量MCP-counter方法进行验证。为此,我们设计了一个RNA混合物体外实验(无花果。gydF4y2Ba3gydF4y2Ba)。从健康的捐赠者的外周血免疫人群纯化;他们的RNA提取和混合在高度可变的浓度(从0.7到46%的样本的RNA)。RNA比例的人口被安排在两个转置拉丁方块避免共线性,从而确保特异性(附加文件gydF4y2Ba1gydF4y2Ba:表S10)。进一步稀释混合物在固定数量的一个解决方案包含信使rna提取hct - 116,结直肠癌细胞系。转录组分析显示,MCP-counter成绩高度相关的细胞比例的人群中引入混合物(无花果。gydF4y2Ba3 bgydF4y2Ba),皮尔逊相关系数从0.94到0.99。我们添加到这些混合物信使rna提取成纤维细胞和人脐静脉内皮细胞,延长拉丁方布局(浓度产生的额外的文件所示gydF4y2Ba1gydF4y2Ba:表S11),计算MCP-counter估计使用定量聚合酶链反应(qPCR)。这两个细胞群,我们也获得了积极和显著的线性相关性估计(图。gydF4y2Ba3 cgydF4y2Ba;r = 0.96和gydF4y2BapgydF4y2Ba= 9.9×10gydF4y2Ba−6gydF4y2Ba内皮细胞,r = 0.93gydF4y2BapgydF4y2Ba= 8.9.10gydF4y2Ba−5gydF4y2Ba成纤维细胞)。最后,尽管大量的细胞毒性淋巴细胞信使rna不是我们控制的混合实验,我们测试是否CD3 + T细胞(通过他们的CD8 +子集)和NK细胞的细胞毒性淋巴细胞水平MCP-counter得分。我们因此进行了线性模型(“方法”)显示,细胞类型显著贡献,积极的水平细胞毒性淋巴细胞分数,共同解释观察到的方差的99%(无花果。gydF4y2Ba3 dgydF4y2Ba;gydF4y2BapgydF4y2Ba= 1.3×10gydF4y2Ba−9gydF4y2BaNK细胞和gydF4y2BapgydF4y2Ba= 0.038 CD3 + T细胞,RgydF4y2Ba2gydF4y2Ba= 0.99)。此外,免疫组织化学(包含IHC) CD3的数字量化gydF4y2Ba+gydF4y2Ba,CD8αgydF4y2Ba+gydF4y2Ba和CD68gydF4y2Ba+gydF4y2Ba细胞密度进行组织部分来自38个结直肠癌肿瘤。每个细胞群被发现的IHC-measured密度与相应的MCP-counter得分(无花果。gydF4y2Ba3 egydF4y2Ba)。gydF4y2Ba

图3gydF4y2Ba
图3gydF4y2Ba

定量验证MCP-counter估计。gydF4y2Ba一个gydF4y2Ba体外RNA混合物的设计验证实验。gydF4y2BabgydF4y2BaMCP-counter的相关性分数已知样本的RNA RNA的比例混合样品。的gydF4y2Ba虚线gydF4y2Ba代表了最小二乘回归直线。的gydF4y2Ba红点gydF4y2Ba对应的极限检测(non-hematopoietic发现MCP样本的平均分数gydF4y2Ba轴gydF4y2Ba和相应的mRNA分数这线性回归预测的gydF4y2Ba轴gydF4y2Ba)。gydF4y2BacgydF4y2Ba内皮细胞和成纤维细胞在相同的方式进行测试gydF4y2BabgydF4y2Ba但使用qPCR数据。gydF4y2BaHUVECgydF4y2Ba人类脐静脉内皮细胞。gydF4y2BadgydF4y2Ba三维散点图显示细胞毒性T淋巴细胞MCP-counter分数和之间的关系和NK细胞比例的混合物。gydF4y2BaegydF4y2BaMCP-counter分数的相关性与相应的细胞密度通过免疫组织化学方法测定gydF4y2Ba

最后,我们评估了该技术的检测极限为每个细胞群使用non-hematopoietic控制样本。对于每一个化验人口,我们观察到一个检测极限低于2%(根据人口,从1/950到1/50的样品的总RNA;无花果。gydF4y2Ba3 bgydF4y2Ba)。,这些结果验证使用MCP-counter方法直接比较丰富的相应的细胞群在转录组样本。gydF4y2Ba

比较MCP-counter同此前发布的方法gydF4y2Ba

MCP-counter等不同方法CIBERSORT [gydF4y2Ba9gydF4y2Ba),其目的是为了衡量intra-sample比例(within-leukocyte)免疫细胞的数量,而MCP-counter输出大量估计每细胞群,使一个inter-sample比较,在被表达在任意单位的成本。为了说明这些差异,我们模拟mRNA混合物的比例within-leukocyte 5免疫细胞的数量保持不变,平等而肿瘤细胞的比例变化(图。gydF4y2Ba4gydF4y2Ba)。在此设置,只有MCP-counter能够准确反映在模拟混合免疫细胞丰度的差异,而CIBERSORT(准确地)估计的比例稳定在白细胞的免疫细胞的人口比例的模拟的混合物。gydF4y2Ba

图4gydF4y2Ba
图4gydF4y2Ba

比较MCP-counter同此前发布的方法。gydF4y2Ba一个gydF4y2BaMCP-counter评分(gydF4y2Ba左gydF4y2Ba)和CIBERSORT估计(gydF4y2Ba正确的gydF4y2Ba)在模拟mRNA混合物5免疫人群介绍了平等的比例,用不同比例的肿瘤细胞(gydF4y2Ba轴gydF4y2Ba)。gydF4y2Ba误差线gydF4y2Ba代表标准误差估计。gydF4y2BabgydF4y2Ba热图显示分数计算与TM集三个来源(gydF4y2BaPred列gydF4y2Ba)。的gydF4y2Ba真理列gydF4y2Ba显示每个TM的样本集的状态。因此,一组TM的性能由一致性表示Pred和真理之间的列。成套标记,不使用信息从验证系列,用于MCP-countergydF4y2Ba

比较鲁棒性TM集用于MCP-counter和那些在先前发表的方法,确定了我们metagene分数计算三组微环境与TM系列报道Bindea et al。gydF4y2Ba11gydF4y2Ba]或俊井等。gydF4y2Ba12gydF4y2Ba]。MCP-counter分数达到高特异性和灵敏度为每个相应的细胞群,虽然有些TM集从其他方法有时负样本(图中高度表达。gydF4y2Ba4 bgydF4y2Ba;额外的文件gydF4y2Ba2gydF4y2Ba:图S9)。gydF4y2Ba

分析正常和癌组织的微环境gydF4y2Ba

我们应用MCP-counter 47 505个样本的第一个数据集生成非病理性解剖位置(gydF4y2Ba15gydF4y2Ba]。淋巴器官(脾、淋巴结、扁桃体、骨髓),正如所料,发现港口大量的免疫细胞,而胸腺中CD3 MCP-counter得分最高gydF4y2Ba+gydF4y2BaT细胞(图gydF4y2Ba5gydF4y2Ba)。另一方面,众所周知的“免疫保护区”,如睾丸,正确发现功能丰富的免疫细胞。gydF4y2Ba

图5gydF4y2Ba
图5gydF4y2Ba

估计大量的浸润免疫和基质细胞健康组织和non-hematopoietic人类肿瘤。gydF4y2Ba一个gydF4y2BaMCP-counter分数在健康的组织。的多个样本来自相同类型的十几组织,结果MCP-counter平均分数。gydF4y2BabgydF4y2Ba意味着MCP-counter分数的恶性组织和三个转录组平台。gydF4y2Ba行gydF4y2Ba命令使用层次聚类过程,病房的聚合条件和欧氏距离。gydF4y2BaHNSCCgydF4y2Ba头颈部鳞状细胞癌gydF4y2Ba

肿瘤免疫学是MCP-counter的自然应用程序之一。我们估计大量的免疫和非免疫细胞的数量在19407年样本生成32 non-hematopoietic人类肿瘤,因此提出的全球分析良性细胞群丰度在人类癌症(无花果。gydF4y2Ba5 bgydF4y2Ba)。MCP-counter分数从三个潜在的转录组获得平台(Affymetrix人类基因组U133 + 2.0, Affymetrix 133 a,和Illumina公司HiSeq)产生了可再生的模式在癌症(附加文件gydF4y2Ba2gydF4y2Ba:平均图S10),从而产生一种合成视图(图。gydF4y2Ba5 bgydF4y2Ba)。我们观察到肾透明细胞癌的丰度最高的内皮细胞癌症,虽然葡萄膜黑色素瘤,发生的眼睛,免疫保护区,由免疫细胞渗透不良。结直肠癌样本平均免疫细胞丰度。神经胶质瘤恶性胶质瘤和低渗透的T细胞出现。经常viral-induced宫颈鳞状细胞癌是高度渗透的细胞毒性T细胞和NK细胞但不佳的单核细胞的来源。gydF4y2Ba

预后与MCP-counter估计相关联的值gydF4y2Ba

包括三个肿瘤系列,分别为2631年、1615年和6047年样本被注释为总生存期(OS)。我们另外策划1591肿瘤转录组使用其他转录组平台与操作系统获得的注释(附加文件gydF4y2Ba1gydF4y2Ba:表S6和S12)。通过执行一个荟萃分析的单变量Cox模型调整在每个独立的研究中,我们评估了每个微环境细胞群的丰度之间的相关性,以MCP-counter分数估计,在癌症类型(图和操作系统。gydF4y2Ba6gydF4y2Ba)。虽然这单变量分析没有调整的变量可能影响操作系统,如肿瘤或治疗阶段,然而出现符合出版文献[gydF4y2Ba1gydF4y2Ba],特别是揭示全面良好的预后与T细胞的浸润有关,除了先前报道得肾透明细胞癌(gydF4y2Ba5gydF4y2Ba在低级别胶质瘤。成纤维细胞大多是与贫穷相关的结果。gydF4y2Ba

图6gydF4y2Ba
图6gydF4y2Ba

预后价值与non-hematopoietic MCP-counter分数有关人类癌症。gydF4y2Ba一个gydF4y2Ba荟萃分析的单变量预后价值总体存活率MCP-counter分数在人类癌症。gydF4y2Ba大圈gydF4y2Ba代表低gydF4y2BapgydF4y2Ba值。gydF4y2Ba绿色gydF4y2Ba代表危险比率低于1(良好的预后的影响)和gydF4y2Ba红色的gydF4y2Ba风险率高于1(不良预后的影响)。gydF4y2Ba沉闷的颜色gydF4y2Ba代表gydF4y2BapgydF4y2Ba值高于0.05。gydF4y2BaHNSCCgydF4y2Ba头颈部鳞状细胞癌。gydF4y2BabgydF4y2Ba- - - - - -gydF4y2BadgydF4y2Ba肿瘤微环境的分类gydF4y2BabgydF4y2Ba肺腺癌基于浸润T细胞和B细胞的数量,gydF4y2BacgydF4y2Ba结直肠癌基于丰富的细胞毒性淋巴细胞和成纤维细胞,和gydF4y2BadgydF4y2Ba乳腺癌的基础上丰富的细胞毒性淋巴细胞和单核细胞的起源细胞gydF4y2Ba

评估是否MCP-counter相关识别肿瘤组由多个细胞数量,基于他们的相对渗透我们试图复制之前报道预测分类。在非小细胞肺腺癌,这是最近报道,由B细胞或T细胞渗透独立预测有利预后[gydF4y2Ba16gydF4y2Ba,gydF4y2Ba17gydF4y2Ba]。在结肠直肠癌、广泛的文学存在高渗透保护作用的T细胞(gydF4y2Ba2gydF4y2Ba,gydF4y2Ba3gydF4y2Ba据报道,而成纤维细胞与贫穷相关的结果(gydF4y2Ba6gydF4y2Ba,gydF4y2Ba7gydF4y2Ba]。在乳腺癌中,分层依赖细胞毒性T细胞(与有利的结果)和巨噬细胞(可怜的结果)提出了gydF4y2Ba18gydF4y2Ba]。使用MCP-counter,我们可以复制这些临床相关的模式(图gydF4y2Ba6罪犯gydF4y2Ba)。gydF4y2Ba

讨论gydF4y2Ba

Tissue-infiltrating免疫和非免疫基质细胞的基因表达的信号测量实验。检索此信息可以产生丰富的估计tissue-infiltrating细胞(gydF4y2Ba19gydF4y2Ba),说明在癌症样本。利用这些信息,我们开发了MCP-counter方法,实现在一个易于使用的R包中。gydF4y2Ba

它产生一个分数为每个十MCP截然不同。我们验证,这些成绩是准确的丰度估计在三个不同的设置:MCP)转录组的概要4804验证样本,MCP-counter分数分离正负样本(相对于每个十细胞群)具有高特异性和敏感性;b)在体外RNA混合设置,我们表明,MCP-counter分数对应的细胞群RNA提取高度相关(皮尔森相关系数从0.93到0.99)的RNA分数对应的细胞群的混合物;和c)在体外,我们表明,MCP-counter估计与包含IHC测量相应的细胞密度。使用体外设置,我们表明,MCP-counter的探测下限的人口比例低于2%的样本的总RNA在使用Affymetrix人类基因组U133 + 2.0微阵列。这种检测极限可能降低使用更敏感的基因表达技术,Nanostring或RNA-sequencing化验。我们一直观察到下限检测使用qPCR数据的两个细胞群(无花果。gydF4y2Ba3 cgydF4y2Ba)。gydF4y2Ba

其他技术来定量描述异构组织明显的细胞成分包括流式细胞术和酶包含IHC。MCP-counter估计在概念上接近IHC-estimated细胞密度(每个表面的细胞数量单位组织切片),产生的估计可以用来比较丰富的跨样本对应的细胞群。然而,与包含IHC MCP-counter允许同时量化十细胞群与单个基因表达实验中,同时包含IHC量化通常只限于几个标记。细胞信息的空间定位,可以在包含IHC实验,如有遗失,然而,当使用转录组技术。组织学证实MCP-counter估计可能是必要的情况下周围组织样品的污染是不可避免的。dna测序数据也可以用于评估细胞的比例重新安排t细胞受体或b细胞受体位点,提供丰富和曲目信息这两个人口。的八个其他人群MCP-counter提供估计,但是,无法量化的使用dna测序数据。研究T细胞和B细胞的单克隆,然而,一个有趣的协变量补充丰富的估计这些细胞群,从RNA-seq访问数据,最近在肿瘤样本(gydF4y2Ba20.gydF4y2Ba- - - - - -gydF4y2Ba22gydF4y2Ba]。gydF4y2Ba

MCP-counter更敏感和具体的解释分数比其他先前发表TM-based方法(gydF4y2Ba11gydF4y2Ba,gydF4y2Ba12gydF4y2Ba]的严谨、公正、和保守的方法来定义它是基于TM集(无花果。gydF4y2Ba4 bgydF4y2Ba),重要的是,定量验证实验(无花果。gydF4y2Ba3gydF4y2Ba)。它在概念上不同于流式细胞仪实验或流cytometry-inspired计算方法如CIBERSORT [gydF4y2Ba9gydF4y2Ba),旨在描述各种细胞群的相对比例在一个示例(图。gydF4y2Ba4gydF4y2Ba)。相比之下,MCP-counter是专门设计用于比较的绝对丰度给定细胞群跨多个样本。gydF4y2Ba

MCP-counter分数线性与相应的细胞群丰度在样本,但它们表达任意单位。这些任意单位是依赖于基因表达平台用于生产数据,我们只能比较样本产生相同的基因表达平台。尽管如此,我们表明,肿瘤细胞相对丰度在三大数据集,共计19000多个肿瘤和得到三个不同的基因表达平台,在很大程度上是一致的(额外的文件gydF4y2Ba2gydF4y2Ba:图S10),验证使用MCP-counter评估哪些样品最或至少渗透到每个细胞群的特征。尽管如此,由于MCP-counter分数基于总结基因表达特性(如每千碱基读取数百万),其准确性会受到影响,如果这种总结的质量很低。丰富的细胞群估计MCP-counter通常在组织样本的频率相对较低。因此,在高深度测序样品(> 8000万读/样本)gydF4y2Ba23gydF4y2Ba),据报道,提高量化罕见的成绩单,可以改善RNA-sequencing MCP-counter估计样本的准确性。gydF4y2Ba

我们说明了利用MCP-counter十几人类组织和观察到的丰度估计与已知的免疫状态的样品一致。我们应用MCP-counter描述平均MCP细胞丰度32 non-hematopoietic人类恶性肿瘤。这种分析证实了非常高的透明细胞肾细胞癌血管化和显示宫颈鳞状细胞癌肿瘤,通常病毒引起,由T淋巴细胞和高度渗透,值得注意的是,由其他免疫细胞毒性T细胞,但只有适度的子集。其他结果出现更令人吃惊,比如高大量的成纤维细胞的细胞间质肿瘤的微环境的可能源自肉瘤肿瘤细胞的一个子集或肝细胞癌的血管化相对较低的样品可能是由于独特的在肝脏内皮细胞表型。MCP-counter在这些情况下应该与组织病理学知识和数据在一个给定的癌症。gydF4y2Ba

MCP-counter最相关的分层一群相似的样品成分的基础上他们的免疫和基质微环境,或遵循微环境的构成。MCP-counter确认重要的单变量的使用操作系统之间的关联和肿瘤细胞毒性淋巴细胞的浸润大多是积极的(gydF4y2Ba4gydF4y2Ba]。相比之下,无免疫力的重要预后之间的联系和广泛的丰富基质细胞群,值得注意的是,成纤维细胞被证明是主要使用MCP-counter负面。这些观察结果,很大程度上符合出版文献[gydF4y2Ba1gydF4y2Ba,gydF4y2Ba4gydF4y2Ba,gydF4y2Ba6gydF4y2Ba,gydF4y2Ba7gydF4y2Ba),验证使用MCP-counter评估MCP在其他群患者的预后价值。gydF4y2Ba

MCP-counter补充包含IHC方法,因为它允许10个细胞群的分析使用单一基因表达实验,从而使研究假设的快速生成比可以使用组织学证实和空间研究数据。我们特别是说明其使用单独分类肺腺癌、大肠癌、乳腺癌肿瘤microenvironment-defined子组。在这种背景下,我们能够确认三以前公布的预后影响microenvironment-based肿瘤分类。这些结果表明,MCP-counter可能使识别新multi-marker微环境层次。gydF4y2Ba

MCP-counter依赖TM已确定在一个包含癌症细胞系的基因表达谱数据集来自21个不同的解剖位置在其消极的控制,确保适用性广泛的样本。然而,这种大型控制样本的多样性可能丢弃TM将相关到一个特定的设置:例如,筛选过程废弃NCAM1 CD56、NK细胞的一种广泛使用的标志,也是神经恶性肿瘤细胞表达的,因此不适合量化NK细胞在大脑样本。的一般框架,因此我们可以根据识别额外的TM调查一组更受限制的器官。gydF4y2Ba

MCP-counter可以纳入临床常规免疫渗滤特征在样本IHC-based量化是不可能的,如细针穿刺活检。在这种背景下,样品通常收集一次。补充当前多试样使用MCP-counter,专为探索性分析,可以显著解决所需的基因表达平台,使用一套校准样品。例如,这里描述的体外RNA混合物可以帮助地图MCP-counter丰富分数专制单位,如相应的细胞在一个样本的百分比。然而,设定明确的调优可能被要求达到临床协议所需的可靠性。gydF4y2Ba

结论gydF4y2Ba

据我们所知,MCP-counter是第一个验证的健壮的量化计算方法,使大量的多种免疫和非免疫基质人群外围细胞转录组的异构正常或恶性组织等组织。它可能在临床相关,因为免疫生物标志物可以帮助预测患者的预后gydF4y2Ba3gydF4y2Ba)或反应疗法(gydF4y2Ba24gydF4y2Ba,尤其是免疫疗法(gydF4y2Ba25gydF4y2Ba]。回顾性和前瞻性应用研究炎症概要文件通过转录组应有助于解开和基质人群免疫的作用在癌症和其他疾病和破译这些种群之间的相互作用。gydF4y2Ba

方法gydF4y2Ba

基因表达谱数据集gydF4y2Ba

我们策划转录组配置文件从公共存储库的几种类型的样本(微环境细胞群(MCP), non-hematopoietic人类肿瘤,十几人的组织,在体外RNA混合物)和获得使用不同的基因表达平台(主要Affymetrix HGU 133 + 2.0, HGU 133 a, HuGene第1.0位,和Illumina公司HiSeq 2000)。生存分析、转录组的概要non-hematopoietic人类肿瘤与OS注释也被包括在内。表gydF4y2Ba1gydF4y2Ba列出了策划类型的样本,由基因表达平台分层,指向包含样品的标识符。gydF4y2Ba

表1策划类型的样品gydF4y2Ba

基因表达谱归一化gydF4y2Ba

Affymetrix人类基因组U133 + 2.0, 133年人类基因组,HuGene第1.0数组gydF4y2Ba

MCP数据集和肿瘤数据集从人类基因组Affymetrix U133 + 2.0, 133年人类基因组,和HuGene第1.0数组规范化使用冷冻健壮multiarray平均(fRMA)方法,实现fRMA R包(1.18.0版)。与RMA fRMA使用固定的探测特定效应和方差估计,允许一个一致的基因表达谱正常化(GEP)从不同的系列,提供他们获得在同一基因表达的平台。gydF4y2Ba

实施获得的人类基因组Affymetrix U133 + 2.0, 133年人类基因组,和HuGene 1.0阵列平台因此规范化使用的frma功能frma Bioconductor R包使用提供的预处理输入向量Bioconductor R包frmahgu133plus2frmavecs 1.3.0版本版本,frma133afrmavecs 1.3.0版本版本,和hugene.1.0.st。分别v1frmavecs 1.0.0版本。frma方法被称为批玻璃纸文件对应于个人系列。gydF4y2Ba

TCGA基因表达数据gydF4y2Ba

基因表达数据从非流动TCGA TCGA禁运项目获得数据门户(gydF4y2Bahttps://gdc-portal.nci.nih.gov/gydF4y2Ba)。只有实施使用Illumina公司2000年HiSeq检索获得。Already-normalized“三级”数据为每个项目单独下载。结果* .rsem.genes。normalized_results files were then merged into a single pan-cancer expression matrix.

其他基因表达平台gydF4y2Ba

GEP获得使用其他基因表达平台,我们使用预处理实施每项研究发表的数据,可以从相应的公共存储库。gydF4y2Ba

公开的示例注释gydF4y2Ba

MCP数据集:发现series-Affymetrix U133 + 2.0数组)gydF4y2Ba

样本注释根据author-reported表型,产生344种不同的标签(附加文件gydF4y2Ba1gydF4y2Ba:表S1)。我们记录这些标签分为63类,包括21个癌细胞表型免疫和基质标签(42)。gydF4y2Ba

MCP数据集:133验证series-Affymetrix和HuGene第1.0数组)gydF4y2Ba

样本注释根据63年标签用于注释发现微环境系列。前面定义的63个类别不符合一些样品和表现型动机的15类(附加文件gydF4y2Ba1gydF4y2Ba:表S4和S5)。这些新定义的类别细化一些最初的63标签。gydF4y2Ba

十几人体组织(GEO: GSE7307)gydF4y2Ba

样本注释从GEO检索:GSE7307。样本对应于病变组织、细胞系或排序的免疫细胞被丢弃,只保留十几,外围细胞异类样本。为了清晰起见,一些组织重新集结在更广泛的解剖位置(详细的额外文件gydF4y2Ba1gydF4y2Ba:表S14系列)。解剖系统手动添加。gydF4y2Ba

Non-hematopoietic肿瘤样本系列gydF4y2Ba

从三个肿瘤数据集,只有样品对应于原发性肿瘤从肿瘤切除术,没有获得新辅助治疗,没有使用激光捕获显微解剖保留进行分析(附加文件gydF4y2Ba1gydF4y2Ba:表S6、S7 S8 S9, S12)。gydF4y2Ba

注释为样本从地理和ArrayExpress检索从”系列矩阵”检索文件和“sdrf”文件,分别。注释TCGA的TCGA样本检索数据门户(gydF4y2Bahttps://gdc-portal.nci.nih.gov/gydF4y2Ba)。gydF4y2Ba

因为注释来自许多不同的团体,只有一个子集的变量为每个系列都保留。相应的值是和谐一致的本体。下面的列表包含最后一组样本的变量注释被保留:样品标识符;系列标识符;基因表达的平台;癌症类型;样本类型(解剖、活检、细胞培养、手术之后,激光捕获显微解剖,手术);总体生存事件和延迟(个月)gydF4y2Ba

Non-hematopoietic肿瘤样本系列(其他平台)gydF4y2Ba

只有样品标识符、肿瘤类型、样品状态和操作系统被保留。gydF4y2Ba

切除肿瘤样本重复gydF4y2Ba

一些肿瘤实施中存在多个公共数据集和正确地贴上“重新分析”。在这种情况下,只考虑到原样品进行分析。为了避免未指明的复制的创业计划,我们计算MD5校验和为所有未压缩的玻璃纸文件。和样品一模一样的MD5校验和被认为是重复的。在这种情况下,只有样品属于最古老的系列。注释出现在最近的样本实例和缺席老实例被添加到样本的注释。注释被保持最古老的注释解决冲突。这些冲突没有发生临床随访变量。gydF4y2Ba

选择TMgydF4y2Ba

组织样本的锥体图类别gydF4y2Ba

我们定义为一个金字塔有向无环图和一个根节点。微环境样品纯化细胞被标记根据他们的人口免疫或基质,导致63种不同的标签在MCP发现系列中,有一个额外的15 MCP验证系列标签,导致78标签。我们组织这些标签在一个金字塔形的图(附加文件gydF4y2Ba2gydF4y2Ba:图S1)和节点代表人口(类别)和定向边代表包容关系。例如,CD8的标签”gydF4y2Ba+gydF4y2BaCD4 T细胞”。gydF4y2Ba+gydF4y2BaT细胞”、“Tγδ细胞”、“”、“记忆T细胞激活T细胞”,和“幼稚T细胞”,所有的标签包括在他们(例如Effector-memory CD8 T细胞)形成“T细胞”类别,这本身是包含在“T / NK血统”的类别。这78个样本的标签,对应终端的叶子这金字塔(例如,“规范CD4 Treg细胞”),而另一些则对应于更高级别的节点(例如,外周血单核细胞(PBMC))。除了这些78标签,15造血作用或immunology-inspired类别,但不直接由样本相关的组织在一个结构化的金字塔(例如“淋巴细胞”)或作为一个潜在的细胞群(例如“antigen-experienced B细胞”)被添加(附加文件gydF4y2Ba1gydF4y2Ba:表向)。类别对应肿瘤样本被丢弃的TM的识别,只有作为消极的控制,可用于筛选导致68个类别。gydF4y2Ba

在定义这组78标签和68类(53个类别是直接由标签,有额外15类不能直接代表数据集),我们详尽编码标签和类别之间的关系用三种可能的关系(附加文件gydF4y2Ba1gydF4y2Ba:表向)。相对于一个类别,我们定义了三套样品:gydF4y2Ba

  • CgydF4y2Ba:“积极的样本”是那些标签包含在类别(所有细胞组成一个样本gydF4y2BaCgydF4y2Ba在类别)gydF4y2Ba

  • \(\眉题C {} \)gydF4y2Ba:“负样本”是那些标签是完全重叠的类别(所有细胞的样品gydF4y2Ba\(\眉题C {} \)gydF4y2Ba不是在类别)gydF4y2Ba

  • 1:“混合样本”是那些标签是部分重叠的类别(一些细胞样本gydF4y2BaCgydF4y2Ba和一些gydF4y2Ba\(\眉题C {} \)gydF4y2Ba)。gydF4y2Ba

例如,CD8gydF4y2Ba+gydF4y2BaT细胞,gydF4y2BaCgydF4y2Ba是一组样本的标签是“CD8 T细胞”或“效应CD8记忆T细胞”(额外的文件吗gydF4y2Ba2gydF4y2Ba:图S1;额外的文件gydF4y2Ba1gydF4y2Ba:表向),混合样品,例如,CD3gydF4y2Ba+gydF4y2BaT细胞CD4混合gydF4y2Ba+gydF4y2Ba和CD8gydF4y2Ba+gydF4y2BaT细胞,或混合CD8 PBMCgydF4y2Ba+gydF4y2BaT细胞,例如,单核细胞。gydF4y2Ba\(\眉题C {} \)gydF4y2Ba被定义为所有非容积非混血样本。gydF4y2Ba

注意代表的关系在附加的文件gydF4y2Ba2gydF4y2Ba:图S1只对应于“直接包含”的关系,这是传递(为清晰起见我们因此移除所有的箭头可以推断通过传递性)。因此,严格排除或混合关系并不代表但在筛选过程中考虑(附加文件中的相关信息是可用的gydF4y2Ba1gydF4y2Ba:表向)。gydF4y2Ba

为每个类别选择经颅磁刺激gydF4y2Ba

我们执行一个详尽的探索类金字塔屏幕存在的潜在TM在每个节点。对于一个给定节点的金字塔,附加的文件gydF4y2Ba1gydF4y2Ba:表向定义组阳性样本gydF4y2BaCgydF4y2Ba和消极的样品gydF4y2Ba\(\眉题C {} \)gydF4y2Ba(混合样本为该节点被丢弃)。常见的微分表达式测试(基于截止值的叠化的意义,例如,学生的学习任务)旨在调查两个样本是否来自两个连续分布具有相同的意思。TM的定义需要更严格的方法,我们不仅需要微分表达式,而且空表达的负样本。给定这两组样本,因此三合探针集合级别的统计是计算每个探针集:积极的AUC,褶皱的变化(FC),和一个特定的褶皱变化(证监会),后两个有以下定义:gydF4y2Ba

$ $ FC = X - \眉题{X} $ $gydF4y2Ba
$ $证监会= \离开(X - \眉题{X}敏\右)/ \离开(\眉题{X}马克斯- \眉题{X}敏\右)$ $gydF4y2Ba

我们由X形心(即表示。,一个verage across all samples) of categoryCgydF4y2Ba,gydF4y2Ba\(\眉题{\ mathrm {X}} \)gydF4y2Ba的重心gydF4y2Ba\(\眉题C {} \)gydF4y2Ba,gydF4y2Ba\({\眉题{\ mathrm {X}}} _ {\ mathrm {j}} \)gydF4y2Ba任何类j创作的重心gydF4y2Ba\(\眉题C {} \)gydF4y2Ba(j k = 1 . .)gydF4y2Ba\(\眉题{\ mathrm {X}} \)gydF4y2Ba最小值的最小值在质心类组成gydF4y2Ba\(\眉题C {} \)gydF4y2Ba(gydF4y2Ba\({\眉题{\ mathrm {X}}} _{\分钟}\)gydF4y2Ba=敏gydF4y2BajgydF4y2Ba∈gydF4y2Ba1 . . kgydF4y2Ba{gydF4y2Ba\({\眉题{\ mathrm {X}}} _ {\ mathrm {j}} \)gydF4y2Ba}),gydF4y2Ba\(\眉题{\ mathrm {X}} \)gydF4y2Ba马克斯的最大价值重心的类组成gydF4y2Ba\(\眉题C {} \)gydF4y2Ba(gydF4y2Ba\({\眉题{\ mathrm {X}}} _{马克斯}\ \)gydF4y2Ba=最大gydF4y2BajgydF4y2Ba∈gydF4y2Ba1 . . kgydF4y2Ba{gydF4y2Ba\({\眉题{\ mathrm {X}}} _ {\ mathrm {j}} \)gydF4y2Ba})。具体的FC占高表达gydF4y2BaCgydF4y2Ba相比gydF4y2Ba\(\眉题C {} \)gydF4y2Ba和低变异性gydF4y2Ba\(\眉题C {} \)gydF4y2Ba。gydF4y2Ba

对于每一个金字塔的非根节点,探针集AUC > 0.97, FC > 2,证监会> 1.5保留(附加文件gydF4y2Ba1gydF4y2Ba:表S3)。的选择(日志gydF4y2Ba2gydF4y2Ba任意设置为2)FC截止,瀑布上的一般选择短裤日志gydF4y2Ba2gydF4y2BaFC (gydF4y2Ba26gydF4y2Ba]。然后我们进行模拟通过2000“负面”据点从N (0, s)和100年“积极”据点从N(2),其中N(μs)指定的正态分布均值μs是中值标准差的探针集观察我们发现系列,这表明一个AUC截止0.97与25%的类型两个错误。香港证监会的截止值选择过滤后通过检查证监会的单变量分布值探针集FC > 2和AUC > 0.97,只选择一个截止保留的上平尾分布,以30%的探针集通过上述前两个标准下降这截止。gydF4y2Ba

选择TM集十的人口gydF4y2Ba

在一种公正的方式选择的TM金字塔的每一层,我们手动选择最相关的TM集,丢弃非常大类(如“基质细胞”,它将在一个肿瘤,指定所有良性细胞微环境),种类过少(< 30)阳性样品从高维数据可靠地识别健壮的标记,那些不适当的控制是在发现系列,和那些没有识别标记。gydF4y2Ba

减少TM集四种群gydF4y2Ba

四种群(中性粒细胞,内皮细胞、成纤维细胞和B谱系细胞),TM发现系列中标识的数量要高得多(> 90)比其它细胞群(< 25)。获得更平衡的标记集,我们做了相同的选择过程验证系列,获得TM集重叠与发现中标识系列(附加文件gydF4y2Ba1gydF4y2Ba:表S3)。减少标记的数量,我们因此带标记的十字路口穿过三个微环境系列(B血统,成纤维细胞),或发现和HuGene 1.0系列(内皮细胞),或发现和Affymetrix HGU 133系列(中性粒细胞)。值得注意的是,这个过滤步骤没有执行MCP验证的数据,数据系列(图使用。gydF4y2Ba2gydF4y2Ba;额外的文件gydF4y2Ba2gydF4y2Ba:数据S3、S4 S6)。gydF4y2Ba

计算MCP-counter分数gydF4y2Ba

给定一组转录组标记的一个给定的类别,我们计算一个相应的样品得分,叫以后gydF4y2BaMCP-counter得分gydF4y2Ba使用日志gydF4y2Ba2gydF4y2Ba几何平均数的这组标记。gydF4y2Ba

主成分分析的微环境样本gydF4y2Ba

对于每个MCP系列,我们保留样本特征明显属于造血血统(T或NK细胞,B细胞,单核细胞的谱系,粒细胞、内皮细胞、成纤维细胞)和癌症细胞系。探针集被过滤了,仅仅保留那些超过第95百分位数方差在每个系列。主成分分析是第一主要表现为每个系列和数据两个组件(解释最方差)显示(附加文件gydF4y2Ba2gydF4y2Ba:图S2;细胞谱系的颜色)。gydF4y2Ba

相关资料的TM micrenvironment和肿瘤数据集gydF4y2Ba

对于一个给定的经颅磁刺激,相应的特征子集的矩阵表达式三微环境系列和三个主要肿瘤系列(Affymetrix人类基因组U133 + 2.0, 133 a,和,TCGA)。在这六个矩阵,皮尔森相关系数是计算每一对特性(附加文件gydF4y2Ba2gydF4y2Ba:数字S5-S7)。gydF4y2Ba

这个分析是出于以下模型:一个转录组标记的定义是一个功能,表达一个且只有一个细胞群在一个均匀的水平。让(我)gydF4y2Ba年代gydF4y2Ba是一个组织样本组成的gydF4y2BangydF4y2Ba细胞数量与比例πgydF4y2Ba我gydF4y2Ba(我= 1 . . n), (2)gydF4y2BafgydF4y2Ba是一个功能和(iii)gydF4y2BafgydF4y2Ba年代gydF4y2Ba是其测量表达式在样品年代和(iv)gydF4y2BafgydF4y2Ba我gydF4y2Ba它的测量在一个细胞群表达我(我= 1 . . n)。假设之间的线性测量特性f的表达式和相应的有针对性的信使rna,我们有以下方程:gydF4y2Ba

$ $ {\ mathrm {f}} _ {\ mathrm{年代}}= {{\ displaystyle{\总和}_ {i = 1} ^ n \ mathrm {f}}} _ {\ mathrm{我}}。{\ uppi} _ {\ mathrm{我}}$ $gydF4y2Ba
(1)gydF4y2Ba

这个方程表明被测信号的外围细胞异种组织和proportion-weighted表达水平在每个人口。对于TM,因为gydF4y2BafgydF4y2Ba我gydF4y2Ba一个人口非空gydF4y2BakgydF4y2Ba,我们有:gydF4y2Ba

f f $ $ {} _ = {} _k。{\π}_k $ $gydF4y2Ba
(2)gydF4y2Ba

即。,the measured expression level is proportional to the proportion of the cell population with non-null expression for the TM.

如果gydF4y2BaggydF4y2Ba是另一个表达式的特性,是人口的转录组标记gydF4y2BakgydF4y2Ba我们也有:gydF4y2Ba

$ $ {g} _ = {g} _k。{\π}_k $ $gydF4y2Ba
(3)gydF4y2Ba

结合方程式。2和3,我们有:gydF4y2Ba

$ $ {\ uppi} _ {\ mathrm {k}} = \压裂{{\ mathrm {f}} _ {\ mathrm{年代}}}{{\ mathrm {f}} _k} = \压裂{{\ mathrm {g}} _} {{\ mathrm {g}} _k} $ $gydF4y2Ba
(4)gydF4y2Ba

如果我们现在有gydF4y2Ba米gydF4y2Ba转录组测量,Eq。4站在每个独立测量组织。我们因此,为每一个gydF4y2BajgydF4y2Ba1,…,m:gydF4y2Ba

$ $ {\ uppi} _ {\ mathrm {k} \ mathrm {j}} = \压裂{{\ mathrm {f}} _ {\ mathrm {}, \ mathrm {j}}} {{\ mathrm {f}} _k} = \压裂{{\ mathrm {g}} _{年代,j}} {{\ mathrm {g}} _k} $ $gydF4y2Ba
(5)gydF4y2Ba

在哪里gydF4y2Ba\({\π}_ {k, j} \)gydF4y2Ba细胞的人口比例吗gydF4y2BakgydF4y2Ba在示例gydF4y2BajgydF4y2Ba,gydF4y2BafgydF4y2Ba年代,jgydF4y2Ba表达水平的特性gydF4y2BafgydF4y2Ba在示例gydF4y2BajgydF4y2Ba,gydF4y2BaggydF4y2Ba年代,jgydF4y2Ba表达水平的特性gydF4y2BaggydF4y2Ba在示例gydF4y2BajgydF4y2Ba。重要的是,自gydF4y2BafgydF4y2BakgydF4y2Ba和gydF4y2BaggydF4y2BakgydF4y2Ba的表达水平gydF4y2BafgydF4y2Ba和gydF4y2BaggydF4y2Ba的细胞群gydF4y2BakgydF4y2Ba,他们是独立的样本gydF4y2BajgydF4y2Ba。gydF4y2Ba

方程5因此表明,对于每一个样本,gydF4y2BafgydF4y2Ba年代gydF4y2Ba=gydF4y2BaggydF4y2Ba年代gydF4y2Ba乘以常数gydF4y2BafgydF4y2BakgydF4y2Ba/ ggydF4y2BakgydF4y2Ba。我们表明,鉴于gydF4y2BafgydF4y2Ba和gydF4y2BaggydF4y2Ba是两个转录组标记为人口gydF4y2BakgydF4y2Ba,然后的表达gydF4y2BafgydF4y2Ba和gydF4y2BaggydF4y2Ba在一系列的转录组测量成正比。在一个完美的系统(不存在)非线性和噪声,因此我们预计1的相关系数两个TM具体的对于一个给定的细胞群。gydF4y2Ba

RNA混合模型gydF4y2Ba

外周血免疫细胞排序gydF4y2Ba

周围静脉血提取三个健康的捐赠者使用肝素vacuntainer管(BD生物科学)。外周血单核细胞(PBMC)或多形核的细胞(中性粒细胞)被孤立使用Ficoll-Paque +(通用电气医疗集团生命科学)或变形预科(Axis-Shield)密度梯度,分别。PBMCs是沾anti-CD3 FITC(克隆UCHT1) anti-CD14 APC (MΦP9) anti-CD19 ECD: (j3 - 119)和anti-CD56 PE (B159);中性粒细胞是沾anti-CD66b FITC (G10F5) anti-CD19 ECD: (j3 - 119), anti-CD3 PE (UCHT1) anti-CD56 PE (B159), anti-CD14 APC (MΦP9)。细胞分选是在流式细胞仪咏叹调血细胞计数器(BD生物科学)和细胞纯度高于97%总是实现。我们整理以下人群:T细胞(DAPIgydF4y2Ba−gydF4y2Ba/ CD3gydF4y2Ba+gydF4y2Ba/ CD14gydF4y2Ba−gydF4y2Ba/ CD19gydF4y2Ba−gydF4y2Ba/ CD56gydF4y2Ba−gydF4y2Ba)、单核细胞(DAPIgydF4y2Ba−gydF4y2Ba/ CD3gydF4y2Ba−gydF4y2Ba/ CD14gydF4y2Ba+gydF4y2Ba/ CD19gydF4y2Ba−gydF4y2Ba/ CD56gydF4y2Ba−gydF4y2Ba),B细胞(DAPIgydF4y2Ba−gydF4y2Ba/ CD3gydF4y2Ba−gydF4y2Ba/ CD14gydF4y2Ba−gydF4y2Ba/ CD19gydF4y2Ba+gydF4y2Ba/ CD56gydF4y2Ba−gydF4y2Ba)和NK细胞(DAPIgydF4y2Ba−gydF4y2Ba/ CD3gydF4y2Ba−gydF4y2Ba/ CD14gydF4y2Ba−gydF4y2Ba/ CD19gydF4y2Ba−gydF4y2Ba/ CD56gydF4y2Ba+gydF4y2BaPBMCs),中性粒细胞(DAPIgydF4y2Ba−gydF4y2Ba/ CD66bgydF4y2Ba+gydF4y2Ba/ CD19gydF4y2Ba−gydF4y2Ba/ CD3gydF4y2Ba−gydF4y2Ba/ CD56gydF4y2Ba−gydF4y2Ba/ CD14gydF4y2Ba−gydF4y2Ba在中性粒细胞)。gydF4y2Ba

细胞培养gydF4y2Ba

HCT116 CCD-18Co细胞线是从写明ATCC买来的,培养根据供应商的指令。主要人类脐静脉内皮细胞(HUVEC;第三段)被孤立如前所述gydF4y2Ba27gydF4y2Ba在M199培养基培养)和(Gibco,佩斯利,英国)与20%胎牛血清。gydF4y2Ba

RNA提取gydF4y2Ba

细胞细胞溶解在RLT(试剂盒)巯基乙醇-1%的缓冲和RNA是纯化麦克斯韦16 simplyRNA工具包(Promega)根据制造商的指示。遗传物质的质量和数量与2100年生物分析仪测定仪器(安捷伦科技)。gydF4y2Ba

混合物的RNA的解决方案gydF4y2Ba

一组四个双重的连续稀释进行排序的RNA提取每个整除外周血免疫细胞,产生解决方案减少浓度S0为每个细胞群S4。十个整除被用来混合这些解决方案使用两个调换拉丁方布局(表gydF4y2Ba2gydF4y2Ba)。gydF4y2Ba

表2 mRNA混合物实验布局gydF4y2Ba

相对应的卷10 ng HCT116结直肠癌细胞的溶液line-extracted信使rna被添加到混合3 - 12所示。两个额外的样品(混合1和2)的纯HCT116信使rna也包括在内。由此产生的浓度提供额外的文件gydF4y2Ba1gydF4y2Ba:S10表。gydF4y2Ba

qPCR的实验中,我们添加了从成纤维细胞信使rna, HUVEC这些以前生成的混合物以以下方式。gydF4y2Ba

mRNA的解决方案只有上述混合1到12,我们添加了一组四个双重的连续稀释培养的成纤维细胞和HUVEC的信使rna,收益率降低浓度的解决方案S0为每个细胞群(表S4gydF4y2Ba3gydF4y2Ba)。这两个细胞群,S0对应3 ng /μL mRNA。结果的比例可以在附加文件中gydF4y2Ba1gydF4y2Ba:S10表。gydF4y2Ba

表3 mRNA混合物扩展实验布局gydF4y2Ba

微阵列杂交gydF4y2Ba

生物素化的双链cDNA总RNA的目标是准备从10 ng使用NuGEN鼓掌Pico WTA系统V2工具包(目录编号3302)其次是NuGEN安可生物素模块套件(目录编号4200)根据制造商的建议。碎片和标签后,4.55μg cDNA杂化16 h在45°C, 60 rpm人类GeneChip人类基因组U133 + 2.0数组(Affymetrix)。芯片的清洗和彩色GeneChip流体站450 (Affymetrix)使用FS450_0004脚本和GeneChip扫描仪扫描3000 7 g (Affymetrix)μm 1.56的决议。(原始数据。CEL intensity files) were extracted from the scanned images using the Affymetrix GeneChip Command Console (AGCC) version 4.0.

定量聚合酶链反应gydF4y2Ba

与高容量cDNA逆转录PCR进行逆转录工具包(应用生物系统)。12基因的定量表达式分析确定在应用生物系统公司7900年ht快速实时PCR系统。基因的表达水平是决定使用周期(Ct)阈值标准化为beta-actin(ΔCt)。分析基因的列表显示在附加的文件gydF4y2Ba1gydF4y2Ba:表S15。gydF4y2Ba

相关性MCP-counter分数和已知的mRNA的比例gydF4y2Ba

MCP-counter分数计算从fRMA-normalized RNA-mixture微阵列数据集和绘制已知的mRNA log-proportions。皮尔森相关系数和相应的对t分布进行了测试。gydF4y2Ba

qPCR实验,MCP-counter跑使用基因符号作为标识符,“完整”TM集的交集为成纤维细胞和内皮细胞和基因化验,qPCR特性。gydF4y2Ba

估计检测的极限gydF4y2Ba

每个五分类的细胞群(NK细胞、B细胞、T细胞、单核细胞、嗜中性粒细胞),我们拟合的最小二乘线性回归模型与相应MCP-counter mRNA log-proportions分数称为预测变量使用十mRNA混合样本。gydF4y2Ba

non-hematopoietic样本的得分MCP-counter MCP发现系列计算。上述线性适合被用来预测五分类细胞群的mRNA分数从相应的MCP-counter分数。各地的指数的均值估计log-proportions non-hematopoietic样品报告的估计为每个人口免疫细胞化验检测极限。gydF4y2Ba

数据沉积gydF4y2Ba

的转录组数据12混合物样品一直是沉积在NCBI基因表达的综合和可通过地理系列加入GSE64385数量。gydF4y2Ba

线性模型相关的细胞毒性淋巴细胞MCP-counter分数NK细胞和T细胞丰度gydF4y2Ba

NK和CD3 + T细胞是两个种群中引入我们的信使rna混合物实验包含细胞毒性淋巴细胞对NK细胞(作为一个整体,通过他们的CD8 +子集CD3 + T细胞)。因此建立模型来评估是否可以解释观察到的细胞毒性淋巴细胞分数NK细胞和T细胞的比例在我们的混合样品。gydF4y2Ba

让gydF4y2BaCgydF4y2Ba,gydF4y2BaNKgydF4y2Ba,gydF4y2BaTgydF4y2Ba指定对应的信使rna数量细胞毒性淋巴细胞,NK细胞,分别和CD3 + T细胞。让gydF4y2BaC.MCPgydF4y2Ba指定的细胞毒性淋巴细胞MCP-counter得分。我们有下面的线性关系在mRNA水平:gydF4y2Ba

$ $ C = {} _ {NK} .NK + {} _T。T + b”, $ $gydF4y2Ba

在哪里gydF4y2Ba一个“gydF4y2BaNKgydF4y2Ba,gydF4y2Ba一个“gydF4y2BaTgydF4y2Ba和gydF4y2Bab”gydF4y2Ba是标量常数。gydF4y2Ba

CgydF4y2Ba不控制在我们的数据集。然而,在假设gydF4y2BaCgydF4y2Ba与细胞毒性淋巴细胞MCP-counter得分,因为mRNA数据日志gydF4y2Ba2gydF4y2Ba规模,我们有:gydF4y2Ba

$ $ C = C {2} ^ {。MCP} $ $ + b”gydF4y2Ba

结合这两个方程,我们有:gydF4y2Ba

$ $ {2}^ {C。MCP} = {} _ {NK}。NK +{一}_T。b T + $ $gydF4y2Ba

与gydF4y2BabgydF4y2Ba= (gydF4y2Bab”−b”gydF4y2Ba)/gydF4y2Ba一个gydF4y2Ba,gydF4y2Ba一个gydF4y2BaNKgydF4y2Ba=gydF4y2Ba一个“gydF4y2BaNKgydF4y2Ba/ gydF4y2Ba一个gydF4y2Ba,gydF4y2Ba一个gydF4y2BaTgydF4y2Ba=gydF4y2Ba一个“gydF4y2BaTgydF4y2Ba/ gydF4y2Ba一个gydF4y2Ba,这也是一个线性关系。我们因此测试使用二元线性模型在我们的数据集。gydF4y2Ba

IHC-based细胞密度估计gydF4y2Ba

串行5-μm formalin-fixed从大肠癌石蜡包埋组织切片染色使用autostainerPlus链接48 (Dako)。抗原上进行检索和deparaffinization PT-Link (Dako)使用FLEX设想目标检索解决方案(Dako)。额外的文件中列出使用的抗体gydF4y2Ba1gydF4y2Ba:表S16。过氧化物酶活性检测使用diaminobenzidine衬底(Dako)。幻灯片沾anti-CD3、anti-CD8A anti-CD68是数字化NanoZoomer扫描仪(滨松)。阳性细胞在肿瘤核心的密度是衡量使用Calopix软件(Tribvn、法国)。gydF4y2Ba

Affymetrix探针集映射到基因标识符和整个系列gydF4y2Ba

Affymetrix人类基因组U133 + 2.0, 133 a,和HuGene第1.0位数组,探针集映射到基因标识符使用注释提供了Affymetrix版本35。gydF4y2Ba

TCGA GEP与ENTREZ注释标识符的转换为使用Homo_sapiens雨果符号。gene_info (gydF4y2Baftp://ftp.ncbi.nih.gov/gene/DATA/GENE_INFO/Mammalia/Homo_sapiens.gene_info.gzgydF4y2Ba;检索2015年5月20日)。gydF4y2Ba

当评估选择过程的再现性微环境系列、功能之间的映射进行了如下。Probesets Affymetrix之间共享的人类基因组U133 + 2.0和133平台的映射,而其他人则被忽略了。HuGene第1.0和人类基因组U133 + 2.0 Affymetrix平台不共享任何探针,探针组两个平台映射到相同的基因符号是两个平台之间的映射。gydF4y2Ba

R MCP-counter方法的实现gydF4y2Ba

我们实现了MCP-counter R包称为“MCPcounter”。用户应该叫“MCPcounter.estimate”函数,它接受一个标准化的基因表达矩阵作为其第一个参数的类型和特性,应该映射到选择TM(探针集,雨果符号,ENTREZ ID)作为第二个参数。gydF4y2Ba

我们使用映射TM”调查规定》计算MCP-counter得分Affymetrix人类基因组U133 + 2.0和Affymetrix 133样品,和雨果符号标识符为样本获得Affymetrix HuGene第1.0,Illumina公司Hiseq和其他基因表达平台。gydF4y2Ba

这个包是可用Zenodo (https://doi.org/gydF4y2Ba10.5281 / zenodo.61372gydF4y2Ba)。gydF4y2Ba

模拟mRNA混合物(无花果。gydF4y2Ba4gydF4y2Ba)gydF4y2Ba

我们叫gydF4y2BadgydF4y2Ba线性范围(基因)×样本GEP矩阵,与样品相关的六个可能的表型,五个相应的免疫细胞的数量(T细胞,NK细胞,B细胞,单核细胞的谱系,中性粒细胞)和一个non-hematopoietic肿瘤细胞系。模拟是按照以下三步程序执行。gydF4y2Ba

步骤1gydF4y2Ba

对于每个这六个可能的表型,随机选择一个创业计划在微环境系列3对应的样品和我们叫gydF4y2Bad 'gydF4y2Ba矩阵gydF4y2BadgydF4y2Ba限于这六个样品(列)。gydF4y2Ba

步骤2gydF4y2Ba

从六个随机选择的样本gydF4y2Ba1gydF4y2BaS . .gydF4y2Ba6gydF4y2Ba(一个/表型)创建两个套虚拟创业计划,gydF4y2Ba年代gydF4y2Ba*gydF4y2Ba和gydF4y2Ba年代gydF4y2Ba”gydF4y2Ba,gydF4y2Ba定义为gydF4y2Ba年代gydF4y2Ba* =gydF4y2BadgydF4y2Ba”。gydF4y2BaWgydF4y2Ba+gydF4y2Baε和gydF4y2Ba年代gydF4y2Ba' =gydF4y2Ba日志gydF4y2Ba2gydF4y2Ba(gydF4y2BadgydF4y2Ba”。gydF4y2BaWgydF4y2Ba+gydF4y2BaεgydF4y2Ba)。ε对应于标准正态分布的随机噪声引起的每个基因表达特性模拟的混合物。gydF4y2BaWgydF4y2Ba是一个6×7×混合样本矩阵(表吗gydF4y2Ba4gydF4y2Ba)。gydF4y2Ba

表4细胞群的重量模拟混合物gydF4y2Ba

换句话说,六个随机选择的GEP与权重线性错综复杂gydF4y2BawgydF4y2Ba我gydF4y2Ba为每个5免疫人群和互补的重量1−5gydF4y2BawgydF4y2Ba我gydF4y2Ba肿瘤细胞群。对于每个方法,七种不同的模拟混合从而计算每组随机选择样本。gydF4y2Ba

第三步:运行CIBERSORT *和MCP-counter年代”gydF4y2Ba

五十模拟进行(导致350年估计为7的值gydF4y2BawgydF4y2Ba每使用模拟运行)。图gydF4y2Ba4gydF4y2Ba表示,对于每个细胞群,意味着MCP-counter成绩或CIBERSORT估计对于一个给定的值gydF4y2BawgydF4y2Ba在50个模拟。CIBERSORT,零估算non-introduced细胞的数量(例如,肥大细胞)被丢弃,剩下的估计可以总结为1。然后,估计是总结亚群(例如,“B细胞”CIBERSORT估计金额相对应的估计天真的B细胞,B存储单元,和浆细胞亚群)。gydF4y2Ba

MCP-counter TM集与其他方法的比较gydF4y2Ba

TM集Bindea提出et al。(“Immunome”TM)和俊井et al。(“估计”TM)从相应的出版和检索估计R包,分别。Immunome组,探针集被用作Affymetrix人类基因组U133 TM + 2.0和133系列微环境和基因符号HuGene 1.0系列微环境。估计,基因符号是用于所有三大系列。对于每个微环境的三个系列的,分数计算(“MCP-counter分数的计算”“方法”部分)从TM集提出,Immunome和估计。为每个组TM(列)和每个细胞群在无花果。gydF4y2Ba4 bgydF4y2Ba(行),平均分数为TM这个细胞人口计算。这个向量的平均分数,称为“Pred”(预测)向量,线性映射到一个颜色代码的最小值是蓝色的,红色的最大能量,最大和最小的意思是白色的。“真相”向量的颜色,由每个细胞群的状态,是附加到每个预测向量(红色,即。、积极,如果细胞群应该表达基因在TM集中;蓝色,即。,neg一个tive, if the cell population should not express genes in the TM set; and white if the cell population mixes both positive and negative cells). An accurate TM set should thus produce blue Truth is blue and red values when the Truth is red. White values of the Truth column are less informative as expression of the TM set would then depend both on the accuracy of the TM set and on the proportion of the corresponding cell population in the sample.

代表MCP-counter分数在癌症gydF4y2Ba

在三种肿瘤系列中,样本分割根据肿瘤类型在无花果。gydF4y2Ba4 bgydF4y2Ba。MCP-counter得分中值为计算每个在每个肿瘤细胞群类型,产生三个“中间矩阵”(一个技术平台)。自从MCP-counter分数表达任意单位,依赖于基因表达平台使用,我们这三个矩阵的每一列z变换(每一列的均值减去在每个平台和由此产生的价值乘以三个标准差的平均值为本专栏观察跨三个平台;额外的文件gydF4y2Ba2gydF4y2Ba:图S8)。结果平均三个矩阵(省略缺失值对于癌症缺少一个或两个数据集;无花果。gydF4y2Ba5 bgydF4y2Ba)。gydF4y2Ba

预后价值MCP-counter分数gydF4y2Ba

对于一个给定的癌症类型,多个数据集,有时基于不同平台,收集。MCP-counter估计第一次单独计算每个数据集。得到的分数然后z变换对于每一个单独的数据集,导致类似的跨数据集分布的分数。然后,单变量Cox比例风险模型分别为操作系统安装在每个数据集使用相关的z变换MCP-counter分数。聚合产生的估计在数据集(β值),我们使用了meta-analytical R包元(函数metagen),使用固定效应模型(如在每个系列遵循相同的分数分布)。这个函数权重的独立估计使用一个反变量权重。gydF4y2Ba

Microenvironment-based肿瘤分类gydF4y2Ba

MCP-counter估计第一次单独计算每个数据集。得到的分数然后z变换对于每一个单独的数据集,导致类似的跨数据集分布的分数。数据集来自同一癌症然后合并所有MCP-counter变量是使用中值减少的关键(导致“高”和“低”样本为每个变量和每个癌症的根据他们的相对位置的中值)。我们选择三个肿瘤分类的文献(使用B和T细胞在肺腺癌中,成纤维细胞和细胞毒性在结直肠癌淋巴细胞,巨噬细胞和细胞毒性淋巴细胞在乳腺癌)。对于这三个癌症,我们连接的关键分数感兴趣的两个变量,导致四类(高、高低、低,新低)。相应的策划,kaplan - meier曲线的操作系统gydF4y2BapgydF4y2Ba相应的生存率较报道的价值。gydF4y2Ba

缩写gydF4y2Ba

AUC:gydF4y2Ba

ROC曲线下的面积gydF4y2Ba

舰队指挥官:gydF4y2Ba

褶皱变化gydF4y2Ba

fRMA:gydF4y2Ba

冷冻健壮multiarray平均gydF4y2Ba

地理:gydF4y2Ba

基因表达综合gydF4y2Ba

HUVEC:gydF4y2Ba

人类脐静脉内皮细胞gydF4y2Ba

包含IHC:gydF4y2Ba

免疫组织化学gydF4y2Ba

MCP:gydF4y2Ba

微环境细胞群gydF4y2Ba

NK:gydF4y2Ba

自然杀伤细胞gydF4y2Ba

操作系统:gydF4y2Ba

总生存期gydF4y2Ba

PBMC:gydF4y2Ba

外周血单核细胞gydF4y2Ba

中性粒细胞:gydF4y2Ba

多形核的细胞gydF4y2Ba

qPCR:gydF4y2Ba

定量聚合酶链反应gydF4y2Ba

证监会:gydF4y2Ba

特定的褶皱变化gydF4y2Ba

TCGA:gydF4y2Ba

癌症基因组图谱gydF4y2Ba

TM:gydF4y2Ba

转录组标记gydF4y2Ba

引用gydF4y2Ba

  1. 白克E,吉拉尔多NA,日尔曼C, de Reynies, Laurent-Puig P, Zucman-Rossi J, Dieu-Nosjean M, Sautes-Fridman C,弗里德曼WH。免疫组织、immunoscore和恶性肿瘤细胞分子子组的预后和theranostic分类癌症。难以Immunol。2016; 130:95 - 190。gydF4y2Ba

    文章gydF4y2BaPubMedgydF4y2Ba谷歌学术搜索gydF4y2Ba

  2. 页面F,伯杰,加缪M, Sanchez-Cabo F,成本,Molidor R, Mlecnik B, Kirilovsky,尼尔森M, Damotte D, Meatchi T, Bruneval P, Cugnenc P, Trajanoski Z,弗里德曼W, Galon j .效应记忆T细胞早期转移,在结肠直肠癌和生存。郑传经地中海J。2005; 353:2654 - 66。gydF4y2Ba

    文章gydF4y2BaPubMedgydF4y2Ba谷歌学术搜索gydF4y2Ba

  3. Galon J,成本,Sanchez-Cabo F, Kirilovsky, Mlecnik B, Lagorce-Pages C, Tosolini M,加缪M,伯杰,风P, Zinzindohoue F, Bruneval P, Cugnenc P, Trajanoski Z,弗里德曼W,页面F类型、密度和位置的免疫细胞在人结直肠肿瘤预测临床结果。科学。2006;313:1960-4。gydF4y2Ba

    文章gydF4y2Ba中科院gydF4y2BaPubMedgydF4y2Ba谷歌学术搜索gydF4y2Ba

  4. 弗里德曼WH,页面F, Sautes-Fridman C, Galon j .免疫组织在人类肿瘤:对临床结果的影响。Nat癌症。2012年,牧师12:298 - 306。gydF4y2Ba

    文章gydF4y2Ba中科院gydF4y2BaPubMedgydF4y2Ba谷歌学术搜索gydF4y2Ba

  5. 吉拉尔多NA,白克E, F页面,Skliris G, Verkarre V, Vano Y, Mejean, Saint-Aubert N, L Lacroix, Natario我,卢波,Alifano M, Damotte D, caz, Triebel F,弗里曼GJ, Dieu-Nosjean M, Oudard年代,弗里德曼WH, Sautes-Fridman编排和预后意义的免疫微环境的检查点小学和转移性肾细胞癌。癌症研究杂志2015;21:3031-40。gydF4y2Ba

    文章gydF4y2Ba中科院gydF4y2BaPubMedgydF4y2Ba谷歌学术搜索gydF4y2Ba

  6. Isella C, Terrasi Bellomo SE, Petti C, Galatola G, Muratore, Mellano, Senetta R, Cassenti, Sonetto C, Inghirami G, Trusolino L, Fekete Z,德里德M, Cassoni P, Storme G, Bertotti,医生大肠基质对结直肠癌转录组的贡献。Nat麝猫。2015;47:312-9。gydF4y2Ba

    文章gydF4y2Ba中科院gydF4y2BaPubMedgydF4y2Ba谷歌学术搜索gydF4y2Ba

  7. Calon, Lonardo E, Berenguer-Llergo Espinet E, Hernando-Momblona X,伊格莱西亚斯M, Sevillano M, Palomo-Ponce年代,Tauriello DVF, Byrom补充道:D,丝膜C, Morral C, Barcelo C为例,里埃拉,Attolini CS, Rossell D,桑丘E,巴特列大肠基质基因表达定义在结直肠癌预后不良亚型。Nat麝猫。2015;47:320-9。gydF4y2Ba

    文章gydF4y2Ba中科院gydF4y2BaPubMedgydF4y2Ba谷歌学术搜索gydF4y2Ba

  8. Shen-Orr党卫军,Gaujoux r .计算反褶积:从异类样本提取细胞特定类型信息。当今Immunol 2013; 25:571-8。gydF4y2Ba

    文章gydF4y2Ba中科院gydF4y2BaPubMedgydF4y2Ba谷歌学术搜索gydF4y2Ba

  9. 纽曼,刘CL,格林先生,抚慰着AJ,冯W,徐Y,黄平君CD, Diehn M, Alizadeh AA。健壮的枚举的细胞组织表达谱的子集。Nat方法。2015;12:453-7。gydF4y2Ba

    文章gydF4y2Ba中科院gydF4y2BaPubMedgydF4y2Ba公共医学中心gydF4y2Ba谷歌学术搜索gydF4y2Ba

  10. 龚T, Szustakowski JD。DeconRNASeq:反褶积的统计框架基于mRNA-Seq异构组织样本数据。生物信息学。2013;29:1083-5。gydF4y2Ba

    文章gydF4y2Ba中科院gydF4y2BaPubMedgydF4y2Ba谷歌学术搜索gydF4y2Ba

  11. Bindea G, Mlecnik B, Tosolini M, Kirilovsky,瓦尔德内尔,Obenauf AC,天使H, Fredriksen T,拉方丹则L,伯杰,Bruneval P,弗里德曼WH,贝克尔C,页面F, Speicher先生,Trajanoski Z, Galon j .时空动态显示瘤内免疫细胞免疫景观在人类癌症。免疫力。2013;39:782 - 95。gydF4y2Ba

    文章gydF4y2Ba中科院gydF4y2BaPubMedgydF4y2Ba谷歌学术搜索gydF4y2Ba

  12. 吉原俊井认为K, Shahmoradgoli M,马丁内斯E, Vegesna R,金正日H, Torres-Garcia W, Trevino V,沈H, Laird PW,莱文哒,卡特SL,斯坦利·G, Stemke-Hale K,米尔斯GB, Verhaak RGW。推断肿瘤纯洁和基质和免疫细胞外加剂表达数据。Nat Commun。2013; 4:2612。gydF4y2Ba

    文章gydF4y2BaPubMedgydF4y2Ba公共医学中心gydF4y2Ba谷歌学术搜索gydF4y2Ba

  13. 考尔MN, Bolstad BM,伊RA。冷冻健壮multiarray分析(fRMA)。生物统计学。2010;11:242-53。gydF4y2Ba

    文章gydF4y2BaPubMedgydF4y2Ba公共医学中心gydF4y2Ba谷歌学术搜索gydF4y2Ba

  14. Lukk M, Kapushesky M, Nikkila J,帕金森H, Goncalves, Huber W, Ukkonen E, A Brazma全球人类基因表达的地图。生物科技Nat》。2010; 28:322-4。gydF4y2Ba

    文章gydF4y2Ba中科院gydF4y2BaPubMedgydF4y2Ba公共医学中心gydF4y2Ba谷歌学术搜索gydF4y2Ba

  15. Fehrmann工匠们,·德容HJM Ter Elst,德弗里斯,Crijns AGP, Weidenaar AC, Gerbens F,德容,van der Zee AGJ,加以定位,完成de Vries坎普斯佤邦,霍夫斯特拉RMW, Te Meerman GJ,德邦ESJM。转录监管系统提供一个新的视角(TSR):对TSR剖析。《公共科学图书馆•综合》。2008;3:e1656。gydF4y2Ba

    文章gydF4y2BaPubMedgydF4y2Ba公共医学中心gydF4y2Ba谷歌学术搜索gydF4y2Ba

  16. 日尔曼C, Gnjatic年代,Tamzalit F, Knockaert年代,备注R,作为J, Lepelley,白克E, Katsahian年代,Bizouard G, Validire P, Damotte D, Alifano M, Magdeleinat P,克莱莫我Teillaud J,弗里德曼W, Sautes-Fridman C, Dieu-Nosjean M .存在三级淋巴B细胞的结构与肺癌患者的保护性免疫。是J和保健医学。2014;189:832-44。gydF4y2Ba

    文章gydF4y2Ba中科院gydF4y2BaPubMedgydF4y2Ba谷歌学术搜索gydF4y2Ba

  17. 作为J,日尔曼C, Vo-Bourgais跆拳道,卢波,克莱因C, Knockaert年代,de Chaisemartin L, Ouakrim H,白克E, Alifano M, Validire P,备注R,哈蒙德SA克莱莫我Damotte D,弗里德曼W, Sautes-Fridman C, Dieu-Nosjean M .树突细胞肿瘤相关三级淋巴结构信号Th1细胞毒性免疫组织和许可证的积极的预后价值渗透CD8 + T细胞。实用癌症杂志2014;74:705-15。gydF4y2Ba

    文章gydF4y2Ba中科院gydF4y2BaPubMedgydF4y2Ba谷歌学术搜索gydF4y2Ba

  18. DeNardo DG,布伦南DJ, Rexhepaj E, Ruffell B, Shiao SL,马登科幻,加拉格尔WM, Wadhwani N,凯尔SD, Junaid SA Rugo HS,黄,Jirstrom K,西提单,Coussens LM。白细胞复杂性预测乳腺癌生存和功能调节化疗反应。癌症。2011;1分54秒- 67。gydF4y2Ba

    文章gydF4y2Ba中科院gydF4y2BaPubMedgydF4y2Ba公共医学中心gydF4y2Ba谷歌学术搜索gydF4y2Ba

  19. Venet D, F Pecasse Maenhaut C, Bersini h .分离样品到他们的选民使用基因表达数据。生物信息学。2001;17增刊1:s279 - 87。gydF4y2Ba

    文章gydF4y2BaPubMedgydF4y2Ba谷歌学术搜索gydF4y2Ba

  20. 李,李T, Pignon J,王B,王J,舒克拉SA窦R, Q,陈Hodi FS, Choueiri TK,吴C, Hacohen N, Signoretti年代,刘JS,刘XS。肿瘤浸润的T细胞的人类癌症。Nat麝猫。2016;48:725-32。gydF4y2Ba

    文章gydF4y2Ba中科院gydF4y2BaPubMedgydF4y2Ba谷歌学术搜索gydF4y2Ba

  21. Iglesia MD,帕克JS、Hoadley KA Serody JS, Perou厘米,文森特BG。基因组分析免疫细胞浸润在11肿瘤类型。中华肿瘤杂志。2016;108年。gydF4y2Ba

  22. 棕色的SD,雷伯恩洛杉矶,霍尔特RA。剖析tissue-resident T细胞RNA序列的体验。基因组医学。2015;7:125。gydF4y2Ba

    文章gydF4y2Ba中科院gydF4y2BaPubMedgydF4y2Ba公共医学中心gydF4y2Ba谷歌学术搜索gydF4y2Ba

  23. 西姆斯D, Sudbery我Ilott NE Heger (A,桥CP测序深度和范围:基因组分析的关键因素。Nat牧师麝猫。2014;15:121-32。gydF4y2Ba

    文章gydF4y2Ba中科院gydF4y2BaPubMedgydF4y2Ba谷歌学术搜索gydF4y2Ba

  24. 安德烈F, Dieci MV, Dubsky P Sotiriou C, Curigliano G, Denkert C, s法则分子途径:免疫途径参与乳腺癌的治疗反应和结果。癌症研究杂志2013;19:28-33。gydF4y2Ba

    文章gydF4y2Ba中科院gydF4y2BaPubMedgydF4y2Ba谷歌学术搜索gydF4y2Ba

  25. Taube JM,克莱恩,Brahmer JR,徐H,潘X, Kim JH陈L, Pardoll DM, Topalian SL,安德斯RA。PD-1协会PD-1配体和其他特性的肿瘤免疫微环境与应对anti-PD-1疗法。癌症研究杂志2014;20:5064 - 74。gydF4y2Ba

    文章gydF4y2Ba中科院gydF4y2BaPubMedgydF4y2Ba公共医学中心gydF4y2Ba谷歌学术搜索gydF4y2Ba

  26. 段陶曼先生,避蚊胺,Nimishakavi G, z褶皱变化和假定值显著改变微阵列所规定的解释。BMC Bioinf。2012; 13增刊2:S11。gydF4y2Ba

    文章gydF4y2Ba谷歌学术搜索gydF4y2Ba

  27. Jaffe EA Nachman RL、贝克尔CG Minick CR。人类来自脐静脉内皮细胞的文化。形态学鉴定和免疫标准。中国投资。1973;52:2745-56。gydF4y2Ba

    文章gydF4y2Ba中科院gydF4y2BaPubMedgydF4y2Ba公共医学中心gydF4y2Ba谷歌学术搜索gydF4y2Ba

下载参考gydF4y2Ba

确认gydF4y2Ba

我们希望承认团队的成员10日13日和15的Cordeliers研究中心,该中心d 'Imagerie Cellulaire et de Cytometrie Cordeliers研究中心的“中金”形式和“Plateforme Biopuces et Sequencage”IGBMC的各自的技术和科学知识。基因表达的努力综合、ArrayExpress肿瘤的表达项目,以及国际基因研究团,所有的团队分享他们的创业计划结果极大地承认。这项工作涉及到法国国家计划的支持必须d 'Identite des Tumeurs®(CIT)资助和联赛开发的国家靠le癌症。我们感谢朱利安Calderaro建议和洞察力的评论。gydF4y2Ba

资金gydF4y2Ba

这项工作是支持的“国家卫生研究所et de la医学”,巴黎第五大学,皮埃尔和玛丽居里大学杜国家癌症研究所(2011 - 1 - plbio - 06 - inserm 6 - 1), CARPEM(个性化医学癌症研究),Labex Immuno-Oncology(弗里德曼LAXE62_9UMS872)基金会弧倒说是关于癌症的Canceropole巴黎,杜国家癌症研究所(2011 - 1 - plbio - 06 - inserm 6 - 1, plbio09 - 088 idf -获得),安第斯大学医学院(唠叨)Colciencias(唠叨)。EB支持CARPEM博士后奖学金和唠叨PPATH博士奖学金。gydF4y2Ba

可用性的数据和材料gydF4y2Ba

三个微环境实施系列已经存入第三方重新分析下地理GSE86370加入代码。GSE64385 mRNA混合物沉积在加入代码。gydF4y2Ba

MCP-counter包用于这项工作已经沉积在http://dx.doi.org/gydF4y2Ba10.5281 / zenodo.61372gydF4y2Ba源代码是免费的gydF4y2Bahttp://github.com/ebecht/MCPcountergydF4y2Ba。GNU通用公共许可证下的软件许可v3。gydF4y2Ba

作者的贡献gydF4y2Ba

EB, AdR, C科幻,P LP和码头设计研究,解释数据,写的手稿。EB,唠叨,BB,我,不,FP, JS生成的数据。AdR和码头监督这项研究。所有作者阅读和批准最终的手稿。gydF4y2Ba

相互竞争的利益gydF4y2Ba

作者宣称没有利益冲突。gydF4y2Ba

伦理批准和同意参与gydF4y2Ba

不适用。gydF4y2Ba

作者信息gydF4y2Ba

作者和联系gydF4y2Ba

作者gydF4y2Ba

相应的作者gydF4y2Ba

对应到gydF4y2BaAurelien de ReyniesgydF4y2Ba。gydF4y2Ba

额外的信息gydF4y2Ba

本文将可用的勘误表gydF4y2Bahttp://dx.doi.org/10.1186/s13059 - 016 - 1113 - ygydF4y2Ba。gydF4y2Ba

附加文件gydF4y2Ba

额外的文件1:表S1。gydF4y2Ba

微环境细胞群(MCP)的数据集。发现系列。Affymetrix人类基因组U133 + 2.0。gydF4y2Ba表S2。gydF4y2Ba选中的转录组标记及其在MCP表达数据集。gydF4y2Ba足球俱乐部gydF4y2Ba褶皱的变化,gydF4y2BaaucgydF4y2BaROC曲线下的面积,gydF4y2BaFcspecgydF4y2Ba特定的褶皱变化(参见“gydF4y2Ba方法gydF4y2Ba”)。gydF4y2Ba133年p2gydF4y2Ba是发现MCP系列;gydF4y2Ba133年,一个gydF4y2Ba和gydF4y2BaHG1gydF4y2Ba验证MCP系列。gydF4y2BaRestricted.TM.setgydF4y2Ba显示相应的探针集是否只有在完整的一套标记(gydF4y2Ba没有gydF4y2Ba),或者如果它是包含在完成和限制集(gydF4y2Ba是的gydF4y2Ba)(见gydF4y2Ba方法gydF4y2Ba)。gydF4y2Ba表S3。gydF4y2Ba结果发现和验证筛选过程的系列。对于每个非根节点(类别)代表在附加文件中gydF4y2Ba2gydF4y2Ba:图S1或行中列出的附加文件gydF4y2Ba1gydF4y2Ba:向表,应用筛选过程中所描述的“gydF4y2Ba结果gydF4y2Ba”和“gydF4y2Ba方法gydF4y2Ba”的章节中,我们报告的数量标记标识在每个系列,不同的数据集的数量为该节点包含积极的样品,和积极的样本的数量。标记被这个过程之间的重叠或双人三胞胎MCP系列的报告和相应的确切概率法gydF4y2BapgydF4y2Ba价值。gydF4y2Ba表S4。gydF4y2Ba微环境细胞数量数据集。验证系列1。Affymetrix 133 a。gydF4y2Ba表S5。gydF4y2Ba微环境细胞数量数据集。验证系列2。Affymetrix HuGene圣1.0。gydF4y2Ba表S6。gydF4y2BaNon-hematopoietic人类肿瘤数据集。创业计划的数量每表达平台和肿瘤类型列出,以及样品数量为总生存期(OS)注释。gydF4y2Ba表S7。gydF4y2BaNon-hematopoietic人类原发性肿瘤数据集1。Affymetrix人类基因组U133 + 2.0。gydF4y2Ba表S8。gydF4y2BaNon-hematopoietic人类原发性肿瘤数据集2。Affymetrix 133gydF4y2Ba。表S9gydF4y2BaNon-hematopoietic人类原发性肿瘤数据集3。TCGA, Illumina公司HiSeqgydF4y2Ba。表S10gydF4y2Ba信使核糖核酸纯化细胞群:混合比例(微阵列数据集)。gydF4y2Ba表S11。gydF4y2Ba信使核糖核酸纯化细胞群:混合比例(qPCR数据集)。gydF4y2Ba表S12。gydF4y2BaNon-hematopoietic人类原发性肿瘤meta-dataset 4。其他基因表达平台,样品与OS注释。gydF4y2Ba表向。gydF4y2BaMCP样品标签和类别之间的关系表现在附加的文件gydF4y2Ba2gydF4y2Ba:图S11。MCP样品标签列线和类别。指定“1”积极的标签和标签的显示包含类别(这意味着所有样本中包含的细胞群的一类);“0”指定负面的标签和标签的指示严格分离的类别(这意味着没有细胞类型的样本类别);−1指定排除标签(用于“混合样品”)和显示污染样本的类别(这意味着一些细胞组成样本的类别外,有些类别)。gydF4y2Ba表S14系列。gydF4y2BaAuthor-reported组织类型,记录组织类型和解剖系统十几人类组织样本(数据集GSE7307)。gydF4y2Ba表S15。gydF4y2BaTaqMan探针用于qPCR列表分析。gydF4y2Ba表S16。gydF4y2Ba抗体,用于免疫组织化学分析实验条件。(XLSX 1568 kb)gydF4y2Ba

额外的文件2:图S1。gydF4y2Ba

Hierachization样本记录的表型。样品标签出现在发现或验证系列都是图上的代表,以及手动编码更高级别的类别。gydF4y2Ba箭头gydF4y2Ba表示“包括”的关系。第二种类型的关系,(见“混合样品gydF4y2Ba方法gydF4y2Ba”这里不代表使用和定义),但在附加文件中有详细描述gydF4y2Ba1gydF4y2Ba:表向。各种器官的癌症细胞系聚合在一个标签在这个图简单。gydF4y2Ba图S2。gydF4y2Ba之间的一致性MCP样本分层与无监督数据表示。跨三个MCP MCP样本的主成分分析的数据集基于标准差的功能排在前5%。样品颜色的根据他们的表型。gydF4y2Ba图S3。gydF4y2Ba再现性之间的转录组标记表达模式发现和验证系列。转录组标记表达四分位数在外周血单核细胞(PBMC), CD3gydF4y2Ba+gydF4y2BaT细胞CD4gydF4y2Ba+gydF4y2BaCD8 T细胞,gydF4y2Ba+gydF4y2BaT细胞、NK细胞Tγδ细胞,B细胞,pDC(血浆树突细胞)、粒细胞,中性粒细胞,嗜酸性粒细胞,单核细胞,巨噬细胞,骨髓树突状细胞(mDC),肥大细胞、内皮细胞、成纤维细胞和癌症细胞系在MCP发现系列和MCP验证系列。gydF4y2Ba图S4。gydF4y2BaAUC为每个MCP-counter分数MCP发现和验证系列。这里使用的TM集是“完整”集,不使用任何信息从验证系列。gydF4y2Ba图S5。gydF4y2Ba在MCP样品黑色基因的表达模式。gydF4y2Ba图S6。gydF4y2BaCoexpression相同转录组标记特定的细胞群的三个MCP的数据集。热点图关联矩阵的表示。这里使用的TM集是“完整”集,不使用任何信息从验证系列。gydF4y2Ba图S7。gydF4y2BaCoexpression相同转录组标记特定的肿瘤细胞群的三个数据集。热图TM相关矩阵的表示。TM被命令使用层次聚类与完整的链接和皮尔森的“距离”。gydF4y2Ba图S8。gydF4y2Ba恶性肿瘤内coexpression模式的再现性。热图TM相关矩阵的表示在每一个恶性肿瘤。附加文件中的颜色比例是一样的gydF4y2Ba2gydF4y2Ba:图S6以及功能的顺序。gydF4y2Ba图S9。gydF4y2Ba总结了TM集微环境系列的分布。箱线图显示分数分布的计算与TM集Bindea et al。(gydF4y2Ba左gydF4y2Ba)和MCP-counter完成TM集(gydF4y2Ba正确的gydF4y2Ba)在三个MCP系列。对于每一组TM,箱线图是彩色的gydF4y2Ba红色的gydF4y2Ba“积极”样本,gydF4y2Ba蓝色的gydF4y2Ba“消极”的样品,和灰色的“混合”样本。gydF4y2Ba图S10。gydF4y2Ba再现性的恶性肿瘤是人类肿瘤meta-datasets丰度估计在三个主要的。在恶性组织MCP-counter得分手段。为每个平台、列z变换。gydF4y2Ba深红色gydF4y2Ba表示最高和gydF4y2Ba深蓝色gydF4y2Baz得分最低。一个gydF4y2Ba灰线gydF4y2Ba显示相应的恶性肿瘤并不代表在元数据集。(PPTX 9607 kb)gydF4y2Ba

权利和权限gydF4y2Ba

开放获取gydF4y2Ba本文是分布式根据创作共用署名4.0国际许可证(gydF4y2Bahttp://creativecommons.org/licenses/by/4.0/gydF4y2Ba),允许无限制的使用、分配和复制在任何媒介,你提供给适当的信贷原始作者(年代)和来源,提供一个链接到Creative Commons许可,并指出如果变化。知识共享公共领域奉献豁免(gydF4y2Bahttp://creativecommons.org/publicdomain/zero/1.0/gydF4y2Ba)适用于数据可用在这篇文章中,除非另有说明。gydF4y2Ba

再版和权限gydF4y2Ba

关于这篇文章gydF4y2Ba

验证通过CrossMark货币和真实性gydF4y2Ba

引用这篇文章gydF4y2Ba

白克,E。,Giraldo, N.A., Lacroix, L.et al。gydF4y2Ba估计人口大量tissue-infiltrating免疫和基质细胞的人口使用基因表达。gydF4y2Ba基因组医学杂志gydF4y2Ba17gydF4y2Ba218 (2016)。https://doi.org/10.1186/s13059 - 016 - 1070 - 5gydF4y2Ba

下载引用gydF4y2Ba

  • 收到了gydF4y2Ba:gydF4y2Ba

  • 接受gydF4y2Ba:gydF4y2Ba

  • 发表gydF4y2Ba:gydF4y2Ba

  • DOIgydF4y2Ba:gydF4y2Bahttps://doi.org/10.1186/s13059 - 016 - 1070 - 5gydF4y2Ba

关键字gydF4y2Ba

  • 转录组标记gydF4y2Ba
  • 基因签名gydF4y2Ba
  • 反褶积gydF4y2Ba
  • 肿瘤微环境gydF4y2Ba