条文本

原文
综合基因组元分析确定肿瘤内基质是胃癌患者生存的预测因子
免费的
  1. Yonghui吴1
  2. Heike Grabsch2
  3. 塔蒂阿娜伊万诺娃1
  4. Iain Beehuat Tan3.
  5. 杰西塔莫里2
  6. 贾休依4
  7. 亚历山大·伊恩·赖特2
  8. 尼古拉斯·P·韦斯特2
  9. 戈登·A·哈钦斯2
  10. 珍妮吴1
  11. 结果表明李1
  12. 朱利安李1
  13. 辜俊浩1
  14. 杨嘉观5
  15. 妮可·范·格里肯6
  16. Bauke Ylstra6
  17. 孙英Rha7
  18. 贾弗·阿贾尼8
  19. 郑在浩9
  20. 成勋卢9
  21. 林家汉10
  22. 亚历克斯Boussioutas1112
  23. Ju-Seog李13
  24. 帕特里克·谭41415
  1. 1细胞与分子研究,新加坡国家癌症中心
  2. 2病理学与肿瘤生物学,利兹大学分子医学研究所,英国
  3. 3.新加坡国家癌症中心肿瘤内科
  4. 4癌症和干细胞生物学,杜克-新加坡国立大学研究生医学院,新加坡
  5. 5新加坡国立大学永洛林医学院医学系
  6. 6荷兰阿姆斯特丹自由大学医学中心病理科
  7. 7韩国延世大学癌症中心内科
  8. 8美国MD安德森癌症中心胃肠内科肿瘤科
  9. 9韩国延世大学医学院外科
  10. 10新加坡总医院病理科,新加坡
  11. 11癌症基因组学和生物化学实验室,彼得麦卡勒姆癌症中心,东墨尔本,维多利亚,澳大利亚
  12. 12澳大利亚维多利亚州Footscray,墨尔本大学西部医院医学系(RMH/WH)
  13. 13美国MD安德森癌症中心癌症医学部系统生物学
  14. 14新加坡癌症科学研究所,新加坡国立大学永洛林医学院
  15. 15新加坡基因组研究所,新加坡
  1. 对应到Patrick Tan博士,癌症和干细胞生物学副教授,杜克-新加坡国立大学研究生医学院,新加坡学院路8号,169857;gmstanp在{}duke-nus.edu.sg

摘要

客观的胃腺癌(胃癌,GC)是全球癌症死亡的主要原因。识别有助于GC患者生存的分子程序可能会提高我们对GC发病机制的理解,突出新的预后因素并揭示新的治疗靶点。作者旨在对原发GCs中表达的基因表达程序进行全面的盘点,并确定那些与患者生存显著相关的表达程序。

设计使用网络建模方法,作者对来自多个独立患者队列的940个胃转录组数据进行了大规模的GC转录组数据荟萃分析。作者分析了由428个GCs和163个非恶性胃样本组成的训练集,以及由288个GCs和61个非恶性胃样本组成的验证集。

结果作者确定了原发GCs中表达的178个基因表达程序(“模块”),这些基因表达程序与不同的生物学过程、染色体定位模式、独联体-调节母题和临床病理参数。在多个GC验证队列中,转化生长因子β (TGF-β)信号通路相关基质相关基因“超级模块”的表达一致预测患者生存。通过胃切除标本组织切片形态学测定,肿瘤内间质比例也与间质超模块表达和胃癌患者生存显著相关。

结论在多个独立的队列中,基质基因表达预测胃癌患者的生存,并可能与肿瘤内基质比例密切相关,这是一种特定的形态学胃癌表型。这些发现表明针对GC间质的治疗方法可能值得评估。

  • 胃癌
  • 基因表达
  • 预后因素
  • 食道癌
  • 分子病理学
  • 致癌作用
  • 胃腺癌
  • 结肠直肠癌
  • 图像分析
  • 幽门螺杆菌胃炎
  • 巴雷特的化生
  • 巴雷特的癌
  • 结直肠癌筛查
  • 胃前
  • 肝癌

数据来自Altmetric.com

请求的权限

如果您希望重用本文的任何或全部内容,请使用下面的链接,该链接将带您到版权清除中心的RightsLink服务。您将能够快速获得价格和即时许可,以多种不同的方式重用内容。

本研究的意义

关于这个问题我们已经知道了什么?

  • 原发癌症的基因表达谱可以提供实体肿瘤中癌细胞和其他细胞群表达的生物途径的“快照”。

  • 确定与患者生存相关的基因表达程序可以提高我们预测临床预后的能力,发现调节疾病进展的特定分子过程,并突出治疗干预的新途径。

新的发现是什么?

  • 这项研究报告了迄今为止对胃癌转录组的最大分析,提供了胃癌中存在的表达程序(“模块”)的全面清单。

  • 在原发性胃癌中表达的178个模块中,基质相关基因的转化生长因子β (TGF-β)相关模块的表达在多个数据集中一致地预测了患者的生存。

  • 原发性胃癌组织病理学分析显示,间质模块表达与瘤内间质(ITS)比例相关。

  • 直接组织病理学测量ITS比例可预测胃癌患者的生存。

在可预见的未来,它会对临床实践产生怎样的影响?

  • 在常规组织病理学评估中量化ITS在胃癌中的比例,可以作为个体肿瘤间质基因表达水平的替代标记。

  • 靶向肿瘤间质相关通路的治疗,如TGF-β信号通路,值得在胃癌中考虑。

简介

胃腺癌(胃癌,GC)是全球癌症死亡的主要原因。12目前GC患者的治疗基于临床参数,如年龄、表现状态和肿瘤、淋巴结、转移(TNM)分期,3.它们被共同用来决定病人是否应该只接受手术治疗,手术加化疗/放化疗还是只接受化疗。其中,TNM分期是临床医生用来预测GC患者预后的主要工具。然而,具有相同TNM分期的GC患者往往表现出不同的临床结果4提示存在影响GC疾病侵袭性的其他因素。之前的研究试图确定其他GC预后因素,研究了各种临床、组织学(形态亚型、分化等级)和分子因素,包括Ki67表达(细胞增殖的标志),p53突变状态,DNA倍性和人表皮生长因子受体2 (HER2)表达。5 - 9然而,对于大多数这些因素,特别是在多个独立患者队列中进行测试时,并没有一致地观察到明确的预后作用。到目前为止,GC的预后研究主要集中在GC细胞中发生的畸变。然而,与所有实体肿瘤一样,GCs是高度复杂的实体,由肿瘤上皮细胞、血管、成纤维细胞、免疫细胞和细胞外基质组成。与癌细胞相比,对于这些其他成分对GC患者预后的潜在贡献,我们知之甚少。10 - 13

基因表达谱是一种强大的技术,可以为肿瘤中存在的不同基因表达程序提供无偏倚和整体的“分子快照”。14虽然包含这些表达程序的一些基因仅由癌细胞表达,但肿瘤内的其他细胞类型也可能有助于基因表达谱。在这里,我们假设对大量GC转录组的详细分析将提供与GC相关的不同表达程序的全面清单,然后可以测试其与患者预后的相关性。分析来自不同患者群体的940个胃癌和非恶性胃组织的基因表达数据,我们发现在多个胃癌队列中,由基质相关基因组成的“基质模块”的表达与转化生长因子β (TGF-β)信号转导和患者生存有关。在胃癌组织切片中,我们进一步发现胃癌间质(肿瘤间质,ITS)的比例也预测了患者的生存。据我们所知,这是第一个证明胃癌患者间质基因表达和ITS比例对预后有影响的研究。我们的结果强调了ITS比例作为一种预测生物标志物的潜在作用,以确定可能对肿瘤基质定向治疗有反应的GCs患者亚组。此外,由于我们的分子分析表明GC间质模块与TGF-β信号通路相关,针对TGF-β通路的分子治疗可能值得在GC患者中进行评估。

方法

胃癌数据集

发现数据集

GC共表达网络使用9个独立的GC表达微阵列数据集(补充表1)生成,包括591个胃样本(428个GC和163个非恶性样本(正常胃粘膜、慢性胃炎、萎缩性胃炎伴肠化生)。163个非恶性胃样本中有109个与GC样本相匹配,而其余54个非恶性胃样本来自患有胃癌的个体的胃活检幽门螺杆菌无癌症的胃炎患者,被纳入一项随机安慰剂对照试验H幽门治疗。15数据集来自国家生物技术信息中心(NCBI)的基因表达Omnibus (http://www.ncbi.nlm.nih.gov/geo/),或来自合作者(SG-2, LS-1和AMS)。其中几个数据集之前已经发表过。15 - 20本研究没有使用来自发现数据集的详细临床信息,除了对AMS队列(34个GCs)进行了分析,为生存分析提供了额外的动力。

验证数据集(转录组)

使用三个GC数据集(SG-3, AU-2和YGC)进行验证分析,包括288个GC和61个非恶性胃样本。这些样本在发现阶段没有使用。所有61个非恶性验证样本均与GC相匹配。7例患者接受新辅助治疗(1例患者,SG-3队列;6例患者,AU-2队列)。临床特征在表1.在患者同意的情况下,从参与中心的组织库或病理档案中收集初级gc,并根据当地法规和立法获得各自机构研究伦理审查委员会的批准。经机构审查委员会批准收集临床信息。这些验证数据集的基因表达数据已保存在基因表达Omnibus登录号GSE15459 (SG-3)、GSE35809 (AU-2)和GSE13861 (YGC)下。21

表1

验证数据集的临床特征

验证数据集(组织芯片(TMA))

另外还分析了GC - TMA数据集(LS-2)。tma是由1970年至1991年间在英国利兹总医院外科学术部接受D2根治性切除的163例GC患者组成的独立组构建的。在排除技术故障和术后30天内死亡患者的数据(术后死亡率)后,有131例患者的结果可供分析。术后中位随访时间5.5年,从0.11年到20.6年不等。49名(37.4%)患者在研究结束时死于癌症。LS-2 TMA数据集的临床特征见在线补充表2。

补充方法提供了GC网络构建的细节,网络模块的功能注释,模块的映射和个体样本的致癌途径,临床病理和生存分析,以及计算机点计数ITS的定量。

结果

网络分析发现GC中存在多个保守的基因表达模块

我们建立了591个胃组织样本的发现系列(428个癌症样本和163个匹配的非肿瘤样本),这些样本来自9个独立的GC转录组数据集,代表了来自不同国家的各种胃癌患者群体,包括胃癌发病率低和高的国家(在线补充表1)。我们使用这些发现数据集构建了GC基因共表达网络。首先,我们建立了一个在所有9个数据集中普遍存在的基因核心网络,其中包括在gc和非恶性胃样本中表现出一致和稳健表达相关性的基因(见方法,图1一个).其次,为了增加网络中的基因数量,我们将网络结构扩展到8,7,6个数据集的所有可能组合。该网络构建方法产生了最终的GC共表达网络,由14965个相互作用连接的3177个基因组成(错误发现率(FDR) <0.001,补充表3,图1一个).

Gastric cancer (GC) coexpression network construction and annotation. (A) Network construction. (left to right) Core network exhibiting conserved coexpression correlations across 9 GC datasets (9C9). Genes are nodes (pink) and edges are coexpression correlations (blue). The core network was expanded by adding nodes and edges across all possible combinations of 8, 7 and 6 GC datasets (9C8, 9C7, 9C6). Light pink nodes represent pre-existing nodes already present in the prior network, while dark pink nodes represent new genes. Light blue lines represent pre-existing edges from the prior network, while dark blue lines represent new edges. All genes and edges are associated with a false discovery rate <0.001. (B) Functional annotations of modules. (blue-white heat map) Gene composition overlap between the 178 modules. Darker blue regions represent modules with significant gene overlap. The white-blue scale bar indicates p values for the module overlap (hypergeometric test). (Surrounding four red matrices) Module mapping against the Molecular Signatures Database (MSigDB); cytogenetic location (top), pathway signatures (right), cis-regulatory binding sites (bottom) and gene ontologies (left). Darker red areas represent significant module associations (minimum overlap number of genes = 5). The white-red scale bar indicates the p values for the module association. The multicoloured vertical colour bar to the right of the white-blue heat map represents groups of modules exhibiting significant overlap in gene content (super-modules, see colour code at bottom right). Arrows indicate representative cis-regulatory motifs (E2F, IRF1) and chromosomal bands (6p21). E2F- and IRF1-binding motifs are shown using standard position-weight matrix terminology.
" data-icon-position="" data-hide-link-title="0">图1
图1

胃癌共表达网络的构建与注释。(一)网络建设。(从左至右)显示9个GC数据集的保守共表达相关性的核心网络(9C9).基因是节点(粉红色),边缘是共表达相关性(蓝色)。通过在8,7和6个GC数据集的所有可能组合中添加节点和边来扩展核心网络(9C89C79C6).浅粉色节点表示先前网络中已经存在的已有节点,而深粉色节点表示新的基因。浅蓝色线表示来自先前网络的预先存在的边缘,而深蓝色线表示新的边缘。所有基因和边缘都与错误发现率<0.001相关。(B)模块功能标注。(蓝白热图)178个模块之间的基因组成重叠。深蓝色区域代表基因重叠显著的模块。白-蓝比例条表示模块重叠的p值(超几何测试)。(周围四个红色矩阵)分子特征数据库(MSigDB)模块映射;细胞遗传学位置(上),通路特征(右),独联体-调控结合位点(下)和基因本体(左)。较深的红色区域表示显著的模块关联(基因最小重叠数= 5)。白-红色比例条表示模块关联的p值。白-蓝热图右侧的多色垂直色条表示在基因内容上表现出显著重叠的模块组(超级模块,见右下角的颜色代码)。箭头表示代表性独联体-调控基序(E2F, IRF1)和染色体带(6p21)。使用标准的位置权重矩阵术语显示E2F-和irf1 -结合基序。

为了将网络划分为有意义的和生物学上相关的亚单位,我们在共表达网络中定义了“模块”,定义为相对于组外基因表现出高度内部共表达的基因组。使用前面描述的模块构造算法,22我们在网络中鉴定了178个共表达模块,每个共表达模块由10-200个基因组成(补充图1,补充文献1;补充表4给出了一个有代表性的模块)。为了支持GC网络的生物学相关性,在多个层次上进行网络拓扑分析,例如,在(1)整个共表达网络中的所有个体基因之间,(2)所有模块之间和(3)特定模块中的基因之间,发现所识别的网络都表现出一种“无标度”结构,大多数基因充当“边缘”,某些基因充当“枢纽”(补充图2和补充表5;参见讨论)。这些发现与之前的研究一致,即生物网络通常是无标度的。23

由于共表达基因通常在相同的途径中发挥作用或共享相关的生物学功能,24通过将共表达网络中的178个模块的基因内容与分子特征数据库(MSigDB)进行比较,我们开始系统地注释共表达网络中的178个模块独联体-规管结合位点(图1 b).178个模块中,共有148个(83%)模块在显著性阈值水平上成功映射到至少一个MSigDB数据集(p<0.001,最小重叠>5个基因),而30个模块缺乏MSigDB分配,可能是新的。几个模块共享类似的MSigDB注释,这增加了这些模块可能参与共同生物程序的可能性。我们称这些高阶关联为“超级模块”,并在共表达网络中确定了七个不同的超级模块。一个超级模块包含32个模块,涉及细胞周期和增殖的各个方面。25第二个超级模块被称为“基质超级模块”,包含23个与细胞外基质生物学和基质细胞相关的模块。共表达网络中剩余的超级模块与免疫反应、消化功能、线粒体、核糖体和蛋白酶体功能相关(参见《免疫应答》中的颜色图例)图1 b).补充文档1提供了178个模块的所有成员基因,补充文档2提供了178个模块及其MSigDB赋值的综合表。

确定个别验证样本中的模块表达水平

为了比较单个GCs之间不同模块的表达水平,我们使用了先前发表的算法(GENOMICA,见Methods and Segal, 2004年26),将178个表达模块映射到上述网络构建中未使用的三个独立GC数据集上(新加坡数据集:SG-3, 153个GC和38个匹配的非恶性胃样本;澳大利亚数据集:AU-2, 70个gc和9个非恶性样本;韩国数据集:YGC, 65个GCs和14个匹配的非恶性样本)。表1提供这些数据集的临床病理特征。为了最大限度地提高统计能力,我们将这些数据集中的所有样本(SG-3、AU-2和YGC)合并,得到349个样本(288个gc和61个非恶性胃样本)的联合验证系列。

将表达模块映射到这个组合验证系列,证实了这些模块在单个gc中存在差异表达(图2一个).我们注意到了模块之间有趣的关系。例如,细胞增殖模块高表达的GCs倾向于共表达与消化功能相关的模块,而基质模块高表达的GCs则表现为细胞增殖模块低表达和消化功能相关模块低表达。GCs的一个子集显示与蛋白体功能相关的模块的高表达(见讨论)。

" data-icon-position="" data-hide-link-title="0">图2
图2

模块的表达模式与不同的临床病理特征和致癌途径相关。(A)下方的红绿热图代表了经层次聚类排序的组合验证系列SG-3/AU-2/YGC数据集(349个样本)中模块表达的不同模式。红色表示高度表示的模块,而绿色表示低级别表示的模块。热图上方的彩色条代表临床病理特征(年龄、性别、Laurén分类、分化等级、TNM分期、胃癌或非恶性胃组织)(右上方的彩色图例)。(B)与模块和超级模块相关的致癌途径。数据来源于349个联合验证系列中的288个胃癌:SG-3 (n=153), AU-2 (n=70)和YGC (n=65)。(左)E2F通路激活与细胞周期超模块表达显著相关(相关系数r=0.533, p<0.001)。y轴表示E2F通路激活水平,x轴表示细胞周期超模块表达水平。每个数据点代表一个独立的验证样本。(右)肿瘤坏死因子(TNF)通路激活与免疫应答超模块表达相关(相关系数r=0.510, p<0.001)。 The y axis represents levels of TNF pathway activation, while the x axis represents levels of immune response super-module expression.

GC表达模块与不同的临床病理特征相关

我们使用联合验证系列来探索这些模块的表达是否与临床病理特征相关,包括年龄、性别、疾病分期、组织病理亚型和分化等级(图2一个和补充表6)。联合验证系列的结果在下面的段落和补充表6中给出,而单个数据集的分析结果可以在补充图3和补充表7中找到。对于这些分析和所有后续分析,p值进行了多假设检验校正,校正后的p值<0.05被认为是显著的。

诊断年龄

65岁以下患者的GCs表现出更高的基质和免疫反应超模块表达(基质:p<1.00×10−323;免疫反应:p=6.69×10−3),而65岁以上患者的GCs表现出更高的细胞周期(p=1.47×10−7),线粒体(p=4.99×10−3)和核糖体(p=0.028)超模块表达。

性别

男性患者的GCs与较高的细胞周期相关(p<1.00×10−323)和蛋白酶体(p=9.1×10−4)的超模块表达,而女性患者的GCs与更高的间质超模块表达相关(p<1.00×10−323).

疾病阶段(UICC(国际癌症控制联盟)/AJCC(美国癌症联合委员会)第6版)

早期(I期和II期)GCs与较高的细胞周期相关(p=4.32×10)−9),线粒体(p=7.68×10−9),核糖体(p=5.87×10−3)和蛋白酶体(p=0.035)超模块表达,而晚期(III期和IV期)GCs与更高的间质超模块表达相关(p<1.00 ×10−323).

组织病理学亚型

肠型GCs表现出较高的细胞周期(p<1.00 ×10−323),蛋白酶体(p=4.95×10−14),消化功能(p=6.97×10−13),线粒体(p=3.0×10−3)和免疫反应超模块表达(p=3.45×10−3),而弥散型GCs与较高的气孔超模块表达相关(p<1.00×10−323).

分化等级

分化良好和中等程度的低级别GCs表现出较高的细胞周期(p<1.00×10)−323)、消化功能(p<1.00×10−323),线粒体(p=2.93×0−9)和蛋白酶体(p=5.49×10−7)超模块表达,而低分化和未分化的高级别GCs与更高的间质相关(p<1.00×10)−323)和免疫反应(p=1.08×10−5)超模块表达式。我们还考虑了目前世卫组织的指导方针,即仅应在肠道型gc中进行分级。27当我们的分析仅限于肠型GCs时,低级别GCs表现出较高的消化功能(p=5.10×10)−7)和线粒体(p=0.002)超模块表达,而高水平的GCs与较高的免疫应答相关(p=1.20×10−15)和基质(p=0.027)超模块表达。

当分别分析三个独立的验证数据集(SG-3、AU-2和YGC)时,也观察到这些关系中的绝大多数(69个中的61个)存在类似的趋势,这支持了上述关联的稳健性。与349个样本集的组合相比,在单个组中只有8种关系呈现相反的趋势,并且这8种关系中只有1种关系显著(Laurén分类和YGC队列中的细胞周期模块表达,p值<0.05,补充表7)。

GC表达模块与不同的致癌途径相关

除了研究与临床病理特征的关联,我们还试图将178个模块的表达与已知在恶性肿瘤中被激活或解除调控的分子信号通路联系起来。使用先前描述的通路映射方法,我们绘制了特定的基因表达签名(“通路签名”),代表了先前涉及胃癌发生的21种致癌和肿瘤抑制通路(p53、EGFR、TGF-β、STAT3、VEGF、CEBP、AKT、BRCA1、HER2、SRC、E2F、TNF、WNT、NF-kB、PI3K、PPARG、p63、RAS、CD31和HSP90)28 - 30)到组合验证系列。然后,我们确定了特定的GC模块,其表达与通路特征的表达显著相关(在线补充表8和9)。

E2F是细胞周期基因的转录调节因子。31我们发现表达高水平E2F通路激活的gc也表达32种不同的细胞周期相关模块(r= 0.533, p < 0.001;图2 b,左面板)。支持E2F作为这些模块的转录调节因子,对这些细胞周期相关模块的基因启动子分析显示,它们在E2F结合基序中显著富集(p=2.41×10)−7图3一).

图3

致癌途径和模块表达。(A)超级模块中的转录因子结合基序。网络图描绘了细胞周期和免疫超级模块。蓝色和红色点表示较大的超级模块中的不同模块。E2F共识结合位点在细胞周期超级模块基因中显著富集(p=2.41×10)−7),而IRF1共识结合位点在免疫超模块基因中显著富集(p=2.72×10−5).显示了E2F1-和irf1 -结合基序的位置权重矩阵描述。(B) 288个GCs中TGF-β通路与基质超模块表达的相关性(相关系数r=0.708, p<1.0×10−323).y轴表示TGF-β通路激活水平,x轴表示间质超模块表达水平。每个点描述一个独立的样本。(C)基质超级模块中血清反应因子转录因子结合基序的富集(p=2.31×10−16).网络图中的绿色、粉色和红色点表示超级模块中的不同模块。

显示高水平肿瘤坏死因子(TNF)和核因子kappa -活化B细胞轻链增强子(NF-kB)通路激活的GCs也表达与免疫功能相关的多个模块(r=0.510, p<0.001;图2 b,右侧面板)。来自免疫模块的基因启动子分析显示,它们的特征是NF-kB靶基因的富集(p=1.51×10)−6,超几何检验)和干扰素调节因子1 (IRF1)结合基序的基因(p=2.72×10−5图3一).IRF1被描述为TNF和NF-kB信号转导的主要下游靶点。32

基质超级模块的表达与TGF-β通路激活水平的升高有关(r=0.708, p<1.0×10)−323图3 b此外,TGF-β配体TGF-β3和TGF-β1的表达,以及TGF-β受体TGF-β r1、TGF-β r2和TGF-β r3的表达在间质超模块高表达的GCs中始终较高(p值均<0.001;在线补充表10)。基质超模块基因的启动子分析显示,它们在具有血清反应因子结合基序的基因中显著富集(p=2.31×10)−16图3 c),一种已知由TGF-β信号激活的转录因子。到三十五这些结果表明,TGF-β信号通路可能调控胃癌基质超模块的表达。

与临床病理特征相似,当分别分析三个独立的验证数据集(SG-3、AU-2和YGC)时,在联合验证系列中观察到的表达模块和癌基因通路之间的关联在很大程度上得到了保留(在线补充表9)。

GCs中间质超级模块的表达预测总生存率

通过研究不同的表达模块,我们发现胃癌中基质超模块的表达水平与患者生存率之间存在显著关系。具体而言,在联合验证数据集中,将基质超模块表达作为模型中的连续变量的单变量Cox回归分析显示,基质超模块表达水平高的GCs与较差的总生存率显著相关(p=0.025;人力资源1.007, 95% CI 1.001 - 1.013;表2).Kaplan-Meier生存分析也观察到类似的结果,比较1/3的间质超模块高表达患者和1/3的间质超模块低表达患者(p=0.004, log-rank检验;图4).在分析个体数据集时,还观察到间质超模块高表达的GCs患者的不良生存趋势(p=0.043 (SG-3);p = 0.045 (YGC);p = 0.23 (AU-2);进一步支持患者生存率与基质超模块表达之间的关联,在第四个数据集中也观察到患者生存率的显著关系(AMS, n=34;比较顶部和底部的分位数),这是在共表达数据的初始构建中使用的,其临床结果数据是可用的(p=0.018;在线补充图5)。

表2

在联合验证系列中对基质超模块表达和临床病理特征进行单因素和多因素Cox回归分析

图4

基质超模块表达预测来自联合验证数据集的癌症和弥散型胃癌(GC)患者的生存率。(A)基质超级模块的表达式预测了联合验证数据集中所有GC患者的生存率。根据间质超模块表达水平,将所有GC患者分为高间质组(上1/3)、中间质组(中1/3)和低间质组(下1/3)。采用Kaplan-Meier分析比较高间质(上1/3)或低间质(下1/3)胃癌患者自手术时起的总生存概率。间质超模块表达水平高的胃癌患者预后较差(p=0.004, log-rank检验)。(B)间质超模块表达水平预测弥漫性胃癌患者的生存。118例弥漫型胃癌患者(结合SG-3/AU-2/YGC数据)根据间质超模块表达水平被分为三个大小相等的组:高间质(上1/3)、中等间质(中1/3)和低间质(下1/3)。Kaplan-Meier生存分析显示,弥漫性GC和高水平间质超模块表达(上1/3,n=40)患者的生存较弥漫性GC和低水平间质超模块表达(下1/3,n=40)患者的生存差(p=0.015, log-rank检验)。

为了比较基质超模块表达与当前患者预后预测临床病理金标准的预后意义,我们进行了多因素Cox回归分析,纳入基质超模块表达(连续变量)、年龄(<65岁vs≥65岁)、性别、切缘状态(R0 vs R1)、形态(肠型vs扩散型vs混合型、根据TNM分类(UICC/AJCC第6版)区分分化程度(好、中、差)和病理肿瘤分期。在联合验证系列中,间质超模块表达的预后价值与疾病分期有关(p=0.12, HR: 1.005, 95% CI 0.999 ~ 1.012;表2).一项阶段调整分析显示,间质超模块表达与生存之间的关联主要在III期和IV期(即晚期)疾病中观察到(III期和IV期p=0.024, I期和II期p=0.668;在线补充表11)。局限于III期GC患者的Kaplan-Meier生存分析显示,高水平间质超模块表达的GC患者与低水平间质超模块表达的GC患者预后较差(p=0.039;在线补充图6)。

除存活外,间质超级模块的高表达与弥漫性形态显著相关(p<1.00×10)−323;在线补充表6),一种传统上与临床预后不良相关的组织学亚型。3637在联合验证集中对弥散型GCs的亚组分析中,我们发现弥散型和高间质超模块表达的GCs患者与弥散型和低间质超模块表达的GCs患者相比,生存率明显较差(p=0.015;图4 b).这一结果表明,通过测量间质超模块表达,可以揭示组织学分类之外的额外信息,支持最近描述弥散型GC不同亚型的报道。38

为了使用非阵列技术验证我们的结果,我们在GC全切片上对两种蛋白vimentin (VIM)和caldesmon (CALDESM)进行了免疫组化,它们的mRNA表达与基质超模块表达高度相关(参见选择标准方法)。在LS-1数据集中,VIM蛋白表达与基质超模块表达呈相关性(r=0.34, p=0.08)。同样,CALDESM蛋白表达与基质超模块表达呈显著正相关(r=0.22, p=0.26;我们认为IHC结果与基质超模块表达之间只有趋势而无显著相关性并不奇怪,因为前者是基于单个生物标志物(如VIM或CALDESM蛋白)的测量,而后者是基于878个基因的协调表达水平,这可能更稳健。

间质超模块表达与瘤内间质比例相关

我们假设GC间质超模块表达水平可能与常规苏木精和伊红(H&E)染色GC切片中观察到的特定组织病理学特征相关。为了探索这种可能性,我们分析了两个GC数据集,代表我们能够获得足够质量的组织学分析的完整H&E切片的病例,以及相应的基因表达数据。这些包括(1)156个gc,包括119个SG-3 gc,以及随后在本研究过程中招募的另外37个gc(“扩展的SG-3”)和(2)LS-1数据集中的所有29个gc。基因组和组织学分析证实,GCs在各个GCs中表现出高度可变的间质超模块表达(图5一个LS-1)。从每个病例中选择具有代表性的h&e染色切片,并使用Aperio扫描仪进行扫描。为了量化癌症内不同成分的比例(例如,癌细胞,间质,包括成纤维细胞和细胞外基质,肿瘤腔,坏死,血管,炎症细胞),我们使用了计算机化形态测量法(点计数,见在线补充方法),以前应用于结肠癌39由韦贝尔正式描述。40所研究的GCs在肿瘤细胞密度、肿瘤间质、血管和免疫细胞浸润方面表现出不同的组织病理学表型(图5B和C).在扩充的SG-3和LS-1数据集中,我们检测到间质超级模块的表达与瘤内间质形态量化比例之间存在显著正相关(SG-3: ITS中位数:60%,范围:15-99%,相关系数r=0.327, p=3.14×10)−5图5 d;LS-1: 29个GCs, ITS中位数:47%,范围:3-88%;相关系数r=0.426, p=0.021;在线补充图8)。在校正了分期、年龄、性别、Laurén分类和分级后,间质超模块表达与ITS比例之间的相关性仍然显著(扩展SG-3: p=0.002;LS-1: p = 0.024;偏相关分析41).这一结果提示间质超级模块在GCs中的表达水平可能与ITS在h&e染色组织切片中测量的比例直接相关。

Association of intra-tumoural stroma (ITS) proportion with stromal super-module expression and patient survival. (A) Stromal super-module expression of gastric cancers (GCs) in the LS-1 dataset (n=29). Columns represent individual GCs, rows represent individual stromal modules. Red, high stromal super-module expression, green, low stromal super-module expression. The orange arrows at the extreme left and right represent GCs selected for figure 5B and C. (B) and (C) Representative H&E-stained sections of GCs (top panel) illustrating prominent differences in ITS between a GC with high stromal super-module expression (B) and a GC with low stromal super-module expression (C). Consecutive sections from the same blocks subjected to cytokeratin (CK) immunohistochemistry to facilitate visualisation of GC tumour cells (brown). The intra-tumoural stroma was CK negative (blue due to the haematoxylin counterstain). (D) Association of stromal super-module expression with the ITS proportion in the expanded SG-3 dataset. The y axis represents the normalised ITS proportion measured by morphometry (see Methods). The x axis represents the expression level of the stromal super-module. Each point represents an individual GC. A significant positive correlation was observed (correlation coefficient r=0.327, p=3.14×10−5). (E) 131 GCs from LS-2 were divided into three equal-sized groups based on the levels of ITS, for example GCs with high, moderate or low ITS proportion. Kaplan–Meier analysis demonstrates that patients with GCs exhibiting a high ITS proportion (blue line) have poorer cancer-specific survival compared to patients with low ITS proportion GCs (green line, p=0.006, log-rank test).
" data-icon-position="" data-hide-link-title="0">图5
图5

肿瘤间质(ITS)比例与间质超模块表达和患者生存的关系。(A) LS-1数据集中胃癌(GCs)的基质超模块表达(n=29)。列表示单个gc,行表示单个间质模块。红色,高间质超模块表达,绿色,低间质超模块表达。最左和最右的橙色箭头表示图5B和C中选择的GC (B)和(C)代表性的GC的h&e染色切片(上面板),显示了高基质超模块表达的GC (B)和低基质超模块表达的GC (C)之间ITS的显著差异。来自同一块的连续切片接受细胞角蛋白(CK)免疫组化处理,以方便GC肿瘤细胞的可视化(棕色)。肿瘤间质CK阴性(因苏木素复染而呈蓝色)。(D)在扩展的SG-3数据集中,间质超模块表达与ITS比例的关联。y轴表示用形态测量法测量的归一化ITS比例(见方法)。x轴表示基质超模块的表达水平。每个点代表一个单独的GC。 A significant positive correlation was observed (correlation coefficient r=0.327, p=3.14×10−5).(E) 131个LS-2的GCs根据ITS水平分为3个大小相等的组,如ITS比例高、中、低的GCs。Kaplan-Meier分析表明,与ITS比例低的GCs患者相比,ITS比例高的GCs患者的癌症特异性生存率较差(绿线,p=0.006, log-rank检验)。

为了进一步研究基质超模块表达与ITS比例的关系,我们测试了直接从h&e染色的组织样本中测量的ITS比例是否可以预测GC患者的生存。应用同样的计算机点计数方法,我们分析了另一个131例GC患者的独立系列,从中构建了TMA (LS-2,见方法,在线补充表2提供了TMA队列的临床病理特征)。弥漫性GC比肠型GC ITS比例高(ITS弥漫性GC中位数:64%,范围:17-95%;ITS肠型GC中位数:47%,范围:11-92%;p = 0.005;学生t检验),晚期GCs比早期GCs (ITS晚期GCs中位数:62%,范围:11-95%;ITS早期GCs中位数:47%,范围:13-92%;p=0.01),在高级别GCs中高于低级别GCs (ITS中位高级别GCs: 57%,范围:13-95%;ITS低等级gc中位数:47%,范围:11-82%;p = 0.007)。 Similar to the genomic results, a Kaplan-Meier survival analysis comparing the one third of patients with high ITS GCs with one third of patients with low ITS GCs revealed that patients with high ITS GC had a significantly poorer prognosis (p=0.006, log-rank test;图5 e).ITS高弥散型GCs也有生存恶化的趋势(p=0.29, log-rank检验)。然而,在多因素分析中,包括ITS比例(连续变量)、年龄(<65岁vs≥65岁)、性别(男性vs女性)、形态(肠型vs弥散型vs混合型)、分化程度(良好vs中度vs较差)以及Cox回归模型中TNM分类(UICC/AJCC第6版)的病理肿瘤分期,ITS比例并不是患者生存的独立预测因素(p=0.682;在线补充表12)。

与LS-2数据集类似,在扩展的SG-3数据集中,弥漫性GC比肠道型GC中ITS比例更高(ITS弥漫性GC中位数:67%,范围:15-96%;ITS肠型GC中位数:53%,范围:18-92%;p = 9.204×10−5),高级别gc的比例高于低级别gc (ITS高级别gc的中位数:64%,范围:15-96%;ITS低等级gc中位数:55%,范围:20-92%;p=0.044),在晚期gc中比早期gc更常见(ITS晚期gc中位数:63%,范围:18-95%;ITS早期GCs中位数:53%,范围:15-96%;p = 0.076)。最重要的是,当根据ITS比例分为三个大小相等的组时,ITS GCs高的SG-3患者与ITS GCs低的患者相比,总体生存期也较差(p=0.047;来自完全独立的GC数据集的临床病理数据、患者生存和形态测量结果与基因组分析结果之间的相似性,支持了间质超模块表达水平与GC中ITS比例之间潜在的生物学关系。

讨论

这项研究报告了迄今为止最大的GC基因组元分析,超过了以前的研究,患者总数增加了一倍多。22与以往单中心GC基因表达研究相比,15 - 20我们对多个表达数据集的元分析提供了更强的统计能力,使我们能够识别显著的基因-基因关系,而这些关系在较小的数据集中很可能不太明显。22例如,我们能够检测到与线粒体和蛋白体功能相关的几个模块的表达,这证明了当前研究的灵敏度的提高,这在我们自己之前对相同数据的较小子集的分析中并不明显。15 - 20先前基于单个微阵列平台数据的研究也可能由于平台特定的工件而存在偏差。42相比之下,我们的元分析方法结合了来自多个独立患者群体和不同微阵列平台的数据,最大限度地提高了确定的关系在生物学上相关的概率。

我们的分析表明,GC共表达网络呈现出一种“无标度”的拓扑组织,其中绝大多数基因连接到少数其他基因(“边缘”),只有少数基因(“枢纽”)与许多其他基因高度连接。43-45一项对顶级“中心”基因的调查显示,这些基因与正常的胃生理有关(包括LIPF),细胞黏附力(NCAM1LGALS4 MGP),基因转录(ILF2H2AFZ)和信号(PPP2R3APPTRC(在线补充表5)。这些“枢纽”基因可能在GC基因共表达网络中发挥重要控制节点的作用,然而,没有直接的功能数据,“枢纽”基因在GC基因共表达网络中的功能意义仍有待阐明。除了中心基因,我们的分析还揭示了178个与不同细胞功能相关的表达模块,从细胞增殖和免疫到线粒体和基质功能。一些确定的表达模块可能突出治疗机会。例如,我们在GCs的一个子集中观察到与蛋白酶体功能相关的模块的高表达。Bortezomib是一种临床批准的蛋白酶体抑制剂,最近在GC细胞中显示出临床前疗效。46研究表达高水平蛋白酶体模块的GCs是否对硼替佐米或其他相关蛋白酶体抑制剂化合物表现出高度敏感性可能是有趣的。我们还确定了模块之间的关系,例如,细胞增殖模块高表达的GCs倾向于共表达与消化功能相关的模块,而基质超模块高表达的GCs表现出低水平的增殖和消化模块表达。本研究中观察到的基质和增殖模块表达的互斥性与最近的研究一致,即癌细胞既可以以增殖状态存在,也可以以侵袭状态存在,但通常不能同时增殖和侵袭。47-49

我们发现,在多个独立的GC数据集中,TGF-β相关基质相关基因超模块的表达水平一致地预测临床结果。基质超级模块的表达也与ITS比例、特定的形态GC表型和弥散型组织学有关。这些基因组和形态测量结果具有临床意义,因为它们表明胃癌患者的预后可能受到癌细胞和肿瘤基质中的其他细胞类型的影响。我们的结果也提供了一个分子基础,可以解释,至少部分,弥漫性胃癌患者预后不良。首先,基质与细胞增殖之间的负相关可能导致弥散型GCs对靶向活跃分裂细胞的细胞毒化疗反应较差。其次,高ITS比例可能通过减少药物向肿瘤细胞的传递而直接抑制当前治疗的效果5051保护细胞免受化疗诱导的细胞凋亡。52第三,最近的功能研究表明,肿瘤基质可能在肿瘤细胞的分化、增殖和迁移中起着至关重要的作用,53肿瘤间质可能通过提供肿瘤进展所必需的有利的机械环境支架而促进侵袭性疾病。54这些发现得到了对不同癌症类型的研究的支持,包括食管癌、55结直肠,3956前列腺,57胰腺癌,58乳腺癌和肝癌,59这表明肿瘤微环境和间质可能在患者预后和化疗敏感性中起重要作用。60 - 63然而,据我们所知,我们的报告首次证明了肿瘤基质在胃癌中的预后作用,强调了ITS比例作为一种预测生物标志物的潜在作用,以确定可能对针对肿瘤基质的治疗有反应的GCs患者亚组。

鉴于间质超模块表达水平与胃癌患者生存之间的关联,以及目前弥漫性胃癌中靶向药物(曲妥珠单抗、拉帕替尼)的有限应用,我们对识别可能影响肿瘤间质生长的分子途径感兴趣。通过将基质超级模块的表达水平与不同致癌信号通路的活性相关联,我们的分析强烈暗示TGF-β信号通路是肿瘤间质的关键调节因子。虽然TGF-β通路在历史上一直被视为肿瘤抑制通路,肿瘤细胞经常表现出TGF-β通路组分的突变或表观遗传失活,如TGFβRI, TGFβRII而且SMAD464最近发表的研究表明,肿瘤中的TGF-β信号更复杂,可能会刺激促肿瘤的基质环境。65例如,由癌细胞分泌的TGF-β配体已被证明可以改变肿瘤基质中健康成纤维细胞的功能,导致支持肿瘤生长、血管化和转移的肌成纤维细胞样表型。6667值得注意的是,TGF-β通路已被确定为使用内源性蛋白(如可溶性β聚糖或装饰蛋白)或人工制剂(如反义寡核苷酸、抗体或小药物分子)进行治疗干预的靶点。64鉴于目前GC患者缺乏治疗选择,评估靶向TGF-β是否可能被证明是扰动GC肿瘤间质和改善患者预后的有效策略将是重要的。

总之,这是第一次对GC转录组数据进行全面的基因组元分析,生成了GC中存在的多个基因表达模块的可靠目录。我们的分析显示,GC中基质超模块的表达水平可能是GC的一个新的预后因素,这一途径可能涉及TGF-β信号通路。诚然,患者生存与基质基因表达/ITS比例之间的关联虽然具有统计学意义,但在效应量方面相对较弱。因此,目前仍不确定测量ITS比例是否将被证明是预测GC患者预后的有用临床工具,高于和超过公认的TNM肿瘤分期标准。为了明确解决这一问题,未来的研究目标将包括测量来自大型前瞻性多中心随机对照试验人群的患者材料中的ITS比例,其中由于疾病阶段、患者相关因素、治疗、病理报告和组织收集而产生的潜在偏差被最小化。最后,我们很少有患者在手术前接受化疗,因此,我们的结果不能说明新辅助化疗后ITS比例的预后价值。鉴于西方胃癌患者越来越多地使用新辅助化疗,6869在组织学和分子水平上评估新辅助化疗对ITS的影响将是有趣的。

致谢

作者感谢Genentech公司的Ken Hillan支持利兹微阵列数据集的生成。

参考文献

视图抽象

补充材料

  • 补充数据

    此网页文件由BMJ出版集团从作者提供的电子文件制作而成,并没有对内容进行编辑。

    本数据补充文件:

脚注

  • 资金这项工作得到了新加坡生物医学研究委员会给予PT的赠款(赠款05/1/31/19/423),新加坡国家医学研究委员会(赠款TCR/001/2007),以及新加坡杜克国立大学研究生医学院和新加坡癌症科学研究所的内部赠款。资助者在研究设计、数据收集和分析、发表决定或手稿准备中没有任何作用。

  • 相互竞争的利益一个也没有。

  • 病人的同意获得的。

  • 伦理批准原发性胃癌组织样本是在患者同意的情况下从参与中心的组织库或病理档案中收集的,并根据当地法规和立法获得各自机构的研究伦理审查委员会的批准。经机构审查委员会批准收集临床信息。

  • 出处和同行评审不是委托;外部同行评审。

  • 数据共享声明本研究中的微阵列数据可从GEO获得,登录号为GSE2669、GSE2680、GSE2685、GSE2637、GSE3438、GSE15459、GSE13861、GSE37023、GSE35809和http://smd.stanford.edu/cgi-bin/publication/viewPublication.pl?pub_no=516

相关的文章

  • 消化
    Emad El-Omar 威廉格雷迪 亚历山大现场 托马斯·罗斯奇