跳转到主页内容
访问键 NCBI主页 MyNCBI主页 主要内容 主导航
比较研究
2016年7月21日;535(7612):435-439。
doi: 10.1038 / nature18927。 Epub 2016年7月13日。

人类微生物群中的移动基因从全球到个体尺度都是结构化的

从属关系
免费PMC文章
比较研究

人类微生物群中的移动基因从全球到个体尺度都是结构化的

I L布里托et al。 自然
免费PMC文章

排错在

摘要

最近的工作强调了微生物组在人类健康中的重要性,并在很大程度上将表型的差异归因于个体之间存在的物种差异。然而,移动基因可以在同一物种的不同菌株上赋予截然不同的表型。人们对人类微生物组中移动基因的功能和分布知之甚少,特别是基因库是全球同质的还是受人类人口结构的限制。在这里,我们使用单细胞基因组学和宏基因组学相结合的方法,通过比较在81个北美大都市和172个斐济农业岛民微生物群中发现的移动基因来研究这个问题。我们发现斐济和北美微生物群之间的移动基因含量有很大差异,功能差异反映了已知的饮食差异,如斐济个体中发现的植物性淀粉降解基因过多。值得注意的是,我们还观察到邻近斐济村庄的移动基因库之间的差异,尽管村庄之间的微生物组组成是相似的。最后,我们观察到高比率的重组导致个体特定的移动元素,这表明一些基因的丰度可能反映了环境选择而不是扩散限制。总之,这些数据支持了这样一个假设:人类活动和行为提供了形成移动基因库的选择压力,而移动基因的获取对于殖民特定的人类群体很重要。

数据

扩展数据图1
图1.扩展数据在研究中使用的组合系统发育跨越了细菌生命树
利用本分析中使用的所有参考基因组和单细胞组合的16S rRNA全基因或16S rRNA基因V68区的多重序列比对构建的系统发育树。使用RDP构建16S对准线。然后使用FastTree组装树。树形中所有深枝的支撑力都很低,因此,为了说明的目的,顶枝仅作为外群。外层的颜色条显示了古类群和细菌门的分类联系。内部的颜色条显示操作分类单元的源:HMP参考单元(蓝色)和FijiCOMP单单元程序集(红色)。70个FijiCOMP单细胞组合的16S rRNA基因序列无法获得,因此未包含在该树中。
扩展数据图2
图2.扩展数据识别水平转移基因和评估它们在宏基因组样本中的分布的方法
水平转移区域首先通过HMP参考基因组和FijiCOMP单细胞组合之间的成对blast进行识别。开放阅读框在水平传输区域内进行注释。移除移动基因集中的遗传冗余,以确保使用UCLUST和BLAST组合进行准确的丰度估计。然后将宏基因组读数与独特的移动基因数据集对齐。对对齐进行过滤,只保留那些在超过50%的读取长度中与99%标识对齐的读取。宏基因组样本中基因的丰度被确定,其对齐深度至少为4倍,超过80%的基因长度。
扩展数据图3
图3.扩展数据移动基因家族的丰度在很大程度上由队列决定
(A)绘制热图,显示每个宏基因组样本中由功能基因家族(COG分配、KEGG、TIGRFAM或PFAM家族)聚集的移动基因的丰度(FPKM)。利用完全连锁的方法对个体间功能基因家族谱之间的欧氏距离进行了层次聚类;以及个体移动基因组成之间的距离。数值以对数刻度标出。(B)绘制热图,显示在每个宏基因组样本中被认为有较高置信度的移动基因家族的丰度(FPKM)。这些包括来自移动基因的移动基因家族,它们被注释为水平转移机制或有额外的支持它们的系统发育位置。基因家族和个体的位置保持在扩展数据图3A中,以供比较。(C)绘制热图,显示在每个宏基因组样本中被观察到在HMP参考基因组之间转移的移动基因的丰度(FPKM)。基因家族和个体的位置保持在扩展数据图3A中,以供比较。
扩展数据图4
图4.扩展数据糖苷水解酶13基因和高置信度移动基因内糖苷水解酶家族的分布表现出群体特异性富集
(A) FijiCOMP(红色)和HMP(蓝色)宏基因组粪便样本中被注释为糖苷水解酶13家族成员的移动基因的流行率和丰度(用FPKM测量)。(B)在FijiCOMP(红色)和HMP(蓝色)宏基因组粪便样本中存在的高置信度移动基因亚群中的所有糖苷水解酶(GH)家族的患病率和丰度。这里只包括从移动基因中被注释为水平转移机制或对其系统发育位置有额外支持的独特基因家族。丰度通过FPKM测量,根据生长激素家族聚合,并作为样本密度的函数绘制。对于每个生长激素家族,观察到的独特水平转移基因的数量被记录下来,以及它们底物的来源。
扩展数据图5
图5.扩展数据HMP和FijiCOMP研究参与者肠道微生物群的组成
(A)从HMP(蓝色)和FijiCOMP(红色)队列的个体宏基因组样本中,根据门绘制了细菌的相对丰度。根据队列和优势门的丰度对样本进行分类。(B)从HMP(蓝色)和FijiCOMP(红色)队列中个体的宏基因组样本中,拟合出菌纲(bacterioales)内的科的相对丰度。根据队列和拟杆菌门顶端成员的丰度对样本进行排序。
扩展数据图6
图6.扩展数据移动基因在两个队列中广泛的细菌宿主背景中被观察到
(A,B)热图显示了与一个tRNA基因和两个特定水平转移基因对齐的人均读对数。根据与特定tRNA基因相关的物种,热图中的颜色反映了read丰度。颜色条表示读数来自哪个气象队列:FijiCOMP(红色)和HMP(蓝色)。
扩展数据图7
图7。基因的相对丰度和不同人群的环境对精确的定义并不敏感
基因家族的百分比,由COG注释(左面板)、相同基因(中面板)和基因上下文(右面板)确定,用于广泛的参数。柱状图以5%的增量绘制。黑色阴影条是图4中绘制的参数。
扩展数据图8
图8。在不同的系统发育距离上,细胞之间的水平转移是不同的
(A)比较全长16S rRNA和V68 16S rRNA区域的核苷酸身份切断,以避免在密切相关的细胞之间进行比较。对于每一对HMP参考基因组,它们全长16S rRNA的核苷酸身份与它们的V68区域的核苷酸身份进行比对。97%的全长16S(对应大约7500万年的进化)身份被用作截止点,而当只有V68区域的序列可用时,95%被用作截止点。只有那些在全长和V68区域相似性均超过90%的基因组被显示出来。(C) HGT频率被绘制为物种间所有细胞-细胞比较(黑色)、仅HMP参考基因组(蓝色)和FijiCOMP单细胞组合(红色)之间的系统发育差异的函数。这幅图只包含了可以识别全长16S rRNA基因的细胞。每条线的细胞-细胞比较的数量如图(B)所示。
扩展数据图9
图9。为最终移动基因集选择的具有代表性的基因与经过过滤以减少冗余的基因高度相似
在参考基因组和单细胞组装之间的细胞-细胞BLASTn比较中观察到的每个重叠水平转移区域,基因聚类以识别唯一基因并减少基因集的冗余。这一步骤对于读取比对后宏基因组数据集中这些基因的准确丰度测量至关重要。使用UCLUST对来自每个重叠水平传输区域的所有开放阅读帧进行分组。每一个被过滤的基因的核苷酸身份和它的基因被选择读取对齐(即质心)被绘制出来。
扩展数据图10
图10.扩展数据宏基因组在整个长度上以高保真度与移动基因对齐
宏基因组的读取需要在至少50%的读取长度上与移动基因的99%身份一致。尽管看起来50%的截断率很低,但几乎所有的读取在整个基因长度上都具有近乎完美的核苷酸身份。
图1
图1。功能性移动基因的富集具有区域特异性
(A) FijiCOMP(红色)和HMP(蓝色)宏基因组粪便样本中所有注释的可移动糖苷水解酶(GH)家族的患病率和丰度。通过FPKM测量每个水平转移基因的丰度,根据GH家族聚合,并绘制为样本密度的函数。对于每个GH家族,在两个队列中存在的唯一水平转移基因的数量被绘制(灰色),以及它们的底物来源。(B) FijiCOMP(红色)和HMP(蓝色)宏基因组粪便样本中植物物质的流行率和丰度(阅读来自Viridiplantae王国的rRNA序列)。(C)经注释的移动抗生素耐药基因在FijiCOMP(红色)和HMP(蓝色)宏基因组粪便样本中的流行率和丰度。(p值基于曼-惠特尼检验)。(D)斐济四个村庄中8个村庄特有的移动基因(31个村庄特有基因)的流行率和丰度。患病率比较的q值(A,B,D)基于fdr校正的Fisher确切检验;丰度比较的q值基于fdr校正的Mann-Whitney检验。
图2
图2。全球和当地人群的微生物组组成
(A) FijiCOMP(红色)和HMP(蓝色)宏基因组样本物种组成之间jensen - shannon差异的主坐标分析。(B) FijiCOMP宏基因组样本中物种组成之间的jensen - shannon差异的主坐标分析,根据他们的村庄成员。
图3
图3。个体移动遗传元件结构由于重组表现出高度的变异
(A-C)来自不同大陆(A,B)或不同村庄(C)的个体的微生物群之间集合的移动遗传元素的比较示例。移动基因之间的基因联系根据它们存在的个体被着色,灰色表示在两个个体的微生物群中存在的联系。基因根据其宽泛的COG类别被着色。(D)对于每个移动基因端,根据邻近基因是否具有广泛的功能一致性(由COG类别决定)以及它们是否位于同一DNA链上,表示它们是否可能包含相同的操纵子,绘制邻基因的中位数和四分位比例(由宏基因组读对的比例决定)。(E)每一类功能类别的移动基因连接的基因家族的平均数,由移动基因之间的配对读连锁决定。柱状图显示的是平均的标准误差。
图4
图4。基因在全球人群中广泛存在,尽管特定的移动遗传元素结构不是
基因家族(由功能注释决定)(左)、相同基因(中)和基因上下文(由基因之间的独特联系定义)的百分比(右)根据它们在FijiCOMP和HMP群体中的流行率绘制。基因家族、基因和基因环境被称为“个人的”(在单个个体中存在)、“罕见的”(在一个群体中小于5%而在另一个群体中不存在);“丰富”(在一个人群的50%和另一个人群的<10%);“普通”(两种人群中≥25%);“广泛”(在两种人群中均≥50%);和“普遍”(≥75%的人群)。颜色反映与一个或两个群体的联系。

类似的文章

引用的

参考文献

    1. Turnbaugh PJ等人。一种与肥胖相关的肠道微生物群,其能量收集能力增强。大自然。2006;444:1027 - 1031。-PubMed
    1. Giongo A等。定义1型糖尿病的自身免疫微生物群。ISME杂志,2011;5:82-91。-PMC-PubMed
    1. 秦静,等。2型糖尿病患者肠道菌群的宏基因组相关性研究。大自然。2012;490:55-60。-PubMed
    1. 薛君,等。肠道柯氏普雷沃氏菌的扩大与关节炎易感性的增强相关。eLife。2013; 2: e01202。-PMC-PubMed
    1. 康德威,等。自闭症儿童肠道菌群中普雷沃氏菌和其他发酵体的发生率降低。PLOS One. 2013 10.1371/journal.pone.0068322。-PMC-PubMed

发布类型

物质