跳到主页内容
美国国旗

美国政府的官方网站

点政府

gov意味着它的官员。
联邦政府网站经常在gov或mil。共享敏感信息之前,确保你在一个联邦政府网站。

Https

这个网站是安全的。
https://确保你连接到官方网站,您提供的任何信息是加密和传输安全。

访问键 NCBI主页 MyNCBI主页 主要内容 主导航
审查
2015年6月,13 (6):360 - 72。
doi: 10.1038 / nrmicro3451。 Epub 2015年4月27日。

测序和超越:整合分子微生物群落分析的“组学”

从属关系
免费的PMC的文章
审查

测序和超越:整合分子微生物群落分析的“组学”

埃里克一Franzosaet al。 Nat Microbiol牧师 2015年6月
免费的PMC的文章

文摘

高通量DNA测序证明无价的调查不同环境和host-associated微生物群落。在这次审查中,我们讨论了微生物群落分析的新兴策略补充和扩大传统的宏基因组分析。这些包括小说DNA测序策略识别strain-level微生物变异和社区时间动态;测量多个“使”数据类型,更好地捕捉社会功能活动,如转录组、蛋白质组学和代谢组学;并结合多种形式的数据使一个集成框架。我们强调“multi-omics”的研究方法导致微生物群落结构和功能的改善机械的模型。

数据

图1
图1所示。优化实验设计
一个。整个metagenome猎枪(WMS)测序研究面临权衡受试者认为,每主题样本的数量,每个样本测序深度实现固定测序预算(在这里,6 WMS测序的“单位”)。更大的稀有物种的测序深度有助于识别和罕见变异丰富的物种(如单核苷酸多态性);在病例对照研究考虑更多的科目提高统计能力;考虑多个样品/主题是至关重要的时间进程分析;并结合DNA和RNA(元'omic)测序揭示差异功能潜力和微生物群落的功能活动出现在不同的个体。b。结合低成本和低分辨率的高成本和提高分辨率的扩增子测序WMS测序(在这里,一个“单元”的WMS测序和四个“单元”的扩增子测序被认为相当于成本)支持更丰富的实验设计。例如,两阶段研究设计首先测量大量的个人使用扩增子测序,然后后续使用WMS测序与样品的一个子集(根据个人选择的代表团体或那些代表集团内的极端情况下)。同样,时间进程的研究可以结合扩增子序列,用于调查大量的时间点,与WMS测序,应用于分析时间点的一个子集(例如第一个和最后一个)更多的细节。虽然描述了在人类sequencing-based化验的上下文中,这些考虑都同样适用于环境样品和各种高通量功能屏幕,包括宏蛋白质组学和代谢组学。
图2
图2。分析strain-level微生物群落的变化
一个。映射paired-end读取微生物参考基因组测序揭示不仅存在于一个社区的基因组,还特定物种的分离株之间的差异和孤立的引用。在这个例子中,大多数职位4 x报道,由4 paired-end测序读上面堆放(映射)中的每个位置参考基因组。基因缺失事件可以检测到参考基因组覆盖率较低;删除基因(橙色)招募没有读取样本和两侧成对读取(橙色搭配读取)。更高的报道有助于区分测序错误和真实nucleotide-level应变变化。这些变化包括固定的差异(样本时总是不同于参考一些网站)和单核苷酸多态性(SNPs;网站出现在两个或两个以上的国家在样例)。一起配对不地图的读取(红色和蓝色读)表明额外的结构变化,包括基因的插入材料中没有参考水平基因转移等机制(HGT)。b。组装paired-end读到更大的基因组片段,叫叠连群,便于检测的应变变化没有参考基因组。例如,分析叠连群从三个环境隔离微生物物种可以揭示小说的基因组安排和高度的事件。宏基因组组装还允许参考重叠群的比较(在这种情况下,t = 0) paired-end读取获得的在不同的时间点在时间分析(如t = 6个月或t = 1年),使新兴snp的识别。c。读取映射到参考基因组显示模式基因的存在和缺席,这是一种应变变化。这里,两个人在两个时间点取样(t = 0和t = 1年)杰出的存在和缺乏基因在物种的蓝色基因是稳定存在于个人1和稳定在个人缺席2,而红色的基因是稳定存在于个人2和稳定个人1中缺席。
图3
图3。在人类肠道metatranscriptome和metagenome有关
在这个例子中,猎枪RNA和DNA序列数据从肠道微生物组的样本8健康个体与HUMAnN功能描述。每个小组展示了一个基因或功能模块的功能活动(表达水平)强烈偏离潜在功能(宏基因组丰富)。中位数基因或转录丰度是策划涉及多个基因的功能;来自同一个人DNA和RNA值是相关的。tetA(一种抗生素耐药性行列式),甲烷生成(一个重要的代谢途径中肠道热点),细菌核糖体,和groEL(细菌伴护蛋白质)强烈过度,RNA富足持续超过它们的DNA的富足。因此,平均而言,在这些功能基因产生许多成绩单副本,表明他们是高度活跃在人类肠道(例如,细菌核糖体亚基被不断合成)。相反,孢壁蛋白H(一个基因参与应对营养饥饿)和合成色氨酸的强烈under-expressed (DNA丰富持续超过RNA丰富)。减少从这些微生物转录功能表明他们抑制在人类肠道健康,可能由于生物利用度较高的营养(包括色氨酸)来自主机的饮食。转录的细菌核糖体蛋白质和groEL高度变量在个人相对于强大的宏基因组保护(见插图板),这是与科目的转录调控的模式一致。这样的推论不可能如果微生物群落的RNA或DNA序列数据被认为是孤立的。
图4
图4。集成多'omic数据的更深层次的生物的见解
一个。促进微生物样本的综合分析,不同的多'omic数据类型通常是与微生物相关的基因或基因家族作为一个共享的参考点。这些基因可能是取自一个参考数据库或直接从样品组装。宏基因组,metatranscriptomic, metaproteomic序列数据(如paired-end读取或蛋白质片段被质谱)然后直接映射到这些基因序列同源性的基础上,而产量基因的拷贝数和活动的信息。代谢物(被质谱)可以被映射到一个子集的基因利用已知enzyme-coding基因之间的关系和他们的产品,从而提供一个额外的、独立的基因活动。有几个动机和执行多'omic数据集成优势。例如,在没有DNA数据的情况下,功能活动的措施与社区功能潜在抱愧蒙羞。因此,转录丰度可以通过基因拷贝数归一化;这消除了混杂效应和高光,下或non-expressed函数(b部分)。单独弱,但一致的信号(从不同的化验和/或研究)提供更强的集体支持的假设。在这里,一个假设的微生物功能更丰富的DNA, RNA,蛋白质含量,以防样品相对于控制样品(c部分)。数据集成还使描述性建模。例如,结合蛋白质组学和代谢组学的数据分析可以揭示通路是否由不同的酶(在这种情况下,X, Y,和Z,代谢底物1、2和3,分别)是不活跃或活跃的(d部分)。

类似的文章

引用的

发布类型

网格计算