跳转到主页内容
访问键 NCBI主页 MyNCBI主页 主要内容 主导航
2016年7月,13(7):581 - 3。
doi: 10.1038 / nmeth.3869。 Epub 2016 5月23日。

DADA2: Illumina扩增子数据的高分辨率样本推断

从属关系
免费PMC文章

DADA2: Illumina扩增子数据的高分辨率样本推断

本杰明·J·卡拉汉et al。 Nat方法 2016年7月
免费PMC文章

摘要

我们提出了用于建模和纠正illumina测序扩增子错误的开源软件包DADA2 (https://github.com/benjjneb/dada2)。DADA2精确地推断样本序列,并解决低至1个核苷酸的差异。在几个模拟社区中,DADA2识别了更多的真实变体,输出的假序列比其他方法更少。我们将DADA2应用于一组孕妇的阴道样本,揭示了以前未检测到的crispatus乳杆菌变体的多样性。

数据

图1
图1。由DADA2推断的序列变体与由usparse构造的otu相比较
由DADA2输出的合并序列被绘制为三个Illumina扩增子数据集:(a) Balanced, (b) HMP和(c) Extreme。频率在y轴上;到x轴上最接近的更丰富序列的汉明距离。形状代表精度(方法)。当变量与群落中的其他成员很好地分离时,DADA2推断的序列变量与usparse输出的OTUs(黑色)基本一致。然而,DADA2解决了额外的变化(蓝色),特别是在usparse的OTU半径内(虚线),同时输出更少的假序列(One Off和Other)。
图2
图2。怀孕期间人类阴道群落中的crispatus乳杆菌序列变异
DADA2识别了六种乳酸菌crispatus16S rRNA序列变异存在于多个样本中,并且在所有reads中占显著比例(L1: 19.7%, L2: 11.1%, L3: 6.5%, L4: 3.1%, L5: 1.3%, L6: 0.4%)。(a) L1-L6在每个样本中的频率。底部的黑条链接来自同一主题的样本。(b) L1 vs. L2和(c) L1 vs. L3的频率,按样本。虚线表示总频率为1。

类似的文章

引用的

参考文献

    1. 人类微生物组项目联盟。大自然。2012;486:207 - 214。-PMC-PubMed
    1. Rosen MJ, Davison M, Bhaya D, Fisher DS。科学。2015;348:1019 - 1023。-PubMed
    1. 李志强,李志强,李志强。中国科学(d辑)。2010;-PMC-PubMed
    1. 昆斯C,兰岑A,达文波特RJ,特恩堡PJ。BMC生物信息学。2011;12:38。-PMC-PubMed
    1. 王志强,王志强,王志强。生物信息学学报。2012;13:382。-PMC-PubMed

方法一定参考

    1. 孙Y,等。ESPRIT:利用大量16S rRNA焦核糖核酸序列估算物种丰富度。核酸研究,2009;37:e76。-PMC-PubMed
    1. Caporaso JG,等。《中国日报》,2012;6:1621。-PMC-PubMed
    1. 李志刚,李志刚,李志刚。生物信息学研究。2011;-PMC-PubMed

发布类型

LinkOut -更多的资源