跳转到主页内容
访问键 NCBI主页 MyNCBI主页 主要内容 主导航
2013年11月15日;29(22):2933-5。
doi: 10.1093 /生物信息学/ btt509。 Epub 2013 9月4日。

Infernal 1.1: RNA同源性搜索速度快100倍

从属关系
免费PMC文章

Infernal 1.1: RNA同源性搜索速度快100倍

Eric P Nawrockiet al。 生物信息学
免费PMC文章

摘要

简介:Infernal构建了一个RNA家族的序列和二级结构的概率轮廓,称为协方差模型(CMs),从结构上注释的多个序列比对作为输入。Infernal使用CMs在序列数据库中搜索新的家族成员,并创建潜在的大型多序列比对。Infernal 1.1版本引入了一种新的基于加速轮廓隐马尔可夫模型(HMM)方法和HMM-带状CM对齐方法的RNA同源搜索过滤管道。这使得在以前版本的基础上可以加速~ 100倍,在完全无过滤的CM搜索基础上可以加速~ 10000倍。

可用性:源代码、文档和基准测试可从http://infernal.janelia.org下载。Infernal是根据GNU GPLv3自由授权的,应该可以移植到任何posix兼容的操作系统,包括Linux和Mac OS/X。文档包括带有教程的用户指南、文件格式和用户选项的讨论以及软件中实现的方法的附加细节。

联系人:nawrockie@janelia.hhmi.org

数据

图1所示。
图1所示。
基准的ROC-like曲线。图显示了新的Infernal 1.1带过滤器和不带过滤器,旧的Infernal 1.0.2,使用nhmmer(来自Infernal 1.1中包含的HMMER包,默认参数)和使用BLASTN (ncbi-blast-2.2.28+,默认参数)进行profile HMM搜索。缺省Infernal 1.1的最大灵敏度(未显示)为0.81(820个真阳性中发现629个),这是在0.19/Mb/查询的假阳性率下实现的。对于未过滤的Infernal,在每个查询每Mb 2.9个假阳性时,最大灵敏度为0.87。这表明,在较高的假阳性率下,过滤器阻止了一些真阳性被发现,但阻止了更多的假阳性被发现。CPU时间是在3.0 GHz Intel Xeon处理器上为单个执行线程测量的所有106个系列搜索的总时间。地狱时间不包括模型校准所需的时间。

类似的文章

  • Infernal 1.0: RNA排列的推断。
    Nawrocki EP, Kolbe DL, Eddy SR。 Nawrocki EP等人。 生物信息学。2009年5月15日;25(10):1335-7。doi: 10.1093 /生物信息学/ btp157。Epub 2009 3月23日。 生物信息学》2009。 PMID:19307242 免费的PMC文章。
  • DNA同源性搜索。
    惠勒TJ,艾迪SR。 Wheeler TJ,等。 生物信息学,2013年10月1日;29(19):2487-9。doi: 10.1093 /生物信息学/ btt403。Epub 2013 7月9日。 生物信息学》2013。 PMID:23842809 免费的PMC文章。
  • 查询依赖带(QDB)用于更快的RNA相似性搜索。
    Nawrocki EP, Eddy SR。 Nawrocki EP等人。 《公共科学图书馆·计算生物学》,2007年3月30日;3(3):e56。doi: 10.1371 / journal.pcbi.0030056。Epub 2007年2月7日。 PLoS计算生物学,2007。 PMID:17397253 免费的PMC文章。
  • 宏基因组数据中功能RNA同源物的计算鉴定。
    Nawrocki EP, Eddy SR。 Nawrocki EP等人。 RNA生物学,2013年7月;10(7):1170-9。doi: 10.4161 / rna.25038。Epub 2013 5月20日。 RNA生物学,2013。 PMID:23722291 免费的PMC文章。 审查。
  • 编辑RNA结构排列的艺术。
    安徒生。 安徒生。 方法Mol生物学,2014;1097:379-94。doi: 10.1007 / 978 - 1 - 62703 - 709 - 9 - _17。 方法Mol生物学,2014。 PMID:24639168 审查。

引用的

  • 脊椎动物谱系中的ncRNA谱系。
    Pignatelli M, Vilella AJ, Muffato M, Gordon L, White S, Flicek P, Herrero J。 Pignatelli M,等。 数据库(牛津大学)。2016年3月15日;2016:bav127。doi: 10.1093 /数据库/ bav127。打印2016。 数据库(牛津大学)。2016. PMID:26980512 免费的PMC文章。
  • 结核分枝杆菌基因组:期望与惊喜。
    Das S, Pettersson BM, Behra PR, Ramesh M, Dasgupta S, Bhattacharya A, Kirsebom LA。 Das S等。 中国生物学报,2016年4月8日;8(4):975-85。对doi: 10.1093 / gbe / evw049。 《基因组生物学》,2016。 PMID:26941228 免费的PMC文章。
  • HCV基因组的编码区包含一个调控RNA结构网络。
    Pirakitikulr N, Kohlway A, Lindenbach BD, Pyle AM。 Pirakitikulr N,等。 中国生物医学杂志,2016年4月7日;62(1):111-20。doi: 10.1016 / j.molcel.2016.01.024。Epub 2016年2月25日 Mol Cell, 2016。 PMID:26924328 免费的PMC文章。
  • 克鲁维酵母指数生长阶段非编码rna的功能解析。
    赵永斌,李爱杰,赵山,金泰,朴志华,赵博凯。 Cho YB,等。 BMC Genomics. 2016年2月29日;17:154。doi: 10.1186 / s12864 - 016 - 2474 - z。 BMC Genomics, 2016。 PMID:26923790 免费的PMC文章。
  • 可利用纤维素生物聚糖的土壤微生物鉴定。
    连杰,崔杰,谭玉生,何伟,温泽,贾波。 连杰,等。 PLoS One, 2016年2月12日;11(2):e0149336。doi: 10.1371 / journal.pone.0149336。eCollection 2016。 PLoS One, 2016。 PMID:26872347 免费的PMC文章。

参考文献

    1. Altschul SF,等。gapping BLAST和PSI-BLAST:新一代蛋白质数据库搜索程序。核酸研究,1997;25:3389-3402。-PMC-PubMed
    1. 棕色的议员。使用随机上下文无关语法的小亚单位核糖体RNA建模。Proc, Int。相依智能。系统。Mol. biology, 2000; 8:57-66。-PubMed
    1. Burge SW,等。Rfam 11.0: 10年的RNA家族。核酸,2013;41:D226-D232。-PMC-PubMed
    1. Cole JR等人。核糖体数据库项目:改进的比对和rRNA分析的新工具。核酸研究,2009;37:D141-D145。-PMC-PubMed
    1. Durbin R,等。生物序列分析:蛋白质和核酸的概率模型。英国剑桥:剑桥大学出版社;1998.

发布类型

物质