跳转到主页内容
访问键 NCBI主页 MyNCBI主页 主要内容 主导航
2016年1月4日;44(D1):D286-93。
doi: 10.1093 / nar / gkv1248。 Epub 2015 11月17日。

eggNOG 4.5:一个具有改进的真核、原核和病毒序列功能注释的分层矫形学框架

从属关系
免费PMC文章

eggNOG 4.5:一个具有改进的真核、原核和病毒序列功能注释的分层矫形学框架

Jaime Huerta-Cepaset al。 核酸测定
免费PMC文章

摘要

eggNOG是一个公共资源,它在不同的分类级别上提供蛋白质的同源组(OGs),每个OGs都有集成和总结的功能注释。自最新公开发行版以来的开发包括跨分类级别创建OGs的算法的更改,使嵌套的组在层次结构上保持一致。这允许在嵌套的OGs之间更好地传播功能项,并导致95890个以前未特征的OGs的新注释,将总体注释覆盖率从67%提高到72%。OGs的功能注释已经扩展到为每个组提供基因本体术语、KEGG路径和SMART/Pfam域。此外,基于系统发育树的分析,eggNOG现在提供了OGs之间的成对orthology关系。我们还结合了一个框架,用于基于预先计算的HMM配置文件将新序列快速映射到OGs。最后,eggNOG 4.5版本整合了一个新的数据集,涵盖2605个病毒OGs,涵盖352个病毒蛋白质组中的5228个蛋白质。所有的数据都可以通过一个完全重新设计的web界面,以web服务的形式批量下载。新的接入点提供了更快的搜索和一些新的浏览和可视化功能,方便了专家和经验不足的用户的需求。eggNOG v4.5可在http://eggnog.embl.de获得。

数据

图1所示。
图1所示。
eggNOG管道的示意图:绿色框表示在这个版本中添加的新数据和/或方法。蓝色标签表示更新的方法和/或数据相对于以前的版本。灰色框表示4.5版本中未更改的步骤。
图2。
图2。
一个OGs的等级结构一致,包括来自SEC24蛋白家族的基因,从根分类水平(最后普遍共同祖先,LUCA)到啮齿动物特定水平。每个OG由一个盒子表示,盒子上标有它所属的谱系名称,盒子的大小与分组的蛋白质数量成正比。用蓝色渐变填充的方框表示特别包含小鼠SEC24A蛋白的OGs的嵌套层次结构。灰色框表示OG层次结构中的折叠分支。请注意,存在另一个特定于bilateria的OG,但出于可读性原因已被折叠。含有小鼠SEC24A蛋白的最具谱系特异性的OG位于啮齿动物分类水平,其颜色为粉红色。基于18VD7啮齿动物特异性组的系统发育分析,SEC24基因的细粒度orthology显示在底部,树枝表明谱系特异性重复。(B病毒分类树。黑色分支表示计算OG的级别,而白色分支表示没有在该级别上计算OG。数字分别表示该水平OGs的数量,该水平OGs中所含蛋白质的数量和该水平OGs中蛋白质所代表的蛋白质组的数量。
图3。
图3。
网站截图显示鱼类和灵长类动物的肌凝蛋白MYO7AA。(一个)用于检索直方图的引导搜索对话框。(B)相关系统发育树的部分树表示。树中的蓝色节点代表物种形成事件。红色节点表示重复事件(在平行日志中)。所有同源序列的Pfam结构域显示为直线。注意,树可视化适应于查询,突出显示种子和目标物种,并将其余部分用灰色显示。(C显示生命树中直系植物分布的分类学剖面表示法。(D)基于与OG相关的基因本体术语的功能概况。(E) OG的过滤内容(蛋白质名称和序列),仅限于查询和目标物种。(F)配对正交预测适用于查询蛋白和目标物种。根据从系统发育树推断的物种形成和重复事件,解决了同源和同源关系。

类似的文章

引用的

参考文献

    1. 通过基因复制来进化。纽约:施普林格科学与商业传媒;2013.
    1. Studer r.a., Robinson-Rechavi M.,我们能有多大的信心认为正交线是相似的,而平行线是不同的?趋势,2009;25:21 - 216。-PubMed
    1. Nehrt N.L, Clark w.t., Radivojac P., Hahn M.W.用哺乳动物的比较功能基因组数据检验正交正交猜想。公共科学图书馆第一版。医学杂志。2011;7:e1002073。-PMC-PubMed
    1. Gabaldón T., Koonin E.V.基因矫形学的功能和进化意义。Genet. 2013; 14:360-366。-PMC-PubMed
    1. Koonin E.V. Orthologs, para - los,和进化基因组学。为基础。Rev. Genet. 2005; 39:309-338。-PubMed

发布类型

LinkOut -更多的资源