跳到主要内容

感谢您访问nature.com。您使用的是对CSS支持有限的浏览器版本。为了获得最好的体验,我们建议您使用最新的浏览器(或关闭Internet Explorer的兼容性模式)。同时,为了确保持续的支持,我们将在没有样式和JavaScript的情况下显示站点。

下一代基因型植入服务和方法

摘要

基因型归责是遗传关联研究的一个关键组成部分,它增加了力量,促进了元分析,并有助于信号的解释。基因型估算在计算上有很高的要求,使用目前的工具,通常需要访问高性能的计算集群和测序基因组的参考面板。在这里,我们描述了对imputation机器的改进,与标准的imputation工具相比,它可以将计算需求降低一个数量级以上,而不损失精度。我们还描述了一种新的基于web的imputation服务,它可以方便地访问新的参考面板,并极大地改善用户体验和工作效率。

这是订阅内容的预览,通过你所在的机构访问

相关的文章

引用本文的开放获取文章。

访问选项

买条

在ReadCube上获得时间限制或全文访问。

32.00美元

所有价格均为净价格。

图1:状态空间约简的概述。

参考文献

  1. 1000基因组计划联盟。人类遗传变异的全球参考。自然526, 68-74(2015)。

  2. 荷兰财团基因组。荷兰种群的全基因组序列变异、种群结构和人口学历史。Nat,麝猫。46, 818-825(2014)。

  3. Gudbjartsson, D.F.等人。冰岛人口的大规模全基因组测序。Nat,麝猫。47, 435-444(2015)。

    中科院文章谷歌学者

  4. 西多尔,C.等人。基因组测序阐明了撒丁岛的遗传结构,并加强了脂质和血液炎症标志物的关联分析。Nat,麝猫。47, 1272-1281(2015)。

    中科院文章谷歌学者

  5. 李永华,李永华,李永华,李永华。为基础。基因组学:哼。麝猫。10, 387-406(2009)。

    中科院文章谷歌学者

  6. Marchini, J. & Howie, B.全基因组关联研究的基因型imputation。Nat. Rev. Genet。11, 499-511(2010)。

    中科院文章谷歌学者

  7. 皮蒂斯,G.等。数千个研究特异性全基因组序列的罕见变异基因型植入:对具有成本效益的研究设计的影响。欧元。j .的嗡嗡声。麝猫。23, 975-983(2015)。

    文章谷歌学者

  8. Fuchsberger, C., Abecasis, G.R. & Hinds, D.A. minimac2:更快的基因型imputation。生物信息学31, 782-784(2015)。

    中科院文章谷歌学者

  9. Howie, B., Fuchsberger, C., Stephens, M., Marchini, J. & Abecasis, G.R.通过预阶段在全基因组关联研究中快速准确的基因型imputation。Nat,麝猫。44, 955-959(2012)。

    中科院文章谷歌学者

  10. 麦克阿瑟,D.G.等。人类蛋白质编码基因功能缺失变异的系统调查。科学335, 823-828(2012)。

    中科院文章谷歌学者

  11. 科恩,j.c., Boerwinkle, E,莫斯利,T.H. Jr. &霍布斯,H.H.序列变异PCSK9低密度脂蛋白和预防冠心病。心血管病。j .地中海。354, 1264-1272(2006)。

    中科院文章谷歌学者

  12. Stitziel, N.O.等人。失活突变NPC1L1以及预防冠心病。心血管病。j .地中海。371, 2072-2082(2014)。

    文章谷歌学者

  13. Sulem, P.等人。鉴定出一大批罕见的完整的人类敲除基因。Nat,麝猫。47, 448-452(2015)。

    中科院文章谷歌学者

  14. 麦卡锡,S.等。基因型估算的参考组为64,976个单倍型。Nat,麝猫。http://dx.doi.org/10.1038/ng.3643(2016)。

  15. 普里查德,j.k和普泽沃斯基,M.人类的连锁不平衡:模型和数据。点。j .的嗡嗡声。麝猫。69, 1-14(2001)。

    中科院文章谷歌学者

  16. Browning, B.L. & Browning, S.R.数百万个参考样本的基因型imputation。点。j .的嗡嗡声。麝猫。98, 116-126(2016)。

    中科院文章谷歌学者

  17. Delaneau, O., Marchini, J. & Zagury, J.F.线性复杂性相位方法的数千个基因组。Nat方法。9, 179-181(2011)。

    文章谷歌学者

  18. Delaneau, O., Zagury, J.F. & Marchini, J.疾病和群体遗传研究的改进全染色体相位。Nat方法。10, 5-6(2013)。

    中科院文章谷歌学者

  19. 保罗,J.S.和宋,Y.S.区块HMM计算大规模人口基因组推断。生物信息学28, 2008-2015(2012)。

    中科院文章谷歌学者

  20. Abecasis, g.r., Cherny, s.s., Cookson, W.O. & Cardon, L.R. merlin -使用稀疏基因流树快速分析密集遗传图谱。Nat,麝猫。30., 97-101(2002)。

    中科院文章谷歌学者

  21. Markianos, K., Daly, M.J. & Kruglyak, L.通过减少继承空间的高效多点联动分析。点。j .的嗡嗡声。麝猫。68, 963-977(2001)。

    中科院文章谷歌学者

  22. Howie, b.n., Donnelly, P. & Marchini, J.下一代全基因组关联研究的灵活和准确的基因型imputation方法。公共科学图书馆麝猫。5, e1000529(2009)。

    文章谷歌学者

  23. Dean, J. & Ghemawat, S. Mapreduce:大型集群上的简化数据处理。Commun。ACM51, 107-113(2008)。

    文章谷歌学者

  24. Schönherr, S.等。Cloudgene:私有云和公共云中MapReduce程序的图形化执行平台。BMC生物信息学13, 200(2012)。

    文章谷歌学者

  25. 1000基因组计划联盟。从人口规模测序的人类基因组变异图。自然467, 1061-1073(2010)。

  26. 1000基因组计划联盟。来自1092个人类基因组的遗传变异综合图谱。自然491, 56-65(2012)。

  27. 国际HapMap联盟。国际人类基因组单体型图计划自然426, 789-796(2003)。

  28. Plagnol, V. & Wall, J.D.人类种群可能的祖先结构。公共科学图书馆麝猫。2, e105(2006)。

    文章谷歌学者

  29. 李勇,Willer, C.J, Ding, J., Scheet, P. & Abecasis, G.R. MaCH:利用序列和基因型数据估计单倍型和未观察到的基因型。麝猫。论文。34, 816-834(2010)。

    文章谷歌学者

  30. Baum, l.e., Petrie, T., Soules, G. & Weiss, N.一种发生在马尔可夫链概率函数统计分析中的最大化技术。安。数学。统计。41, 164-171(1970)。

    文章谷歌学者

  31. Marchini, J., Howie, B., Myers, S., McVean, G. & Donnelly, P.一种新的多点方法用于全基因组关联研究的基因型imputation。Nat,麝猫。39, 906-913(2007)。

    中科院文章谷歌学者

  32. Fritsche, L.G.等。一项关于年龄相关性黄斑变性的大型全基因组关联研究强调了罕见和常见变异的贡献。Nat,麝猫。48, 134-143(2016)。

    中科院文章谷歌学者

  33. Vrieze, S.I.等人。寻找罕见变异:1325名心理生理内显型个体全基因组测序的初步结果。心理生理学51, 1309-1320(2014)。

    文章谷歌学者

  34. Williams, a.l., Patterson, N., Glessner, J., Hakonarson, H. & Reich, D.成千上万的基因分型样本的分期。点。j .的嗡嗡声。麝猫。91, 238-251(2012)。

    中科院文章谷歌学者

  35. Li H. Tabix:从通用tab分隔文件中快速检索序列特征。生物信息学27, 718-719(2011)。

    文章谷歌学者

  36. 李建忠等。从全基因组变异模式推断出世界范围内的人类关系。科学319, 1100-1104(2008)。

    中科院文章谷歌学者

下载参考

确认

作者感谢D. Hinds在minimac3代码优化方面的帮助和A.L. Williams提供的HAPI-UR。我们感谢美国国立卫生研究院资助HG007022和HL117626 (G.R.A.), HG000376 (M.B.)和R01DA037904 (S.I.V.),奥地利科学基金(FWF)资助J-3401 (C.F.),以及欧洲共同体第七框架计划(FP7/2007-2013)在资助协议602133 (L.F.和S.S.)下的支持。这项工作也得到了美国国立卫生研究院老龄问题研究所(D. Schlessinger)内部研究计划的部分支持。

作者信息

作者及隶属关系

作者

贡献

s.d., l.f., s.s., g.r.a.和C.F.设计了方法和实验。王秋森,A.E.L siv毒株,a.k. E.Y.C, S.L。答,d . Schlessinger P.-R.L。d . Stambolian W.G.I,其子as,第50,F.C, F.K, M.B.提供数据或工具。s.d., G.R.A和C.F.写了初稿。在准备期间,所有作者都对手稿进行了批判性的评论。

相应的作者

对应到Gonçalo R Abecasis基督教Fuchsberger

道德声明

相互竞争的利益

作者声明没有相互竞争的经济利益。

综合补充信息

补充图1 Imputation服务器概述。

imputation工作流使用两个MapReduce作业来并行化质量控制和分阶段/imputation步骤。

补充图2各变型现场质量控制工作流程。

补充图3参数估计研究。

该图比较了人类基因组多样性计划(HGDP)在染色体20-22上的六个不同人群上的三种参数估计方法的imputation精度。

补充信息

补充文字及图表

补充图1-3、补充表1-4和补充说明。(PDF 2575kb)

权利和权限

转载及权限

关于本文

通过CrossMark验证货币和真实性

引用本文

Das, S, Forer, L., Schönherr, S。et al。下一代基因型植入服务和方法。Nat麝猫48, 1284-1287(2016)。https://doi.org/10.1038/ng.3656

下载引用

  • 收到了

  • 接受

  • 发表

  • 发行日期

  • DOIhttps://doi.org/10.1038/ng.3656

这篇文章被引用

搜索

快速链接

自然简报

报名参加自然简报时事通讯-什么重要的科学,免费到您的收件箱每天。

获取当天最重要的科学故事,免费在您的收件箱。 注册《自然简报》