摘要
基因型归责是遗传关联研究的一个关键组成部分,它增加了力量,促进了元分析,并有助于信号的解释。基因型估算在计算上有很高的要求,使用目前的工具,通常需要访问高性能的计算集群和测序基因组的参考面板。在这里,我们描述了对imputation机器的改进,与标准的imputation工具相比,它可以将计算需求降低一个数量级以上,而不损失精度。我们还描述了一种新的基于web的imputation服务,它可以方便地访问新的参考面板,并极大地改善用户体验和工作效率。
这是订阅内容的预览,通过你所在的机构访问
相关的文章
引用本文的开放获取文章。
认知完整的老年人阿尔茨海默病多基因风险评分与淀粉样蛋白积累的关系
阿尔茨海默氏症研究与治疗开放获取2022年9月23日
表型或遗传变异的共享可以提高饲料效率基因组预测的准确性
遗传选择进化开放获取2022年9月6日
Canary:用于将MaCH估算的剂量文件转换为PLINK文件的自动化工具
BMC生物信息学开放获取2022年7月27日
访问选项
订阅期刊
获得1年的完整期刊访问权限
99.00美元
每期只要8.25美元
所有价格均为净价格。
增值税稍后将在结帐时添加。
税务计算将在结账时完成。
买条
在ReadCube上获得时间限制或全文访问。
32.00美元
所有价格均为净价格。
参考文献
1000基因组计划联盟。人类遗传变异的全球参考。自然526, 68-74(2015)。
荷兰财团基因组。荷兰种群的全基因组序列变异、种群结构和人口学历史。Nat,麝猫。46, 818-825(2014)。
Gudbjartsson, D.F.等人。冰岛人口的大规模全基因组测序。Nat,麝猫。47, 435-444(2015)。
西多尔,C.等人。基因组测序阐明了撒丁岛的遗传结构,并加强了脂质和血液炎症标志物的关联分析。Nat,麝猫。47, 1272-1281(2015)。
李永华,李永华,李永华,李永华。为基础。基因组学:哼。麝猫。10, 387-406(2009)。
Marchini, J. & Howie, B.全基因组关联研究的基因型imputation。Nat. Rev. Genet。11, 499-511(2010)。
皮蒂斯,G.等。数千个研究特异性全基因组序列的罕见变异基因型植入:对具有成本效益的研究设计的影响。欧元。j .的嗡嗡声。麝猫。23, 975-983(2015)。
Fuchsberger, C., Abecasis, G.R. & Hinds, D.A. minimac2:更快的基因型imputation。生物信息学31, 782-784(2015)。
Howie, B., Fuchsberger, C., Stephens, M., Marchini, J. & Abecasis, G.R.通过预阶段在全基因组关联研究中快速准确的基因型imputation。Nat,麝猫。44, 955-959(2012)。
麦克阿瑟,D.G.等。人类蛋白质编码基因功能缺失变异的系统调查。科学335, 823-828(2012)。
科恩,j.c., Boerwinkle, E,莫斯利,T.H. Jr. &霍布斯,H.H.序列变异PCSK9低密度脂蛋白和预防冠心病。心血管病。j .地中海。354, 1264-1272(2006)。
Stitziel, N.O.等人。失活突变NPC1L1以及预防冠心病。心血管病。j .地中海。371, 2072-2082(2014)。
Sulem, P.等人。鉴定出一大批罕见的完整的人类敲除基因。Nat,麝猫。47, 448-452(2015)。
麦卡锡,S.等。基因型估算的参考组为64,976个单倍型。Nat,麝猫。http://dx.doi.org/10.1038/ng.3643(2016)。
普里查德,j.k和普泽沃斯基,M.人类的连锁不平衡:模型和数据。点。j .的嗡嗡声。麝猫。69, 1-14(2001)。
Browning, B.L. & Browning, S.R.数百万个参考样本的基因型imputation。点。j .的嗡嗡声。麝猫。98, 116-126(2016)。
Delaneau, O., Marchini, J. & Zagury, J.F.线性复杂性相位方法的数千个基因组。Nat方法。9, 179-181(2011)。
Delaneau, O., Zagury, J.F. & Marchini, J.疾病和群体遗传研究的改进全染色体相位。Nat方法。10, 5-6(2013)。
保罗,J.S.和宋,Y.S.区块HMM计算大规模人口基因组推断。生物信息学28, 2008-2015(2012)。
Abecasis, g.r., Cherny, s.s., Cookson, W.O. & Cardon, L.R. merlin -使用稀疏基因流树快速分析密集遗传图谱。Nat,麝猫。30., 97-101(2002)。
Markianos, K., Daly, M.J. & Kruglyak, L.通过减少继承空间的高效多点联动分析。点。j .的嗡嗡声。麝猫。68, 963-977(2001)。
Howie, b.n., Donnelly, P. & Marchini, J.下一代全基因组关联研究的灵活和准确的基因型imputation方法。公共科学图书馆麝猫。5, e1000529(2009)。
Dean, J. & Ghemawat, S. Mapreduce:大型集群上的简化数据处理。Commun。ACM51, 107-113(2008)。
Schönherr, S.等。Cloudgene:私有云和公共云中MapReduce程序的图形化执行平台。BMC生物信息学13, 200(2012)。
1000基因组计划联盟。从人口规模测序的人类基因组变异图。自然467, 1061-1073(2010)。
1000基因组计划联盟。来自1092个人类基因组的遗传变异综合图谱。自然491, 56-65(2012)。
国际HapMap联盟。国际人类基因组单体型图计划自然426, 789-796(2003)。
Plagnol, V. & Wall, J.D.人类种群可能的祖先结构。公共科学图书馆麝猫。2, e105(2006)。
李勇,Willer, C.J, Ding, J., Scheet, P. & Abecasis, G.R. MaCH:利用序列和基因型数据估计单倍型和未观察到的基因型。麝猫。论文。34, 816-834(2010)。
Baum, l.e., Petrie, T., Soules, G. & Weiss, N.一种发生在马尔可夫链概率函数统计分析中的最大化技术。安。数学。统计。41, 164-171(1970)。
Marchini, J., Howie, B., Myers, S., McVean, G. & Donnelly, P.一种新的多点方法用于全基因组关联研究的基因型imputation。Nat,麝猫。39, 906-913(2007)。
Fritsche, L.G.等。一项关于年龄相关性黄斑变性的大型全基因组关联研究强调了罕见和常见变异的贡献。Nat,麝猫。48, 134-143(2016)。
Vrieze, S.I.等人。寻找罕见变异:1325名心理生理内显型个体全基因组测序的初步结果。心理生理学51, 1309-1320(2014)。
Williams, a.l., Patterson, N., Glessner, J., Hakonarson, H. & Reich, D.成千上万的基因分型样本的分期。点。j .的嗡嗡声。麝猫。91, 238-251(2012)。
Li H. Tabix:从通用tab分隔文件中快速检索序列特征。生物信息学27, 718-719(2011)。
李建忠等。从全基因组变异模式推断出世界范围内的人类关系。科学319, 1100-1104(2008)。
确认
作者感谢D. Hinds在minimac3代码优化方面的帮助和A.L. Williams提供的HAPI-UR。我们感谢美国国立卫生研究院资助HG007022和HL117626 (G.R.A.), HG000376 (M.B.)和R01DA037904 (S.I.V.),奥地利科学基金(FWF)资助J-3401 (C.F.),以及欧洲共同体第七框架计划(FP7/2007-2013)在资助协议602133 (L.F.和S.S.)下的支持。这项工作也得到了美国国立卫生研究院老龄问题研究所(D. Schlessinger)内部研究计划的部分支持。
作者信息
作者及隶属关系
贡献
s.d., l.f., s.s., g.r.a.和C.F.设计了方法和实验。王秋森,A.E.L siv毒株,a.k. E.Y.C, S.L。答,d . Schlessinger P.-R.L。d . Stambolian W.G.I,其子as,第50,F.C, F.K, M.B.提供数据或工具。s.d., G.R.A和C.F.写了初稿。在准备期间,所有作者都对手稿进行了批判性的评论。
相应的作者
道德声明
相互竞争的利益
作者声明没有相互竞争的经济利益。
综合补充信息
补充图1 Imputation服务器概述。
imputation工作流使用两个MapReduce作业来并行化质量控制和分阶段/imputation步骤。
补充图3参数估计研究。
该图比较了人类基因组多样性计划(HGDP)在染色体20-22上的六个不同人群上的三种参数估计方法的imputation精度。
补充信息
补充文字及图表
补充图1-3、补充表1-4和补充说明。(PDF 2575kb)
权利和权限
关于本文
引用本文
Das, S, Forer, L., Schönherr, S。et al。下一代基因型植入服务和方法。Nat麝猫48, 1284-1287(2016)。https://doi.org/10.1038/ng.3656
收到了:
接受:
发表:
发行日期:
DOI:https://doi.org/10.1038/ng.3656
这篇文章被引用
表型或遗传变异的共享可以提高饲料效率基因组预测的准确性
遗传选择进化(2022)
MetaGS:一种精确的方法,利用汇总统计数据在种群中归因和组合SNP效应
遗传选择进化(2022)
Canary:用于将MaCH估算的剂量文件转换为PLINK文件的自动化工具
BMC生物信息学(2022)
种系变异对癌症转录组的贡献和临床相关性
BMC癌症(2022)
创新的计算方法揭示了极端早产儿童认知障碍的遗传机制
神经发育障碍杂志(2022)