跳到主页内容
美国国旗

美国政府的官方网站

点政府

gov意味着它的官员。
联邦政府网站经常在gov或mil。共享敏感信息之前,确保你在一个联邦政府网站。

Https

这个网站是安全的。
https://确保你连接到官方网站,您提供的任何信息是加密和传输安全。

访问键 NCBI主页 MyNCBI主页 主要内容 主导航
2018年10月,562 (7726):203 - 209。
doi: 10.1038 / s41586 - 018 - 0579 - z。 Epub 2018 10月10。

英国生物库资源深表现型和基因数据

从属关系
免费的PMC的文章

英国生物库资源深表现型和基因数据

克莱尔Bycroftet al。 自然 2018年10月
免费的PMC的文章

文摘

英国生物库的项目是一个前瞻性群组研究遗传和表型数据收集约500000人来自英国,在招聘年龄在40至69。开放资源的独特之处在于它的规模和范围。丰富的各种表型和与健康有关的信息可以在每个参与者,包括生物测量,生活方式指标,在血液和尿液生物标志物,身体和大脑的成像。后续提供的信息是连接健康和医疗记录。全基因组基因型数据已经收集了所有的参与者,提供许多机会的发现新的基因协会和复杂性状的遗传基础。这里我们描述基因数据的集中分析,包括基因型质量、属性的人口结构和基因数据的关联性,高效逐步和基因型参数,增加测试的变异的数量约为9600万。古典晚上11人类白细胞抗原基因等位变异是估算,导致经济复苏的信号与已知的人类白细胞抗原等位基因之间的关联和许多疾病。

利益冲突声明

J.M.是创始人和主任Gensci警察局,G.M. and S.L. are partners in Peptide Groove LLP. G.M. and P.D. are founders and directors of Genomics Plc. The remaining authors declare no competing financial interests.

数据

图1
图1所示。总结英国生物库资源和基因分型结果数组的内容。
总结英国生物库资源的主要组成部分。更多细节请参见扩展数据如表1。的图还显示了一个示意图表示不同类别的内容在英国生物库公理基因型数组。数据显示标记每个类别内的近似计算,忽略任何重叠。更详细描述数组的内容是英国生物库中可用公理数组内容摘要。
图2
图2所示。总结基因型数据质量和内容。
英国生物库的所有情节都显示属性基因型数据在应用质量控制。一个加器分布基于所有样本(805426标记)。插图显示只罕见的标记(加< 0.01)。b分布的数量批量质量控制(QC)测试,标记失败(见方法)。每一个加范围,我们显示标记的部分失败指定批次的数量。c加的,比较英国生物库ExAC相同的等位基因的频率,在欧洲血统的参与者在每个研究(补充信息)。这个分析使用91298重叠的标记。显示每个六角形本彩色标记的数量在下降,本(日志10规模)。虚线红线所示x=y。截然不同的标记等位基因频率出现在顶部,底部和左手的情节包含大约300标记。这是0.3%的所有标记的比较(见补充资料讨论)。d,意思是日志2比率(左2R) X和Y染色体上为每个示例,说明可能的性染色体非整倍性(见方法)。有652个样本可能的性染色体非整倍性(十字架)。集群的位置的不同假定的分析是由希腊符号表示:λ= X0(或马赛克XX / X0),θ= XXX,α= XXY,和π= XYY。项个人在这些地区给出了补充表2。自述性的颜色表示不同的组合,和性推断,Affymetrix(从基因数据)。几乎所有样品(99.9%)、自我报告和推断性是相同的,但对于小数量的样品(378)他们不匹配(见补充资料讨论)。
图3
图3所示。祖先的多样性和家族亲缘。
一个参与者,每个点代表一个英国生物库(n= 488377个样本)和被放置在每个主成分得分(PC)的前4个主成分。颜色和形状表示每个个体的自我报告的种族背景。参见表3扩展数据比例在每个类别。b亲戚的数量分布,参与者在英国生物库队列。每个酒吧的高度显示计数的参与者(日志10规模)表示数量的亲戚。颜色显示的比例每个亲缘类在一个酒吧。c,家庭组织在英国生物库队列的例子。点代表参与者,颜色的点之间显示出他们的推断关系(例如,蓝线加入完整的兄弟姐妹)。家庭网络的整数显示总数的队列(如果多于一个)相同的配置,忽略三度对。
图4
图4所示。协会统计数据为人类的高度。
结果(P人类高度值)之间的关联测试并使用三个不同的基因型为2号染色体组数据。在一个- - - - - -c,P值显示在−日志10规模,限制在50视觉清晰度和未调整的多重比较。标记与−日志10(P)> 50 50的绘制y轴和显示为三角形,而不是点。水平红线表示P= 5×10−8一个公布的结果,由巨大的荟萃分析(n= 253288),与NCBI GWAS目录用红色标记重叠(策划报告P值)。b,协会统计数据(从线性混合模型,见方法)的英国生物库标记基因型数据(n= 343321)。c,协会统计数据(从线性混合模型,见方法)英国生物库标记的估算数据(n= 343321)。点颜色粉色标记的基因表明用于预研阶段和非难。这意味着大多数的数据在每一个这些标记的来自于基因型分析。黑色点(绝大多数,~ 800万)表明充分估算标记。d,维恩图的计数结果的数量1 mb windows与至少一个轨迹P< 5×10−8巨头,英国生物库基因分型和英国生物库估算数据集(见方法)。括号里的百分比是工会的windows的比例在所有三个数据源(1215)。英国生物库中包含的只有三个窗口基因分型数据而不是估算数据。e的,比较Z再保险公司e英国生物库的年代(y轴)和巨人(x轴)。Z分数计算效应值除以标准误差,但只是为标记P< 5×10−8在巨大的一组575个相关地区,我们还用于可信集分析(见方法)。用最小的标记P值(巨人)在每个地区突出显示蓝色的圆圈。黑色虚线所示x=y,红色实线显示了线性回归直线对这些数据估计。回归系数的标准错误显示在括号中。皮尔森的相关性是用于计算r 2价值。
扩展数据图1
扩展数据图1。总结纸浆包质量控制。
一个- - - - - -c三块显示,杂合性缺失率,我们用来标记质量差的样品(n= 488377个样本)。面板一个b显示为每个样本之前和之后的杂合性,分别纠正祖先背景使用主成分。符号(形状和颜色)表示每个参与者的自我报告的种族背景。面板c显示的968个样本标记为异常值(红色),和所有其他的样品(黑色),与其他两个形状相同的情节。垂直线显示阈值我们用来调用样品作为离群值缺失率。在所有情节缺失率数据转换为分对数的规模,但与轴带注释的原始值。
扩展数据图2
扩展数据图2。强度数据和基因型的例子要求标记不同的等位基因频率。
每个sub-figure显示强度数据为一个标记在六个不同的批次。批次标签前缀“UKBiLEVEAX”只包含样本类型使用英国BiLEVE Axiom数组,和那些前缀“批处理”只包含样本类型使用英国生物库Axiom数组。每个点代表一个样本,根据的推断基因型彩色标记。的xy轴强度的转换探头组针对每个等位基因A和B的定义(见补充信息探针集)。椭圆表示后验概率分布的位置和形状(二维多元正态)改变了三种基因型的强度的批处理。即,每个椭圆画,它包含85%的概率密度。看到AffymetrixAxiom基因分型方案数据分析指导Affymetrix基因型调用的更多细节。计算每个标记的,我们使用发布英国生物库中的所有样本基因型数据。一个标记加器为0.077,布置得井然有序基因型集群。b,强度标记与加0.00092布置得井然有序基因型集群。像预计的那样在哈迪温伯格平衡,没有和样品小纯合子基因型的实例。c,强度标记加器为0.00066,杂合子的集群并不是分开的大结合体主要集中在一些批次,使其更难以自信地称之为杂合的基因型。
扩展数据图3
扩展数据图3。意思是主成分得分为每个自我出生的国家。
每一列显示每个元素一个主成分和主成分得分均值为个人出生在标签的国家,按比例缩小的标准差的主成分得分。在每一列元素只有彩色如果这个国家有一个非零系数(P< 10−5;双面的t以及)与出生地线性模型预测和主成分得分结果(n= 487848个样本)。国家(行)已被命令使用层次聚类(“hclust”函数R)。每个国家的标签旁边的符号显示最常见的种族背景类别之间的参与者在这个国家出生的。举例来说,最常见的自我报告的种族背景的参与者出生在斯里兰卡是“任何其他亚洲背景”。不到20个人在那里出生的国家被排除在分析之外。
扩展数据图4
扩展数据图4。分布的分数在常染色体标记估算数据集的信息。
左上角图显示了完整的分数的分布信息。剩下的面板显示部分加分布;加器> 5%、1% < 5%、0.1%≤≤乘加加< 1%、0.01%≤乘加<≤0.1%和0.001%加< 0.01%。
扩展数据图5
扩展数据图5。地区协会站高度GWAS示例。
GWAS协会统计数据(P值)站高度关注的染色体2 ~ 3 mb地区没有达到全基因组意义巨人(2014)分析,但在英国生物库(线性混合模型;见的方法)。的P多个测试值显示不调整。英国生物库的标记基因分型表现为钻石,和估算标记圆圈。最小的两个标记P值为每个基因分型数据和估算数据放大并强调了黑色的轮廓,和其他英国生物库标记颜色根据其相关性(r 2),这两个之一。即基因标记与领先的基因标记(rs17713396)和估算指标主要估算标记(rs12714401)。标记与r 2小于0.1的值显示为黑色或绿色的。
扩展数据图6
扩展数据图6。比较精细定位的巨人(2014)和英国生物库估算数据。
这里我们总结我们的可靠的分析结果在巨大(2014)和575年英国生物库相关基因组区域高度站在这两项研究(见方法)。情节上的红色实线表示x=y一个,情节比较标记的数量的95%可信集大小小于18标记在这两项研究(363个地区在左边的情节;445在右边的情节)。b,c,从分析考虑所有情节都标记在每一个研究。在b我们展示,每个地区的比例分析对于一个给定的研究中使用的标记的95%可信的研究。情节包含相同的363个地区如左边所示图一个。在c我们总结一下,575个地区,多少重量我们英国生物库的分析放在标记,分析巨人(2014)表示很重要。

评论

  • 英国生物库的股票大数据的承诺。
    考克斯N。 考克斯N。 大自然。2018年10月,562 (7726):194 - 195。doi: 10.1038 / d41586 - 018 - 06948 - 3。 自然》2018。 PMID:30305754 没有可用的抽象。
  • 英国生物库数据为500000人精密医学的方法。
    (没有作者列出) (没有作者列出) 大自然。2018年10月,562 (7726):163 - 164。doi: 10.1038 / d41586 - 018 - 06950 - 9。 自然》2018。 PMID:30365879 没有可用的抽象。
  • 英国生物库。
    面包干N。 面包干N。 Nat方法。2018年12月,15 (12):1001。doi: 10.1038 / s41592 - 018 - 0245 - 2。 Nat方法。2018。 PMID:30504882 没有可用的抽象。

类似的文章

  • 全基因组测序与归责发现了人体测量特征的遗传信号。
    Tachmazidou我Suveges D,敏杰,里奇GRS,斯坦伯格J,沃尔特·K Iotchkova V,瓦尔兹特鲁布J,黄J, Memari Y,麦卡锡年代,克劳福德AA, Bombieri C, Cocca M, Farmaki AE,憔悴的TR, Jousilahti P, Kooijman MN, Lehne B, Malerba G, Mannisto年代,Matchan, Medina-Gomez C, Metrustry SJ,唠叨,Ntalla我,符咒L,雷纳NW,萨拉C,斯科特WR, Shihab哈,生意L,圣Pourcain B, Traglia M, Trajanoska K, Zaza公司G,张W,阿提加斯女士,邦萨尔N, Benn M,陈Z, Danecek P,林王寅,洛克,烹调的菜肴J,曼宁AK,穆勒,Sidore C, Tybjaerg-Hansen, Varbo, Zoledziewska M,菲南C, Hatzikotoulas K,亨德里克斯AE,坎普JP, Moayyeri, Panoutsopoulou K, Szpak M,威尔逊SG, Boehnke M, Cucca F, Di Angelantonio E, Langenberg C,林格伦C,麦卡锡MI,莫里斯美联社,Nordestgaard BG,托宾博士斯科特•RA Wareham新泽西;SpiroMeta财团;GoT2D财团;伯顿P,钱伯斯JC,史密斯GD Dedoussis G,菲利克斯•摩根富林明,弗朗哥哦,Gambaro G, Gasparini P,哈蒙德CJ,霍夫曼,变水量,Jaddoe Kleber M,官JS,佩罗拉M, Relton C,环SM, Rivadeneira F, Salomaa V,斯佩克特TD, Stegle O, Toniolo D, Uitterlinden AG);气电焊财团;理解社会科学组;UK10K财团;巴罗佐,Gre考试… ➔看到抽象完整的作者列表 Tachmazidou我,等。 2017 J哼麝猫。100年6月1;(6):865 - 884。doi: 10.1016 / j.ajhg.2017.04.014。2017年5月25日Epub。 2017年J哼麝猫。。 PMID:28552196 免费的PMC的文章。
  • 评估数字表现型来增强人类疾病的基因研究。
    DeBoever C, Tanigawa Y, Aguirre M,麦克因尼斯G, Lavertu, Rivas马。 DeBoever C, et al。 J哼麝猫。2020年5月7日,106 (5):611 - 622。doi: 10.1016 / j.ajhg.2020.03.007。Epub 2020年4月9日。 2020年J哼麝猫。。 PMID:32275883 免费的PMC的文章。
  • 遗传、生活方式和环境。英国生物库是一个开放存取资源后,500000名参与者的生活改善未来几代人的健康。
    Trehearne。 Trehearne。 Bundesgesundheitsblatt Gesundheitsforschung Gesundheitsschutz。2016年3月,59 (3):361 - 7。doi: 10.1007 / s00103 - 015 - 2297 - 0。 Bundesgesundheitsblatt Gesundheitsforschung Gesundheitsschutz》2016。 PMID:26753864
  • 英国生物库(英国生物库):JACC焦点研讨会6/8。
    莱西Caleyachetty R,小约翰T, B, BeševićJ,康罗伊M,柯林斯R,艾伦N。 Caleyachetty R, et al。 J科尔心功能杂志。2021年7月6日,78 (1):56 - 65。doi: 10.1016 / j.jacc.2021.03.342。 J科尔心功能杂志。2021。 PMID:34210415 审查。
  • 风湿性疾病基因组学研究的发展方向。
    冈田克也Y, Kishikawa T, Sakaue年代,Hirata J。 冈田克也Y, et al。 大黄说中国北部。2017年8月,43 (3):481 - 487。doi: 10.1016 / j.rdc.2017.04.009。 大黄说北。2017。 PMID:28711147 审查。

引用的

引用

    1. Plenge RM、Scolnick EM Altshuler d .验证通过人类遗传学治疗靶点。Nat。启药物。2013;12:581 - 594。doi: 10.1038 / nrd4051。- - - - - -DOI- - - - - -PubMed
    1. 英国生物库。英国生物库Axiom数组内容摘要http://www.ukbiobank.ac.uk/wp-content/uploads/2014/04/UK-Biobank-Axiom-A..。(2014)。
    1. 英国生物库。英国生物库的基因分型和质量控制,大规模、广泛表型潜在资源http://biobank.ctsu.ox.ac.uk/crystal/docs/genotyping_qc.pdf(2015)。
    1. 年轻的AI,唐纳利Wauthier F p .多个小说gene-by-environment交互修改FTO基因变异在身体质量指数的影响。Nat Commun。2016; 7:12724。doi: 10.1038 / ncomms12724。- - - - - -DOI- - - - - -PMC- - - - - -PubMed
    1. 由于WJ, et al。人类血液细胞性状变异的等位基因的景观和链接常见的复杂疾病。细胞。2016;167:1415 e19——1429.。doi: 10.1016 / j.cell.2016.10.042。- - - - - -DOI- - - - - -PMC- - - - - -PubMed

发布类型

网格计算

物质