条文本

下载PDF
改进的NGS变量调用工具PRSS1-PRSS2轨迹
  1. "卢1
  2. Bo谢2
  3. 伊敏王2
  4. 杨高23.
  5. 舒化徐123.45678
  1. 1遗传工程国家重点实验室,遗传与发育协同创新中心,生命科学学院进化生物学研究中心复旦大学上海,中国
  2. 2中国科学院大学上海营养与健康研究所计算生物学重点实验室中国科学院上海,中国
  3. 3.生命科学与技术学院ShanghaiTech大学上海,中国
  4. 4中山医院肝癌研究所肝外科移植科复旦大学上海,中国
  5. 5动物进化与遗传学卓越中心中国科学院昆明,中国
  6. 6江苏省系统基因组学与比较基因组学重点实验室,生命科学学院江苏师范大学徐州,中国
  7. 7河南省医药科学研究所郑州大学郑州,中国
  8. 8复旦大学张江国际创新中心、当代人类学教育部重点实验室复旦大学上海,中国
  1. 对应到徐树华教授,复旦大学生命科学学院,上海200438;xushua在}{fudan.edu.cn;娄海义博士,复旦大学生命科学学院,上海200438;louhaiyi在}{fudan.edu.cn

来自Altmetric.com的统计

带着兴趣,我们阅读了韦斯最近的两项研究和配基他报告了用下一代测序(NGS)对错义变体的假阳性呼叫PRSS1-PRSS2与胰腺炎相关的基因座。1 2假阳性是由于假基因之间的同源性PRSS3P2TRY7以及蛋白质编码基因PRSS1PRSS2这导致了错误的短读数,并混淆了胰腺疾病的遗传诊断。在这里,为了提供一个具有成本效益的解决方案,我们提供了一个名为NGS的工具包。PRSS1-2caller (https://github.com/Shuhua-Group/NGS.PRSS1-2caller),以改善对变异的侦测PRSS1-PRSS2从NGS数据的轨迹。门店。PRSS1-2caller enables accurately detecting single nucleotide variants, small insertions and deletions and copy number variants with high sensitivity, which could be further applied in the genetic diagnosis at thePRSS1-PRSS2轨迹。

在人类参考基因组GRCh38中,第7号染色体的备选contig是一个与胰蛋白酶原基因序列重复10.6 kb的5基因结构PRSS1PRSS3P1PRSS3P2TRY7而且PRSS2(chr7_KI270803v1_alt:7 49 409-8 01 557),3.而缺失形式包含在第7号染色体中PRSS1PRSS3P1而且PRSS2(chr7:142746720 - 142778572)4在线补充信息).我们分别从典型的3基因和5基因基因组组装中模拟短读,评估了NGS读取定位(在线补充信息).当从一个5基因的单倍型短读对齐到一个3基因的单倍型时,正如报道的那样,错位发生了。1 2但在其他情况下,特别是当使用5基因单倍型作为参考时,这种错位是可以避免的(图1一个).鉴于此,我们开发了工具包NGS。PRSS1-2caller’ to improve variant-detecting at thePRSS1-PRSS2基于GRCh38备选位点(在线补充信息).

图1

ngs . prss1 -2调用者的短读映射和评估。(A) 5基因胰蛋白酶原单倍型到3基因胰蛋白酶原参考文献的短读映射(上图)和3基因胰蛋白酶原单倍型到5基因胰蛋白酶原参考文献的短读映射(下图)。“短读映射”轨迹中的颜色峰值表示核苷酸的排列:灰色,匹配;其他颜色不匹配。“变体”轨迹中的颜色条表示与参考的不匹配,其中误义和移码变体分别用橙色和红色突出显示。注意,错误调用的错义和移码变异只出现在以GRCh38主染色体7为参考的结果中,而在以GRCh38备选染色体作为参考的结果中不存在。因此,以5基因胰蛋白酶原单倍型作为ngs . prss1 -2调用者的参考。(B) NGS的性能。PRSS1-2caller in real data from the 1000 Genomes Project. AFR, African; EAS, East Asian; EUR, European; HET 3/5 heterozygous 3-gene/5-gene structure; HOM 3, homozygous 3-gene structure; HOM 5, homozygous 5-gene structure;SAS, South Asian;.

仿真数据的性能表明,NGS。PRSS1-2caller generated very few false positive and false negative calls in all haplotype combinations. In contrast, the commonly used variant calling approach Genome Analysis Toolkit (GATK)5基于GRCh38的替代contig产生了更多的假阳性和假阴性调用。门店。PRSS1-2caller achieved a high precision of 0.98–1.00 and a high recall rate of ~0.96–0.98, which outperformed the GATK results even at the genome-wide genic regions (在线补充信息).此外,上天。PRSS1-2caller could perfectly recall 95% (19/20) of the known pathogenic alleles. Finally, apply of NGS.PRSS1-2caller in the real data also achieved a high F1 score with an average of 0.99 in precision and 0.96 in recall (图1 b).这些评价表明NGS。PRSS1-2caller enables variant discovery with high precision and sensitivity at thePRSS1-PRSS2可用于遗传诊断。

我们总会在应用。PRSS1-2caller to the 1000 Genomes Project data6并发现3基因/5基因胰蛋白酶原基因型频率在不同人群中存在差异。大多数欧洲人(>70%)是5基因单倍型携带者,而大多数东亚人(>50%)是3基因单倍型携带者(在线补充信息).最引人注目的是,我们发现一系列胰腺炎保护等位基因与3基因单倍型(图2).特别是rs4726576-A与R2=0.96在CEU(犹他州欧洲血统居民)是一个突出的例子,这降低了启动子活性PRSS17对于东亚和南亚人群,也观察到与低胰腺炎风险等位基因有很强的联系。例如,rs10273639-T在日本人群的胰腺炎相关研究中被报道,8具有3基因单倍型结构的LD为R2=0.95 JPT(东京日语);rs2855983-A在印度人群中与预防胰腺炎相关,9在完全LD (R2=1)具有ITU(来自英国的印度泰卢固人)的3基因单倍型。总之,我们提供了一种调用NGS数据中的变量的解决方案PRSS1-PRSS2位点,可进一步应用于胰腺相关疾病的医学研究和诊断。

图2

欧洲和亚洲样本中胰腺炎保护等位基因与3-基因单倍型的连锁。CEU、ITU和JPT 3基因单倍型与胰腺炎保护等位基因之间存在LD。三角图中的数字表示LD (R2) 3基因/5基因单倍型结构与日本人群关联研究中报道的snv (rs10273639;橙色盒子)和印度人口(rs2855983;青色盒子)和与之相关的变体PRSS1催化剂活性(rs4726576;紫色框)。看到在线补充信息对于其他欧洲和亚洲人口的LD模式。欧洲血统的犹他州居民;ITU,来自英国的印度泰卢固人;JPT,东京的日语;LD,连锁不平衡;snv,单核苷酸变异。

伦理语句

病人同意发表

伦理批准

这项研究涉及人类参与者,我们分析了来自1000基因组计划的公开数据。如项目原始文件中所述,1000基因组计划由伦理委员会或机构董事会批准。参与者在参与研究前给予知情同意。

参考文献

补充材料

  • 补充数据

    这个网络仅文件已由BMJ出版集团从作者提供的电子文件生产(s),并没有编辑的内容。

脚注

  • HL、BX和YW贡献相等。

  • 贡献者SX和HL构思和设计了这项研究。YW发现了错位的模式,并分析了基因座结构。HL发现了与胰腺炎的联系。SX监督了这项研究。HL、BX和YW开发了工具包。HL和BX进行评价。HL、BX、YW、YG进行测序数据处理和分析。HL起草了手稿。SX修改了手稿。

  • 资金本研究得到国家自然科学基金(NSFC)资助项目(32030020、32041008、31871256、31771388和31961130380)、中国科学院战略重点研究项目(XDPB17、XDB38000000)、英国皇家学会牛顿高级研究项目(NAF\R1\191094)和上海市科技重大项目(2017SHZDZX01)的资助。资助方不参与研究设计、数据收集、分析、出版决定或稿件准备。

  • 相互竞争的利益没有宣布。

  • 来源和同行评审不是委托;外部同行评议。

  • 补充材料本内容由作者提供。它没有经过BMJ出版集团有限公司(BMJ)的审查,也可能没有经过同行评审。讨论的任何意见或建议仅仅是那些作者(s)和不被BMJ认可。BMJ放弃从放在内容上的任何依赖产生的所有责任和责任。如果内容包含任何翻译材料,BMJ不保证翻译的准确性和可靠性(包括但不限于当地法规、临床指南、术语、药品名称和药物剂量),并且不对翻译和改编或其他原因引起的任何错误和/或遗漏负责。

请求的权限

如果您希望重用这篇文章的任何部分或全部,请使用下面的链接,它将带您访问版权清除中心的RightsLink服务。您将能够快速获得价格和以多种不同方式重用内容的即时许可。