条文本
摘要
客观的研究多重混合感染过程中基因组微进化的详细性质幽门螺杆菌个体的菌株。
设计我们从一位患有慢性胃炎和肾炎的患者的一次活检中抽取了18株分离物。全基因组测序应用于这些分离株,并使用统计遗传工具来研究它们的进化史。
结果基因组分为两个进化支,反映了两种不同菌株在胃中的定植,这些谱系在估计2.8年和4.2年的进化中积累了多样性。我们在两个演化支之间检测到大约150个明显的重组事件。世系间的重组是一个持续不断的过程,在两个分支上都有检测到,但一个分支的重组效果比另一个分支高近一个数量级。推测的祖先序列也显示了两株菌株在多样化之前的重组证据,我们估计它们都感染了同一宿主至少12年。谱系之间的重组束平均长度为895 bp,并在体外实验中观察到受体序列的穿插。一种噬菌体相关蛋白的复杂进化历史为过去4年里单一噬菌体谱系频繁地再感染两个支提供了证据。
结论利用全基因组测序技术,可以对该病的遗传变化机制作出详细的结论幽门螺旋杆菌基于从一次胃活检中取样的细菌。
- 幽门螺杆菌
这是一篇开放获取文章,根据创作共用属性非商业(CC BY-NC 4.0)许可证发布,该许可证允许其他人以非商业方式分发、混音、改编、在此作品的基础上进行构建,并以不同的条款许可其衍生作品,前提是原始作品被正确引用且使用是非商业性的。看到的:http://creativecommons.org/licenses/by-nc/4.0/
数据来自Altmetric.com
本研究的意义
关于这个问题我们已经知道了什么?
幽门螺杆菌引起严重疾病后,慢性感染人类胃。
感染可以持续多年,在此期间,基因组进化是由高突变率和重组驱动的。
新的发现是什么?
同一宿主同时感染两株幽门螺旋杆菌可以通过对单个活检中几个分离株的基因组进行测序来揭示。
当合并感染发生时,它可以持续多年而不失去其中一个菌株。
在此期间,菌株之间发生重组,其影响比同一感染菌株的突变或重组要深远得多。
在可预见的未来,它会对临床实践产生怎样的影响?
在更多的个体中进行类似的研究将提供详细的见解幽门螺旋杆菌利用它产生的多样性长期感染人类的胃。更好地理解宿主内基因组进化对于设计有效的治疗方法是必要的幽门螺旋杆菌.
简介
幽门螺杆菌是一种宿主特异性细菌病原体,在人胃粘膜中建立慢性感染,导致各种胃十二指肠疾病,从浅表胃炎和消化性溃疡到胃癌和粘膜相关淋巴组织淋巴瘤。1,2一些关于宿主内部进化的研究表明,重组可以成为基因组多样化的强大力量,特别是在存在多种菌株混合感染的情况下。3 - 6幽门螺旋杆菌对从同一患者中连续取样的分离株进行了比较,以估计突变和重组率以及重组片段的大小。3 - 5在其中一项研究中,成对连续分离株之间的进化距离与分离间隔的时间显著相关,但与宿主的年龄无关。4这表明,在第一次分离之前,这对恐龙在相对较短的时间内拥有共同的祖先。这一假设通过对来自40个南非人的同时分离的基因组对的比较得到了证实,其中大多数人距离最近的共同祖先(TMRCA)的时间大于3.5年。6
的进化方式幽门螺旋杆菌在各个主机内尚未进行详细调查,许多问题仍未得到解答。例如,目前还不清楚不同菌株的重组率是否相似,以及菌株输入的DNA数量是否随时间而变化,并取决于由于胃环境或免疫选择的变化而引起的特定挑战。同样未知的是,重组主要是由慢性混合感染促成的,还是在被优势菌株击败之前,与短暂殖民胃的血统发生交换。在体外进行的实验表明,即使在所有其他条件相同的情况下,菌株之间的重组率也会有显著差异。7号到9号他们还发现重组区域偶尔包含不受影响的短间隙(即与受体而不是供体菌株相同),这些被称为“受体的穿插序列”(ISR);但这些实验室实验与宿主内部进化的相关性仍未确定。
在这里,我们对18个基因组进行了测序幽门螺旋杆菌在同一时间点从一名中国慢性胃炎和肾炎患者中分离得到。这是最全面的测序工作幽门螺旋杆菌从一个病人的报告,最全面的任何细菌病原体之一,类似于,例如,最近的研究金黄色葡萄球菌.10,11这些基因组的比较使我们能够研究它们的遗传关系和宿主内部的进化。
材料与方法
隔离幽门螺旋杆菌
幽门螺旋杆菌菌落从中国浙江省一名53岁男性慢性胃炎和肾炎(系膜增生性肾炎)患者的胃镜胃窦活检标本中分离出来。患者于2012年和2013年进行了胃镜检查。2012年,第一次内镜检查显示慢性浅表性胃炎。2013年第二次内镜随访,发现慢性浅表性胃炎,组织学诊断为粘膜轻度慢性炎症伴轻度肠化生。患者在第一次胃镜检查前3个月未使用抗生素,未服用任何抗分泌药物。2012年取的活检标本均质并接种弯曲杆菌琼脂基(CM0935, Oxoid)板含有10%的去纤维羊血和幽门螺旋杆菌补充SR0147E (Oxoid)。培养皿在微氧(5% O2, 10% co285% N2)在37°C条件下48小时或72小时。通过脲酶、过氧化氢酶和氧化酶试验,获得了18个具有特征形态的单菌落。每个菌落都通过另一轮单菌落隔离进一步净化。
基因组测序、组装和注释
根据制造商的说明,使用QIAamp DNA Mini Kit (QIAGEN,德国)提取基因组DNA。使用IlluminaTruSeq DNA样品制备试剂盒制备文库。根据MiSeq系统用户指南,使用IlluminaMiSeq测序系统对18株分离株进行2*150个周期测序。对18例配对端短插入文库测序数据进行从头组装幽门螺旋杆菌最优组装参数k-mer在奇数13 ~ 127之间选择。2株分离株(3和12)用SOAPdenovo V.1.05进行组装,12其余16株用Velvet V.1.2.07进行组装,13同时选取了18个程序集的最佳哈希长度。生成的contigs的注释使用RAST(使用子系统技术的快速注释)执行,14tRNAs和rnas通过tRNAscan-SE进行鉴定15和RNAmmer。16使用progressiveMauve对18个基因组进行比对,17采用stripSubsetLCBs脚本共提取357个基因组区域,长度为>500 bp。这些共享区域的连接长度为1344 kbp。根据NCBI提交要求,如果任何序列包含超过10个连续n,将草稿基因组组装分成更小的contigs,短于200 bp的contigs在提交NCBI前被丢弃。
基因组序列分析
共享的对齐区域首先用于构建系统发育(如图所示)图1)使用邻域连接方法。18ClonalFrame V.1.219分别应用于来自两个进化支的基因组,共使用2万次迭代,其中前一半被丢弃作为老化,后一半每10次迭代采样一次。使用以前的估计幽门螺旋杆菌1.38×10的宿主内分子钟−5每年每个位点发生突变,6在年的时间尺度上显示了两个支系的无性系系谱图2.对于ClonalFrame推断出的每一个重组事件,计算出从任何一个分支到潜在供体的最小距离(图3),从而提供了枝间和枝内事件数量的估计值。20 - 22对于每个重组事件,在受影响的区域计算一个邻居连接树(四个例子显示在图4).将重组事件映射到先前完成并注释的基因组F5723使用MuMMER24以评估哪些基因被交换了(见在线补充图S2和S3)。最后,将两个进化支的共同祖先序列输入到ClonalFrame中,19然后进行两两比较,如前所述,22日至25日为了评估基因组不同部分的同源性水平(图5).
限制修改系统分析
Blastn26用于在18个基因组序列中搜索先前研究确定并在REBASE数据库中列出的限制性内切修饰(R-M)基因(http://rebase.neb.com/rebase/rebase.seqs.html).27选择覆盖率在90%以上、e值在1e-10以下的命中,分析两个支系的差异基因含量。所有18个基因组共享的基因中的SNP模式根据它们在MAUVE中的排列进行了分析。17
抗生素敏感性试验
易感性幽门螺旋杆菌采用琼脂稀释法对阿莫西林(Amo)、克拉霉素(Cla)、呋喃唑酮(Fur)、左氧氟沙星(Lev)、四环素(Tet)和甲硝唑(Met) 6种抗生素分离株进行检测,对照标准品为美国国家食品和药物控制研究所。10微升细菌悬浮液(108CFU/mL)分别接种到含有5%羊血和不同浓度上述抗生素的muller - hinton琼脂板(Oxoid)上,37℃微嗜氧条件下孵育3天。参考菌株ATCC43504 NCTC1163728用于质量控制。对Amo、Cla、Fur、Lev、Tet和Met的抗性断裂点分别设置为≥2、≥1、≥2、≥2、≥2和≥8 μg/mL。29,30.
数据可用性
的基因组序列草案幽门螺旋杆菌分离株已存入NCBI GenBank数据库(登录号已显示在在线补充表S1中)。
结果
隔离幽门螺旋杆菌以及全基因组测序
我们从一位53岁患有慢性胃炎和肾炎的中国患者的胃镜胃窦活检样本的培养板中选择了18个单菌落分离株(指定为1-18)。根据MiSeq系统用户指南,使用IlluminaMiSeq测序系统进行2*150个周期的测序。这18种的整体性质幽门螺旋杆菌基因组摘要见在线补充表S1。大多数草稿基因组组装在100个contigs以内,GC含量(约39%)和总组装基因组长度(约1.6 Mbp)与预期一致幽门螺旋杆菌.31
基于共享基因组的邻居连接树显示,分离株分为两个不同的分支(图1).分支A包含7个分离株,而分支B由其余11个分离株组成。自幽门螺旋杆菌具有泛群体结构,我们得出结论,这两个分支代表了来自本地基因库的两个不同菌株对同一宿主的不同感染。对多位点序列分型位点的分析表明,这两个分支都属于hspEAsia人群(见在线补充表S2)。32
虽然所有菌株都是同时分离的,但与其他菌株相比,基因组4和16上面的分支较短。这表明它们可能是最初在胃中生长的两种菌株的杂交。较短的分支长度正是像相邻连接这样的方法所期望的,它不考虑重组。
两个支系的克隆谱系
我们使用ClonalFrame推断两个分支的克隆谱系,以解释重组的方式。19ClonalFrame分别应用于两个进化支,以避免假设它们共享相同的进化参数。这个比率,r:m,代表了通过重组和突变引入取代的比率,并且是它们的相对影响的一个方便的总结;33演化支A和B的r:m分别为2.3和19.8。因此,重组,而不是突变,是两个支系进化的主要驱动力,但它几乎比支系B的突变重要一个数量级。这种差异是由于相对于支系B的突变,重组率(ρ/θ=1.05)高于支系a的突变(ρ/θ=0.09)。两支分枝的平均重组束长度相似(δ=895 bp (572;1250))。
一旦重组事件被考虑在内,演化支A和B的高度为5.9×10−5和3.9×10−5分别为每个位点的突变。宿主内突变率最近已被估计幽门螺旋杆菌1.38×10−5每年每处场地,6这明显高于许多其他细菌病原体,34但与之前的研究结果一致幽门螺旋杆菌.3 - 5这意味着支A和支B的TMRCA分别为4.2年和2.8年(图2).These estimates are consistent with a previous study which found an average TMRCA of 3.61 years for pairs of genomes from a single infection in 40 different hosts.6这一结果并不意味着这两种感染只发生在几年前,而是说它们至少发生在这么久以前,遗传多样性已经受到遗传漂变和可能的免疫选择的限制。宿主为53岁,这表明感染可能确实发生在tmrca之前,这一点可以通过下一节中祖先序列的比较提供证据。
重组事件及其起源
个体重组事件由ClonalFrame在对应于这两种感染的两个克隆谱系的每个分支上推断出来(图2).ν参数反映了通过重组带来的多态性的平均数量,估计为0.026 (0.025;0.027); 0.024 (0.023;0.026)(方括号中的值为95%可信区间)。这两个估计值彼此相似,并且略高于两个谱系株之间的平均核苷酸差异(π=0.0212)。这与ClonalFrame识别的许多组合事件是两个分支之间的交换是一致的。
我们应用先前描述的方法来评估每个重组事件的可能起源。20 - 22简单地说,从ClonalFrame输出文件中提取重组片段,并与来自两个进化支的基因组的同源序列进行比较(减去受重组事件影响的菌株)。如果序列与重组片段相同或包含单核苷酸差异,则认为找到了匹配。在分支A中,共提取了51个事件。两个事件只在分支A中匹配,32个事件只在分支B中匹配,两个事件都匹配,15个事件都不匹配。在演化支B中,共提取297个事件;114个项目只在A支系中匹配,50个项目只在B支系中匹配,62个项目同时匹配,71个项目都不匹配。在演化支之间检测到的事件比在演化支内部检测到的事件多,尽管后一种类型的事件没有前者产生那么多的差异。因此,枝内重组更难检测,因此我们的结果并不一定意味着重组在枝间发生得更频繁,而不是在枝内。不匹配任何一个进化支的事件仍然可能来自其中一个或另一个进化支,因为两个进化支的多样性只是部分采样,并且只与现在的菌株进行比较(而重组可能是古老的)。
对于每个推断出的重组事件,两个分支中最佳匹配的距离表示为散点图(图3).左下角的区域对应的事件有一个不明确的起源(即,可能是一个分支或另一个分支);左边的事件,而不是底部的事件,有一个明确的起源在分支a,而底部的事件,而不是左边的事件,有一个明确的起源在分支B。在分支a中,许多事件都有一个明确的起源在分支B,正如之前报道的那样。在分支B中,许多事件来自分支A,但也有相当多的事件来自分支B,也有相当多的事件模棱两可,再次如上所述。在这两个演化支中,也发现了一些事件,似乎既不是来自演化支A,也不是来自演化支B(中至右上)图3).
为了进一步研究这些模式,计算了所有重组事件的局部树。图4图中显示了四个样本区域,其中重组发生在演化支B中,a、B、c、d的标记与中对应图3B. a区是一个典型的例子,从a支系向B支系有许多明确的输入。属于B支系的菌株1显然从a支系输入了这个区域。在B区,两个菌株(1和15)都来自B支系,它们的输入序列是a支系的特征。图2),该区域对应两个事件,第一个菌株从A支系传入,第二个菌株也从A支系或第一个菌株传入。因此,两个导入与两个演化支的成员之间的距离较低(图3B).在c区域,2号品系似乎输入了既不是来自支系A也不是来自支系B的东西,因此与所有潜在供体的距离很高(图3B).品系2与其他品系有几个不同之处,这些不同之处分散在一个长895 bp的区域内。其余的基因组在整个区域几乎是相同的,所以另一种解释是菌株2是B支祖先序列的唯一代表。最后,一些基因组区域具有更复杂的进化史,因此很难推断发生了哪些重组事件。一个例子是编码噬菌体相关蛋白的区域d。一定发生了几次重组事件,以解释在该区域观察到的克隆谱系和系统发育之间的差异。
体外实验发现大约10%的重组事件包含ISR,它是导入序列中的短片段,其中序列与受体而不是供体相同。7号到9号我们在重组所识别的最清晰的重组事件中寻找ISR,也就是说,那些可以用两个演化支之间交换的简单场景来解释的事件。在线补充图S1显示了四个包含ISR的重组区域的例子。在分支A中,35个清晰的重组事件中有3个包含ISR,在分支B中,104个中有16个包含ISR。这是首次在体内检测到ISR的报道,发生重组事件的比例与实验室实验报道的相似。
两个渐进式基因组聚合幽门螺旋杆菌菌株
图2表明重组是渐进的,因为事件似乎分布在克隆谱系的所有分支上。我们假设进化支之间的重组可能导致两个进化支之间的基因组收敛。为了验证和量化这一点,我们比较了两个进化支基因组之间的当前平均距离与两个估算的共同祖先之间的距离。根据ClonalFrame的结果,推断出两个演化支的祖先序列,并计算出它们之间的距离,得到D=0.021308。这比目前两个进化支的基因组之间的平均成对距离(π=0.021213)略大。因此,在过去的3年时间里,由于两个支系拥有共同的祖先,因此比通过突变和与其他支系的重组而产生的分化效应更重要,因此产生了轻微的趋同效应。
使用先前描述的方法比较了两个估算的祖先基因组序列22日至25日当沿着基因组观察时,揭示了两个基因组之间距离分布的明显双峰性(图5).这表明,这两个感染源最初彼此相距约2.5%,但它们的基因组中约15%的基因组已经重组(在分支分化之前),从而形成了高度同源的区域。这种聚合可能是两个菌株在两个方向上重组的结果,我们可以根据我们在两个分支中观察到的重组量来估计这种重组发生的速率;在分支A的多样化过程中,4%的基因组位置被重组,分支长度总和为12.01年(图2).在进化支B中,22%的位置在15.89年的进化过程中重新组合。因此,这两个祖先品系的预期收敛率等于(4/12.01)+(22/15.89)=1.7% /年。这表明,这两种菌株在他们的共同祖先∼3年前之前已经同时感染了∼9年,因此,两种菌株中的一种感染发生在∼12年前,而另一种菌株在此之前已经存在了不确定的时间。
参与重组的基因
我们发现的重组事件被映射到完整的注释参考基因组F57上,F57也是hspEAsia群体的成员。23所有三种类型的重组事件都是这样分析的,即在共同祖先之前的事件,在分支A的多样化过程中,在分支B的多样化过程中(见在线补充图S2)。外膜蛋白被发现重组高于平均水平(Fisher精确检验,p=0.0111),特别是跳基因家族(Fisher精确测试,p=0.0208)(见在线补充图S3)。先前的研究表明,重组更常发生在正选择下的区域,特别是编码具有致病性作用的蛋白质的区域。35基因编码的外膜蛋白重组频率显著增加幽门螺旋杆菌.在外膜蛋白中跳编码大多数已知粘连蛋白的亚科幽门螺旋杆菌,是特别有趣的。5我们的结果与之前的报告一致,发现这些基因比基因组的其余部分更容易发生宿主内重组。
-系统
为了了解进化支A和B之间不同的重组率的机制,我们分析了R-M系统,这是细菌进化出的一种防御系统,用于识别和切割外源DNA,在转化过程中起着重要作用幽门螺旋杆菌.36在18个基因组中发现了149个R-M基因。其中,18个基因组共有6个,11个分支A特有,6个分支B特有(见在线补充表S3)。此外,在两个进化支共享的R-M基因中观察到不同的SNP模式(见在线补充表S4)。由此可见,两支演化支在R-M体系中存在明显差异,这或许可以解释它们在重组率上的差异。
讨论
植物宿主内进化的研究幽门螺旋杆菌主要是在同一时间点培养的两个或三个分离株上进行,或从同一患者中依次培养。3 - 6,39,40尽管这种方法提供了种群中重组、突变和重组的平均速率的估计,但它没有提供关于不同菌株如何利用这些过程来适应宿主的信息。我们所知道的唯一一项研究是,从同一宿主中分离出几个分离株,重点是基因组组成,而不是同源序列比较。41我们的研究的一个潜在的局限性是它是基于18个基因组序列,因此宿主内多样性可能只是部分采样。假设宿主内群体在胃中是一致的,并且每个基因组都是从这个群体中独立随机抽取的,那么一个只代表10%群体的菌株在我们基于18个基因组的研究中没有被采样的概率相对较小(p=0.15)。为了在0.05显著性阈值下降低这一概率,需要29个独立的基因组。如果一种菌株的出现频率更低,比如只代表5%的人口,那么在我们的研究中,采样或不采样的概率几乎是相等的,而需要59个基因组来保证采样。
在这里,我们已经表明,在一个胃的窦部的活组织检查中,存在两个不同感染的后代,从而形成了一个具有两个广泛不同分支的系统发育树。这一观察结果与经常感染多种毒株的报道一致。42-44当共感染发生时,菌株间重组成为可能,这导致宿主内微进化的速率比仅由从头突变所可能的要高得多,这导致了在比较来自不同人群的基因组时观察到的复杂的混合模式。32,45-49
所有的分离株在基因组水平上都是不同的,这两个分支的共同祖先可以追溯到2.8年和4.2年前。对这两个分支的祖先序列进行比较后发现,在共同祖先出现之前,重组已经进行了大约9年,这意味着这两个菌株的合并感染至少在12年前就开始了。这是对两种毒株开始合并感染的时间的估计,很可能在此之前很长一段时间内就存在一种或另一种毒株,可能是从幼儿时期开始的。它还假定,自共感染开始以来,两种菌株一直以相同的速度重组,然而,最初似乎可能是第二种感染菌株出现的频率相对较低,因此重组可能较慢。因此,最好将12年的估计值视为合并感染发生时间的下限。这一结果与受感染的宿主年龄为53岁的事实相一致,并表明在过去12年里,胃窦部没有强烈的瓶颈或克隆扫描。
进化变化主要是由两个进化支之间的同源重组引起的,其中一个的重组率比另一个高10倍。体外实验表明,转化的频率可以显著依赖于使用的供体和受体菌株。7号到9号这两种菌株在同一个胃中,应该有相同的重组机会,这表明重组率的差异可能是由于它们内在遗传特性的差异造成的。50我们的结果表明,不同的重组率可能是由于不同的R-M系统存在于两个分支。重组的总体效果是导致两个感染菌株之间的基因组收敛,无论是在两个进化支的共同祖先之前还是之后。在谱系的每个分支上都存在重组事件,这意味着在慢性混合感染的胃中,重组是一个连续的过程,涉及每个事件中单个短片段的转移。
进口土地的性质与以前的报道相似。平均输入尺寸为895 bp,这与以往的体外研究结果一致7号到9号在体内。3 - 5先前的体外研究报告了频繁的ISR导致供体和受体之间的序列嵌合。7号到9号在体内研究这一特性以前是不可能的,因为它需要了解供体和受体序列可能是什么,而在这里,我们第一次能够这样做。我们已经证明,事实上,它们以与体外实验相似的速度发生,影响约10%的进口。
我们发现一个频繁交换的基因编码一种噬菌体相关蛋白(图4D).该基因的完整进化史无法确定,但它似乎在过去3年里在菌株之间多次转移。这一结果表明,活跃的噬菌体感染和重复转移可以在单个胃中发生,而不会破坏细菌种群的稳定。自幽门螺旋杆菌可以通过自然转化获得DNA,噬菌体介导的转移对同源重组的重要性尚不清楚,值得进一步研究。
Met的抵抗在所有国家都很频繁幽门螺旋杆菌通常是由于RdxA的突变或截断。在我们的研究中,在没有抗生素挑战的情况下,尽管与met敏感谱系竞争,其中一个克隆仍然稳定地保持了met抗性。因此,对于全长版本的RdxA似乎存在弱选择。
在这项研究中,我们已经证明了利用全基因组测序来详细地得出关于基因改变机制的结论是可能的幽门螺旋杆菌基于从一次胃活检中取样的细菌。要得出关于自然选择作用的结论更加困难,因为我们还没有观察到足够多的事件,无法对哪些变化可能是适应性的做出可靠的结论。这也很难推测两个无性系的不同重组特征对它们短期或长期进化轨迹的影响。在大量患者中进行的类似研究将为基因交换在细菌在人类胃这种独特的恶劣环境中生存所起的作用提供前所未有的见解。
致谢
我们感谢小林一藏教授对限制性修饰基因分析的建议。
参考文献
补充材料
脚注
QC、XD、ZW、ZL各占一半。
调整通知王圣奇的隶属关系和资助部分已更新自在线首次发布。正确的作者是何丽华。
贡献者QC, XD, ZW, DF, SW和JZ构思了该研究。QC、LH、YL、YY、XL、YG、MZ、JL、WW进行实验室工作。ZL, XD, MN, ZL, MZ和XB对生物信息学组装管道有贡献。XD, QC和ZL对数据进行分析。QC, XD, ZW, ZL, DF和JZ撰写了论文。所有作者都阅读并批准了最终的手稿。
资金浙江省公共技术社会发展项目科技计划(No. 2010C33035)、国家“十二五”科技支柱计划重点项目(No. 2012BAI06B02)和SKLID基金(No. 2014SKLID102)资助。XD要感谢国家卫生研究所为健康保护研究股提供的资金。
相互竞争的利益一个也没有。
病人的同意获得的。
出处和同行评审不是委托;外部同行评审。