英文原题:Direct Nanopore Sequencing for the 17 RNA Modification Types in 36 Locations in the E. coli Ribosome Enables Monitoring of StressDependent Changes
供稿人:马毅骢 北京大学
大家好,今天为大家介绍一篇 ACS Chemical Biology 文章,标题为“Direct Nanopore Sequencing for the 17 RNA Modification Types in 36 Locations in the E. coli Ribosome Enables Monitoring of StressDependent Changes”,文章的通讯作者是来自犹他大学的 Aaron M. Fleming 教授和 Cynthia J. Burrows 教授。RNA的化学修饰是调控细胞内基因表达的重要机制,而传统的RNA修饰鉴定方法虽然能借助高通量的测序手段找到区间内的多个修饰位点,但一次测序通常只能鉴定一种或一类修饰,故难以进行多种修饰共同调节细胞活动的研究。以大肠杆菌的16S和23S rRNA链为例,其上具有36个化学修饰位点,共17种不同结构,这些RNA修饰在外界刺激下表现出高度的动态性。
在本工作中,作者团队利用蛋白质纳米孔传感器和解旋酶刹车进行RNA测序,实现了对细菌rRNA上所有修饰的同时监测。通过测定纳米孔电流水平、碱基识别和解旋酶滞留时间,研究者以未经修饰的人工合成rRNA以及敲除了RNA修饰写入酶的突变菌株作为对照,成功找到了各类RNA修饰的特征读出。基于以上技术,作者团队探究了在代谢物刺激和低温刺激下,大肠杆菌rRNA修饰的动态图谱。特别的,16S rRNA 1402位的m4Cm修饰在两种刺激条件下都减少了。借助解旋酶滞留时间的变化,作者团队发现N4甲基基团的丧失是m4Cm修饰下调的根本原因,而2'-OMe基团则不受影响。从功能角度看,这种修饰稳定了核糖体与mRNA密码子在P位点的结合,从而增加了翻译的准确性。此外,大肠杆菌基因组有七个rRNA操纵子的变体,作者团队找到了rRNA修饰读出与七种操纵子变体的对应关系,确定了操纵子特异性对11个假尿嘧啶修饰的动态变化有何种影响。该研究表明,使用纳米孔测序技术在一条RNA链上直接监测超过16种RNA修饰是可行的,这为表观遗传学的研究提供了一种强有力的工具(图 1)。
图 1: 使用纳米孔测序技术鉴定多种 RNA 修饰的示意图
利用纳米孔技术直接测序RNA具有在一条核酸链上找到复数修饰类型的潜力。纳米孔RNA测序技术通过电泳将RNA链通过一个小孔径的蛋白质纳米孔。当核苷酸通过蛋白质的狭窄区域时,离子电流会根据序列发生变化。离子电流水平随后通过循环神经网络进行解卷积,得到碱基序列的读出。大约五个RNA核苷酸会被视为一个分析单元,即k-mer。纳米孔测序的进行需要一种依赖ATP的3',5'-解旋酶来减慢RNA通过纳米孔的速度,确保仪器有足够的时间记录到微小的电流水平差异。需要指出的是,现有的RNA碱基识别算法是基于标准RNA序列进行训练的,故不具备发现未知修饰的能力。不过,通过对比标准RNA样品与带有修饰的RNA样品在碱基识别、离子电流和滞留时间等参数中的特征与差异,我们就能鉴定到已知的RNA化学修饰。
在这项工作中,研究者将测序的重点放在大肠杆菌的16S和23S rRNA上。根据已报道的文献,大肠杆菌 rRNA 中有17种化学修饰,它们的结构式和修饰位点可参阅图2。本工作着重关注如何利用纳米孔测序技术对同一RNA链上的多种修饰进行检测和定量分析。这是本领域首次将多达36个修饰位点的碱基识别、离子电流和解旋酶滞留时间等特征进行标注与分类,并利用这些发现来探讨在代谢或冷休克应激后,大肠杆菌的rRNA中是否以及如何发生修饰的变化(图2)。
图 2: 大肠杆菌16S与23S rRNA中所有化学修饰的示意图
首先,作者团队借助多种公开的算法对RNA纳米孔测序的原始数据进行处理。其中,研究者使用从rrnA操纵子中获取的16S和23S rRNA进行体外转录并测序,以提供没有修饰的空白对照。作者团队使用了minimap2以将测序数据与rrnA操纵子的序列进行比对,并使用SAMtools对测序结果进行排序,最后使用Integrative Genomics Viewer对修饰信息进行可视化处理。作者团队还使用了Nanopore-Psu16和ELIGOS2对碱基识别数据进行定量分析。最后,研究者使用了Nanopolish、Nanocompore和Tombo等程序对离子电流和滞留时间数据进行分析和定量。
商业化的纳米孔测序系统是以3'端至5'端方向对RNA链进行测序的,这会对数据质量产生影响。首先,大量工作已经证明从RNA链的3'端开始测序将有更高的读取深度,而幸运的是,大部分rRNA修饰位点位于16S和23S rRNA链中靠近3'端的部分。其次,RNA 修饰必须先经过解旋酶再进入纳米孔,如果修饰改变了酶的动力学特征,它所产生的影响会在修饰位点前约11个核苷酸处被观察到,而非该修饰经过纳米孔时出现。在电流水平数据中,RNA修饰可能会对位于k-mer中心位置的电流水平产生影响,这会导致距离较近的修饰位点间互相干扰的问题。基于在36个大肠杆菌rRNA修饰位点观察到的碱基识别、离子电流和滞留时间数据的特征,大部分RNA修饰可被成功识别。其中,17个修饰位点位于与其他修饰相距5个或更多核苷酸的主序列上,因此这些修饰位点所产生的对测序原始数据的扰动更容易被识别到。另一方面,有19个修饰位点与序列中的另一个修饰相距5个或更少的核苷酸,它们各自的特征,尤其是在离子电流和解旋酶滞留时间数据中,很难被确定。这种情况下,研究者需要构建敲除了RNA修饰酶的突变菌株来作为对照组,以排除距离较近的化学修饰间的干扰。
按照以上方法,作者团队能够系统地确定所有大肠杆菌rRNA修饰的特征,但是也存在少数例外。比如,在16S rRNA中,存在两个由同一个甲基转移酶写入RNA的m62A残基,分别位于1518和1519位点;尽管它们产生的电流特征很难解析,但通过碱基识别数据可以进行定量分析。其次,在23S rRNA中,存在Ψ1911、m3Ψ1915和Ψ1917这三个由同一合成酶催化的假尿嘧啶修饰。对于这些修饰,研究者虽然无法确定纳米孔离子电流的特征,但依然能使用碱基识别数据进行其鉴定和定量。最终,作者团队确定了27种修饰的碱基识别特征、28种修饰的纳米孔离子电流水平特征和26种修饰的解旋酶滞留时间特征。这些特征将在接下来的研究中用于监测大肠杆菌在应激条件下rRNA修饰的动态变化(图 3)。
图 3: 对大肠杆菌rRNA上的各类修饰进行纳米孔测序后的初步结果
根据先前的研究,大肠杆菌在应激条件下会发生数量可观的rRNA修饰变化。具体而言,代谢应激可使用含有0.5%葡萄糖的M9培养基在37度下对细菌进行20小时的有氧培养来诱发,而低温应激则可在37度下有氧培养细菌20小时后,再将其置于20度中继续培养1小时来诱发。为了对RNA修饰进行定量分析,作者团队使用了多种算法来处理数据。比如,Tombo算法通过比较细菌rRNA与无修饰的rRNA之间的电流水平来量化RNA修饰。基于电流水平的碱基识别数据也可以用于RNA修饰的定量分析。ELIGOS2算法则可通过比较细菌rRNA链与空白rRNA链间特定碱基上的ESB误差来进行修饰的定量分析。Nanopore-Psu算法则是基于多数细菌rRNA训练的、用于预测特定位点上Ψ修饰的工具。在确认基于以上算法的RNA修饰定量流程所产出的数据在常态细菌rRNA上具有良好的可重复性后,作者团队对每种应激条件进行了重复数据集的分析,并使用t检验找出具有显著变化的位点。在图4中,这些变化以颜色编码,黄色表示降低的显著性较低,红色表示降低的显著性较高,绿色表示增加的显著性较低。需要注意的是,不同分析算法有时会给出的定量结果,这提示我们使用纳米孔测序技术鉴定RNA修饰有局限性(图4)。
图 4: 应激条件下大肠杆菌rRNA修饰的动态变化
在众多修饰中,1402位的m4Cm修饰在两种应激条件下均发生了显著下调,研究者因此对该修饰进行了深入研究。从化学角度看,该修饰的两个甲基分别位于核苷酸的碱基和核糖上,而m4Cm修饰的消失究竟是由哪个甲基基团的丢失引起的,便不得而知。使用传统方法(如质谱)研究核苷酸上单个甲基的变化有很高的挑战性,而纳米孔测序技术能通过解旋酶滞留时间的变化对甲基修饰的位置进行辨别。对常态细菌rRNA的测序发现,m4Cm修饰可引起两个滞留时间的异常峰,因此作者团队假设,这两个信号一个是由碱基甲基基团引起的,另一个则是由糖甲基引起的。有趣的事,在与对照组进行统计分析时,应激条件下的大肠杆菌rRNA只呈现了单个滞留时间的变化峰,从而支持了同一个甲基基团在两种应激条件下从同一位点丢失的推论。研究者进一步构建了敲除 rsmH 甲基转移酶的菌株,以获得碱基部分不带有甲基的m4Cm修饰样品。结果表明,突变菌株rRNA的滞留时间特征与应激细菌的rRNA是相似的。这表明,纳米孔测序技术拥有解析RNA修饰的细节变化的能力(图 5)。
图 5: 解旋酶滞留时间可用于鉴定RNA修饰中甲基丢失的位置
大肠杆菌基因组中有七个rRNA操纵子(rrnA~H),它们的碱基序列有少量差异,并被认为在不同生物过程中发挥作用。传统的RNA修饰鉴定方法会把所有的修饰位点映射到rrnA上,因此丢失了特定修饰位点在不同rRNA变体上呈现不同变化的信息。基于纳米孔测序技术的RNA修饰鉴定可精确还原每种rRNA上特定修饰的动态变化,进而揭示更为复杂的应激调控机制。首先,作者团队测定了应激条件下不同rRNA操纵子变体的表达水平。结果表明,那些离复制子较远的操纵子(rrnH、D和G)呈现明显地表达上调,而那些离复制子较近的操纵子(rrnA、rrnB和rrnE)的表达水平则会下降,这与先前的报道是一致的。之后,研究者将假尿嘧啶修饰(Ψ)这一最为常见的RNA修饰定位到全部七个rRNA变体上,发现不同变体上Ψ的频率并不相同。具体而言,rrnA变体的23S Ψ746 频率高达80%,而该修饰在rrnC变体中的频率则低至67%。不仅如此,23S Ψ2457修饰在全体rRNA中的变化呈现下调,但实际上,这一变化主要由rrnD变体贡献,而其他变体上该修饰的变化并不显著。此外,23S Ψ746修饰在全体rRNA中的水平并未有明显变化,但实际上,这是由于该修饰在rrnH变体中大量减少而在其余变体中少量增加所带来的中和结果。因此,纳米孔测序技术为RNA修饰的鉴定提供了更高的精度(图 6)。
图 6: 不同大肠杆菌rRNA启动子变体中RNA修饰的动态变化
综上,本工作使用商业化的纳米孔测序平台对大肠杆菌rRNA进行了测序。作者团队评估了在RNA测序过程中同时鉴定和定量分布于36个位点上的多达17种不同化学修饰的能力,并成功找到了每种修饰对应的纳米孔测序读数特征。值得注意的是,这种高通量的RNA修饰鉴定之所以能完成,离不开先前工作对大肠杆菌rRNA上所有修饰的确认。换言之,使用纳米孔技术测定RNA修饰对先验知识有很高的要求,故该方法不适合发现新的化学修饰,但在绘制RNA修饰的动态图谱中有较大价值。因此,作者团队详细研究了应激条件下大肠杆菌rRNA中修饰的变化,并获得了传统方法难以达到的精度。可以预见,纳米孔测序技术将在表观遗传学的研究中发挥更多作用。
转自:“ACS美国化学会”微信公众号
如有侵权,请联系本站删除!