投稿问答最小化  关闭

万维书刊APP下载

“快得抓不住”?转座子的研究进展

2023/2/10 17:53:09  阅读:218 发布者:

Barbara McClintock曾将它们称为“调控元件”,她所使用的术语也许比今天更常用的术语——转座子(TE)更具预见性和描述性。在许多生物体中,包括植物、动物(哺乳动物和其他动物)和细菌等不同的进化支,TE是基因组结构和调控的主要组成部分。在人类中,大约45%的基因组由TE组成,其中大部分是逆转录转座子;而在小鼠中,TE占基因组的37%TE并不是进化垃圾,它对基因组和转录组有各种影响。即使在哺乳动物基因组中,许多TE处于失活状态,但多种TE(如LINEAlu)仍然显示为转座激活[1, 2]。这可能是该物种正常遗传变异的一部分,但更常见的是与不良结果有关,如发育障碍、遗传病和肿瘤形成。为了防止这种现象,TE的活性和表达在许多基因组中有专门的调控机制,受到严格的调控。例如,即使几乎全基因组去甲基化和常染色质区域形成,在发育过程中对TE的抑制也通常丝毫不减[3]

近年来,与TE有关的研究在经历最初的激增之后,发表的论文数量自2013年以来持续下降(基于PubMed列出的论文数量)。相比之下,即使我们不考虑与COVID-19大流行有关的大量研究,研究论文数量以及其他领域的研究也呈现总体稳定增长。虽然TE在许多类型的生物活动中仍然是新颖且重要的信息来源,但研究工作未能满足人们对其在基因组中重要性的理解。这种下降的潜在原因之一是TE对基因组重要的属性:作为重复元件,与串联重复不同,它分散在基因组中,对TE的深入研究需要越来越多的专业工具和方法来产生新的见解[4, 5]。例如,由于个别TE实例对局部基因组区域的潜在影响,如通过调节基序(如转录因子结合位点)的贡献,将TE活性作为单个元基因来分析可能会导致不充分或误导性的结果。此外,如前所述,许多TE在生殖细胞和体细胞中都有活跃的转位,通常会产生大规模的结构变异,如果不对单个细胞或生物体进行检查,就很难正确捕获这些差异。使用生物的参考基因组而不考虑这种转位的可能性,可能会导致错过TE研究的机会。克服这些挑战可能需要对公认的方法进行广泛的修改或调整,这并非等闲之事。

TE是基因组结构和调节的主要组成部分

尽管已发表的TE研究有所减少,但近年来出现了越来越多的计算工具,旨在为TE研究者面临的问题创建定制的解决方案[5]。在批量RNA测序中,由Hyun-Hwan Jeong等人研发的SalmonTEWan R Yang等人研发的SQuIRE等工具,使得TE分析有了长足的进步。这些工具改进了位点特异性定量,使数据更加精确。由于产生的数据更复杂,使用单细胞测序的TE研究也持续优化。此前,Jiangping He及其同事提供了scTE数据管道,允许在单细胞RNA-seq数据的宏基因水平上对TE进行定量。最近,Rocío Rodríguez-QuirozBraulio Valdebenito-Maturana发表了soloTE,它可以在特定基因座水平上对单细胞数据中的TE表达进行定量,以细化这类分析。Mikhail BiryukovKirill Ustyantsev创建了DARTS,用于在基因组组装中搜索与结构域相关的逆转录子,以分析编码多肽的逆转录子和包含特殊结构域的序列。同时,这类开发工具仍有很多改进的空间。例如,在一项涉及多种算法和数据管道(包括上述的SQuIRESalmonTE)的基准分析中,Natalia Savytska等人整合了转录起始点概况数据,以便更准确地鉴定和量化特定TE表达[6]。由于这些创新,有希望加快我们对TE的理解。

总之,TE研究仍然是一个至关重要的、但未被充分重视的研究领域。克服从事和理解TE研究的障碍是一个重要的前景,这需要不同生物学科的众多研究人员共同努力。这就是为什么我们想吸引你注意新一期BMC基因组学合集,标题为 "转座子",以强调我们目前不断增长的TE知识。

参考文献:

1. Chen D, Cremona MA, Qi Z, Mitra RD, Chiaromonte F, Makova KD. Human L1 Transposition Dynamics Unraveled with Functional Data Analysis. Mol Biol Evol. 2020 Dec 16;37(12):3576-3600. doi: 10.1093/molbev/msaa194. PMID: 32722770; PMCID: PMC7743743.

2. Stenz L. The L1-dependant and Pol III transcribed Alu retrotransposon, from its discovery to innate immunity. Mol Biol Rep. 2021 Mar;48(3):2775-2789. doi: 10.1007/s11033-021-06258-4. Epub 2021 Mar 16. PMID: 33725281; PMCID: PMC7960883.

3. Greenberg, M.V.C., Bourchis, D. The diverse roles of DNA methylation in mammalian development and disease. Nat Rev Mol Cell Biol 20, 590607 (2019). https://doi.org/10.1038/s41580-019-0159-6

4. Bourque, G., Burns, K.H., Gehring, M. et al. Ten things you should know about transposable elements. Genome Biol 19, 199 (2018). https://doi.org/10.1186/s13059-018-1577-z

5. Goerner-Potvin, P., Bourque, G. Computational tools to unmask transposable elements. Nat Rev Genet 19, 688704 (2018). https://doi.org/10.1038/s41576-018-0050-x

6. Savytska N, Heutink P, Bansal V. Transcription start site signal profiling improves transposable element RNA expression analysis at locus-level. Front Genet. 2022 Oct 21;13:1026847. doi: 10.3389/fgene.2022.1026847. PMID: 36338986; PMCID: PMC9633680.

Gökhan Karakülah & Doğa Eskier

Gökhan Karakülah博士是一名计算生物学家,专攻下一代测序和多组学分析。Karakülah博士的研究集聚焦于非编码基因和重复元件,特别是转座子,以及它们在生物过程中的作用,如发育和疾病。

Doğa Eskier是一名博士生,专门从事计算生物学领域的研究。他们的研究重点是对非编码基因组元件的下一代测序和多组学分析,尤其是转座子。

转自:BMC科研永不止步”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com