新研究揭示了20种不同近交小鼠品系的细节

发布时间:2023-04-06 17:45:03 栏目:生活

    导读 去年完整的端粒到端粒(T2T)人类基因组的完成强调了以前被认为是完整的基因组序列实际上根本不是完整的。此外,许多最近的基因组是用短读长

    去年完整的“端粒到端粒”(T2T)人类基因组的完成强调了以前被认为是“完整”的基因组序列实际上根本不是完整的。

    此外,许多最近的基因组是用短读长测序技术测序的,该技术将DNA片段分成短片段,通常长150-300个碱基对,然后与参考序列进行比较。虽然快速,准确且相对经济,但短读长方法通常会错过基因组的大部分,总体约为10%。缺失的片段包括高 G/C 含量和重复序列的区域,包括片段重复、简单重复和转座元素 (TE)。

    TE是已经移动到基因组中其他位置的重复序列,这些序列的迁移性对基因组变异有很大贡献。重复序列通常是结构变异(SV)形成的基础 - 由重复,插入,删除和倒置引起的基因组差异。当使用短读长测序(特别是那些由重复介导的测序)时,SV经常被遗漏,但它们可以在基因组失调和疾病中发挥重要作用。

    研究人员已经转向长读长测序来更全面地分析基因组,因为这些技术能够对更长的DNA片段进行测序,并且可以准确地捕获更完整的基因组图片。最近的进展提高了长读取的准确性和实用性,使研究人员能够研究以前未检测到的基因组特征,而不仅仅是人类。

    杰克逊实验室(JAX)和康涅狄格大学健康中心助理教授Christine Beck博士领导了一个团队,探索了另一个值得注意的物种小鼠的基因组,并揭示了20种不同近交系的细节,这些菌株对于为基于小鼠的遗传学和基因组学研究提供信息至关重要。

    小鼠品系之间的结构变异

    小鼠有自己的参考基因组,称为GRCm39,基于C57BL / 6J的序列,C<>BL / <>J是来自Mus musculus homeus亚种的菌株。但是许多常用的实验室小鼠品系也来源于另外两个亚种,Mus musculus castaneus和Mus musculus musculus,并且不同近交品系之间存在许多遗传差异。

    对于发表在Cell Genomics上的“不同小鼠基因组结构变异的分辨率揭示了由于转座元件引起的染色质重塑”中提出的工作,Beck博士选择了多种常用菌株,包括遗传多样性协作杂交(CC)和多样性远交(DO)小鼠面板的七个亲本创始人,六个遗传来源异常的CC菌株, 以及其他七种具有不同遗传背景的常用菌株。

    该研究的主要作者Ardian Ferraj是一名研究生,也是该研究的主要作者,然后组装了这20只小鼠的基因组,并使用这些序列来鉴定动物中存在的SV,这些SV将其基因组与C57BL / 6J参考的基因组区分开来。使用由Beck实验室成员Peter Audano博士开发的PAV程序,Ardian表明SV在小鼠基因组中普遍存在,并且对基因组变异有广泛贡献。事实上,与先前发表的来自不同小鼠基因组的单核苷酸变异相比,SV所含的受影响碱基数量几乎是其五倍。

    他们还发现小鼠基因组之间的SV比人类基因组之间的SV多样性大得多,这表明单个小鼠参考基因组不足以在小鼠品系之间映射基因组数据。重要的是,长读长测序对于捕获这种变异至关重要。在18种小鼠品系中,与短读数据相比,研究小组检测到额外的213,688次插入,64,277次缺失和97次长读倒。

    可转座元件和结构变化后果

    虽然只有少数TE仍然能够在人类基因组中动员,但它们在小鼠中更具流动性。正因为如此,Beck和她的团队专注于转座元素变体(TEV),他们发现它占所有SV的近40%,其中大部分(60%)是插入。有多种类型的TEV,称为短核元件与长穿插核元件(SINE和LINE),其大小可预测。在小鼠基因组中,LINE的发生率几乎是SINE的两倍,为47%至24%。

    由于其大小,LINE也贡献了小鼠基因组中近一半的可变序列内容,而非TEV SV仅贡献了24%,SINE贡献了2.1%。各种内源性逆转录病毒序列产生了剩余的28%的TEV。逆转录病毒是RNA病毒,其基因组被逆转录成DNA,然后将其插入基因组中。虽然目前许多逆转录病毒都与艾滋病和癌症等疾病有关,但正常的哺乳动物基因组含有大量来自数千年来逆转录病毒的DNA,称为内源性逆转录病毒或ERV,有助于驱动小鼠的基因组变异。

    那么所有这些基因组变异和活动的可能后果是什么?研究人员在已知基因组特征的背景下研究了SV,并预测了影响的严重程度。在基因序列中新检测到的SV中,绝大多数(94,863)在内含子内,内含子是从前mRNA中剪接出来的序列,因此它们不会改变蛋白质结构;1,469个位于基因两端的非翻译片段(UTR);和实际蛋白质编码序列中的510。

    他们还在特定基因Mutyh中发现了以前未检测到的逆转录病毒元件插入,Mutyh是一种与某些小鼠品系中已知突变特征相关的DNA修复基因。潜在的变异是未知的,但研究小组发现插入与Mutyh基因表达的显着降低有关。这一发现表明,未知的SV可以改变重要的基因组区域,并存在于与健康和功能相关的特征(包括疾病)相关的基因中。

    最后,与Jax研究员Laura Reinholdt博士合作,研究小组研究了TE对胚胎干细胞差异的影响。TE促进基因组多样性,它们的变异可能会改变菌株之间基因表达的重要方面。事实上,该研究发现,超过22,000个TEV与干细胞染色质可及性的显着变化有关,干细胞染色质可及性是基因表达的关键调节因子,来自10种遗传多样性小鼠品系的胚胎干细胞。

    再次关注一个具体的例子,他们研究了基因Slc47a2中的菌株特异性(CAST/EiJ)内含子插入,该基因伴随着菌株特有的染色质可及性信号。他们发现与缺乏插入的菌株相比,Slc47a2表达水平升高,具有菌株特异性转录本和多能性因子的可能结合区,表明TEV在早期发育中的重要作用。

    更完整的理解

    鉴于小鼠作为哺乳动物遗传学和人类疾病模型的重要性,有必要充分了解基因组变异的功能后果。小鼠品系基因组之间SV的全面检测和表征是这种理解的关键部分,Beck博士及其合作者产生的结果和数据为该领域迈出了重要的一步。

    作者为研究界提供了序列解析的SV资源,小鼠胚胎干细胞表达资源和染色质可及性数据,这些数据可能有助于进一步研究小鼠进化和感兴趣的基因组学潜在性状。

免责声明:本文由用户上传,如有侵权请联系删除!