文献精读 | 揭秘基因组GC含量的进化史

发布日期:
2023-08-10
核酸

NUCLEIC ACID

核酸(nucleic acid)是由许多核苷酸单体聚合形成的生物大分子化合物,包括核糖核酸(RNA)和脱氧核糖核酸(DNA)。核苷酸单体又由五碳糖、磷酸基团和碱基构成。生物体中常见的碱基包括腺嘌呤(A)、鸟嘌呤(G)、胸腺嘧啶(T)、胞嘧啶(C),尿嘧啶(U)。其中,尿嘧啶存在于RNA中,而胸腺嘧啶存在于DNA中。它们遵守碱基互补配对原则,即G与C配对,A与T(DNA中)或U(RNA中)配对。


文献精读 | 揭秘基因组GC含量的进化史



GC含量是指生物完整基因组中胞嘧啶和鸟嘌呤所占的比例,它是核酸序列组成的重要特征之一。不同物种的GC含量各不相同,可以影响物种生态、分布、环境适应和生活方式[1]。真核生物基因组的GC含量变化范围相对较小,为30%-50%,而原核生物GC含量的变化范围则相对较大为20%-75%[2-4]。最低的Candidatus Zinderia insecticola 仅有13.5%,最高的Anaeromyxobacter dehalogenans 达到75%[5]。细菌基因组大小与否都可能富含GC或富含AT,但在一些系统发育组中,会有一定的趋势,即基因组较小的更富含AT,而基因组较大的土壤细菌往往更富含GC。





高低GC的分布原则



某一物种基因组内,GC的分布并不一定是均匀的。高GC比例总是分布在基因密集区或常染色质区,且高GC含量也表现出更好的耐碱性和耐高温性;而高AT比例区则多分布在基因贫乏区或异染色质。且GC含量高的基因倾向存在于GC丰富区,GC含量低的基因则倾向分布于GC贫乏区[4,6]。且基因编码区的GC含量大多数情况下高于编码区两侧的非编码区[7]


另一方面,在同一条DNA链中,相邻的C和G以磷酸二酯键相连被称作CpG序列,这些序列大多零散分布,且呈现甲基化的状态;而聚集在一起的则称为CpG岛(CpG island)。这类CpG岛通常处于未甲基化状态,主要分布在基因启动子区域,可以影响转录因子结合启动子的亲和性。如果被甲基化,则转录因子无法结合启动子进而影响基因表达。


GC含量差异化的重要价值









在进化过程中,GC含量在进化过程中也会发生一定变化,因此可以作为一种反映进化的重要指标。



关于不同生物之间的GC含量的差异目前有两种学说。第一个“中性学说”[2]认为,不同生物之间GC含量的差异是由于碱基的随机突变和漂移,胞嘧啶甲基化和脱氨基事件在细胞中频繁发生,DNA复制时会产生C和A的错配,进入下一轮复制后,发生碱基替换,原本的C被T代替,因此DNA序列的进化总趋势是GC含量减少,AT含量增加。第二个“选择学说”[8]认为,这种差异是由环境和生物的生活习性等因素综合作用产生。


早前曾有学者提出过同质段理论,基因组中含有比较固定均一或相似比例的GC碱基对的序列称为同质段(isochore)结构。同质段理论即是将人类基因组分为五个不同的同质段家族:L1、L2、H1、H2和H3,GC含量分别为<37%、37%-42%、42%-47%、47%-52%和>52%[9]。可以通过间接比较生物的同质段模式来确定它们的进化关系,例如发现变温动物基因组中的同质段结构与恒温动物基因组中的具有显著差异[10]。但后来的学者又提出这些家族之间会有很多重复,无法可靠地将基因组片段完全分类到各个家族。


01

GC含量可作为细菌分类的标准之一


当两种细菌的GC含量差异小于10%到12%时,其有可能是同源的[11]。细菌在长期进化过程中,为了适应不断变化的环境,可能会丢失基因从而造成GC含量的改变,且趋向于呈现出双峰模式(图A)。高GC和低GC的分支出现,可能表明高GC细菌和低GC细菌的祖先谱系可能经历不同的生存环境以及存在不同的适应机制[12]。例如GC含量减少可能与极冷环境的适应有关。

文献精读 | 揭秘基因组GC含量的进化史

图引自:Wenkai T, Bin L, Mengyun C, et al. Genomic Legacies of Ancient Adaptation Illuminate GC-Content Evolution in Bacteria.[J].Microbiology Spectrum, 2022, 11(1)


另外有研究表明,营养限制会减少细菌基因组大小并影响核苷酸组成[13]。新的研究也进一步证明,碳氮比低的土壤环境倾向于存在具有较低GC含量和较大基因组的土壤细菌群落;碳氮比高的土壤则倾向于具有较高GC含量和较小基因组的细菌群[14]。在对数百个动物、植物物种进行基因组序列分析后显示,在动物界,基因启动子GC含量随着演化历程呈现持续增长的趋势,但是在植物界却表现出降低趋势[15]




02

GC含量能够影响转基因植物中基因的表达


科研人员在利用现代分子技术研究植物基因表达时,还发现GC含量能够影响转基因植物中基因的表达。由于某种生物的基因组GC含量具有特定特征,当插入外源基因后,其GC含量和其两侧的原本的序列的GC含量不一致,植物自身会识别到这种差异,进而抑制该外源基因的表达,造成基因沉默。


随着现代分子技术的发展,人们对基因及基因组的研究日益增多,基因的人工合成也经历了数次迭代。从初代的亚磷酰胺三酯合成法,到基于芯片的二代合成,再到超高通量合成的第三代合成,以及最新的酶促合成。初代合成技术虽然已经十分成熟,但是在基因合成过程中,面对GC含量高或低的基因,合成的难度依然是一个挑战。






德奥平长难基因合成服务


创新探索/技术先驱/精准合成/稳定交付


高GC含量的基因片段,一方面会对退火温度要求很高,另一方面富含GC的部分容易形成二级结构,DNA聚合酶也更倾向于在这种地方停滞,所以对合成和测序都有很大的影响。如果AT含量高的话,特别是在接头的部分富含AT,那么非常容易发生错配,自然合成也有可能失败。

针对于高难度基因合成的难点痛点,德奥平生物通过自主研发优化了基因合成方法,大幅提高了高难度基因的重组稳定性及克隆阳性率,可帮助客户精准完成毒性基因以及GC含量20%-75%的基因合成服务。

文献精读 | 揭秘基因组GC含量的进化史


文献精读 | 揭秘基因组GC含量的进化史


文献精读 | 揭秘基因组GC含量的进化史



参考文献:

[1]. Mann S , Chen Y P P .Bacterial genomic G+C composition-eliciting environmental adaptation[J].Genomics, 2010, 95(1):7-15.

[2]. Sueoka,N.On the genetic basis of variation and heterogeneity of DNA base composition[J].Proc Natl Acad Sci U S A, 1962, 48(4):582-592.

[3]. Rd H I .Whole-Genome Random Sequencing and Assembly of[J].Science, 1995.

[4]. Ikemura.Codon usage and tRNA content in unicellular and multicellular organisms.[J].Molecular biology and evolution, 1985

[5]. Jon B , Vegard E , Ola B ,et al.Modeling of the GC content of the substituted bases in bacterial core genomes[J].Bmc Genomics, 2018, 19(1):589.

[6]. Ikemura T , Aota S I .Global variation in G+C content along vertebrate genome DNA. Possible correlation with chromosome band structures.[J].Journal of Molecular Biology, 1988, 203(1):1-13.

[7]. Aota,Shin-ichi,Ikemura,et al.Diversity in G+C content at the third position of codons in vertebrate genes and its cause[J].Nucl Acids Res, 1986.DOI:10.1093/nar/14.16.6345.

[8]. Bernardi B G .Compositional constraints and genome evolution[J].Journal of Molecular Evolution, 1986.

[9]. Cohen N , Dagan T , Stone L ,et al.GC Composition of the Human Genome: In Search of Isochores[J].Molecular Biology and Evolution, 2005, 22(5):1260-1272.

[10]. Costantini M , Auletta F , Bernardi G .Isochore and gene distribution in fish genomes[J].Genomics, 2007, 90(3):364-371.

[11]. M.O.D. Goodfellow, A.G., Roots of bacterial systematic. HDB NEW BACTERIAL SY. 1993, London: Academic Press. 3-54

[12]. Wenkai T, Bin L, Mengyun C, et al. Genomic Legacies of Ancient Adaptation Illuminate GC-Content Evolution in Bacteria.[J].Microbiology Spectrum, 2022, 11(1)

[13]. Giovannoni S J , Thrash J C , Temperton B .Implications of streamlining theory for microbial ecology[J].The ISME Journal, 2014, 8(8):1553-1565.

[14]. Chuckran P F , Flagg C , Propster J ,et al.Edaphic controls on genome size and GC content of bacteria in soil microbial communities[J].Cold Spring Harbor Laboratory, 2021.

[15]. Zhang J S , Wang H Q , Xia J ,et al.Coevolutionary insights between promoters and transcription factors in the plant and animal kingdoms[J].Zoological Reseach, 2022(005):043.


咨询IVD原料及科研服务产品请通过以下方式与我们联系——




客服热线:185 1363 7192
销售热线:186 1089 6066
售后热线:185 1363 7531
订购邮箱:order@dia-up.com
官方网站:www.dia-up.com

文献精读 | 揭秘基因组GC含量的进化史

                                                                            

                                                                               德奥平生物      

   

DIA-UP

BIOTECH
















平生物成立于2012年,拥有超过10余年经验的专业技术研发团队,荣获多项发明专利。公司已构建体外诊断原料研发平台(涵盖引物及探针合成、核酸分子检测原料、免疫试剂原料、生化试剂原料、血凝试剂原料、荧光免疫层析POCT大板、生化试剂大包装、血凝试剂大包装、校准质控品等10大产品体系)、自动化高通量DNA读写平台、RNA智能设计与合成平台、蛋白抗体制备平台、科研试剂耗材供应平台等五大核心技术平台。


德奥平生物采用10万级/万级净化车间,进行产品生产和包装,严格执行ISO13485:2016质量管理体系规范,秉持“匠心品质,成就客户”的发展理念,致力于为体外诊断和科研领域客户,持续提供高质量的产品和服务。




相关推荐

“心”生代NT-proBNP配对抗体与卓越稳定的校准品蛋白原料上市!
B型利钠肽(BNP)及N末端B型利钠肽前体(NT-proBN...
生化诊断解决方案|CRP天然活性蛋白原料与测定试剂——破解“生化危机”的利器!
人体就像一个运作周密的国家,正常情况下一切井然有序,但难免会...
解锁多平台,实力更出圈!德奥平糖化血红蛋白测定原料完整解决方案请查收
糖化血红蛋白HbA1c糖化血红蛋白(HbA1c)是人体血液中...
卓然出众!德奥平拳头产品合集,一文get各路锦囊,即刻收藏不迷路
01特殊蛋白及小分子原料系列打破进口依赖,全平台多样化应用,...