增强子及超级增强子序列查找
来源/作者:普拉特泽-生物医学整体课题外包平台
一、什么是增强子?
增强子是指能够增加启动子活性, 从而增加基因转录效率的DNA序列。增强子分为细胞特异性增强子和诱导性增强子两种类型:细胞特异性增强子是在特定的细胞或特定的细胞发育阶段, 有选择性的调控基因转录表达。诱导性增强子在特定刺激因子的诱导下才能发挥起增强基因转录活性的增强子,。在我们NCBI第一讲视频也介绍了,增强子具有远距离效应、无方向性、无物种和基因的特异性、具有组织特异性、等特点。
图一、增强子结构示意图
二、增强子和启动子的相互作用
我们已经知道启动子决定转录的起始位点,而增强子决定转录的效率及转录的时间和地点,但是增强子如何促进启动子的转录,是转录领域里面悬而未决的问题。启动子的位置一般是确定的,即与基因之间有特定的距离和方向,增强子则不同,由于它的远距离效应,它可能与其调节的启动子相距数千Kb,可以位于基因上游或下游。那增强子是如何跟启动子相互作用从而影响基因的转录的呢?一般认为当处于非活性状态时,二者不会靠近,但在活性状态下,增强子通过形成环状结构而在三维空间上接近启动子,并将相应转录因子募集到该区域,从而促进基因表达。
(下图显示了增强子如何与启动子相互作用从而增强基因的表达。蓝色线条代表染色体,左边形成环状的这个区域叫做染色的凸环loop,这个环是怎么形成的呢?假设染色体上这个紫色区域就是一个基因,这个基因左边是它的基因的启动子promoter,在这个基因的上游区域或者下游区域会存在增强子即enhancer,这个染色体的这个凸环就是靠这个增强子和启动子之间的关联而形成的,一旦形成了这种折叠染色体凸环,增强子和启动子之间的距离就被拉进。它们又是如何保持这种结构关系的呢?这两个红色的锯齿状代表两个结构蛋白,上面这个锯齿状结构蛋白它锚定在增强子上面,下面这个锯齿状的结构蛋白它锚定在启动子上面,这两个蛋白连接在一起形成了一个二聚体的稳定结构,这个二聚体有助于染色体保持现在这种形状。
图中的梯形状的结构代表转录因子,在转录因子那节的视频中我们介绍了,转录因子分为通用转录因子和激活因子,通用转录因子只能激活很低水平的转录,细胞中活跃基因的转录通常远远高于本地转录,要达到所需的转录增强,通常需要激活因子来激活高水平的转录,而激活因子通常需要跟增强子结合从而才能达到激发高水平转录的作用。特定的转录因子(也就是激活因子)与增强子结合,而普通转录因子和启动子结合。激活因子结合到增强子上(图中红色五角星),增强子被激活,被激活的增强子进一步激活靶基因的启动子,远距离的启动子是如何被激活的呢?在增强子和启动子之间会有一个酶介,这个酶介叫Mediator protein中介蛋白,这个蛋白大约由26个蛋白组成的复合物,被激活的这个增强子通过中间这个蛋白复合体,将信号传递给启动子,从而激活启动子开始转录,开始转录以后在RNA聚合酶2的作用下就可以开始转录形成mRNA,同时这个增强子它也会在这个RNA聚合酶2的作用下形成eRNA。)
图二、真核基因转录调控(增强子和启动子的相互作用)
三、什么是超级增强子?
除了增强子是调控细胞基因时空表达关键的顺式作用元件外,2013年有科学家基于当时增强子的研究,第一次提出了超级增强子(Super-enhancer, SE)概念,并将相关研究结果发表在Cell期刊上。超级增强子(Super-enhancer, SE)是基因组中大量增强子富集的转录调控区域,能够大幅度地激活基因的表达,且具有较高的组织特异性。与普通增强子相比,超级增强子的区域跨度范围通常可达820Kb,远高于普通增强子的200-300bp跨度范围。此外,超级增强子比普通增强子具有更强的转录激活相关组蛋白修饰、辅因子及转录因子富集密度,可以富集高密度的关键转录因子(Master transcription factors)、Bromodomain containing4蛋白(BRD4)、辅因子(Mediator,cohesin)和增强子表观修饰标记(H3K27ac,H3Kme1等)、染色质修饰因子(P300、Pol2和DNAseⅠ等),通过这些特征我们可以识别增强子或者超级增强子。
图三、超级增强子结构示意图
四、为什么要研究超级增强子
一个课题最开始往往是研究某个基因的序列信息以及基因所行驶的功能作用,这些是属于基因的下游研究。但当下游研究累积到一定经验之后,大家往往开始着手于研究基因的上游调控机理,即不单关注某个基因如何影响细胞活动,更关注哪些因素影响这个基因的功能发挥。调控机理研究理论上会涉及多个层面的因素,例如:转录因子、增强子、蛋白激酶、miRNA、DNA甲基化、组蛋白修饰、lncRNA等。上节视频我们学习了转录因子的相关内容,而增强子跟转录因子一样,也会影响基因转录。其中普通增强子影响的基因范围比较小,而超级增强子会影响大量的基因,如果我们能抓住上游的超级增强子,也就意味着我们能拿捏下游很多的靶基因(打个比方:擒贼先擒王。。。),帮助我们去更好的挖掘基因的整个表达调控网络。从2013年至今,以SE为研究对象的高分文章不断涌现,文章已有6000多篇(虽然多,但是不算多,且由于疫情的影响2023年发文数量明显下降,非常具有研究前景),目前对于超级增强子的大部分研究是在恶性肿瘤中进行的,涉及到多种癌症类型包括白血病、结直肠癌/大肠癌、乳腺癌、肝癌、胶质瘤、肺癌等,表明其在恶性肿瘤发生、细胞分化、免疫应答等重要生物学过程中发挥着重要调控功能。
五、如何对增强子和超级增强子进行鉴定
我们要研究某个基因的增强子和超级增强子的功能,首先需要用实验(如经典的ChIP-seq实验)来识别目的样本中的增强子序列(增强子一般具有组织或细胞特异性,许多增强子只在某些细胞或组织中表现活性);然后基于基因敲除或基因干扰技术,研究SE的功能。
根据目前已有的研究,增强子区域有许多特定的特征,可以帮助我们鉴定基因组中的增强子,包括辅因子(Mediator、cohesion)、组蛋白修饰标记(H3K27ac和H3K4me1)、染色体修饰分子(p300)、BET家族蛋白(BRD4)、RNA聚合酶II等。Mediator是转录因子和RNA聚合酶II的桥梁,用于调节基因的转录;而cohesion是染色质三维结构的重要角色;H3K27ac可以识别大部分由主转录因子形成的超级增强子以及数据的准确,目前以 H3K27ac为标记的识别最为广泛;BRD4和p300是转录因子结合的共激活因子,同时P300作为组蛋白乙酰转移酶,是增强子活性标志物,能够通过染色质重塑来调节转录(为了更好地预测和表征增强子,应该并行研究多个特征,因为具有单一特征的区域也可能是其他顺式调控元件或基因编码区)。识别到增强子之后,利用ROSE软件,根据增强子转录活性标记分子结合水平强度的差异鉴定超级增强子和普通增强子,继而进行后续的功能实验。
图四、超级增强子鉴定流程
六、怎么通过数据库查找增强子和超级增强子序列
利用上述实验办法鉴定增强子和超级增强子耗时且需要投入大量财力,随着计算机的发展,逐渐开发出许多的增强子数据库,这些数据库可以帮助我们预测增强子的位置、所包括的活性修饰及可对增强子进行系统的整合和分析,后续也可以辅助验证CHIP实验数据。目前主要有这几个数据库可供使用:SEA(包含人类、 小鼠、果蝇和秀丽隐杆线虫、斑马鱼、鸡、黑猩猩、恒河猴、绵羊、非洲爪蟾和棘鱼等11个物种的增强子信息);dbSuper(包含人和小鼠的增强子数据);SEanalysis和SEdb(包含人的增强子数据),我们将给大家演示如何利用上述数据库进行增强子和超级增强子的预测,希望能给大家带来新的研究视角。大家想看版本的可直接点击↓↓↓
《【Up主爆肝输出】全网最全:基因的表达调控之—增强子/超级增强子(理论+在线数据库操作演示)。视频有一定深度,云里雾里的小伙伴可以把前面几期视频一起看完哦》
→→还可以和小伙伴加入交流群一起探讨哦