在人类基因组中,只有不到2%的遗传信息编码蛋白质。尽管绝大部分的基因组为非编码区,这些区域依旧有着非常重要的生物学功能。非编码区包含着众多不同的功能单元,这些功能单元能够通过调控基因的表达,实现细胞的增殖和分化,从而通过一套基因图谱生成复杂的生物机体。非编码区中的主要功能单元包括启动子,绝缘子、增强子和沉默子。非编码区中的功能单元中的突变和结构变化,同样会对人体产生病变。所以,对非编码区的研究成为近年来遗传组学的重要方向。近年来,随着高通量测序技术的快速发展,大型的公共联合研究项目Encyclopedia of DNA Elements (ENCODE)【1】 对人类基因组中的功能单元进行了详细的定位和功能注释。通过全世界众多实验室的共同努力,对启动子、绝缘子和增强子在基因组中的位置、表观遗传修饰、功能和调节有了广泛的了解。然而,对于同样重要的功能单元沉默子,我们却知之甚少。绝大部分的研究都局限于对少量的和相对独立的沉默子的研究。由于缺乏一个对沉默子进行系统性研究的工具,对沉默子还有许多未解的问题。基因组中到底有多少沉默子?这些沉默子都在基因组中的哪里?沉默子对基因调节到底有多重要?沉默子和人类疾病有多大的关联?
2020年2月24日,来自美国斯坦福大学和荷兰莱顿医学中心的庞宝旭博士和斯坦福大学的Michael Snyder博士在Nature Genetics杂志上在线发表了题为Systematic identification of silencers in human cells的研究论文, 通过独创性地研发了一种对repressive ability of silencer elements (ReSE) 大规模高通量筛选技术,第一次对沉默子在基因组中有了宏观的认识【2】。
在ReSE-lentivirus筛选系统中,筛选的基因组区域被克隆到EF-1α启动子的上游。EF-1α启动子驱动与FK506融合的caspase 9修饰结合蛋白(FKBP-Casp9)的表达。当表达这种融合蛋白的细胞中加入二聚体分AP20187, caspase 9被激活从而诱导细胞凋亡。如果该系统中插入的基因组区域为沉默子,它们将抑制FKBP-Casp9的基因转录和表达,这些细胞将不会发生凋亡。通过对存活细胞和起始细胞进行高通量测序对比来识别潜在的沉默子(图1)。
研究人员通过对K562细胞基因组中染色质开放区进行富集以建立筛选的文库(文库大约占整个基因组的1%),因为染色质开放区域中可能存在被转录因子直接识别的沉默子。通过在K562细胞中进行筛选,研究人员发现沉默子在基因组中广泛存在(图1)。通过对不同组织细胞的研究发现沉默子的功能也有组织特异性,显示沉默子在细胞分化中可能也有重要的调节作用。在不同的组织细胞中,特异性沉默子被不同的转录因子识别从而调节基因表达。沉默子区域可能存在特异性的表观遗传修饰,比如H4K20me组蛋白修饰。通过CRISPR/Cas9敲除技术将沉默子从特定基因—如ABCC2和ABCG2—中完全删除,能够介导这些基因的上调。因为ABCC2和ABCG2基因在介导肿瘤细胞多药耐药有着重要作用 (图2),这些敲除沉默子的细胞对一些化疗药物产生耐药性,间接表明沉默子区域的突变可能对病人的个体化治疗有直接影响。进一步实验证明,沉默子也能通过染色质环路来远程调控基因表达。
综上,研究人员通过ReSE 筛选系统对基因组中沉默子的系统性筛选的初步研究,发现沉默子在人类基因组中大量存在并有重要的调节功能。为未来对基因组中沉默子的发现提供了一个高效的手段。沉默子的全基因组定位和功能研究将会为基因调节和对疾病的个体化诊断治疗提供新的思路。
在同期Nature Genetics杂志上,英国帝国理工学院 Mikhail Spivakov在“News & Views”专栏以 Silencers in the spotlight 为题作了推介【3】。
原文链接:https://www.nature.com/articles/s41588-020-0578-5