知道40%的lncRNA、circRNA有潜在的编码多肽(peptide)的能力吗?
前面咱们也讲到过一些lncRNA、circRNA,文章的质量高至CNS级别,大都和某些疾病息息相关,尤其非编码RNA的翻译话题越来越热,文章也多了起来,慢慢地成为了又一大研究热点,心动了没?
a.人体组织中特异性circRNA的分布;
b.circRNA翻译元件的分布;
c.细胞特异性的circRNA很丰富
在RNA-seq的结果中,习惯上我们将编码蛋白太短不足100个AA的RNA视为非编码RNA(ncRNA),但这一界定显然“错判”了很多RNA,比窦娥冤。
那如果我们要做lncRNA、circRNA的多肽研究的时候,如何下手呢?
(1)预测ncRNA是否存在sORF
咦,什么是sORF?就是small open reading frames (sORFs),就是短开放阅读框,即编码蛋白质的序列,以ATG开始–终止密码子结束。
(2)核糖体RNA测序技术(Ribosome Profiling)
判断一个lncRNA、circRNA是否编码多肽(peptide),最直接的方式就是定位其是否与核糖体相互结合,使用核酸酶消化RNA时,在翻译进行时的核糖体保护了大约30bp的RNA片段,将细胞中这些被保护的RNA片段构建成cDNA文库,再使用RNA-seq技术对文库中所有的片段进行测序,这样的数据库就可以查看ncRNA是否编码多肽了。
核糖体RNA测序可定量探测翻译中的RNA数量
(3)预测lncRNA、circRNA编码的网站
CPC?最近上不去,咱们介绍两个新的
①lncRNAtor:lncRNA编码预测
http://lncrnator.ewha.ac.kr/
②circRNADb:circRNA的编码能力预测
http://reprod.njmu.edu.cn/circrnadb/
登录网站,用circRNA的“NCBI转录本”号进行搜索,然后点击查看
会看到circRNA的DNA序列,以及编码的蛋白序列,然后去NCBI的蛋白BLAST一下,看看是什么功能的蛋白或者多肽。
发现其表达的蛋白是泛素特异性蛋白酶,提示了其多肽功能。
如果lncRNA和circRNA可以编码这么多多肽,那么这些多肽到底起着什么作用呢?等待咱们去进一步挖掘吧。