俗话说,好记性不如烂笔头,小编痛定思痛,决定先整理一份miRNA相关数据库的保姆级教程分享给大家,说不定哪天就用上了呢。好,上正餐!
1. TargetScan:http://www.targetscan.org/vert_72/
这是小编记住的第一个预测哺乳动物miRNA靶基因的数据库,该数据库利用3P-seq测序技术,确定转录本对应的3’UTR区。我们常用的是TargetScanHuman子库,进入数据库主界面之后,我们可以根据已知基因(输入基因symbol或Ensembl ID或转录本ID)预测靶向它的miRNA,也可以根据miRNA预测其靶基因。

以基因PARP1为例,在图1.2的搜索结果中,我们能看到它有3个转录本,最下面是这三个转录本的结构示意图,没啥意外的话直接选第一个最具代表性的就ok了。

点击之后可以查看上面的miRNA结合位点,如图1.3所示,黑色框表示该miRNA和目的基因有多个结合位点,查询页面有一个可下载的保守位点的列表,给出了最有可能的miRNA与PARP1结合位点的序列信息。

接下来,小编又输入miR-9-5p检索了它的靶基因(图1.4),共得到1388个包含保守位点的转录本,表格列出了它们对应的基因symbol和名称,靶基因按照背景得分由小到大进行排序,分值越小可能性越大。此外,表格还列出了靶基因上结合位点的数量以及结合方式,最后一列是相关的文献。其中,表格的第一、二列和Link to sites in UTRs列可以点击查看详细信息。

2.miRBase: http://www.mirbase.org/index.shtml
miRBase是最权威的miRNA公共数据库之一,储存了所有miRNA的序列和注释信息,这些数据都可以在Download页面进行下载,并且还可以预测靶基因。我们可以通过miRNA的名字、miRBase ID或其他关键字来检索miRNA,也可以根据基因组位置、物种组织或已知序列进行查询。

小编以has-miR-100为例,如图2.2所示,我们可以查看它对应的基因、序列、茎环结构、在基因组中的位置等信息。还可以看到这个miRNA前体产生的的两条成熟的miRNA序列has-miR-100-5p和has-miR-100-3p,以及TargetMiner、miRDB等不同数据库预测的靶标。

万能的b站有一个相关视频,链接在此https://www.bilibili.com/video/BV16x411e7NG?p=2,up主将所有检索方式都演示了一遍,并对结果进行了解读,想了解更多的朋友可以看一下哈,也就十多分钟。
3. ENCORI: http://starbase.sysu.edu.cn/
这是starBase的3.0版,小编搜的时候差点就错过它了,咋就还改名字了呢?这个数据库中的miRNA-ncRNA, miRNA-mRNA, ncRNA-RNA, RNA-RNA, RBP-ncRNA和RBP-mRNA 的互作都是基于CLIP-seq和降解组测序(针对植物)数据挖掘的。利用32种癌症的基因表达数据,我们还可以对RNA-RNA和RBP-RNA互作进行泛癌分析。此外,starBase v3.0还允许平台对miRNA、lncRNA、mRNA、假基因等进行生存和差异表达分析,功能非常强大(你可以不用,但我必须得提供,哈哈)。主页面也是做的简洁明了,可以说是很友好了。

咱们主要还是看一下miRNA-mRNA间的互作关系,以has-miR-22-3p为例,最左边是查询选项,包括参考基因组、物种(人或小鼠)以及其他支持数据。
图3.2 miRNA-mRNA查询界面
点击基因name之后(图3.3),可以查看靶基因的详细信息,如转录本ID、结合区域。在图3.2的结果列表中,还包含了PITA、miRanDa、TargetScan等七个软件的预测结果,以及相应的支持数据。
图3.3
最后一列是互作对在32种癌型中的泛癌分析结果,包括它们在每种癌症中的相关系数、显著性p值等信息,还可以将表达数据以散点图或箱式图的形式进行可视化,这一块做的还是有些简单随意的。

Besides,小编发现starBase还根据miRNA-target的互作,提供了miRNA的富集分析,包括GO、KEGG、Reactome等,真的是相当全面了。

4. miRCancer: http://mircancer.ecu.edu/index.jsp
搞生物信息,肯定是绕不开癌症的,所以小编还要给大家简单介绍一下这个肿瘤相关的miRNA数据库。miRCancer针对每种肿瘤,列出了相关的miRNA及其表达趋势,并给出了对应的文献,使用起来也是很简单的,没有什么难度。

点击Search miRCancer之后,我们可以输入自己感兴趣的miRNA 或癌症名称进行检索。这些数据都是开源的,可以点击Download下载txt格式,目前最新版本是2020年6月份的。

然而,有这么一个新的数据库觉得现有的miRNA工具还不够全面,并自称是第一个集miRNA–gene关联的注释信息、表达谱数据、预后图谱以及多种癌症和正常组织中的潜在作用机制于一身的综合性数据库,这好像是算法、数据库类型的文章惯用的写作套路吧。
好了,不卖关子了(毕竟,能看到这里的都是真爱呀),它就是miRactDB(https://ccsm.uth.edu/miRactDB)。小编越看越觉得,这文章一发完,后期维护就全看心情了,不造能坚持多久!

当然,miRNA数据库还有很多,像miRcode、miRDB、miRWalk等等,但一般来说,在平时的科研中,我们掌握其中的两三个就足够了,也没必要非得搞个自行车哈。
好了,小可爱们下次见了,( ^_^ )/~~拜拜!