DeepM6ASeq的安装及使用方法

一、软件下载安装

1.从https://github.com/rreybeyb/DeepM6ASeq网址下载DeepM6ASeq安装包,之后解压安装包。

下面简要描述data,demo_test和result文件夹内容:

  • data: 这个文件夹下存储了人,鼠和斑马鱼的训练模型的数据。

  • demo_test:

  – test.fa: 这个文件用于测试脚本

  – expected results:

    – predout.tsv: 预测结果文件

    – sal.out: 显著图结果文件

    – sal_heatmap: 可视化显著图

  • result:

  – trained_models: 存储人,鼠和斑马鱼训练完成的模型。

  – tomtom: TOMTOM将训练得到的motif与已知motif比对的结果。

  – RSAT: 存储训练得到的motif簇。

2. 安装DeepM6ASeq的依赖包。首先确定自己的python是python 3.x版本的。接下来安装numpy, pytorch以及 scikit_learn。笔者推荐利用miniconda创建虚拟环境安装这些依赖包,下面是笔者安装时利用的命令。

conda create -n py3.7 python=3.7 -y

conda activate py3.7

conda install numpy

conda install pytorch

pip install scikit_learn

pip install Bio

conda install r-ggplot2 -y

conda install r-data.table -y

二、软件使用

1.第一个功能是训练模型。

命令:

python main_train.py -m model_type -pos_fa pos_fa -neg_fa neg_fa -od out_dir

参数:

  • -model_type: 这个参数可以指定为cnn 或者 cnn-rnn。

  • -pos_fa/neg_fa: 这个参数需要阳性样本/阴性样本的fasta文件,并且要求序列长度不超过101bp。

  • -od: 这个参数指定输出文件目录

2. 第二个功能:预测序列是否含有m6A位点。

命令:

python main_test.py -m model_type -infa input_fa -md model_dir -outfn out_fn

参数介绍:

  • -model_type: 这个参数可以指定为cnn 或者 cnn-rnn。

  • -input_fa: 需要检测样本的fasta文件, 序列长度不超过101bp。

  • -model_dir: 模型文件的目录。

  • -out_fn: 输出文件名。

3. 第三个功能:画m6A序列显著图

命令:

python saliency_map.py -m model_type -infa input_fa -md model_dir -outfn out_fn

Rscript saliency_heatmap.R saliency_map_out pdf_name

参数介绍:

  • -model_type:指定模型类型为cnn 或者 cnn-rnn。

  • -input_fa: 需要检测样本的fasta文件, 序列长度不超过101bp。

  • -model_dir: 模型文件的目录。

  • -out_fn: 输出文件名。

  • saliency_map_out:saliency_map.py脚本的输出文件

  • pdf_name:保存的图片名称

注意:saliency_map.py脚本用来得到给定序列的显著图,结果的可视化是利用saliency_heatmap.R脚本实现。

4. 结果评估

针对预测结果评估,作者分别给出了哺乳动物,人,鼠和斑马鱼的阈值,分为中等,高,很高这三个等级,分别对应模型特异性为90%,95%,99%。

 Moderate High Very high
 Mammalian 0.725 0.818 0.929
 Human       0.772 0.841 0.92
 Mouse       0.724 0.813 0.89
 Zebrafish 0.715 0.82 0.9

生物信息学

R包intePareto

2021-9-30 19:16:12

网课分享

TCGA数据库SNP突变数据分析视频(生信自学网)免费下载

2019-10-8 15:19:05

声明 本网站部分文章源于互联网,出于传递更多信息和学习之目的转载,并不保证内容正确或赞同其观点。
如转载稿涉及失效、版权等问题,请立即联系管理员;我们会予以修改、删除相关文章,请留言反馈
Notice: When your legal rights are being violated, please send an email to: [email protected]
2 条回复 A文章作者 M管理员
  1. 学术辣鸡

    我还以为网站不再维护了

  2. 学术辣鸡

    终于更新了!

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索