1. sci666首页
  2. 实用技巧
  3. 生物信息学

详细介绍如何将二代测序原始数据上传SRA

由于实战演练操作,图文有些长。另外图片看不清的话,请看文字说明,自己跟着文字操作说明完成一遍即可理解,或将图片点开后放大,也可以登录网页版微信通过电脑观看。如还有疑问,请后台留言。
在二代测序已经普及的年代,经常听到有人咨询怎样将原始数据上传NCBI的问题。很多人可能觉得数据上传得要生信分析员这种专业人士才能做到。其实数据上传没想象那么难。本期,我们将带你一步步将原始数据提交NCBI只需以下三步!轻轻松松,新技能get !
详细介绍如何将二代测序原始数据上传SRA
1、注册并登陆NCBI帐号;
2、申请BioProject以及BioSample号;
3、创建SRA提交任务以及上传数据。
在提交之前,有几个重要概念是需要我们先了解的。
BioProject主要描述测序项目的研究目的,不同类型的数据(如基因组和转录组)可以放到一个BioProject下。申请成功后,NCBI会给一个类似PRJNA248299这样的号,如果申请过程遇到问题,可以写信给他们的工作人员(genomeprj@ncbi.nlm.nih.gov ),一般他们都会及时回复的。
BioSample用来记录测序所用的生物材料(即样品)的性质,包括样品名称、类型、来源等。
一个生物学样本,是具有唯一生物学特性的样本,通常来说,一个样品就是一个BioSample
延伸:
Ø  对于16S扩增子测序,虽对一份样品测了20000条不同的序列,但这些序列是来自一个样品 – 1 BioSample 
Ø  用同样的药物处理个完全一样的小鼠 – 1BioSample
Ø  CHO 细胞感染病毒后分别在 0, 2, 48小时取样– 4 BioSample
Ø  同一个体分别取了不同部位的样,如脑、心脏、肺、肝、肾– 5 BioSamples
Experiment描述测序所建文库及仪器信息,一个Experiment对应一个BioProject和一个BioSample,而同一个BioSample可以建立多个文库,也就有多个Experiment
Run描述原始序列文件,如果一个Experiment的数据来自不同测序仪,则可以有多个Run
以上四者的关系可以见下图:
详细介绍如何将二代测序原始数据上传SRA
BioProjectBioSampleExperiment以及Run四者之间的关系
一个BioProject一般有多个BioSample
一个BioSample可以对应一个或多个Experiment
一个Experiment可以对应一个或多个Run
MD5 checksum其实是一串32位的字符串,形如“c302afeb870e0dfck675a13b23df20e7每个文件都可以生成一个MD5checksum,且这个值是唯一的,相当于是这个文件的“指纹”。NCBI用来核实原始序列文件传输的完整性,可以要求测序公司提供,也可以在windows下借助软件生成(下载地址:http://www.winmd5.com/,下载后无需安装,直接打开软件界面,根据提示把数据上传到软件上,会自动生成一个MD5 checksum)。

实战篇(完整版)
登入网址:https://www.ncbi.nlm.nih.gov/Traces/sra_sub/sub.cgi?logout=pda
登入后显示如下界面,点击NCBI PDA
详细介绍如何将二代测序原始数据上传SRA
如果有NCBI帐号,则直接登录,没有则根据网页提示注册(很简单)。
详细介绍如何将二代测序原始数据上传SRA
注册完以后,直接进入如下提交页面,点击“Create new submission”,建立新的提交任务。
详细介绍如何将二代测序原始数据上传SRA
填写项目的信息,填完后点击“Save
详细介绍如何将二代测序原始数据上传SRA
提交后,显示如下界面,提示新建“Experiment”,在新建之前,我们需要有BioProjectBioSample号,如果没有,可以根据后面提示进行申请,也可以提前申请。
详细介绍如何将二代测序原始数据上传SRA
提前申请BioProject
链接:https://submit.ncbi.nlm.nih.gov/
详细介绍如何将二代测序原始数据上传SRA
选中“BioProject”,点击“New Submission”,生成一个临时的BioProject号(SUB1457774
详细介绍如何将二代测序原始数据上传SRA
项目类型需要根据自己实际情况选择,此处我们以宏基因组为例,那Project Type选择“Metagenome
详细介绍如何将二代测序原始数据上传SRA
选好后提交,进入3 Target
详细介绍如何将二代测序原始数据上传SRA
点击“Continue”,进入下一步描述项目信息
详细介绍如何将二代测序原始数据上传SRA
此步无需填写,可以直接跳过
详细介绍如何将二代测序原始数据上传SRA
填写文章发表信息
详细介绍如何将二代测序原始数据上传SRA
最后一步,检查没有错误,即可点击“Submit
详细介绍如何将二代测序原始数据上传SRA
提交后,等待处理
详细介绍如何将二代测序原始数据上传SRA
申请Biosample
进入Biosample申请界面
详细介绍如何将二代测序原始数据上传SRA
点击“Newsubmission
详细介绍如何将二代测序原始数据上传SRA
依次完成1-6条信息。首先核实提交者个人信息
详细介绍如何将二代测序原始数据上传SRA
样本一般信息
详细介绍如何将二代测序原始数据上传SRA
选择样品类型,点击“Continue”
详细介绍如何将二代测序原始数据上传SRA
根据提示下载与项目对应的excel表,表里主要是要求填写样本相关的信息,如名称、来源等,填好后保存成txt纯文本文件,再上传到网页(对应图中step1和step 2)。
详细介绍如何将二代测序原始数据上传SRA
此步可以忽略,非“*”标记的均可以不填写
详细介绍如何将二代测序原始数据上传SRA
详细介绍如何将二代测序原始数据上传SRA

BioProject和BioSample申请完成后,我们可以继续新建Experiment
详细介绍如何将二代测序原始数据上传SRA
填写完后点击“Save”,页面自动更新,提示Experiment已新建完成
详细介绍如何将二代测序原始数据上传SRA
点击上图的“New Run”,将测序的原始数据与Experiment关联。
详细介绍如何将二代测序原始数据上传SRA
点击“Save”,显示如下界面,提示已建好Run
详细介绍如何将二代测序原始数据上传SRA
若无需建立“New Run”,则点击“Back”,显示如下:
详细介绍如何将二代测序原始数据上传SRA
详细介绍如何将二代测序原始数据上传SRA
详细介绍如何将二代测序原始数据上传SRA
详细介绍如何将二代测序原始数据上传SRA
在远程站点的根目录(/)下创建以BioProject号命名的文件夹,然后将本地的原始数据拖至这个目录
详细介绍如何将二代测序原始数据上传SRA
显示传输进度:
详细介绍如何将二代测序原始数据上传SRA
上传完成后,回到网页查看提交状态,若“Files”一栏均显示“done”,表示数据已成功上传NCBI,则文章中可以引用SRP******号。
详细介绍如何将二代测序原始数据上传SRA
完成!

这些可能会帮助到你: 问答社区 | 共享百度SVIP | 留言建议

欢迎入群交流:生信分析群: 732179952 · Meta分析群: 797345521 · 医学科研交流群: 797345521

发表评论

登录后才能评论