如果你有Oxford Nanopore测序仪,并且已经拿到新冠病毒样本,可以使用ARTIC Network工作流,这样就可以8小时之内得到新冠病毒的全基因组序列,目前全球多个国家的实验室都在使用这套工作流程。
ARTIC Network
ARTIC Network(https://artic.network/),这个项目是由英国惠康基因会(Wellcome Trust)资助,旨在为病毒爆发开发方案,提供实时的流行病学信息。项目组开发了一组针对新型冠状病毒的实验室和生物信息学工作流程。这个工作流程最早适用于非洲埃博拉病毒的测序诊断工作。目前新冠疫情全球大流行,就顺势利用到了新冠病毒的测序研究中。目前这个团队一直都在努力优化这个工作流,包括前面我们介绍到的如何扩增病毒全基因组序列,也是来自这个团队的研究成果。必须感谢这个团队的努力工作,为这次疫情做出科学研究上的贡献。
流程介绍
其实这个流程也没那么复杂,我们来介绍一下。它是与Nanopore测序仪配合使用,可以是minion也可以是其他型号,测序仪的控制软件MiniKnow会实时产生测序数据,实时进行basecalling,这个工作流程主要的使用的软件为RAMPART,这个软件会实时去读取MinKnow产生的数据,然后进行统计,例如产生了多少数据,数据长度如何分布等,并可视化显示出来。
当然这些工作也可以单独去完成。下面是部分实验室使用ARTIC Network进行新冠病毒测序的工作照。PS:计算机设备一定要非常好。
https://artic.network/ncov-2019/ncov2019-bioinformatics-sop.html
这里给出了RAMPART具体的分析内容。
1、利用guppy进行碱基识别(可跳过)
guppy_basecaller -c dna_r9.4.1_450bps_fast.cfg -i /path/to/reads -s run_name -x auto -r
2、根据barcode拆分数据
guppy_barcoder --require_barcodes_both_ends -i run_name -s output_directory --arrangements_files "barcode_arrs_nb12.cfg barcode_arrs_nb24.cfg"
3、过滤数据,引物扩增范围在400-700bp,过滤掉这个范围之外的序列
artic guppyplex --min-length 400 --max-length 700 --directory output_directory/barcode03 --prefix run_name
4、质控比对,生成一致性序列,这里调用一个分析流程,其实是利用minimap2与参考的新冠病毒序列比对,然后根据比对结果生成一致性序列,这个一致性序列就是待测序样品的基因组序列。不过这种病毒拼接方法会存在一定的问题,我们会在后面的内容中做详细介绍。
artic minion --normalise 200 --threads 4 --scheme-directory ~/artic-ncov2019/primer-schemes --read-file run_name_barcode03.fastq --fast5-directory path_to_fast5 --sequencing-summary path_to_sequencing_summary.txt nCoV-2019/V3 samplename
5、table可视化
6、medaka纠错,得到的一致性序列,还需要使用medaka进行纠错,最终得到更加准确的病毒基因组。
artic minion --medaka --normalise 200 --threads 4 --scheme-directory ~/artic-ncov2019/primer-schemes --read-file run_name_barcode01.fastq nCoV-2019/V1 samplename