-
这些非ATCG的序列在基因组的哪些位置? -
这些非ATCG的序列长度分别是多少? -
基因组上存在多少个gap序列?
-
通过检索,找到能够回答以上问题的工具 -
自己编写脚本,写一段代码进行分析。

cat Athaliana.amb | grep 'N$' | wc -l
#165
cat Athaliana.amb | grep 'N$' | datamash -t ' ' sum 2
# 185738

cat Athaliana.amb | grep 'N$' | wc -l
#165
cat Athaliana.amb | grep 'N$' | datamash -t ' ' sum 2
# 185738