通常,我们在设计引物时要遵循以下3个步骤:
-
基因查找
-
引物设计
-
引物验证
现在,我们就以常见的肿瘤TP53基因为例来演示这一过程。
TP53是一个常见的抑癌基因,在较高比例的实体瘤患者中都发现了该基因的突变。其编码的蛋白具有调控细胞分裂、增值的功能。
首先,我们打开NCBI网站,https://www.ncbi.nlm.nih.gov/ 选择数据库,此处我们选择“Gene”数据库,并输入要查找的基因名称(Gene Symbol)
Gene Symbol是基因的名字,每个基因的Gene Symbol是固定的,搜索时应该分辨出常用名和Gene Symbol。准确的Gene Symbol可以使我们快速地检索到目标基因。
例如,当我们输入该基因的Gene Symbol “TP53”时,页面中可以很快地显示出我们需要的结果:
而当我们输入该基因平时的常用名“p53”时,则会出现相对模糊的搜索结果:
我们在这里需要注意的是,当选择的数据库不同时,搜索结果会略有差别。例如,选择不同的数据库Gene和nucleotide时,搜索TP53的界面如下:
可以看出,当检索的数据库是nucleotide(图左)时,检索界面中的条目下面会显示“Accession”和“GI”两个信息。“Accession”和“GI”是两种不同的序列识别符,“Accession”和“GI”如同序列的身份证,当序列的数据发生改变时,它们会被赋予一个新的“Accession”和“GI”。通过“Accession”和“GI”,我们就可以在NCBI、DDBJ以及EMBL等数据库中找到该序列的相关信息。而当检索的数据库是Gene时,条目只显示Gene ID。
点击“TP53-tumor protein p53”会出现以下界面:
界面的右侧是该基因的“展示目录”,而左侧则是相对应的内容。我们点击红框条目“NCBI Reference Sequences” 即可得到该RNA的序列信息。
另外说明一下,当我们点击右侧的“Genomic regions, transcripts, and products”时可以看见,NCBI为每个基因提供了3种格式的序列,分别为Graphics 、FASTA 和GenBank
相比于FASTA格式,GENEBANK格式描述的内容更多,包括该基因的发现者、相关的文章、不同mRNA及CDS的序列信息等。GENEBANK格式在列出核苷酸序列时以10个核苷酸为一组,同时在每行开端注明该段序列所在的位置,极大地方便了使用者将其与前面罗列的信息进行比对。
回到刚才的“NCBI Reference Sequences”位置,我们可以看到不同的mRNA,每个mRNA后面都有“NM”和“NP”。“NM”代表mRNA的编号,“NP”代表蛋白的编号。
在找到我们需要设计引物的目标序列后,我们就要开始为这个序列设计引物。
这里有两种便捷的方法:首先,我们可以先点击目标mRNA的“NM”号,进入界面后,再点击界面右侧的“Pick Primers”
这时,页面会变成引物设计界面:
另一种方法是,复制目标mRNA的NM号后,点击界面最下方的“Primer-BLAST”,再将NM号粘贴在“PCR-Template”框中
接下来,我们需要简单地为引物设计设定一些参数
当我们设计原核生物(如细菌、病毒等)序列的引物时,我们在“Exon/intron selection”处直接选择“No preference”;而当我们设计真核细胞中的mRNA的引物时,为了防止产物中有DNA污染,我们通常将引物设计在跨外显子处,在“Exon/intron selection”中选择“Primer must span an exon-exon junction ”。
同时,在下方高级参数设置处将引物的GC含量设置成40%-60%
最后,点击最下方的“Get Primers”,即可得到引物设计的结果。我们通常可以得到1条至多条引物,在界面上按分数高低从上至下排列。
在得到引物后,我们还需要从两个方面去检测我们所设计的引物:一是特异性,二是检查引物是否容易形成二聚体。
我们将设计好的引物填入刚才的Primer-BLAST界面,将上游引物和下游引物分别复制上去:
然后点击Primer BLAST:
BLAST后的界面会显示该引物可能会与数据库中的多少mRNA序列互补,从而提供引物特异性的信息。
检测引物的特异性后,我们还需要检测引物是否易形成二聚体。我们可以从https://sg.idtdna.com/calc/analyzer 这个网站上来检查引物的引物是否容易形成二聚体。(网站注册即可)
右侧的“SELF-DIMER”可以检测引物是否容易形成自身二聚体。首先,在序列框中输入正向引物,点击“SELF-DIMER”即可得到分析结果。一般来说,设计出的引物很难避免碱基互补,因此,当配对的碱基对数小于10时,即可认为该引物可以使用。按同样的方法,将反向引物复制粘贴到序列框中,检查反向引物自身配对的情况。
右侧的 “HETRERO-DIMER” 可以检测一对引物是否易形成二聚体。首先在序列框中复制粘贴上正向引物,点击“HETRERO-DIMER”后,在下面弹出的对话框中填入反向引物,最后点击“CALCULATE”,等待分析结果,我们依然以小于10个碱基配对作为验证标准。
至此,简单的引物设计就完成了。但是需要指出的是,PCR是一个复杂的过程,经过软件设计及检测后的引物在实际的实验中仍可能出现二聚体等现象,我们需要在实验过程中不断地优化实验条件来尽可能地避免这些问题的发生。