如题,今天要回答的问题是:为什么芯片、测序等高通量数据的实验结果常常验证不出来?这里我们说的验证不出来意思是指芯片、测序等高通量测序数据显示某个分子显著高表达(按照常用标准P<0.05,差异倍数>2),而用qPCR、WB等实验验证的时候却发现结果不是高表达的,可能没有显著差异,也可能显著低表达,所以我们说验证不出来的意思是:芯片、测序等高通量测序与qPCR、WB等实验验证出来的结果趋势不同。
我们从五个角度展开说明: 样本、物种、分子、层次和实验设计。
一、 样本不同
这个问题是指做高通量筛选时候的样本与验证时候的样本不同,又包括同类型差异和不同类型的差异。一般我们在做实验的时候最常常检测的样本有三类:组织样本,体液(比如血液)和细胞,而每种样本类型又有不同的划分,比如血液就有全血、血浆、血清等,组织又有新鲜组织、石蜡组织等。
同类型差异是指用的样本是完全一样的,只是数量上不同,比如都用新鲜的组织样本进行筛选和验证,高通量筛选的时候有2组(每组3例)共6例,而验证的时候用100对,同类型样本进行的验证差异原因主要是个体之间的差异,特别是异质性非常高的疾病,这种情况常会出现。
不同类型的差异是指用的样本类型不同,比如高通量筛选的时候用血浆样本,而验证的时候用组织样本和细胞样本,这种情况出现验证不出来的几率是比较高的。原因是这样:血浆反映的是全身各系统的综合信息,而且多数情况下只有分泌型的分子才能在血浆中检测到;而组织是器官特异性的复杂体系,比如肿瘤组织就包括了肿瘤细胞、免疫细胞、基质细胞等在内的多种细胞类型,而每个肿瘤细胞的信息都有可能是不同的,这就是肿瘤的异质性;而细胞则来源各异,有的肿瘤细胞株经过多次传代后形态特性均发生了变化,各个实验室之间的细胞也差异较大。综合考虑以上信息,我们一般可以认为细胞的均一性最好,组织次之,血液最差(异质性相反)。
二、 物种不同
分子在物种间的保守性是有差异的,因此即使同种类型的样本,在不同物种间进行验证的时候也会出现验证不出的结果。比如前期通过人的血浆进行的miRNA测序,我们打算用小鼠的血浆样本进行检测,就要考虑需要验证的miRNA分子在小鼠中是否保守,比较极端的例子是小鼠中根本就没有这个编码这个miRNA的基因,又如何能保证验证出人样本中的结果呢?关于如何查询分子在不同物种中的保守性,可看文章:如何查询分子的物种保守性?
三、分子不同
分子不同主要是指一个基因存在多条转录本的情况,所以严格来说,当验证的基因有多条转录本的时候在设计引物进行验证的时候就要注意,我们要检测是后基因还是某条转录本,因为一个基因可能对应多条转录本RNA。
举例说明一下,在下图中,我们就看到GHRL基因至少有10条转录本:
所以,即使我们用同样的样本,物种也一样,而各转录本RNA之间的差异也可能成为验证不出来的原因,我们需要考虑的是某一条转录本RNA还是所有的转录本RNA。
当我们只关注某一条转录本RNARNA的时候就可以根据各转录本之间的差异进行验证了,可惜的是由于各转录本之间差异性太小,以转录本为单位的检测并非完全可能。
四、层次不同
这里说的是检测的分子类型不同,特别是编码基因的验证。当我们用WB检测某个蛋白表达以验证芯片或者测序里面的mRNA表达时,我们就在RNA和蛋白这两个层面进行验证了,因此从RNA到蛋白过程的所有因素都有可能成为验证不出来的原因。总体来看,因为mRNA翻译为蛋白只是蛋白产生的一个因素,而蛋白降解则是影响蛋白水平的另外一个因素了。
除了这个原因外,时间问题也是需要考虑的,因为从mRNA翻译为蛋白是需要时间的,而这个时间也可能成为验证结果不一致的原因,比如mRNA升高后要过几个小时才会伴随蛋白水平的升高。
随手画的,大家懂意思就好。
五、 实验设计问题
前面四个角度是在实验设计没问题的情况下展开的,当然如果实验设计有问题,出现验证不出来的问题也是比较正常的。比如我们前面高通量筛选的时候对肿瘤和癌旁的组织样本进行检测,由于我们关系的问题是肿瘤的转移,所以我们通过qPCR对芯片结果中差异表达的基因分别用高侵袭性和低侵袭性的细胞进行验证,这里就会存在几个问题:
1. 样本类型不同。这里第一部分我们已经说明了。
2. 实验设计问题。因为高通量筛选是肿瘤VS癌旁,因此筛选出来的差异基因是与肿瘤的发生相关的基因,而非转移相关基因;如果关心的是肿瘤的转移这个因素,那我们在做测序的时候就要选择肿瘤转移和非转移的样本,两者之间有关联但还是不同,促进肿瘤增殖的基因不一定促进肿瘤转移。