本次主要来理解一下什么是链特异性文库,为什么要构建这种文库。
首先要明确几个概念,对理解后面的讲解很有帮助:
我们可以理解为拿到基因组,从左向右读过去,这条链就是正链。
反链就是与正链互补的链,因为DNA是双螺旋结果,有正链,就会有反链。
正义链也叫编码链,正义链的序列与mRNA 的序列一样,即携带蛋白的编码信息的这一条链。
与正义链互补的链就是反义链,也叫模板链,其序列与mRNA 互补。
看最左边的普通RNA建库方式: 1.首先把RNA逆转录成 cDNA, 图中的RT指的是reverse transcript 即反转录酶 2.制备完的文库,是双链cDNA, 在cDNA的两端,会加上两个对称的Y型接头,这种情况下,测得结果,我们无法确定是来自正链还是反链。
中间这幅图多展示的是用dUTP做链特异性文库: 1.使用随机引物合成RNA对应的一条cDNA链 2.接着合成cDNA的第二条链,此时采用 dUTP取代dTTP。 3.之后在两端加上接头。 4.再用USER酶处理,将含有U的cDNA链去除,此时,文库中存在的只有一条反链。 5.剩下反链两端的接头是不一样的。 6.下一步通过PCR 扩增,扩增出来的文库,保持了模板上的两个不对称的接头序列。 7.上机测序。 8.测序的过程中是可以分辨正链和反链的。
在做reads比对的时候,如果是正链reads比对到基因方向,那这个read是正义链reads, 如果是正链reads比对到基因反方向,那这个reads 就是反义链reads。
那这样建库的意义是什么呢,这就和lncRNA 的特点有关了,有关lncRNA可以写很多的笔记,这里着重记录几个作为介绍:
- 如果不能区分reads来自哪一条链,那么NAT lncRNA 与mRMA就区分不出来了
- 从思考问题的熊的博客 中,可知道如果把链特异性文库当做普通的文库来计算,对某一个基因来说影响不大,因为反义链的表达水平相对较低,但是如果是普通建库当做链特异性建库处理,结果误差会比较大。所以说,如果在非普通情况下,不用链特异性文库,我们得到的基因表达量是有问题的。
- 通过这种文库方式,可以挖掘顺式天然反义转录本
还有很多的好处,这里不一一列举