转录组(Transcriptome)是指细胞所能转录出的所有信使 RNA(mRNA)的集合。
RNA测序技术(RNA-seq) 是转录组学中广泛使用的 NGS 应用。它涉及 mRNA 分子的测序和定量,提供生物样本中表达基因的全面快照。通过生成数百万个短测序读数,NGS 使研究人员能够准确识别和量化基因表达水平。
在进行mRNA建库的过程当中,首先要解决的问题,是如何去除核糖体RNA也就是去除“rRNA”(Ribosomal RNA)。在通常抽提到的总RNA中,绝大部分都是核糖体RNA(rRNA)。以人类的细胞或组织为例,一般抽提到的总RNA当中,95%都是核糖体RNA。剩下的2%到3%是mRNA。还有2%到3%是Long non-coding RNA、或者tRNA、microRNA,这些RNA,也就是说mRNA只占了所有RNA中的一小部分。去除核糖体RNA,并进行建库的方法,有许多种。我们主要介绍一下应用最广泛的建库方法。
下图是mRNA测序的建库过程图。
1、mRNA分离
首先是利用真核生物的mRNA都有Poly(A)尾巴这个特点,用带有Poly(T)探针的磁珠与总RNA进行杂交。然后Poly(T)探针就和带Poly(A)尾巴的mRNA结合在一起,接下来就回收磁珠,去除其他RNA。
mRNA片段化
再使用Frag/Prime Buffer对mRNA进行打断;
3、cDNA第一链合成
被打断的这些mRNA片段,通过随机六聚体引物(random hexamer primer),逆转录酶以mRNA为模版合成cDNA;
4、cDNA第二链合成
逆转录成(第一链)cDNA后,再合成出第二链(cDNA),这样就成为双链的cDNA,纯化双链cDNA;
双链cDNA末端修复
双链cDNA的末端修复末端补齐,再纯化修复后的cDNA。双链cDNA 3’端加A(dA - tailing)。我们再在双链的cDNA的两端接上“Y”型的接头(每个接头都有一个index,不同的文库构建可以使用不同的index),纯化连接接头的ds cDNA。
6、PCR富集文库
通过PCR扩增完纯化后,进行文库质检,质检完的文库就成了标准的测序文库。
注意,不同样品的total RNA中mRNA含量差异较大,若total RNA起始投入量过低,不能保证有足够的mRNA用于后续建库,因此建议RNA起始量为1~4μg。
在建库的时候会对mRNA的完整度有较高的要求。只有在完整度高的mRNA中测序才会产生比较好的测序结果。原因就是,我们所用的Poly(T)磁珠只会去吸附靠近3'的Poly(A)序列,如果mRNA发生了降解,也就是mRNA断掉了,那么5'端的mRNA就不会被吸附上了,会在富集的过程中被洗脱掉。由此导致我们的测序结果并不准确。