一、 转录组测序概述
定义:
核心目标:
基因表达定量: 精确测量不同基因或转录本的表达水平(丰度)。
转录本结构分析: 鉴定可变剪接事件、转录起始位点、终止位点、外显子使用情况等。
新转录本发现: 识别未被注释的新基因、新剪接变体、非编码RNA等。
融合基因检测: 发现因染色体易位等原因产生的融合转录本(尤其在癌症研究中重要)。
等位基因特异性表达: 研究来自父本和母本等位基因的表达差异。
通用流程:
样本采集与RNA提取: 从目标组织或细胞中提取总RNA。RNA质量至关重要(常用RIN值评估)。
文库构建:
mRNA富集: 通常使用oligo-dT磁珠特异性地捕获带polyA尾的mRNA(真核生物),或去除rRNA(原核生物或需要保留非polyA RNA时)。
片段化: 将长RNA分子随机打断成适合测序仪读长的片段(如150-300bp)。
cDNA合成: 以RNA片段为模板,用逆转录酶合成第一链cDNA,再合成第二链cDNA。
接头连接: 在cDNA片段两端连接测序平台特异的接头(包含测序引物结合位点和样本索引)。
文库扩增与质检: 通过PCR扩增文库,并进行质量控制和定量。
高通量测序: 将文库加载到测序仪上进行大规模并行测序(如Illumina平台的边合成边测序技术)。
生物信息学分析:
数据质控: 去除低质量读段、接头序列等。
序列比对: 将测序读段比对到参考基因组或转录组上。
基因/转录本定量: 计算基因或转录本的表达量(常用FPKM、TPM或Counts)。
差异表达分析: 比较不同组间(如处理vs对照、疾病vs健康)基因表达水平的显著变化。
可变剪接分析: 识别和量化不同的剪接异构体。
新转录本预测: 识别未被注释的转录区域。
功能富集分析: 对差异表达基因进行GO、KEGG等通路富集分析,解释生物学意义。
二、 小RNA测序
定义与目标:
技术特点(与常规mRNA-seq主要区别):
三、 全转录组测序
定义与目标:
技术特点:
四、 总结与比较
| 特征 | 常规转录组测序 (mRNA-Seq) | 小RNA测序 (smRNA-Seq) | 全转录组测序 (Total RNA-Seq) |
|---|
| 主要目标 | PolyA+ 信使RNA (mRNA) | 小RNA (miRNA, siRNA, piRNA等, 18-35nt) | 所有类型的RNA (编码和非编码) |
| 文库关键 | Oligo-dT 富集 polyA+ RNA | 凝胶/磁珠严格大小选择 (18-35nt) | 去除核糖体RNA (rRNA) |
| 优势 | 成本较低,专注蛋白编码基因表达 | 高灵敏度、特异性检测小RNA | 最全面的转录组视图,捕获非编码RNA |
| 劣势 | 丢失非polyA RNA (lncRNA, circRNA等) | 只能检测小RNA | 成本较高,数据分析更复杂,rRNA去除有残留 |
| 测序策略 | 通常双端测序 (PE) | 通常单端测序 (SE, 50bp) | 通常双端测序 (PE),需要更深深度 |
| 链特异性 | 可选,推荐 | 通常不适用 (小RNA本身短) | 强烈推荐/必需 |
| 主要应用 | 基因差异表达,可变剪接 (mRNA) | miRNA表达谱,新miRNA发现,调控机制 | 系统生物学,非编码RNA研究 (lncRNA, circRNA),新转录本发现,全面表达谱 |
选择哪种方法?
如果你只关心编码蛋白质的基因的表达水平和剪接变化,mRNA-Seq通常是最经济高效的选择。
如果你专门研究microRNA或其他小RNA在疾病、发育或调控中的作用,小RNA-Seq是必需且最灵敏的技术。
如果你想要一个最全面的视角,研究所有类型的RNA(包括lncRNA, circRNA, 非polyA mRNA)及其相互作用,或者进行新转录本的探索性发现,那么全转录组测序是最佳选择,尽管成本和数据分析复杂度更高。
总而言之,转录组测序技术(mRNA-Seq, smRNA-Seq, Total RNA-Seq)为我们提供了强大的工具来解码细胞在RNA层面的复杂活动。理解它们各自的原理、目标、技术特点和适用场景,对于设计合理的实验方案和解读研究结果至关重要。