代谢组学:生命的化学指纹图谱
代谢组学是系统生物学的重要组成部分,它研究的是生物体在特定时间和环境下所有小分子代谢物的集合(代谢组),通常指分子量小于 1500 Da 的内源性小分子。这些代谢物是基因表达和蛋白质功能的最终产物,直接反映了细胞、组织或生物体当前的生理状态、生化活动以及对环境刺激(如疾病、药物、营养、压力)的反应。
非靶向代谢组学:探索未知的广阔海洋
非靶向代谢组学是一种无偏倚、全局性的分析策略。它的目标是在不预设目标的情况下,尽可能多地检测和相对定量生物样本中所有可检测的代谢物。这就像对样本进行一次“全景扫描”。
核心技术平台
液相色谱-质谱联用 (LC-MS):
气相色谱-质谱联用 (GC-MS):
非靶向代谢组学的流程与挑战
样品制备: 提取代谢物,尽量减少损失和降解,去除干扰物。
数据采集: 运行 LC-MS 或 GC-MS,获得包含数千甚至数万个色谱峰(代表潜在代谢物)的原始数据。
数据处理:
代谢物注释/鉴定:
注释: 基于精确质量数(LC-MS)、保留时间、碎片信息,与数据库(如 HMDB, METLIN, MassBank)比对,给出可能的分子式或化合物名称(置信度较低)。
鉴定: 需要更高级别的证据,如与标准品在相同实验条件下精确匹配保留时间和碎片图谱(1 级鉴定,金标准),或仅匹配碎片图谱(2 级)。非靶向中大多数是注释(2-3 级),严格鉴定比例较低。
统计分析: 多变量统计(如 PCA, PLS-DA)和单变量统计(如 t-test)寻找组间差异显著的代谢物。
生物学解释: 将差异代谢物映射到代谢通路,理解其生物学意义。
核心挑战: 数据复杂性高,化合物鉴定困难(是瓶颈),生物信息学分析要求高,假阳性/假阴性风险,相对定量(非绝对定量)。
靶向代谢组学:精准聚焦的定量分析
靶向代谢组学是一种假设驱动的分析策略。它预先定义一组特定的代谢物(目标分析物),并开发高度优化的方法来对这些目标物进行精确定量和绝对定量。这就像使用“狙击枪”瞄准特定的目标。
核心技术与特点
核心技术平台: LC-MS/MS (尤其是三重四极杆质谱 TQ-MS) 是绝对主流。GC-MS 也可用于特定目标物。
方法核心:多反应监测/多反应监测 (MRM/SRM):
关键要素:
标准品: 使用化学合成的纯标准品建立校准曲线(浓度 vs 响应),用于绝对定量。
同位素内标: 使用带有稳定同位素标记(如 ¹³C, ¹⁵N)的目标代谢物类似物作为内标(Internal Standard, IS)。在样品制备前加入,校正提取效率、基质效应和仪器波动,大幅提高定量准确性和精密度。
高度优化的前处理与色谱方法: 专门针对目标物设计,最大化回收率、分离度和灵敏度。
优点:
缺点:
只能分析预设的目标物,无法发现新代谢物。
方法开发耗时耗力(需要所有目标物的标准品)。
通量受限于目标物数量(通常几十到几百个)。
应用: 生物标志物验证、临床诊断、药物代谢动力学(PK)、毒理学研究、营养评估、需要高精度定量比较的研究。
常见的靶向代谢组分析类别
靶向脂质组学:
目标: 精确定量特定类别的脂质分子(如磷脂、甘油三酯、鞘脂、胆固醇酯、脂肪酸等)及其分子种。
意义: 脂质是细胞膜主要成分,是重要的信号分子和能量储存形式。其组成变化与心血管疾病、代谢性疾病(糖尿病、肥胖)、神经退行性疾病、癌症等密切相关。
技术: 主要依靠 LC-MS/MS (RPLC 或 HILIC),常使用特定的 MRM 离子对和脂质类别特异的内标。
靶向胆汁酸分析:
目标: 精确定量各种初级胆汁酸(如胆酸 CA, 鹅脱氧胆酸 CDCA)、次级胆汁酸(如脱氧胆酸 DCA, 石胆酸 LCA)及其结合形式(甘氨酸结合型 Glyco-, 牛磺酸结合型 Tauro-)。
意义: 胆汁酸在脂肪消化吸收、胆固醇代谢、葡萄糖稳态中起关键作用,也是重要的信号分子(通过 FXR, TGR5 受体)。其谱图变化是肝胆疾病(胆汁淤积、肝炎、肝硬化)、肠道疾病(IBD)、肠道菌群失调和代谢性疾病的敏感指标。
技术: 主要依靠 LC-MS/MS (RPLC),需要分离多种结构相似的同分异构体,对色谱要求高。使用特定 MRM 和同位素标记胆汁酸内标。
靶向氨基酸分析:
目标: 精确定量 20 种标准蛋白氨基酸以及多种非蛋白氨基酸(如鸟氨酸、瓜氨酸、牛磺酸)、代谢中间产物(如 α-酮戊二酸、琥珀酸)等。
意义: 氨基酸是蛋白质合成的基本单元,也是能量代谢、神经递质合成、一碳代谢等的重要参与者。其血浆或组织水平变化广泛用于评估营养状况、诊断遗传性代谢病(如苯丙酮尿症 PKU)、监测肿瘤代谢、研究肝肾功能损伤、肌肉疾病等。
技术: 常用 LC-MS/MS (HILIC 或 衍生化后 RPLC) 或传统离子交换色谱法。MRM 结合氨基酸特异性同位素内标是主流方法。
总结与比较
| 特征 | 非靶向代谢组学 | 靶向代谢组学 |
|---|
| 目标 | 全局性、无偏倚、发现未知 | 聚焦特定目标、假设驱动、验证/定量 |
| 覆盖范围 | 宽泛(数千种特征) | 狭窄(数十至数百种预设目标物) |
| 定量 | 相对定量(不同样本间比较) | 绝对定量(有浓度单位) |
| 准确性/精密度 | 较低 | 非常高(使用标准品和同位素内标) |
| 鉴定置信度 | 低到中等(多为注释) | 高(通常要求1级或2级鉴定) |
| 发现能力 | 强(可发现新标志物) | 无 |
| 数据复杂性 | 极高(生物信息学挑战大) | 较低 |
| 方法开发 | 相对通用 | 复杂耗时(需标准品,方法验证) |
| 主要平台 | LC-MS, GC-MS | LC-MS/MS (TQ-MS) |
| 典型应用 | 生物标志物发现、通路扰动探索 | 生物标志物验证、临床诊断、精准定量、法规研究 |
| 常见靶向类别 | N/A | 脂质、胆汁酸、氨基酸、有机酸、激素等 |
核心关系: 非靶向和靶向代谢组学是互补的。非靶向用于初步探索和发现潜在感兴趣的代谢物/通路,而靶向则用于对筛选出的关键目标进行精确验证和定量分析。许多研究项目会采用“非靶向发现 -> 靶向验证”的策略。