代谢组学是系统生物学的重要组成部分,它研究的是生物体在特定时间和环境下所有小分子代谢物的集合(代谢组),通常指分子量小于 1500 Da 的内源性小分子。这些代谢物是基因表达和蛋白质功能的最终产物,直接反映了细胞、组织或生物体当前的生理状态、生化活动以及对环境刺激(如疾病、药物、营养、压力)的反应。
核心思想: 代谢物是生命活动的“终点信号”,分析它们可以提供最接近表型的、动态的生化快照。
目标: 发现生物标志物、理解疾病机制、研究药物作用/毒性、评估营养干预、探索生物过程(如发育、衰老)等。
非靶向代谢组学是一种无偏倚、全局性的分析策略。它的目标是在不预设目标的情况下,尽可能多地检测和相对定量生物样本中所有可检测的代谢物。这就像对样本进行一次“全景扫描”。
液相色谱-质谱联用 (LC-MS):
原理: 代谢物首先通过液相色谱根据其物理化学性质(如极性、亲脂性)进行分离。然后进入质谱仪进行电离(常用电喷雾电离 ESI 或大气压化学电离 APCI)和检测,得到代谢物的质荷比和丰度信息。
优点:
适用范围广:特别适合分析热不稳定、极性大、不易挥发的化合物(如大多数脂质、氨基酸、有机酸、糖类、核苷酸等),这是生物样本中代谢物的主体。
样品前处理相对温和。
可与多种分离模式(反相色谱 RPLC, 亲水相互作用色谱 HILIC)结合,覆盖更广的代谢物范围。
缺点:
基质效应可能较显著(样品中其他成分干扰目标物离子化)。
仪器维护成本较高。
数据极其复杂,生物信息学分析挑战巨大。
应用: 最常用的非靶向平台,广泛应用于生物医学研究、植物代谢组学、微生物代谢组学等。
气相色谱-质谱联用 (GC-MS):
原理: 代谢物需要先进行衍生化(使其具有挥发性和热稳定性),然后通过气相色谱根据挥发性进行分离。分离后的代谢物进入质谱仪(常用电子轰击电离 EI)碎裂,产生特征性的碎片图谱用于鉴定。
优点:
分离效率高,重现性好。
电离稳定(EI 源),产生的碎片图谱具有高度可重复性,便于与标准谱库(如 NIST, Wiley)比对进行化合物鉴定。
仪器相对成熟,运行成本较低。
对挥发性/半挥发性小分子(如有机酸、糖类、部分氨基酸、脂肪酸、固醇)灵敏度高。
缺点:
必须衍生化,步骤繁琐且可能引入偏差或副反应,不适合热不稳定化合物。
主要限于挥发性或可衍生化的化合物,对强极性、大分子量代谢物覆盖不足。
衍生化可能无法覆盖所有代谢物类别。
应用: 在分析中心碳代谢(糖酵解、TCA 循环等)相关代谢物、环境毒理学、风味分析等方面有优势。常与 LC-MS 互补使用。
样品制备: 提取代谢物,尽量减少损失和降解,去除干扰物。
数据采集: 运行 LC-MS 或 GC-MS,获得包含数千甚至数万个色谱峰(代表潜在代谢物)的原始数据。
数据处理:
峰提取/对齐: 识别并整合不同样品中的相同色谱峰。
归一化: 消除系统误差(如进样体积差异)。
缺失值填补: 处理未在所有样品中检测到的峰。
代谢物注释/鉴定:
注释: 基于精确质量数(LC-MS)、保留时间、碎片信息,与数据库(如 HMDB, METLIN, MassBank)比对,给出可能的分子式或化合物名称(置信度较低)。
鉴定: 需要更高级别的证据,如与标准品在相同实验条件下精确匹配保留时间和碎片图谱(1 级鉴定,金标准),或仅匹配碎片图谱(2 级)。非靶向中大多数是注释(2-3 级),严格鉴定比例较低。
统计分析: 多变量统计(如 PCA, PLS-DA)和单变量统计(如 t-test)寻找组间差异显著的代谢物。
生物学解释: 将差异代谢物映射到代谢通路,理解其生物学意义。
核心挑战: 数据复杂性高,化合物鉴定困难(是瓶颈),生物信息学分析要求高,假阳性/假阴性风险,相对定量(非绝对定量)。
靶向代谢组学是一种假设驱动的分析策略。它预先定义一组特定的代谢物(目标分析物),并开发高度优化的方法来对这些目标物进行精确定量和绝对定量。这就像使用“狙击枪”瞄准特定的目标。
核心技术平台: LC-MS/MS (尤其是三重四极杆质谱 TQ-MS) 是绝对主流。GC-MS 也可用于特定目标物。
方法核心:多反应监测/多反应监测 (MRM/SRM):
质谱仪(TQ-MS)被设置为只监测目标代谢物及其特征碎片离子对(母离子 -> 子离子)。
这种选择性极大地提高了灵敏度、特异性、抗干扰能力,并允许在复杂基质中进行准确定量。
关键要素:
标准品: 使用化学合成的纯标准品建立校准曲线(浓度 vs 响应),用于绝对定量。
同位素内标: 使用带有稳定同位素标记(如 ¹³C, ¹⁵N)的目标代谢物类似物作为内标(Internal Standard, IS)。在样品制备前加入,校正提取效率、基质效应和仪器波动,大幅提高定量准确性和精密度。
高度优化的前处理与色谱方法: 专门针对目标物设计,最大化回收率、分离度和灵敏度。
优点:
高灵敏度、高选择性、高特异性。
可进行绝对定量,结果可靠、可重复、可比较。
方法经过充分验证(线性范围、精密度、准确度、稳定性等),符合法规要求(如临床诊断、食品安全)。
数据处理相对简单。
缺点:
只能分析预设的目标物,无法发现新代谢物。
方法开发耗时耗力(需要所有目标物的标准品)。
通量受限于目标物数量(通常几十到几百个)。
应用: 生物标志物验证、临床诊断、药物代谢动力学(PK)、毒理学研究、营养评估、需要高精度定量比较的研究。
靶向脂质组学:
目标: 精确定量特定类别的脂质分子(如磷脂、甘油三酯、鞘脂、胆固醇酯、脂肪酸等)及其分子种。
意义: 脂质是细胞膜主要成分,是重要的信号分子和能量储存形式。其组成变化与心血管疾病、代谢性疾病(糖尿病、肥胖)、神经退行性疾病、癌症等密切相关。
技术: 主要依靠 LC-MS/MS (RPLC 或 HILIC),常使用特定的 MRM 离子对和脂质类别特异的内标。
靶向胆汁酸分析:
目标: 精确定量各种初级胆汁酸(如胆酸 CA, 鹅脱氧胆酸 CDCA)、次级胆汁酸(如脱氧胆酸 DCA, 石胆酸 LCA)及其结合形式(甘氨酸结合型 Glyco-, 牛磺酸结合型 Tauro-)。
意义: 胆汁酸在脂肪消化吸收、胆固醇代谢、葡萄糖稳态中起关键作用,也是重要的信号分子(通过 FXR, TGR5 受体)。其谱图变化是肝胆疾病(胆汁淤积、肝炎、肝硬化)、肠道疾病(IBD)、肠道菌群失调和代谢性疾病的敏感指标。
技术: 主要依靠 LC-MS/MS (RPLC),需要分离多种结构相似的同分异构体,对色谱要求高。使用特定 MRM 和同位素标记胆汁酸内标。
靶向氨基酸分析:
目标: 精确定量 20 种标准蛋白氨基酸以及多种非蛋白氨基酸(如鸟氨酸、瓜氨酸、牛磺酸)、代谢中间产物(如 α-酮戊二酸、琥珀酸)等。
意义: 氨基酸是蛋白质合成的基本单元,也是能量代谢、神经递质合成、一碳代谢等的重要参与者。其血浆或组织水平变化广泛用于评估营养状况、诊断遗传性代谢病(如苯丙酮尿症 PKU)、监测肿瘤代谢、研究肝肾功能损伤、肌肉疾病等。
技术: 常用 LC-MS/MS (HILIC 或 衍生化后 RPLC) 或传统离子交换色谱法。MRM 结合氨基酸特异性同位素内标是主流方法。
| 特征 | 非靶向代谢组学 | 靶向代谢组学 |
|---|---|---|
| 目标 | 全局性、无偏倚、发现未知 | 聚焦特定目标、假设驱动、验证/定量 |
| 覆盖范围 | 宽泛(数千种特征) | 狭窄(数十至数百种预设目标物) |
| 定量 | 相对定量(不同样本间比较) | 绝对定量(有浓度单位) |
| 准确性/精密度 | 较低 | 非常高(使用标准品和同位素内标) |
| 鉴定置信度 | 低到中等(多为注释) | 高(通常要求1级或2级鉴定) |
| 发现能力 | 强(可发现新标志物) | 无 |
| 数据复杂性 | 极高(生物信息学挑战大) | 较低 |
| 方法开发 | 相对通用 | 复杂耗时(需标准品,方法验证) |
| 主要平台 | LC-MS, GC-MS | LC-MS/MS (TQ-MS) |
| 典型应用 | 生物标志物发现、通路扰动探索 | 生物标志物验证、临床诊断、精准定量、法规研究 |
| 常见靶向类别 | N/A | 脂质、胆汁酸、氨基酸、有机酸、激素等 |
核心关系: 非靶向和靶向代谢组学是互补的。非靶向用于初步探索和发现潜在感兴趣的代谢物/通路,而靶向则用于对筛选出的关键目标进行精确验证和定量分析。许多研究项目会采用“非靶向发现 -> 靶向验证”的策略。
|
|