在基于质谱的非靶向代谢组学研究中,代谢物鉴定长期面临谱库覆盖有限和碎片化模式预测困难的双重挑战。尽管高分辨液相色谱 - 串联质谱(LC-MS/MS)硬件与计算方法进步迅速,但平均而言,仅有不到10%的特征能被确证注释。面对庞大的化学空间,传统依赖谱库匹配的方法已显捉襟见肘,亟需能获取正交化学数据的创新工作流。
针对这一瓶颈,德国蒂宾根大学等机构的研究团队在《自然·通讯》发表成果,推出了“多重化学代谢组学”(MCheM)工作流。该技术的核心在于将正交的后柱衍生化反应集成到统一的质谱数据框架中,利用在线化学标记技术,为未知分子提供功能基团信息,从而大幅提升基于计算机模拟的谱图匹配和开放修饰搜索的准确性。
MCheM系统通过定制化的硬件配置实现,包括补充型超高效液相色谱泵、T型分流器或反应 manifold 以及注射泵。研究团队设计了三种针对特定官能团的在线衍生化反应:利用L-半胱氨酸靶向亲电基团(如迈克尔受体、β-内酯),使用AQC试剂靶向氨基和酚羟基,以及采用盐酸羟胺靶向醛酮基团。这种在线策略相比传统的批次衍生化具有显著优势,色谱共洗脱特性保留了前体与衍生化产物间的关联,特别适用于复杂混合物的分析。
在软件层面,团队开发了专用的“在线反应性”分析模块,结合离子身份网络(Ion Identity Networking)技术,将MS、MS/MS及反应性信息整合为单一数据流。实验数据显示,在包含约1万个化合物的实验库中,引入MCheM数据后,CSI:FingerID的注释准确率提升了31.9%,GNPS2开放修饰搜索提升了37.6%;在天然产物标准品测试中,CSI:FingerID的准确率更是提升了48.8%。
该技术的实际效用在一项基因组引导的天然产物发现案例中得到验证。研究团队利用MCheM成功鉴定出链霉菌(Streptomyces libani)产生的新型7-糖基化恶唑霉素D。在常规质谱数据中该物质未被识别,但通过MCheM对亲电基团的特异性标记和重排序,该化合物被精准定位。这一发现填补了恶唑霉素家族中糖基化成员的空白,且该结构此前从未在数据库中被记录。
对于中国代谢组学从业者而言,MCheM技术的低成本硬件改造方案(仅需补充泵和注射器)和开源软件流程极具推广价值。随着国产质谱设备的普及,引入此类在线衍生化策略有望成为提升我国非靶向代谢组研究深度、挖掘新型天然产物结构信息的重要突破口。