导语
当我们体检时,医生通常会根据单一代谢指标来进行诊断。然而对于复杂疾病,这样只考虑单一代谢物的方法是过度简化的。近日,北京雁栖湖应用数学研究院教授邬荣领及其带领的统计团队基于丘成桐出的GLMY同调理论(GLMY homology theory),对炎症性肠病(IBD)的代谢数据建模,分析不同因素间相互作用的影响。研究成果以“复杂疾病的代谢物理学”为题发表在PNAS上,该发现不仅有助于相关药物研发,其方法学可适用于一系列疾病的研究。
研究领域:统计物理,同调理论,复杂网络,代谢网络,演化博弈,复杂疾病
郭瑞东 | 作者王智博 | 审校
论文地址:The metabolomic physics of complex diseases
论文标题:https://www.pnas.org/doi/10.1073/pnas.2308496120
1. 疾病作为复杂网络系统
由于大多数疾病涉及代谢变化,越来越多的研究已经开始使用个体代谢物作为疾病的临床预测因子,基于单一代谢物在控制组和病患组中进行统计检验。鉴于大多数疾病是多因素的、动态的和环境特异性的,基于单一代谢物的方法不能绘制代谢功能的全面景观。由于代谢产物在细胞中共存并共同发挥影响,它们很可能形成一个复杂系统,促进人类健康和疾病的生理/生化变化。
网络模型已经被证明在描述复杂系统的内部工作方面是强大的,它可以可视化不同组成部分如何相互作用来调节系统行为。将网络模型应用于代谢数据,前人已有诸多尝试,然而其构建的不是双向、包含正负权重的网络(bidirectional, signed, and weighted bDSW),从而无法全面捕捉复杂系统的动态特征。
炎症性肠病(IBD)是患病率很高、但病因未知的一种慢性免疫介导疾病,这种疾病包括两种类型,克罗恩病(CD)和溃疡性结肠炎(UC)。作为最近医学研究的焦点,我们对 CD 和UC 之间差异和共性的生理机制知之甚少。
这项研究针对炎症性肠病,使用了人类微生物组计划(Human Microbiome Project,HMP)中采集的265个CD患者,146个UC患者以及135个健康对照(HC)的185项粪便代谢物数据。每个被试都包含多种代谢物,其相互作用模式的改变会导致他/她从当前的健康状态转变为UC或CD。将每个被试视为一个生态系统,定义所有代谢物的总丰度值作为其生态位,各代谢物的丰度水平可以表示为生态位的函数。该函数服从部分-整体关系的异速标度律,可用幂方程描述。生态位的概念有助于从静态点提取动态信息。
通过捕食者-猎物方程的演化博弈理论的动态推广,以异速标度律为指导,可以构造准动态的Lokta–Volterra捕食者-被捕食者常微分方程(qdLVODE),将代谢物的丰度分解为独立与相互依赖的两类组件。通过将每个实体的独立组件编码为节点,将每个实体-实体对的相互依赖组件编码为边,方程可以完全捕获代谢物交互的全部涌现特性,并从任何类的代谢数据中推断出信息化、动态化、全方位化和个性化网络。
2. 健康人与炎症性肠病的
代谢网络之间存在差异
将UC,CD与对照三组分别构建网络后,分别进行功能聚类,每组可分为M1到M9等不同模块,使用来自每个模块的所有代谢物的总丰度水平和使用相同模块内的每个代谢物的丰度水平的细粒度网络重建粗粒度网络,形成每个组的两层代谢 bDSW 网络 (图1A),可发现健康人与炎症性肠病的代谢网络各自表现出特定的组织结构。
图1C详细展示了由于其他模块(绿线)的调节,每个模块(蓝线)的净总代谢丰度曲线分解成由内在容量(红线)和相关成分曲线产生的独立成分曲线。该图说明了每个模块的总丰度水平是如何受到(被动)或影响(主动)其他模块的丰度的。可以看出,取决于健康状态,被动和主动影响的模式之间的模块存在显著不同。如果受试者从健康状态改变为 CD,则中枢从3-羟基辛酸酯转变为吲哚乙酸酯。这说明细粒度的双向加权网络可以作为炎症性肠病健康风险的预测因子,而且还可以作为了解炎症性肠病的代谢机制的工具。
图1 利用185种代谢产物构建环境特异性代谢网络
3. 不同年龄间的代谢网络存在差异
衰老是身体和代谢功能的持续下降,与疾病的易感性增加密切相关。将健康组、UC和CD组分别按照年龄分为4组,之后对代谢网络进行粗粒化。发现对 HC 组来说(图2A),代谢网络随着年龄的增长而相对稳定,但对 CD 组来说则显示出巨大的变化。UC 组的一些相互作用随着年龄的变化而变化;例如,从18岁到60岁,M3促进 M5的强度增加,但是当年龄大于60岁时,这种促进转变为 M3抑制 M5(图2B)。这些发现表明,代谢网络对衰老的反应在健康人群和 IBD 人群之间以及 CD 和 UC 人群之间遵循不同的机制。
M9的独立成分(反映其内在能力)随着健康和患病人群的年龄大幅增加,这意味着 M9的内在表达增加是代谢功能老化的信号。然而,M9受其他模块影响的模式在三个组之间有所不同。健康人群的网络组织和结构在超龄时比病人群体更稳定。从一个健康状态下的中心模块转移到疾病状态时会改变它们的网络拓扑,这一改变显示出明显的年龄特异性变化。
图2 不同年龄段的被试在三种情况下的代谢网络
4. 疾病网络比健康网络在拓扑结构上更复杂
GLMY 同调理论(GLMY-homology)可分析网络拓扑结构的复杂性。对于粗粒化后的代谢网络的每个功能模块,考察其同调群的秩,即贝蒂数(Betti number),代表该维度下的网络复杂性。可知CD 和 UC 网络的中心M3在第一维和第二维上比健康网络M8表现出更多的拓扑特征。因此可以推断,疾病网络比健康网络更复杂。
图3 UC、CD与对照组粗粒化代谢网络的中心拓扑复杂度的对比
通过在0,1和2维度上根据 Betti 数(同调性秩)剖析代谢网络,考虑三组模块 M3的负边导出子网络(图4)。HC 和 UC 在第一维上各有三个孔(拓扑特征),但是这些拓扑特征在两组之间是不同的。
亚油酸是一种多不饱和 ω-6脂肪酸,它的代谢对健康至关重要。该发现意味着健康状态和疾病状态之间的拓扑差异,可以用其他代谢产物对亚油酸的抑制强度来解释。
为了使 UC 个体的代谢物网络在拓扑上等同于健康个体的代谢物网络,可以设计可以加强 N6-乙酰赖氨酸和甲基咪唑之间的拮抗作用的治疗干预,从而最大限度地减少其对亚油酸的抑制作用。这说明了该研究对相关药物研发的帮助。
图4 健康与IBD患者代谢网络拓扑结构对比的详细图,剖析的重点是 M3的细粒度网络的基础上的负面交互作用
5. 总结
该研究开创性地开发并应用统计物理模型来分析单一时间点的代谢数据,通过假设代谢物间达成进化稳定策略(ESS),构建代谢网络,再通过网络粗粒化和GLMY同调性分析其拓扑结构的差异,发现网络同调性可以很好地表征健康对照组成网络和IDB患者组成网络之间的差异,以及 UC 网络和 CD 网络之间的差异,并定位关键代谢物。
该研究为实现复杂网络理论剖析复杂疾病的机制基础提供了一个起点。未来的改进有很多方面,包括引入更多来源的数据,例如微生物组、转录组、蛋白组与表型组,在更多空间尺度上讨论众多因素如何介导复杂疾病的发生。另一个方向是引入相比Lokta–Volterra模型更为真实的生态学假设,例如考虑代谢物间的共生与竞争。该研究的框架还可能在分析同一个体中发生的多种疾病的共同病因,以及同时设计多种常见疾病的个性化预防策略更有前景的应用。
生命复杂性系列读书会
生命是什么?生命怎样起源?生命怎样演化?这些是对生命现象的本质追问,除了传统的生物学研究,如今有大量来自信息、物理、计算机领域的工具方法,正在揭开生命复杂性谜题。基于此,集智俱乐部策划“生命复杂性”系列读书会,自2020年11月5日至今,近百名在从事相关问题研究的老师同学或感兴趣的朋友参与。
了解读书会具体规则、报名读书会请点击下方文章:
推荐阅读
1. PNAS速递:复杂疾病的代谢组物理学2. Nat. Commun. 速递:进化如何塑造代谢表型?跨物种代谢网络的功能比较3. Nat. Mach. Intell. 速递:利用神经常微分方程预测微生物群落代谢谱4. 张江:第三代人工智能技术基础——从可微分编程到因果推理 | 集智学园全新课程5. 成为集智VIP,解锁全站课程/读书会6. 加入集智,一起复杂!
点击“阅读原文”,报名读书会