Science | 精准医疗的挑战

今天为大家介绍的是来自Frederike H. Petzschner团队的一篇论文。

Science | 精准医疗的挑战

精准医疗承诺为个体患者量身定制治疗方案。机器学习模型被视为加速精准医疗发展的工具，通过筛选大量复杂数据来精确识别基因、社会人口学或生物标志物，预测适合特定人在正确时间的正确治疗方法。然而，对这些先进预测工具的最初热情现在面临着严峻的现实检验。Chekroud等人展示了在一个临床试验中预测精神分裂症患者对抗精神病药物反应的机器学习模型未能推广到来自新的、未见过的临床试验数据。这些发现不仅凸显了对机器学习方法实施更严格的方法论标准的必要性，还要求重新审视精准医疗所面临的实际挑战。

预测一个患者是否会从特定治疗中受益的答案可能在于他们的基因、生物学特征、社会人口学背景、社会环境、过往经历或许多其他潜在因素。机器学习技术能够分析大型数据集，并识别出最有效的特征组合来准确预测感兴趣的变量。因此，它们为发现预测个体治疗反应的相关特征或生物标志物提供了一条有希望的途径。通常，这包括在已知结果的数据集上训练模型，例如对给定治疗的反应，这被称为监督学习。这种方法的一个常见缺陷是过拟合。过拟合的一个迹象是模型在训练数据上准确预测结果，但在新的、未见过的数据上表现不佳。为了解决过拟合问题，验证模型在未见数据上的表现至关重要。交叉验证是这一目的的一个广泛使用的技术。它涉及反复将数据分割成子集，然后在一个子集上训练模型，并评估其在剩余“保留”数据上的预测准确性（见图）。

Science | 精准医疗的挑战

图1：使用机器学习进行个体治疗预测是基于分类器的开发。为了防止过拟合，模型验证至关重要，通常通过交叉验证或样本外验证来实现。样本外验证需要一个完全独立的数据集，虽然这种方法更耗资源，但它对过拟合的敏感性较低，并且可以提供更具泛化性的结果。

然而，交叉验证并非万无一失。Chekroud等人的工作揭示，在特定临床试验中使用交叉验证训练的模型，用于预测精神分裂症患者对抗精神病药物的反应，未能在其他独立临床试验中预测治疗反应。交叉验证可能导致对保留数据过拟合的一个原因是，模型开发者通过迭代模型调整，最终可能使用了所有可用数据。这个问题可能比通常承认的更为普遍。例如，对116项跨多种精神疾病诊断的研究的全面回顾发现，在样本量小（<50名参与者）的研究中特别有过拟合迹象。小样本量也会导致交叉验证结果的大幅度变化，尽管这些问题在统计学和机器学习中众所周知，但许多研究仍未遵循严谨的科研方法来改进交叉验证的结果。

确保机器学习模型泛化性的可靠方法在于验证其在真正独立、未触碰的验证样本上的预测准确性，这称为样本外验证。通常，由于获取大型数据集的挑战以及对数据获取和使用的严格规则，这种方法在临床研究中并未被使用。然而，Chekroud等人的研究增加了越来越多的证据，强调了这些更强健的验证标准的必要性，以避免过于乐观的结果。即使是经过适当验证并且得到大样本支持的模型，试图预测个体患者的临床结果或治疗反应也可能是不可靠的。在Chekroud等人的研究中，即使将来自多个临床试验的数据汇总以训练模型，其预测仍然无法推广到新的独立试验。这一点的原因是复杂且多方面的。主要因素之一是临床人群数据中固有的异质性。这一问题在精神疾病中尤为突出，这类疾病通常由一系列症状（综合征）定义。具有相同诊断标签的患者可能表现出截然不同的症状，需要不同的治疗。此外，不同个体中相同的症状可能有不同的生物学基础，因此需要不同的治疗策略。仅基于诊断标签的机器学习模型，而不考虑这种异质性，可能导致预测有效治疗策略时的不准确。

应对这一挑战的一种有希望的方法是将患者划分为更精确定义的类别，例如基于潜在症状原因。这可以通过使用旨在描述潜在疾病机制的理论驱动的计算模型部分实现，这种方法在计算精神病学领域越来越受到重视。这些模型越来越多地与数据驱动的机器学习技术一起使用，形成了强大的工具来解决患者群体中的异质性问题。另一种异质性可能源于研究、地点或时间点之间的系统差异。因此，基于特定背景数据（如特定人群、国家、环境或时间段）训练的机器学习模型的预测可能依赖于与当前临床结果相关但在给定研究中与临床结果并无因果关系的特征，在其他背景下可能不具预测性。解决这种异质性的一种方法是汇集多个研究和地点的数据。

使用机器学习预测医学中个体治疗反应的挑战，特别是在精神病学背景下，源于与模型验证标准、诊断异质性以及使用的结果测量相关性的复杂交互问题。解决这些挑战对于有影响力的临床研究至关重要，并有助于实现有效的精准医疗发展。

编译 | 曾全晨

审稿 | 王建民

参考资料

Frederike H. Petzschner ,Practical challenges for precision medicine.Science383,149-150(2024).

DOI:10.1126/science.adm9218

ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง

tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.

ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.

ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.

ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!

ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

Science | 精准医疗的挑战

超越DeepSeek-R1，数学形式化准确率飙升至84% | 字节&南大开源

开源Qwen一周连刷三冠，暴击闭源模型！基础模型推理编程均SOTA

这个5亿播放的AI视频，邪乎得平平无奇

TRAE推出SOLO模式，业内首个「Context Engineer」来了

B站亮相2025世界人工智能大会，发布最受年轻人关注的TOP30 AI应用

刘强东连投3家具身智能！京东美团「战火」烧到外卖之外

3亿美元薪酬被10人拒绝！OpenAI首席研究官一句话引发硅谷史上最疯狂抢人大战

蚂蚁ACL活动全览！论文串讲、人才专项答疑与闭门晚宴等你报名

手术刀式去噪突破LLM能力上限，从头预训练模型下游任务平均提高7.2% | 中科院＆阿里

IMO怒斥OpenAI自封夺金，“91位评委均未参与评分”