制定一个多层次模型,以识别癌症治疗延迟风险的患者

631次阅读
没有评论

编译 | 曾全晨

审稿 | 王建民

今天为大家介绍的是来自Zachary A. K. Frosch团队的一篇论文。

制定一个多层次模型,以识别癌症治疗延迟风险的患者

患者在癌症治疗开始方面的延误会导致临床结果恶化,引发痛苦。然而,近年来患者面临更频繁的延误问题。这种延误更常见于弱势群体,包括来自未充分服务的种族和民族群体、收入较低的人以及居住在资源匮乏、高度贫困社区的人。导致延误的因素是复杂多样的,涉及多个层面,通常不仅受到临床因素的影响,还受到社会健康决定因素(SDOH)的影响。鉴于及时的癌症治疗对患者健康至关重要,而且会加剧健康不平等问题,一些认证机构现在将其视为一项质量指标,研究人员也将其作为评估政策干预效果的一个指标。

准确确定哪些患者可能面临治疗延误的风险可以有助于及时采取有效干预措施。虽然协调护理和患者导航服务可能有助于提高癌症治疗的及时性,但这些干预措施需要大量资源。因此,识别在诊断时面临最大延误风险的患者,并随后针对他们进行干预,可以提供最大的回报,并有助于识别同时受到健康不平等问题影响的患者。然而,迄今为止,大多数治疗延误研究要么侧重于与生存的关联,要么没有同时考虑临床、人口统计学和SDOH指标,或者是以解释性框架而不是预测性框架来研究这个问题。预测建模方法,包括使用从电子健康记录(EHR)中获取的数据训练的机器学习算法,可以成功地识别癌症患者中的与临床相关的结果。作者的目标是开发并验证一个模型,使用多层次数据来源,来估计普通实体瘤患者治疗延误的概率。

数据来源

符合条件的成年患者是那些在2013年1月1日至2019年12月31日期间被诊断为有侵袭性乳腺癌、肺癌、结直肠癌、膀胱癌或肾癌的患者,并随后在作者所在中心接受治疗的患者。通过癌症登记机构记录了共计9918例诊断。研究数据集是通过结合癌症登记机构的数据(例如,诊断到首次治疗间隔)、电子健康记录(例如,实验室值和合并症诊断)以及从2015年至2019年收集的美国社区调查5年估计数据导出的。为了获得社区层面的变量,参与者的地址经过地理编码到了普查区级别。然后,将与这些地理编码相关联的社区层面的变量(例如,家庭收入中位数)附加到了数据集中。这导致了一个合并的多层次数据集,其中包含了临床、人口统计和社区层次的普查数据。

模型变量

制定一个多层次模型,以识别癌症治疗延迟风险的患者制定一个多层次模型,以识别癌症治疗延迟风险的患者制定一个多层次模型,以识别癌症治疗延迟风险的患者

表 1

如表1所示,变量包括在几个不同的类别中:人口统计学(包括种族和民族,从电子健康记录中获取)、癌症特征(例如肿瘤类型和分期)、实验室指标、影像检查医嘱和社区层面等变量。社区层面的变量代表了社会健康决定因素(SDOH)的5个领域,这些因素已经在文献中被发现与癌症结果相关。

实验结果

研究总共包括了6409名患者,平均年龄为62.8岁(标准差12.5岁),其中4321名(67.4%)为女性。最常见的癌症类型包括乳腺癌(2576例,40.2%)、肺癌(1738例,27.1%)和肾癌(1059例,16.5%)。在这6409名患者中,有229人(3.6%)是亚洲人或太平洋岛民;850人(13.3%)是非洲裔;4975人(77.6%)是白人;124人(1.9%)属于其他种族;231人(3.6%)的种族不明。英语是5830人(90.1%)的首选语言,794人(12.4%)来自根据Yost指数划分的最经济弱势的五分之一(见表1)。对于5145人(80.3%)来说,这是他们的首次恶性肿瘤诊断,而4944人(77.1%)在治疗医院之外被诊断。总共有1621名患者(25.3%)经历从诊断到治疗的时间超过60天。

制定一个多层次模型,以识别癌症治疗延迟风险的患者制定一个多层次模型,以识别癌症治疗延迟风险的患者

表 2

模型的AUC-ROC(95%置信区间)为0.713(0.679-0.745)。模型选择的变量的回归系数见表2。如果患者在治疗机构被诊断,或者这是他们的首次恶性肿瘤诊断,或者他们是亚洲人/太平洋岛民或白人(与黑人相比),或者他们有私人医保(与无保险相比),或者他们的癌症处于较晚期,那么他们经历延迟的可能性较低。如果患者患有并发症(如心力衰竭、血管疾病、肺部疾病)或血肌酐水平升高,那么他们经历延迟的可能性较高。与最不劣势的群体相比,如果患者来自极其贫困混乱地区,以及邻里居民中西班牙裔居民比例较高的地区(Race-H ICE指数),那么他们经历延迟的可能性较高。对于黑人居民比例(Race-B ICE指数)较高的社区,这种情况并不明显。

制定一个多层次模型,以识别癌症治疗延迟风险的患者

表 3

制定一个多层次模型,以识别癌症治疗延迟风险的患者

表 4

制定一个多层次模型,以识别癌症治疗延迟风险的患者

表5

与总体人群相比,黑人患者、除去非西班牙裔白人种族以及生活在最不利地区的患者(根据Yost指数的五分位)的AUC-ROC较低,见表3,但置信区间范围较宽。尽管模型选择了社区层面的SDOH变量作为贡献变量,但在使用这些变量和排除这些变量时,AUC-ROC在整体研究人群和分析的社会人口亚组人群中都保持相似(见表4)。表5呈现了在一系列切割值下,考虑患者延误风险的模型的敏感性、特异性、PPV和警戒率。作者选择这些切割值是基于估计概率的分布,旨在平衡这4个度量。特异性在各种切割值下都很高,而敏感性在切割值上表现出更大的变化。将切割值从0.5降低到0.4会将敏感性提高86%,而只会将特异性从0.954降低到0.902,PPV从0.548降低到0.514。然而,这个阈值的改变使警戒率翻了一番。

结论

机器学习模型结合临床、人口统计和社区级别(SDOH)数据,能有效地识别出可能延迟癌症治疗启动的患者。在分析不同人群亚组的性能时,分析结果表明,在某些弱势群体中,估计可能不如整体人群可靠。综合而言,作者的研究结果表明,结合临床和SDOH信息的机器学习模型是可行的,可以识别出存在治疗延迟风险的患者。然而,如何最佳和最公平地将SDOH变量纳入这些模型中需要进一步研究。

参考资料

Frosch ZAK, Hasler J, Handorf E, et al. Development of a Multilevel Model to Identify Patients at Risk for Delay in Starting Cancer Treatment. JAMA Netw Open. 2023;6(8):e2328712. 

doi:10.1001/jamanetworkopen.2023.28712

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy