更新时间:2024-11-04 15:02:13
心血管疾病(CVD)是世界范围内导致死亡的主要原因之一,迫切需要在许多方面,特别是风险识别和预后预测方面找到答案。具有大量观察的真实世界研究为 CVD 研究提供了重要基础,但受到高维度、缺失或非结构化数据的限制。
机器学习 (ML) 方法,包括各种监督和非监督算法,可用于数据治理,并且可有效用于现实世界研究中的高维数据分析和插补。本文综述了几种常用ML方法在CVD领域的理论、优势和局限性以及应用,为进一步应用提供参考。
本文介绍了多种常用 ML 算法的起源、目的、理论、优点和局限性以及应用,包括层次和 k 均值聚类、主成分分析、随机森林、支持向量机和神经网络。一个例子使用收缩压干预试验(SPRINT)数据上的随机森林来展示ML在CVD中应用的过程和主要结果。
ML 方法是产生真实世界证据以支持临床决策和满足临床需求的有效工具。本综述用通俗易懂的语言解释了多种ML方法的原理,为进一步应用提供参考。未来的研究有必要开发准确的集成学习方法,以广泛应用于医学领域。
该研究发表在《心血管创新与应用》杂志上。