【CVIA综述】心血管疾病真实世界研究中的机器学习方法
2023/4/17 13:40:07 阅读:107 发布者:
以下文章来源于CVIA心指南 ,作者CVIA
近日,南京医科大学公共卫生学院赵杨教授团队和北京儿童医院冯国双研究员团队在Cardiovascular Innovations and Applications (CVIA) 杂志上发表了一篇综述:Machine Learning Methods in Real-World Studies of Cardiovascular Disease。
心血管疾病是全球主要死亡原因之一,每年造成约1790万人死亡。大量随机对照试验用于评估心血管疾病的预防和治疗的有效性和安全性,但其受限于花费、时间、普遍性和可能的伦理问题。真实世界研究,作为临床试验的有效替代,受到了越来越多的关注。真实世界数据来源广泛,包括电子健康记录、登记队列、保险数据和移动设备的记录等。真实世界数据具有高维度、缺失、非结构化、体量大且增长迅速等特点,传统的分析方法难以解决,使得研究者们开始广泛关注机器学习算法。
机器学习是一系列关于分类和预测的算法,根据结局变量是否标注可以分为有监督学习和无监督学习算法。无监督学习算法用于探索隐藏的数据模式,通过聚类、降维和变量选择等方法识别同质人群或变量。本综述围绕不同的聚类方法和主成分分析展开,并引用了大量心血管疾病领域的应用实例,该类方法可以进一步用于识别具有特定特征的亚组人群,用于探索精准医学。有监督学习算法使用带有标签的数据训练模型并用于预测概率或分类。目前广泛应用的有监督算法包括随机森林、支持向量机和神经网络。本综述围绕算法的原理展开并总结了优缺点。随机森林可以返回变量重要性排序,帮助临床医生筛选重要的预测变量,但并不代表因果关系。支持向量机基于复杂的数据原理,可以避免过拟合,但核函数的选择仍然基于主观判断。神经网络近年来发展迅猛,广泛用于影像图像识别与预测等方向。最后,本综述通过应用收缩压干预试验(SPRINT)数据,展示了随机森林算法在心血管疾病领域的应用过程和主要结果。
机器学习方法是基于真实世界数据产生真实世界证据的有效工具,可以用于支持临床决策和满足临床需求。本综述以通俗易懂的语言解释了多种算法的原理,为进一步的医学应用提供参考。
作者简介:
周佳薇
周佳薇,女,南京医科大学公共卫生学院博士研究生,研究方向为:临床统计中的方法学研究。
通讯作者简介:
冯国双
冯国双,博士,研究员,主要擅长医学数据探索与挖掘分析。目前任国家儿童医学中心/北京儿童医院大数据中心主任。兼任北京市慢病与健康教育研究会大数据分会主任委员、中国卫生信息与健康医疗大数据学会儿促会副秘书长、中国现场统计研究会空间统计分会理事、中国医药教育协会医药统计专业委员会委员、中华预防医学会中国生物统计学会青年委员等。
赵杨
赵杨,博士,教授,博士生导师,南京医科大学公共卫生学院生物统计学系主任。中华预防医学会生物统计学分会副主任委员,中国卫生信息学会卫生统计教育委员会副主任委员,中国临床肿瘤学会(CSCO)生物统计专家委员会副主任委员,中国医药教育学会医药统计专委会副主任委员,江苏省预防医学会卫生统计学专业委员会主任委员。
原文链接:(点击下方阅读原文可直达)
https://www.scienceopen.com/hosted-document?doi=10.15212/CVIA.2023.0011
转自:“ISE学术前沿”微信公众号
如有侵权,请联系本站删除!