投稿问答最小化  关闭

万维书刊APP下载

Mil Med Res | 北京航空航天大学刘建刚团队:利用人工智能方法辅助磁共振成像诊断前列腺癌的益处!

2023/9/11 8:59:44  阅读:190 发布者:

美国国家综合癌症网络(National Comprehensive Cancer Network, NCCN)报道,磁共振成像适用于前列腺癌诊疗前后的监测。作为一种非侵入性成像方法,磁共振成像可以提供对肿瘤及其周围微环境的全面且宏观描述。因此基于磁共振成像的表征可以作为一种量化前列腺癌异质性的实用方法,从而有可能促进前列腺癌精准诊疗的发展。在临床诊断中,根据病变的一些视觉定量特征(如位置、形状、大小和强度),对磁共振图像上前列腺病变进行视觉评估是一种传统的影像学诊断方法。该方法虽然在诊断中起着重要作用,但也有一些局限性。第一,放射科医生对于磁共振影像的视觉评估很大程度上依赖于其自身的专业知识水平,这通常会在不同医生之间产生阅片诊断结果差异。第二,视觉评估无法发现很多细微但是能够反映肿瘤异质性的磁共振图像特征。第三,视觉评估是定性或半定量的。这些限制可能导致前列腺癌诊断的准确性和稳健性下降。人工智能(Artificial intelligence, AI)是一种数据驱动的方法。AI模型经过大量样本的训练后,可以自动选择最优的特征模式来准确预测新的样本。因此,当使用AI方法分析前列腺病变的磁共振图像时,它可以挖掘精细和深度的影像信息,而这些信息可以反映前列腺可疑病变的相对完整的异质性。由于其在医学图像分析方面的优势,AI方法已被广泛应用于辅助前列腺癌的诊断和治疗过程中。

目前,大多数已发表的关于AI辅助前列腺癌诊疗管理的综述性文章都集中在对AI方法的建模过程和临床应用的分析上,但是在AI模型与传统临床评估方法之间进行性能比较的综述性文章还相对较少,因此对于AI方法在磁共振成像前列腺癌诊疗管理中相对于传统临床诊断方法带来哪些优势尚缺乏较为深入的分析和探查。基于以上现状,北京航空航天大学刘建刚研究员课题组对同时报道了利用基于磁共振成像的AI方法和传统临床评估方法辅助前列腺癌临床诊疗管理的研究进行了分析和总结,特别是在前列腺癌的诊断和预测性能方面对这两种方法进行了比较,从而探索AI方法在磁共振成像前列腺癌精准诊疗中的临床价值和潜力。文章第一作者为北京航空航天大学博士生赵立涛,共同第一作者为中科院自动化所刘振宇研究员,通讯作者为北京航空航天大学刘建刚研究员、田捷教授和北京大学第三医院卢剑教授。

本研究主要关注AI方法在前列腺癌诊疗管理中的两个应用领域,分别是诊断领域,如肿瘤识别和前列腺癌风险分层;预测领域,如对前列腺癌的治疗效果和进展的预测。一般来说,开发用于医学成像分析的AI模型主要有两种方法:基于人工定义特征的影像组学方法和基于深度学习的影像组学方法。构建这些AI模型主要包括以下几个步骤:(1)图像采集和预处理,(2)模型开发,(3)模型性能验证(1)

1 人工智能方法的工作流程

本研究首先比较了AI方法与传统临床评估方法在前列腺癌诊断领域的表现,包括对临床显著性前列腺癌(Clinically significant prostate cancer, csPCa)精准诊断和前列腺癌风险分层任务。结果表明AI方法在诊断前列腺癌方面的总体性能优于放射科医生评估水平。特别是对于csPCa的检测(2a non-csPCa, 2bcsPCa)AI方法的综合受试者工作特征曲线下面积(Area under summary receiver operating characteristic curve, SROC-AUC)和综合特异性均高于临床评估方法。此外,与传统临床评估方法不同,AI方法所提供的定量结果对于放射科医生个人专业知识水平的依赖程度大大降低,因此可以获得一致的诊断结果。这种AI方法相对传统临床评估方法的优势主要是因为前者可以挖掘到后者所无法获得的与前列腺癌诊断相关的细微和深度信息。前列腺影像报告和数据系统(Prostate imaging reporting and data system, PI-RADS)是前列腺癌诊断常用的临床评估方法。作为一种半定量评分系统,PI-RADS对前列腺癌诊断的特异性较低,导致不必要的有创性穿刺活检。此外,由于图像特征和临床特征包含前列腺病变不同的信息,因此将临床特征与基于磁共振影像的AI模型相结合可以提高前列腺癌的诊断性能。如图3a所示,在本研究纳入的综合模型中,PSA/PSADPI-RADS、前列腺体积等临床特征经常与AI模型相结合。

其次,本研究还比较了AI方法与传统临床评估方法在前列腺预测领域的表现,包括对预测淋巴结转移(Lymph node Involvement, LNI)、包膜侵犯(Extracapsular extension, ECE)或生化复发(Biochemical recurrence, BCR)等事件的预测。结果表明,AI方法在预测前列腺癌方面的总体性能优于放射科医生的临床评估。特别是对于前列腺癌不良病理(ECE, 2c; LNI, 2d)的预测,AI方法的SROC-AUC、综合敏感性和特异性均高于临床评估方法。而且在所纳入的一些研究中使用外部测试集对AI模型进行了测试,这在一定程度上证明了这些模型在与前列腺癌预测相关的临床应用中的潜在稳健性和泛化性。此外,一些临床特征也常用于结合AI模型进行前列腺癌疗效预测(3b)。这些发现表明,AI模型可以有效地提高术前预测性能,帮助临床医生做出个体化的诊疗决策。

然而,这些利用AI辅助前列腺癌诊断和预测的研究也存在一些局限性。第一,虽然在一些研究中使用了两个或多个中心的样本,但大多数研究采用了单中心或小数据量的患者队列。因此所提出的AI模型在前列腺癌诊断和预测的泛化性还需要进一步验证。第二,用于前列腺癌诊断和预测的深度学习模型大多是基于二维卷积神经网络(Convolutional neural network, CNN)构建的。然而,对于二维 CNN模型,最终的患者级别的输出结果通常是多个切片图像预测值的平均值,而未考虑切片之间的空间关系。三维CNN可以充分利用空间信息,实现准确的患者级别上的预测。因此,三维深度学习模型应在未来的研究中进一步使用。第三,一些研究虽使用独立的外部验证队列来评估模型性能,但是通常都是回顾性研究。因此,这些模型需要进一步使用前瞻性数据进行验证。最后,基于人工定义特征的影像组学方法仍然需要精确的人工标注,该过程耗时费力。

2 前列腺癌患者的典型示例

3与基于磁共振影像的人工智能模型相结合的临床特征的频率

最后,本研究还对前列腺癌诊断和预测领域所有纳入的研究进行影像组学评分(Radiomics quality score, RQS)评估(4)。这些研究的总平均RQS15.2(11.0-20.0)。总平均RQS比率为42.2%(15.2/36)RQS评估结果表明,与AI模型构建过程密切相关的RQS元素评分较高,如“Feature reduction or adjustment for multiple testing”,“Comparison to goldstandard”和“Discrimination statistics”等;而与AI模型性能评估密切相关的RQS元素评分较低,如“Prospective study registered in a trial database”,“Cost-effectiveness analysis”和“Phantom study on all scanners”等。这说明,纳入研究中的AI模型构建具有较为完善和规范的流程,但其泛化性和临床实用性则还需要通过更高等级的循证医学证据来进一步验证。

4 所有纳入诊断和预测领域研究的人工智能模型的RQS评估结果

未来AI模型可以在以下几个方面进行改进。第一,AI模型可使用高等级的循证医学证据进行验证,例如采用跨国性不同的种族数据或前瞻性数据。第二,基于磁共振成像的影像组学模型与基于病历的自然语言处理相结合,将提供更全面的信息,进一步减轻放射科医生的负担。第三,将开发更先进、更复杂的人工智能方法,例如将放射科医生的专业知识整合到最新的网络架构中,以进一步改善对前列腺癌的诊断和预测效能。第四,AI方法在前列腺癌诊疗管理中的应用,还应进一步扩展到本研究中上述任务之外的领域,如识别适合主动监测的患者、局部复发预测、生存分析、不同治疗方案预后比较等。

参考文献:

Li-Tao Zhao, Zhen-Yu Liu, Wan-Fang Xie, Li-Zhi Shao, Jian Lu, Jie Tian & Jian-Gang Liu. What benefit can be obtained from magnetic resonance imaging diagnosis with artificial intelligence in prostate cancer compared with clinical assessments? Military Medical Research volume 10, Article number: 29 (2023). https://doi.org/10.1186/s40779-023-00464-w.

转自:“解说科研项目”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com