背景:
肺癌是全球癌症相关死亡的主要原因。它在介观尺度上展示了通常人眼无法识别但可以在医学影像上作为影像组学特征非侵入性捕获的表型特征,这些特征可以形成适合机器学习的高维数据空间。我们可以利用影像组学特征在人工智能范式中对患者进行风险分层,并预测组织学和分子结果以及临床结局指标,从而促进改善患者医疗的精准医疗。与组织采样驱动的方法相比,基于影像组学的方法具有非侵入性、可重复性、成本低和不易受肿瘤内异质性影响等优势。
简介:
2023年5月19日,来自英国伦敦帝国理工学院外科和癌症系的Eric O. Aboagye教授课题组在Seminars in Cancer Biology(IF: 17.0)杂志上发表题为“Radiomics and artificial intelligence for precision medicine in lung cancer treatment”的文章[1]。本文就影像组学结合人工智能在肺癌精准治疗中的应用进行综述,重点讨论该领域的开创性和开创性工作,以及未来的研究方向。
主要结果:
在提取影像组学特征后,我们可以将其用于统计或深度学习范式,以开发预测各种临床结局的模型。肺癌影像组学自问世以来引起了大量的研究兴趣,许多研究提出了预测肿瘤组织学、驱动突变、治疗反应、不良反应、治疗后复发和患者预后的模型,用于一系列治疗选择。超过70%的此类出版物是在过去三年中发表的,表明人们对该领域的兴趣日益浓厚。近年来,关于影像组学在肺癌治疗中的应用发表了大量综述。文献计量学检索显示,近3年发表了55篇此类综述。
图1:肺癌影像组学研究趋势。
影像组学。
影像组学特点。
影像组学包括几个特征类别,从一阶特征(如能量和熵)到高阶特征(如小波和拉普拉斯-高斯滤波数据)。影像生物标志物标准化倡议(IBSI)的建立是为了公布一组已证实可重复性的影像组学特征。使用开源包Pyradiomics可计算的与IBSI兼容的特征如图2A所示为系统发育树。
特征的冗余性和再现性。
PyRadiomics可在每张图像上提取多达1500个特征,其中部分特征呈现重叠信息。这些特征的加入会给模型开发带来不必要的偏倚,并增加过度拟合的风险。例子包括强度特征,如标准偏差和方差,以及形状特征,如球形不比例和球形。
并不是所有的特性冗余在概念上都是值得注意的。使用共识聚类可以识别和减少更复杂的冗余,其中通过最大化每个聚类内特征的相关性,将特征空间缩减为几个非冗余的特征聚类。
特征标准化。
2020年,IBDI推出了包含169个特性的列表,这些特性具有标准定义和经过验证的可重复性。影像组学研究的依从性可通过影像组学质量评分(radiomics Quality Score, RQS)进行评估。多变量个体预后或诊断模型的透明报告(TRIPOD)声明提出了涵盖大多数基于影像组学的研究的报告指南。
图2:常见的影像组学特征。
多组学分析。
临床特征如年龄、性别、体能状态、既往癌症治疗、家庭、吸烟和饮酒史已被用于建立肺癌预后模型。在影像组学研究中,它们被用于构建比较模型来衡量基于影像组学的模型的性能,或者使用多变量回归或列线图结合影像组学特征来提高模型的性能。
基因组测序技术的进步,如RNA芯片和定量逆转录聚合酶链反应(qRT-PCR),为建立基于基因组学的肺癌患者预后和治疗反应预测模型奠定了基础。多项研究提出了基于基因组学的早期NSCLC模型,该模型有效地将患者分为高危组和低危组,优于TNM分期的性能。基于基因组学的方法的主要局限性是依赖于组织采样,而组织采样具有侵袭性,并且容易受到肿瘤异质性和进化突变引起的问题的影响。随着驱动突变靶向治疗的出现,二代测序现已成为特定患者群体的标准治疗。与临床特征一样,在可用的情况下,基因组学可与影像组学在多变量框架中集成,以提高性能。
利用基因组学和转录组学方法对影像组学模型进行生物学相关性分析,有助于加深对疾病过程和治疗的理解。通过使用基因集富集分析(GSEA)整合影像组学和转录组学,建立了与模型的组分特征最显著相关的细胞通路。将相关的细胞通路与单细胞RNA测序(scRNAseq)数据进一步整合,可以识别表达最相关基因的细胞群。
图3:放射组学的工作流程。
肺癌的精准医疗。
影像组学在肺癌治疗中的主要应用是虚拟活检和临床结局预测。虚拟活检可无创预测肿瘤组织学和驱动突变,从而帮助制定治疗计划,从而解决了肿瘤内异质性、进化突变和采样不足的问题。在临床结局预测方面,对于接受SABR、根治性放疗、化疗、靶向治疗和免疫治疗的患者,预测患者的预后、治疗反应、疾病复发或进展和治疗副作用。
临床结局预测。
患者预后或生存预测是影像组学最早的应用之一。这可以通过CT影像组学实现,例如在混合NSCLC病例的外部验证数据集中,3年总生存(OS)的AUROC达到0.67;也可以通过PET-CT影像组学实现,通过手工制作的影像组学和深度学习特征,将患者分层为高风险和低风险生存组。
此外,影像组学在接受特定治疗的NSCLC患者预后评估中的应用也得到了广泛的研究和报道。深度学习特征在放疗后(AUROC 0.70)和手术后(AUROC 0.71)队列中也显示出合理的性能。
治疗反应和疾病复发。
在SBRT治疗的NSCLC中,两个影像组学特征被确定与局部失败相关,即均匀性和长时间高灰度强调。同样,两个PET-CT影像组学特征,PET IC2和CT平坦度,与SBRT后肿瘤复发相关,并且在外部验证中显示出对后者的预测价值,AUROC为0.905。CT深度学习特征可以预测SBRT治疗失败,并对降低剂量具有指导作用。
对于接受根治性放疗的患者,基于CT的影像组学(尤其是GLSZM区域百分比)预测治疗后2年内疾病复发的AUROC为0.673,在纳入年龄、体能状态、体重指数、吸烟状态和肿瘤分期等临床特征后,AUROC进一步提高至0.738。
CT影像组学模型外部验证的AUROC为0.85。对于化疗疗效的预测,AUROC为0.797,优于使用已知临床特征包括肿瘤分期(AUROC = 0.670)。在靶向治疗方面,对于EGFR-酪氨酸激酶抑制剂(TKI)治疗的NSCLC, CT影像组学预测疗效的AUROC为0.90,而对于PD-1/PD-L1 CBI治疗的NSCLC,新近建立的CT-影像组学模型预测非疾病进展的AUROC为0.79。另一个基于CD274计数建立的模型在该患者组中预测治疗反应的AUROC为0.68。
图4:预测模型中与影像组学特征相关的基因组和转录组学。
结论和展望:
在过去的50年里,即使有了新的治疗方法和疾病筛查,与其他恶性肿瘤相比,肺癌的长期生存率并没有明显提高。这可以归因于疾病的复杂性:尽管肺癌的患病率和重大的健康挑战,但我们对其细胞群的地理空间结构和进化模式的知识仍然有限。肺癌的组织学异质性是由于存在多个细胞亚群,具有不同的生长、侵袭或转移趋势。全外显子组测序显示,接受治疗的转移灶携带在未接受治疗的转移灶中未发现的新驱动突变。这种新生突变被认为是获得性治疗耐药的来源。
尽管影像组学在推进精准癌症治疗方面的潜力已得到充分证实,但肺癌的影像组学仍受到几个关键负担的限制。首先,其研究吸引力近年来产生了大量文献,其中许多缺乏标准化的方法学和报告。一篇综述评估了截至2019年的NSCLC影像组学论文,发现RQS评分非常低,平均仅为2.5分(总分36)。可以说,最需要关注的领域是外部验证,即使是最新发布的模型也经常缺乏独立测试集的验证。这一不足可以通过不断扩大的公开影像学数据集(如癌症影像学档案[Cancer imaging Archive, TCIA]中的数据集)来解决,这些数据集通常与临床、组织学和基因组/转录组数据配对。
深度学习提供了传统手工影像组学的另一种选择。它减轻了模型对准确的肿瘤分割和特征定义的依赖,从而提高了特征的一致性和再现性,并减少了数据管理所需的工作量。然而,其在目前文献中的应用仍然有限,这可能是由于其庞大的训练数据需求和模型的可解释性欠佳。
原文链接:https://linkinghub.elsevier.com/retrieve/pii/S1044-579X(23)00080-9
参考文献:
[1] Chen M, Copley SJ, Viola P, Lu H, Aboagye EO. Radiomics and artificial intelligence for precision medicine in lung cancer treatment. Semin Cancer Biol. 2023 May 19;93:97-113. doi: 10.1016/j.semcancer.2023.05.004. Epub ahead of print. PMID: 37211292.
转自:“生物医学科研之家”微信公众号
如有侵权,请联系本站删除!