周敏、瞿介明教授《Respiratory Research》发文,揭示利用机器学习整合CT放射学和临床特征预测新冠肺炎后肺纤维化
来源: 瑞金医院图书馆 4 天前


2025年8月, 周敏教授和瞿介明教授《Respiratory Research》 【IF 5,Q1】杂志在线发表题名为“Integrating CT radiomics and clinical features using machine learning to predict post-COVIDpulmonary fibrosis.”——利用机器学习整合CT放射学和临床特征预测新冠肺炎后肺纤维化的研究论文。


瑞金医院呼吸与危重症医学科 周敏教授瞿介明教授、同济大学附属同济医院的 余莉教授为论文的共同通讯作者;瑞金医院呼吸与危重症医学科 赵倩倩博士研究生李依洁硕士研究生、瑞金医院卢湾分院吸与危重症医学科 赵春柳副主任医师为论文的共同第一作者。


doi.org/10.1186/s12931-025-03305-7


上海交通大学医学院附属瑞金医院呼吸与危重症医学科周敏教授、瞿介明教授与医智源健康科技的王平老师团队合作,联合上海市三家医疗中心,在Respiratory Research期刊上发表了一项回顾性临床研究。该研究整合定量胸部CT标志物与临床指标,用于预测新冠肺炎后肺纤维化(PCPF)的发生风险,并采用机器学习算法系统评估不同模型的预测效能,最终开发并验证了一种对PCPF具有良好预测性能的模型,可为患者的早期风险分层与临床干预提供支持。该项目得到科技部国家重点研发计划应急攻关项目2024YFC3044400的资助和支持。


研究背景


超过一半的新冠肺炎幸存者在康复6个月后出现急性新冠肺炎后遗症(PASC)。肺纤维化(PF)是PASC最重要的肺部表现之一。放射组学可以从医学成像中提取定量图像特征的高通量挖掘,基于放射学的精确诊断和治疗决策支持系统可以成为现代医学中的有力工具。定量CT(qCT)允许自动、可重复和可量化的指标,可以在CT图像上测量正常和患病的肺部,但在急性肺部疾病中尚未得到很好的研究。目前缺乏可靠的生物标志物用于新冠肺炎后肺纤维化(PCPF)的早期检测和风险分层,这凸显了开发先进预测工具的紧迫性。该研究旨在开发一种基于机器学习的预测模型,整合定量CT(qCT)影像组学和临床特征来评估COVID-19患者肺纤维化风险。


研究方法


这项多中心回顾性研究纳入了 2022 年 12 月至 2023 年 10 月期间上海三家医院(瑞金医院、同济医院和瑞金医院卢湾分院)确诊的 1251 名成年 COVID-19 肺炎患者。经过入排标准筛选后共纳入204例确诊的COVID-19肺炎患者。其中来自瑞金医院的93例患者分配至开发队列(74例用于训练,19例用于内部验证),来自三家独立医院的111例患者构成外部验证队列。


研究入组流程图


随访期间获得的 CT 图像以及完整的电子健康记录由两位呼吸科专家独立、全面地评估。COVID-19 患者的肺部遗症被分为残留的肺纤维化改变(PF组)和无纤维化(非PF 组)。所有胸部 CT 图像均使用 AVIEW 软件处理并进行全肺分割,主要流程见图1。采用qCT软件分析胸部CT图像,从电子健康记录中获取临床数据和实验室参数。利用最小绝对收缩与选择算子(LASSO)回归及5折交叉验证筛选最具预测性的特征,独立训练了12种机器学习算法,并通过受试者工作特征(ROC)曲线、曲线下面积(AUC)值、敏感性和特异性评估其性能。



研究结果


1.患者特征


该研究纳入了瑞金医院、同济医院和瑞金医院卢湾分院收治的 204 例确诊 COVID-19 肺炎患者,其中包含103 例 PF患者和101例非PF患者。开发队列包括40例PF患者和53例非PF患者,而外部验证集包括63例PF患者和48例非PF患者。在模型开发队列和外部验证队列中,PF组显著比非PF组年龄更大,且 COVID-19 肺炎更严重(p = 0.004 和 p = 0.003;p = 0.003 和 p = 0.001)。与非PF患者相比,PF患者的入院时中性粒细胞计数、肌酸激酶同工酶(CK-MB)水平和D-二聚体水平显著更高。重要的是,整个队列中的PF患者比非PF患者更频繁地接受抗凝治疗和抗纤维化药物。



2.影像组学特征提取和特征选择


使用 AVIEW 软件,研究者对肺部进行了多级分割,并对ILA和ILD进行了纹理分析,在导入图像后自动生成定量结果。共提取78个特征,最终筛选出10个特征用于模型开发,包括年龄、中性粒细胞计数、中性粒/淋巴细胞百分比、嗜碱性粒细胞百分比、是否患有糖尿病、新冠肺炎严重程度分类、抗纤维化治疗、抗凝剂使用、whole lung_reticulation (%) ILD texture analysis以及ILA_Num of lung Zones≥5%_whole lung_ILA。



3.联合模型的开发与验证


对12种广泛使用的机器学习模型进行了比较,发现支持向量机(Support Vector Machine, SVM)模型展现出了最高的预测性能,其构建的组合模型表现出很强的辨别力,训练队列的AUC为0.836(95%CI:0.830-0.842),内部验证队列为0.796(95%CI:0.777-0.816),外部验证队列为0.757(95%CI:6.91-0.873)。



研究结论 


研究者开发并验证了一个整合 CT 影像组学和机器学习的临床预测模型,用于识别肺部后遗症,为高风险肺纤维化 COVID-19 患者的早期干预和个性化管理提供了宝贵指导。


参考文献

Background

The lack of reliable biomarkers for the early detection and risk stratification of post-COVID-19 pulmonary fibrosis (PCPF) underscores the urgency advanced predictive tools. This study aimed to develop a machine learning-based predictive model integrating quantitative CT (qCT) radiomics and cliical features to assess the risk of lung fibrosis in COVID-19 patients.

Methods

A total of 204 patients with confirmed COVID-19 pneumonia were included in the study. Of these, 93 patients were assigned to the development cohort (74 for training and 19 for internal validation), while 111 patients from three independent hospitals constituted the external validation cohort. Chest CT images were analyzed using qCT software. Clinical data and laboratory parameters were obtained from electronic health records. Least absolute shrinkage and selection operator (LASSO) regression with 5-fold cross-validation was used to select the most predictive features. Twelve machine learning algorithms were independently trained. Their performances were evaluated by receiver operating characteristic (ROC) curves, area under the curve (AUC) values, sensitivity, and specificity.

Results

Seventy-eight features were extracted and reduced to ten features for model development. These included two qCT radiomics signatures: (1) whole lung_reticulation (%) interstitial lung disease (ILD) texture analysis, (2) interstitial lung abnormality (ILA)_Num of lung zones≥5%_whole lung_ILA. Among 12 machine learning algorithms evaluated, the support vector machine (SVM) model demonstrated the best predictive performance, with AUCs of 0.836 (95%CI: 0.830–0.842) in the training cohort, 0.796 (95% CI: 0.777–0.816) in the internal validation cohort, and 0.797 (95% CI: 0.691–0.873) in the external validation cohort.

Conclusions

The integration of CT radiomics, clinical and laboratory variables using machine learning provides a robust tool for predicting pulmonary fibrosis progression in COVID-19 patients, facilitating early risk assessment and intervention.


作者介绍


瞿介明 主任医师,教授,博士生导师,上海交通大学医学院附属瑞金医院呼吸与危重症医学科,上海交通大学医学院呼吸病研究所所长,上海市呼吸传染病应急防控与诊治重点实验室主任,中华医学会呼吸病学会主任委员,中国医师协会呼吸医师分会候任会长;研究方向:肺部感染及新型治疗策略与技术。


周敏  主任医师,教授,上海交通大学医学院附属瑞金医院呼吸与危重症医学科,中华医学会呼吸病学分会工作秘书、呼吸治疗学组副组长,中国医师协会呼吸分会慢阻肺委员会委员、政策委员会副主委,上海医学会呼吸病分会委员,上海市科委学科带头人;研究方向:肺部感染、慢性气道疾病。


赵春柳  副主任医师,上海交通大学医学院附属瑞金医院卢湾分院呼吸与危重症医学科;研究方向:慢性气道疾病。


赵倩倩 博士研究生,上海交通大学医学院附属瑞金医院呼吸与危重症医学科;研究方向:肺部感染。


李依洁 硕士研究生,上海交通大学医学院附属瑞金医院呼吸与危重症医学科;研究方向:慢性肺部气道疾病和肺部感染。


【扫描二维码可下载原文】

Integrating CT radiomics and clinical features using machine learning to predict post-COVIDpulmonary fibrosis.pdf


本文内容来源自“瑞金医院图书馆”,原链接:瑞金新知速递 第1061期|周敏教授和瞿介明教授揭示利用机器学习整合CT放射学和临床特征预测新冠肺炎后肺纤维化


* 文章仅供医疗卫生相关从业者阅读参考


本文完

责编:Jerry

33