机器学习鉴别ⅠA期宫颈癌与高级别鳞状上皮内病变:基于MRI影像组学模型

(整期优先)网络出版时间:2021-06-25
/ 1
摘要目的利用宫颈MRI图像提取影像组学特征,建立随机森林模型识别ⅠA期宫颈癌与高级别鳞状上皮内病变(high-grade squamous intraepithelial lesion,HSIL)。材料与方法回顾性分析经手术病理证实的43例ⅠA期宫颈癌患者与51例HSIL患者,按照4∶1的比例设置训练集(ⅠA=34,HSIL=41)与测试集(ⅠA=9,HSIL=10)。收集其术前MRI图像,经预处理后上传至影像组学云平台,分别在OSag-T2WI、OAx-T1WI以及OAx-T2FS上逐层手动勾画宫颈,获得宫颈三维容积感兴趣区(volume of interest,VOI),提取组学特征。采用方差阈值分析法(Variance Threshold)、单变量特征选择法(SelectKBest)以及最小绝对值收缩和选择法(least absolute shrinkage and selection operator,LASSO)进行数据降维、特征选择。采用随机森林模型进行机器学习,绘制ROC曲线,分析不同序列组学模型的诊断效能。结果基于OSag-T2WI、OAx-T1WI、OAx-T2FS以及OSag-T2WI联合OAx-T2FS分别得到8个、10个、6个以及9个有效特征。以OSag-T2WI联合OAx-T2FS的组学特征值建立的随机森林模型诊断效能最高,AUC为0.89 [95% CI (0.74~1.00)];基于OAx-T1WI的模型诊断效能最低,AUC为0.51 [95% CI (0.23~0.78)]。结论基于MRI的影像组学随机森林模型可以较好地在没有明确病灶的情况下区分ⅠA期宫颈癌与HSIL,对于术前减少侵入性检查与指导术式有着重大的意义。