18F-FDG PET/CT影像组学融合特征结合XGBoost模型对乳腺癌HER2表达状态的预测价值

(整期优先)网络出版时间:2023-03-15
/ 1
摘要目的评估基于18F-FDG PET/CT图像的影像组学融合特征结合极端梯度提升(XGBoost)机器学习模型在乳腺癌人表皮生长因子受体2(HER2)表达状态预测中的价值。方法回顾性分析2012年1月至2019年12月于天津医科大学肿瘤医院行18F-FDG PET/CT检查的210例原发性乳腺癌患者[均为女性;年龄52(46,60)岁;HER2阳性95例,HER2阴性115例],采用Python 3.7.1软件从HER2阳性组及HER2阴性组分别随机抽取70%作为训练集[147例,其中HER2阳性67例,年龄52(46,60)岁;HER2阴性80例,年龄55(45,62)岁],30%作为测试集[63例,其中HER2阳性28例,年龄54(43,65)岁;HER2阴性35例,年龄52(45,61)岁]。在CT和PET图像上进行肿瘤分割后,分别提取CT、PET影像组学特征,经后处理获得PET/CT融合特征(包括PET/CT拼接特征和PET/CT平均特征)。建立支持向量机(SVM)模型和XGBoost机器学习模型,输入经特征筛选后保留的特征,用于预测乳腺癌原发灶中HER2的表达状态,并用ROC曲线对模型的预测效能进行评估。采用Delong检验分析不同模型及组学特征的预测效能,并绘制预测效能最高的机器学习模型的校准曲线。结果与SVM模型比较,XGBoost模型在输入CT特征、PET特征、PET/CT拼接特征和PET/CT平均特征时均有更佳的预测效能(z值:2.26~3.54, P值:0.016~0.040)。在XGBoost机器学习模型中,PET/CT平均特征预测乳腺癌HER2表达状态的ROC AUC为0.83(95% CI:0.73~0.93),优于CT特征[0.75(95% CI:0.63~0.88);z=3.57,P=0.027]、PET特征[0.73(95% CI:0.60~0.86);z=2.64,P=0.034]及PET/CT拼接特征[0.74(95% CI:0.60~0.87);z=2.49,P=0.037]。结论基于PET/CT影像组学融合特征建立的XGBoost机器学习模型有望用于乳腺癌患者HER2表达状态的预测。