基于不同训练方法的2种人工智能系统在染色放大内镜下识别早期胃癌的能力比较

在线阅读 下载PDF 导出详情
摘要 摘要目的比较随机裁剪图片深度卷积神经网络识别模型(DCNN-C)和整张图片深度卷积神经网络识别模型(DCNN-W)2种基于不同训练方法的人工智能系统在染色放大内镜下辅助识别早期胃癌的能力。方法回顾性收集武汉大学人民医院内镜中心窄带成像和蓝激光成像2种染色放大内镜模式下的早期胃癌或非癌图片和视频片段,用于DCNN-C和DCNN-W的训练集和测试集。比较DCNN-C和DCNN-W在图片测试集中,以及DCNN-C、DCNN-W和3名高年资内镜医师(平均水平)在视频测试集中识别早期胃癌的能力。统计学方法采用配对卡方检验和卡方检验。观察者间的一致性以Cohen′s Kappa统计系数(Kappa值)表示。结果在图片测试集中,DCNN-C诊断早期胃癌的准确度、灵敏度、特异度、阳性预测值分别为94.97%(1 133/1 193)、97.12%(202/208)、94.52%(931/985)、78.91%(202/256),分别高于DCNN-W的86.84%(1 036/1 193)、92.79%(193/208)、85.58%(843/985)、57.61%(193/335),差异均有统计学意义(χ2=4.82、4.63、61.04、29.69,P=0.028、=0.035、<0.001、<0.001)。在视频测试集中,高年资内镜医师诊断早期胃癌的准确度、特异度和阳性预测值分别为67.67%、60.42%、53.37%,分别低于DCNN-C的93.00%、92.19%、87.18%,差异均有统计学意义(χ2=20.83、16.41、11.61,P<0.001、<0.001、=0.001);DCNN-C诊断早期胃癌的准确度、特异度和阳性预测值分别高于DCNN-W的79.00%、70.31%、64.15%,差异均有统计学意义(χ2=7.04、8.45、6.18,P=0.007、0.003、0.013);高年资内镜医师诊断早期胃癌的准确度、特异度、阳性预测值与DCNN-W比较差异均无统计学意义(均P>0.05);高年资内镜医师、DCNN-W和DCNN-C诊断早期胃癌的灵敏度分别为80.56%、94.44%、94.44%,差异均无统计学意义(均P>0.05)。一致性分析结果显示,高年资内镜医师与金标准的一致性一般至中等(Kappa值=0.259、0.532、0.329),DCNN-W与金标准的一致性中等(Kappa值=0.587),DCNN-C与金标准的一致性极高(Kappa值=0.851)。结论当训练集相同时,DCNN-C识别早期胃癌的能力优于DCNN-W和高年资内镜医师,DCNN-W与高年资内镜医师水平相当。
出处 《中华消化杂志》 2022年07期
出版日期 2022年12月13日(中国期刊网平台首次上网日期,不代表论文的发表时间)
  • 相关文献