论文标题:DeeplearningRadiomicsofshearwaveelastographysignifcantlyimproveddiagnosticperformancefor
assessingliverfbrosisinchronichepatitisB:aprospectivemulticentrestudy
期刊:GUT
影响因子:17.
发表日期:.05
一篇使用卷积神经网络CNN来对肝纤维化分级进行评估的论文,使用的网络是最基本的CNN分类网络。文章做了大量的对比实验,分析讨论部分非常详细,值得细读。
名词缩写:
LSM,Liverstiffnessmeasurement,肝硬度测定值
2D-SWE,two-dimensionalshearwaveelastography,二维剪切波弹性成像
ThedeeplearningRadiomicsofelastography,DLRE,作者提出的深度学习模型
cirrhosis(F4),肝硬化
advancedfbrosis(≥F3),重度肝纤维化
signifcancefbrosis(≥F2),中度肝纤维化
APRI,aspartatetransaminase-to-plateletratioindex,天冬氨酸转氨酶-血小板比值指数
FIB-4,fibrosisindexbasedonfourfactors
实验与方法
方法:deeplearningRadiomicsofelastography(DLRE)
对比方法:
2D-SWE(即使用2D-SWE的LSM)
APRI
FIB-4
数据:
.01-2.01间诊断为乙肝(chronichepatitisB,CHB)
12个临床中心
个病例,共计张2D-SWE
评估DLRE的整体诊断精度:
使用2/3的样本对神经网络进行训练,使用剩下1/3的样本进行测试。
所有入组病人依据ALT,BMI,和inflammationlevels分为不同的小组,DLRE和其他三种方法的精度在三个不同的任务上进行:1.区分F2;2.区分F3,;3.区分F4
评估不同训练样本对诊断精度的影响
在DLRE中,从训练集中每个病人获取1,3,5张图片来训练三个不同的模型
在2D-SWE中,相应地获取1,3,5个测量值来构建三个模型
对上述模型进行对比分析
评估DLRE的鲁棒性
从十二个临床中心中,随机挑选几个中心作为训练集,剩下的作为验证集(保证每次训练集包含大约2/3的总样本)。上述操作重复三次,从而获取三个不同的训练-验证集,通过这三个不同的训练-验证集来评估DLRE的鲁棒性。
结果
四种不同方法的诊断精度对比
在训练集上,DLRE在三个不同的分类任务上,AUC都显著高于其他三种方法
在验证集上,DLRE在区分F3和F4任务中的AUC显著优于其他三种方法;在区分F2任务中AUC显著优于APRI和FIB-4,但是与2D-SWE无显著区别
不同训练样本对诊断精度的影响
对2D-SWE来说,使用1,3,5个测量值,取得的结果无显著区别,无论是训练集还是验证集
对DLRE来说,使用的图片越多,AUC越高,但不一定有显著差异
对比2D-SWE和DLRE,在测试集上,当使用的图片/测量值为1时,两个模型性能相近;当使用的图片/测量值为3或者5时,DLRE性能优于2D-SWE(无显著区别)
DLRE的鲁棒性
三种不同的训练-验证集划分方法获取到的AUC相近,表明DLRE模型具有较好的鲁棒性
讨论
作者对比了使用DLRE,2D-SWE和生物标记物来评估慢性乙肝病人肝纤维化等级的精度。在评估肝硬化(F4)和重度肝纤维化病人(F3)时,DLRE效果最好,2D-SWE效果次之,生物标记物效果最差。在评估中度肝纤维化病人(F2)时,DLRE和2D-SWE效果相当,都优于生物标记物。
DLRE高度依赖于训练样本的量,使用5张图片训练的模型要优于使用1张和3张
DLRE在多中心的验证中,表现出了很强的鲁棒性
-Theend-
长按下图
转载请注明:http://www.twwak.com/jbzl/9497.html