论文解读一深度学习用于肝纤维化分级评

北京好白癜风专科医院 http://www.xftobacco.com/

论文标题:DeeplearningRadiomicsofshearwaveelastographysignifcantlyimproveddiagnosticperformancefor

assessingliverfbrosisinchronichepatitisB:aprospectivemulticentrestudy

期刊:GUT

影响因子:17.

发表日期:.05

一篇使用卷积神经网络CNN来对肝纤维化分级进行评估的论文,使用的网络是最基本的CNN分类网络。文章做了大量的对比实验,分析讨论部分非常详细,值得细读。

名词缩写:

LSM,Liverstiffnessmeasurement,肝硬度测定值

2D-SWE,two-dimensionalshearwaveelastography,二维剪切波弹性成像

ThedeeplearningRadiomicsofelastography,DLRE,作者提出的深度学习模型

cirrhosis(F4),肝硬化

advancedfbrosis(≥F3),重度肝纤维化

signifcancefbrosis(≥F2),中度肝纤维化

APRI,aspartatetransaminase-to-plateletratioindex,天冬氨酸转氨酶-血小板比值指数

FIB-4,fibrosisindexbasedonfourfactors

实验与方法

方法:deeplearningRadiomicsofelastography(DLRE)

对比方法:

2D-SWE(即使用2D-SWE的LSM)

APRI

FIB-4

数据:

.01-2.01间诊断为乙肝(chronichepatitisB,CHB)

12个临床中心

个病例,共计张2D-SWE

评估DLRE的整体诊断精度:

使用2/3的样本对神经网络进行训练,使用剩下1/3的样本进行测试。

所有入组病人依据ALT,BMI,和inflammationlevels分为不同的小组,DLRE和其他三种方法的精度在三个不同的任务上进行:1.区分F2;2.区分F3,;3.区分F4

评估不同训练样本对诊断精度的影响

在DLRE中,从训练集中每个病人获取1,3,5张图片来训练三个不同的模型

在2D-SWE中,相应地获取1,3,5个测量值来构建三个模型

对上述模型进行对比分析

评估DLRE的鲁棒性

从十二个临床中心中,随机挑选几个中心作为训练集,剩下的作为验证集(保证每次训练集包含大约2/3的总样本)。上述操作重复三次,从而获取三个不同的训练-验证集,通过这三个不同的训练-验证集来评估DLRE的鲁棒性。

结果

四种不同方法的诊断精度对比

在训练集上,DLRE在三个不同的分类任务上,AUC都显著高于其他三种方法

在验证集上,DLRE在区分F3和F4任务中的AUC显著优于其他三种方法;在区分F2任务中AUC显著优于APRI和FIB-4,但是与2D-SWE无显著区别

不同训练样本对诊断精度的影响

对2D-SWE来说,使用1,3,5个测量值,取得的结果无显著区别,无论是训练集还是验证集

对DLRE来说,使用的图片越多,AUC越高,但不一定有显著差异

对比2D-SWE和DLRE,在测试集上,当使用的图片/测量值为1时,两个模型性能相近;当使用的图片/测量值为3或者5时,DLRE性能优于2D-SWE(无显著区别)

DLRE的鲁棒性

三种不同的训练-验证集划分方法获取到的AUC相近,表明DLRE模型具有较好的鲁棒性

讨论

作者对比了使用DLRE,2D-SWE和生物标记物来评估慢性乙肝病人肝纤维化等级的精度。在评估肝硬化(F4)和重度肝纤维化病人(F3)时,DLRE效果最好,2D-SWE效果次之,生物标记物效果最差。在评估中度肝纤维化病人(F2)时,DLRE和2D-SWE效果相当,都优于生物标记物。

DLRE高度依赖于训练样本的量,使用5张图片训练的模型要优于使用1张和3张

DLRE在多中心的验证中,表现出了很强的鲁棒性

-Theend-

长按下图


转载请注明:http://www.twwak.com/jbzl/9497.html


  • 上一篇文章:
  • 下一篇文章: 没有了
  • 更多>>

    推荐文章

    • 没有推荐文章
    .