本文只是记录个人阅读论文的感想与思考！难免存在错误！如若理解有误还请各位大佬指出！感谢！

论文一：3D MRI brain tumor segmentation using autoencoder regularization

Introduction

网络的结构是一个编码器与解码器的结构。

由于带标注的医学影像数据有限。添加了一个变分自编码器分支来重构输入图像本身（缓解了带标注数据不足的问题），起到规范共享解码器并对其层施加额外的约束作用。

此外变分自编码器分支只在训练期间使用，使用变分自编码器的动机是为编码器添加额外的指导和正则化。

方法（Method）

网络结构如下图所示

编码器部分：

编码器部分使用ResNet块，其中每一个块由两个带有组归一化和Relu激活函数的卷积组成。在编码器部分逐渐将图像的分辨率缩小，通道数增加。提取深层语义信息。此外为了避免在下采样过程中丢失过多的空间信息。在图像分辨率缩小为原来的1/8后不再进行缩小！

解码器部分：

每个解码器都会放大特征图，通道数减少为原来的1/2，然后与等效空间级别的编码器输出相加。在解码器的末端与原始图像具有相同的空间分辨率。然后使用1*1*1卷积成3个通道，再通过Sigmod激活函数得到最终的分割结果

VAE-变分自编码器部分：

从编码器端点的输出开始，将其减少到256的低维空间（给定均值和标准差分别为128和128）从具有给定的标准差和均值高斯分布的隐空间中抽取一个样本，并且以解码器相同的方式重构为输入图像尺寸。只是在这个分支中不再使用来自编码器的层间跳跃连接

Loss损失函数：

损失由三部分组成如下：

在这个损失函数中

第一项是输出预测和Groud Truth之间的Dice Loss。

第二项是变分自编码器的重构损失，其目的是为了使重构的图像和原始输入图像尽可能保持一致。

第三项是变分自编码器的正则化项，是估计正态分布和先验分布之间的KL散度。其目的是为了使使变分自编码器具有规则性的隐空间，这要更利于与变分自编码器重构出新的内容，从而缓解标注数据不足问题。

论文二：A Two-Stage Cascade Model with Variational
Autoencoders and Attention Gates for MRI
Brain Tumor Segmentation

Introduction

本文提出的网络框架基于两阶段的编码器-解码器分割结构，在网络结构的两个阶段都使用变分自编码器来重构原始输入数据来防止发生过拟合。

在第二阶段的网络结构中，网络在解码器分支中使用了注意力门，避免了解码器在等效空间级别的连接中得到冗余的不必要的信息。并且使用由第一阶段输出形成的扩展数据集进行额外的训练。

Method（方法）

方法概括

输入数据首先经过第一阶段网络进行处理，以获得一个相对粗略的分割结果。第二阶段网络使用来自第一阶段的初步分割图和原始MRI图像的串联作为其输入。第二阶段网络旨在改进NCR/NET（坏死和非增强肿瘤）和ET（增强肿瘤）子区域的预测。此外应用了AGs注意力门来进一步抑制不相关的背景区域。网络结构如下图

第一阶段网络：具有VAE分支的非对称U-Net

编码器部分：编码器由四个空间级别的ResNet块组成，块的数量分别为（1,2,2,4），每个ResNet块中都有两个带有组归一化和Relu的卷积，使用步长为2的3*3*3卷积进行下采样。

解码器部分：解码器具有和编码器对称的结构，每块的块数是1，使用三线性上采样恢复特征图尺寸，并且通过跳跃连接将其与同级别的编码器输出连接。使用1*1*1卷积将特征通道数从32减少到3.使用sigmod将其转换为分割概率图。

VAE分支：这个分支从编码器的输出重构原始图像，一开始使用全连接层将编码器端点输出降低到256维的低维空间，256代表高斯分布的128个均值和128个标准差。从中抽取大小128的样本，按照与解码器相同的策略重构输入图像。另外编码器和VAE之间没有跳跃连接

第二阶段网络：具有VAE分支注意力门控非对称U-Net

第二阶段网络的编码器与第一阶段的网络结构相同，只是在解码器分支上添加了AG（注意门控），来自于每个空间级别的较粗尺度的门控信号被传递到注意力门来确定注意力系数。

AG的输出是来自编码器的输入特征和注意系数的乘积，然后通过逐元素求和将每个级别的AG的输出与来自较粗尺度的2倍上采样特征相加。注意力门的内部结构示意图如下：

如图所示：较粗尺度的门控信号

中提取补充信息为了降低计算成本对输入特征

和门控信号

进行线性变换，变换后的输入特征和门控信号具有相同的空间形状。通过逐元素求和得到的总和送入Relu函数处理进行门控操作。然后是Sigmod函数和三线性上采样器以恢复注意系数矩阵的大小，以匹配输入特征的分辨率。AG的最终输出通过输入特征

和注意系数矩阵

的元素相乘得到。这一过程用公式表示为：

损失函数

网络的损失函数和论文一的损失函数一样，也是由预测结果和GroundTruth的DiceLoss；VAE的重构损失；VAE的正则项三部分加权组成。

参考：编码器与自编码器概念理解

脑肿瘤分割笔记：四&七--自编码器和变分自编码介绍&&具有变分自编码器正则化的U型分割结构

相关概念

自编码器（AE）

自编码器存在的问题

变分自编码器（VAE）

关于正则化的直观解释

论文一：3D MRI brain tumor segmentation using autoencoder regularization

Introduction