二进制分类的CNN模型

如何解决二进制分类的CNN模型

我们是数据科学（和编程）领域的新手，我们正在尝试为二进制分类（男性-女性）建立一个cnn模型。我们的准确度是0.97，但是验证准确度是0.56（我们认为存在过度拟合）。我们有4706张图片，其中70％用于训练，30％用于测试/验证。

model = Sequential()
model.add(Conv2D(128,(3,3),input_shape=x_data_np.shape[1:]))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2,2)))
model.add(Conv2D(64,3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2,2)))
model.add(Conv2D(32,2)))
model.add(Conv2D(16,2)))
model.add(Flatten())
model.add(Dense(64))
model.add(Dense(1))
model.add(Activation('sigmoid'))
model.compile(loss='binary_crossentropy',optimizer='adam',metrics=['accuracy'])

我们如何提高验证准确性？我们是否正确设置了模型参数？非常感谢。

解决方法

您似乎过度拟合。您的数据集非常小，并且您使用了太多的图层，没有丢包或批处理规范化。

我提出了四种补救方法：

1。使用 Dropout 图层

Dropout以一定的概率随机关闭神经元（通常值在0.1-0.4范围内）。这是减少过度拟合的好技术。

# The dropout probability should be tuned.
keras.layers.Dropout(0.3)

通常在网络的顶层（即后来的）添加降序层。丢失概率本身是可以调整的超参数。

2。执行数据扩充

数据增强是一种人为增加数据量的技术。它执行转换，例如移位，剪切，旋转和镜像。 Keras提供了ImageDataGenerator类来非常轻松地处理此问题。

将您的数据组织到训练，验证和测试目录中。每个目录必须包含两个类的子目录-男性和女性。

目录树如下所示（假设您正在对男性和女性进行二进制分类）：

.
├── test
│   ├── male
│   └── female
├── train
│   ├── male
│   └── female
└── validation
    ├── male
    └── female

然后初始化数据生成器以进行训练和测试，并根据需要将图像从0-255缩放到0-1范围。

# Performing data augmentation only on the training set.
train_datagen = keras.preprocessing.image.ImageDataGenerator(
    rescale=1./255
    # Performing data augmentation
    rotation_range=20,width_shift_range=0.1,height_shift_range=0.1,shear_range=10,horizontal_flip=True,# Horizontally flipped version is still an image of a person.
)
# Data generator for validation and testing.
test_datagen = keras.preprocessing.image.ImageDataGenerator(rescale=1./255)

然后从flow_from_directory方法中分批读取训练，验证和测试图像。

train = train_datagen.flow_from_directory('data/train',target_size=(128,128),batch_size=32)
validation = test_datagen.flow_from_directory('data/validation',batch_size=32)
test = test_datagen.flow_from_directory('data/test',batch_size=32)

执行完以上代码后，请确保它告诉您找到了正确数量的图像和正确数量的类。

然后您可以将train，validation和test批次直接传递到keras模型中的fit方法中。 确保在训练期间指定 steps_per_epoch 和 validation_steps 的数量。这是因为发电机永远持续运行生成图像，因此fit需要知道何时停止。出于相同的原因，请确保也为steps方法提供predict参数。

参考： Keras docs

3。使用提前停止

当验证准确性开始提高时，使回调停止。还要绘制学习曲线（训练图和验证损失图与历时图），以检查模型在哪里开始过拟合。

callback = keras.callbacks.EarlyStopping()

您可以将参数传递给回调。检查文档。

引用：Keras docs

将此回调与其他回调一起传递到列表中模型的fit方法中。

4。使用批量归一化

添加批处理归一化层也有助于减少过度拟合。

我将从在每个但最后一个 Activation 层之后添加 BatchNormalization 层开始。这将增强正则化，并有望提高验证准确性。

看起来您的模型过度拟合。考虑将正则化添加到模型中。尝试在Dense（64）层之后添加Dropout层，或在Dense层中添加l2正则化。如果这样做没有帮助，请尝试进行数据扩充。

此时，您可能应该通过调整超参数（最后一层的神经元数量，层数，内核大小，内核数等）来迭代地改进模型。

二进制分类的CNN模型

如何解决二进制分类的CNN模型

解决方法

相关推荐