如何解决二进制分类的CNN模型
我们是数据科学(和编程)领域的新手,我们正在尝试为二进制分类(男性-女性)建立一个cnn模型。我们的准确度是0.97,但是验证准确度是0.56(我们认为存在过度拟合)。我们有4706张图片,其中70%用于训练,30%用于测试/验证。
model = Sequential()
model.add(Conv2D(128,(3,3),input_shape=x_data_np.shape[1:]))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2,2)))
model.add(Conv2D(64,3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2,2)))
model.add(Conv2D(32,2)))
model.add(Conv2D(16,2)))
model.add(Flatten())
model.add(Dense(64))
model.add(Dense(1))
model.add(Activation('sigmoid'))
model.compile(loss='binary_crossentropy',optimizer='adam',metrics=['accuracy'])
我们如何提高验证准确性?我们是否正确设置了模型参数?非常感谢。
解决方法
您似乎过度拟合。您的数据集非常小,并且您使用了太多的图层,没有丢包或批处理规范化。
我提出了四种补救方法:
1。使用 Dropout
图层
Dropout以一定的概率随机关闭神经元(通常值在0.1-0.4范围内)。这是减少过度拟合的好技术。
# The dropout probability should be tuned.
keras.layers.Dropout(0.3)
通常在网络的顶层(即后来的)添加降序层。丢失概率本身是可以调整的超参数。
2。执行数据扩充
数据增强是一种人为增加数据量的技术。它执行转换,例如移位,剪切,旋转和镜像。 Keras提供了ImageDataGenerator
类来非常轻松地处理此问题。
将您的数据组织到训练,验证和测试目录中。每个目录必须包含两个类的子目录-男性和女性。
目录树如下所示(假设您正在对男性和女性进行二进制分类):
. ├── test │ ├── male │ └── female ├── train │ ├── male │ └── female └── validation ├── male └── female
然后初始化数据生成器以进行训练和测试,并根据需要将图像从0-255缩放到0-1范围。
# Performing data augmentation only on the training set.
train_datagen = keras.preprocessing.image.ImageDataGenerator(
rescale=1./255
# Performing data augmentation
rotation_range=20,width_shift_range=0.1,height_shift_range=0.1,shear_range=10,horizontal_flip=True,# Horizontally flipped version is still an image of a person.
)
# Data generator for validation and testing.
test_datagen = keras.preprocessing.image.ImageDataGenerator(rescale=1./255)
然后从flow_from_directory
方法中分批读取训练,验证和测试图像。
train = train_datagen.flow_from_directory('data/train',target_size=(128,128),batch_size=32)
validation = test_datagen.flow_from_directory('data/validation',batch_size=32)
test = test_datagen.flow_from_directory('data/test',batch_size=32)
执行完以上代码后,请确保它告诉您找到了正确数量的图像和正确数量的类。
然后您可以将train
,validation
和test
批次直接传递到keras模型中的fit
方法中。 确保在训练期间指定 steps_per_epoch
和 validation_steps
的数量。这是因为发电机永远持续运行生成图像,因此fit
需要知道何时停止。出于相同的原因,请确保也为steps
方法提供predict
参数。
参考: Keras docs
3。使用提前停止
当验证准确性开始提高时,使回调停止。还要绘制学习曲线(训练图和验证损失图与历时图),以检查模型在哪里开始过拟合。
callback = keras.callbacks.EarlyStopping()
您可以将参数传递给回调。检查文档。
引用:Keras docs
将此回调与其他回调一起传递到列表中模型的fit
方法中。
4。使用批量归一化
添加批处理归一化层也有助于减少过度拟合。
,我将从在每个但最后一个 Activation 层之后添加 BatchNormalization 层开始。这将增强正则化,并有望提高验证准确性。
,看起来您的模型过度拟合。考虑将正则化添加到模型中。尝试在Dense(64)层之后添加Dropout层,或在Dense层中添加l2正则化。如果这样做没有帮助,请尝试进行数据扩充。
此时,您可能应该通过调整超参数(最后一层的神经元数量,层数,内核大小,内核数等)来迭代地改进模型。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。