二进制分类的CNN模型

如何解决二进制分类的CNN模型

我们是数据科学(和编程)领域的新手,我们正在尝试为二进制分类(男性-女性)建立一个cnn模型。我们的准确度是0.97,但是验证准确度是0.56(我们认为存在过度拟合)。我们有4706张图片,其中70%用于训练,30%用于测试/验证。

model = Sequential()
model.add(Conv2D(128,(3,3),input_shape=x_data_np.shape[1:]))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2,2)))
model.add(Conv2D(64,3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2,2)))
model.add(Conv2D(32,2)))
model.add(Conv2D(16,2)))
model.add(Flatten())
model.add(Dense(64))
model.add(Dense(1))
model.add(Activation('sigmoid'))
model.compile(loss='binary_crossentropy',optimizer='adam',metrics=['accuracy'])

我们如何提高验证准确性?我们是否正确设置了模型参数?非常感谢。

解决方法

您似乎过度拟合。您的数据集非常小,并且您使用了太多的图层,没有丢包或批处理规范化。

我提出了四种补救方法:

1。使用 Dropout 图层

Dropout以一定的概率随机关闭神经元(通常值在0.1-0.4范围内)。这是减少过度拟合的好技术。

# The dropout probability should be tuned.
keras.layers.Dropout(0.3)

通常在网络的顶层(即后来的)添加降序层。丢失概率本身是可以调整的超参数。

2。执行数据扩充

数据增强是一种人为增加数据量的技术。它执行转换,例如移位,剪切,旋转和镜像。 Keras提供了ImageDataGenerator类来非常轻松地处理此问题。

将您的数据组织到训练,验证和测试目录中。每个目录必须包含两个类的子目录-男性和女性。

目录树如下所示(假设您正在对男性和女性进行二进制分类):

.
├── test
│   ├── male
│   └── female
├── train
│   ├── male
│   └── female
└── validation
    ├── male
    └── female

然后初始化数据生成器以进行训练和测试,并根据需要将图像从0-255缩放到0-1范围。

# Performing data augmentation only on the training set.
train_datagen = keras.preprocessing.image.ImageDataGenerator(
    rescale=1./255
    # Performing data augmentation
    rotation_range=20,width_shift_range=0.1,height_shift_range=0.1,shear_range=10,horizontal_flip=True,# Horizontally flipped version is still an image of a person.
)
# Data generator for validation and testing.
test_datagen = keras.preprocessing.image.ImageDataGenerator(rescale=1./255)

然后从flow_from_directory方法中分批读取训练,验证和测试图像。

train = train_datagen.flow_from_directory('data/train',target_size=(128,128),batch_size=32)
validation = test_datagen.flow_from_directory('data/validation',batch_size=32)
test = test_datagen.flow_from_directory('data/test',batch_size=32)

执行完以上代码后,请确保它告诉您找到了正确数量的图像和正确数量的类。

然后您可以将trainvalidationtest批次直接传递到keras模型中的fit方法中。 确保在训练期间指定 steps_per_epoch validation_steps 的数量。这是因为发电机永远持续运行生成图像,因此fit需要知道何时停止。出于相同的原因,请确保也为steps方法提供predict参数。

参考: Keras docs

3。使用提前停止

当验证准确性开始提高时,使回调停止。还要绘制学习曲线(训练图和验证损失图与历时图),以检查模型在哪里开始过拟合。

callback = keras.callbacks.EarlyStopping()

您可以将参数传递给回调。检查文档。

引用:Keras docs

将此回调与其他回调一起传递到列表中模型的fit方法中。

4。使用批量归一化

添加批处理归一化层也有助于减少过度拟合。

,

我将从在每个但最后一个 Activation 层之后添加 BatchNormalization 层开始。这将增强正则化,并有望提高验证准确性。

,

看起来您的模型过度拟合。考虑将正则化添加到模型中。尝试在Dense(64)层之后添加Dropout层,或在Dense层中添加l2正则化。如果这样做没有帮助,请尝试进行数据扩充。

此时,您可能应该通过调整超参数(最后一层的神经元数量,层数,内核大小,内核数等)来迭代地改进模型。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


依赖报错 idea导入项目后依赖报错,解决方案:https://blog.csdn.net/weixin_42420249/article/details/81191861 依赖版本报错:更换其他版本 无法下载依赖可参考:https://blog.csdn.net/weixin_42628809/a
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下 2021-12-03 13:33:33.927 ERROR 7228 [ main] o.s.b.d.LoggingFailureAnalysisReporter : *************************** APPL
错误1:gradle项目控制台输出为乱码 # 解决方案:https://blog.csdn.net/weixin_43501566/article/details/112482302 # 在gradle-wrapper.properties 添加以下内容 org.gradle.jvmargs=-Df
错误还原:在查询的过程中,传入的workType为0时,该条件不起作用 <select id="xxx"> SELECT di.id, di.name, di.work_type, di.updated... <where> <if test=&qu
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct redisServer’没有名为‘server_cpulist’的成员 redisSetCpuAffinity(server.server_cpulist); ^ server.c: 在函数‘hasActiveC
解决方案1 1、改项目中.idea/workspace.xml配置文件,增加dynamic.classpath参数 2、搜索PropertiesComponent,添加如下 <property name="dynamic.classpath" value="tru
删除根组件app.vue中的默认代码后报错:Module Error (from ./node_modules/eslint-loader/index.js): 解决方案:关闭ESlint代码检测,在项目根目录创建vue.config.js,在文件中添加 module.exports = { lin
查看spark默认的python版本 [root@master day27]# pyspark /home/software/spark-2.3.4-bin-hadoop2.7/conf/spark-env.sh: line 2: /usr/local/hadoop/bin/hadoop: No s
使用本地python环境可以成功执行 import pandas as pd import matplotlib.pyplot as plt # 设置字体 plt.rcParams['font.sans-serif'] = ['SimHei'] # 能正确显示负号 p
错误1:Request method ‘DELETE‘ not supported 错误还原:controller层有一个接口,访问该接口时报错:Request method ‘DELETE‘ not supported 错误原因:没有接收到前端传入的参数,修改为如下 参考 错误2:cannot r
错误1:启动docker镜像时报错:Error response from daemon: driver failed programming external connectivity on endpoint quirky_allen 解决方法:重启docker -> systemctl r
错误1:private field ‘xxx‘ is never assigned 按Altʾnter快捷键,选择第2项 参考:https://blog.csdn.net/shi_hong_fei_hei/article/details/88814070 错误2:启动时报错,不能找到主启动类 #
报错如下,通过源不能下载,最后警告pip需升级版本 Requirement already satisfied: pip in c:\users\ychen\appdata\local\programs\python\python310\lib\site-packages (22.0.4) Coll
错误1:maven打包报错 错误还原:使用maven打包项目时报错如下 [ERROR] Failed to execute goal org.apache.maven.plugins:maven-resources-plugin:3.2.0:resources (default-resources)
错误1:服务调用时报错 服务消费者模块assess通过openFeign调用服务提供者模块hires 如下为服务提供者模块hires的控制层接口 @RestController @RequestMapping("/hires") public class FeignControl
错误1:运行项目后报如下错误 解决方案 报错2:Failed to execute goal org.apache.maven.plugins:maven-compiler-plugin:3.8.1:compile (default-compile) on project sb 解决方案:在pom.
参考 错误原因 过滤器或拦截器在生效时,redisTemplate还没有注入 解决方案:在注入容器时就生效 @Component //项目运行时就注入Spring容器 public class RedisBean { @Resource private RedisTemplate<String
使用vite构建项目报错 C:\Users\ychen\work>npm init @vitejs/app @vitejs/create-app is deprecated, use npm init vite instead C:\Users\ychen\AppData\Local\npm-