如何解决神经网络猜不出 MNIST 数据集的数字
我用 Java 构建了自己的神经网络。
它的神经元层遵循这样的结构:784(inputs),200,80,10(outputs)
将 MNIST 训练数据输入 300 个批次的 100 张随机选择的图像后,每批次更新权重和偏差。学习率为 0.005。然而,网络似乎采用了每次都给出全零输出的策略。因为只是说
{0,0}
更接近于
{0,1,0}
比它尝试过的任何实际猜测策略。有时,它会尝试改变,但永远找不到比对所有事情都说零更有效的策略。
谁能告诉我如何解决这个问题?是否需要更多的训练数据?这是否意味着我写的反向传播函数有错误?
感谢您的任何建议!
解决方法
- 确保你的数据标签是整数编码的 确保最后的
-
Dense
层有10
个单元,带有softmax
激活函数。 - 使用
sparse_categorical_crossentropy
作为损失函数编译您的模型。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。