AI导航网

栏目导航

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

python – 在Keras中,为什么必须根据神经网络的输出计算损失函数？

时间：2022-09-05分类：Tensorflow作者：编程之家原文地址

首先,我从方法论的角度意识到为什么你的损失函数必须依赖于神经网络的输出.这个问题来自于我在尝试更好地理解Keras和Tensorflow时所做的实验.考虑以下：

input_1 = Input((5,))
hidden_a = Dense(2)(input_1)
output = Dense(1)(hidden_a)

m3 = Model(input_1, output)

def myLoss (y_true, y_pred):
    return K.sum(hidden_a)                    # (A)
    #return K.sum(hidden_a) + 0*K.sum(y_pred) # (B)

m3.compile(optimizer='adam', loss=myLoss)

x = np.random.random(size=(10,5))
y = np.random.random(size=(10,1))

m3.fit(x,y, epochs=25)

此代码导致：

ValueError: An operation has `None` for gradient. Please make sure that all of your ops have a gradient defined (i.e. are differentiable). Common ops without gradient: K.argmax, K.round, K.eval.

但是如果你将A行替换为B行,它就会运行,尽管事实上没有任何数字改变.

前一种情况似乎应该对我来说完全没问题.计算图很明确,一切都应该在损失方面是可区分的.但似乎Keras要求y_pred以某种方式处于损失函数中,无论它是否有任何影响.

谢谢！

事实证明这有点棘手.实际上,Keras不需要y_pred处于丢失函数中.但是,它需要在损失函数中引用所有可训练变量.

当您调用m3.fit()时,Keras将在您的损失函数和图层的可训练权重之间执行渐变计算.如果您的loss函数没有引用trainable_variables集合中的相同元素,则某些渐变计算操作将无法实现.

那怎么避免呢？好吧,即使没有做任何事情,你也可以参考y_pred.或者您可以冻结不会受优化程序影响的图层(因为您无论如何都不计算它们的损失)

所以在你的情况下,你只需要冻结你的输出层：

output = Dense(1, trainable = False)(hidden_a)

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 [email protected] 举报，一经查实，本站将立刻删除。

相关推荐

tensorflow预测单张mnist数据集图片 — 数字识别Predict single image for MNIST dataset by tensorflow - digital reco

MNIST数据集可以说是深度学习的入门，但是使用模型预测单张MNIST图片得到数字识别结果的文章不多，所以本人查找资料，把代码写下，希望可以帮到大家~1#BudingyourfirstimageclassificationmodelwithMNISTdataset2imp...

tensorflow环境的配置

1、新建tensorflow环境（1）打开anacondaprompt，输入命令行condacreate-ntensorflowpython=3.6注意：尽量不要更起名字，不然环境容易出错在选择是否安装时输入“y”（即为“yes”）。其中tensorflow为新建的虚拟环境...

张量tensor是什么

这篇文章主要介绍“张量tensor是什么”，在日常操作中，相信很多人在张量tensor是什么问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大...

tensorflow中model.fit()用法

tensorflow中model.fit()用法model.fit()方法用于执行训练过程model.fit(训练集的输入特征，训练集的标签，batch_size,#每一个batch的大小epochs,#迭代次数validation_data=(测试集的输入特征，

tensorflow如何使用gpu

https://blog.csdn.net/To_be_little/article/details/124438800 目录1、查看GPU的数量2、设置GPU加速3、单GPU模拟多GPU环境1、查看GPU的数量importtensorflowastf#查看gpu和cpu的数量gpus=tf.config.experimental....

tensorflow.js基本使用线性回归一

根据身高推测体重const$=require('jquery');consttf=require('@tensorflowfjs');consttfvis=require('@tensorflowfjs-vis');/*根据身高推测体重*///把数据处理成符合模型要求的格式fu...

tensorflow-条件循环控制5

#!/usr/bin/envpython2#-*-coding:utf-8-*-"""CreatedonThuSep610:16:372018@author:myhaspl@email:[email protected]二分法求解一元多次方程"""importtensorflowastfdeff(x):y=pow...

机器学习 - 开发环境安装pycharm + tensorflow集成篇

继续上篇的pyspark集成后，我们再来看看当今热的不得了的tensorflow是如何继承进pycharm环境的参考：http://blog.csdn.net/include1224/article/details/53452824思路其实很简单，说下要点吧1.python必须要3.564位...

怎么样在python 3 6里安装tensorflow

首先要下载python3.6:https://www.python.org/downloadselease/python-361/接着下载：numpy-1.13.0-cp36-none-win_amd64.whl 安装这两个：安装python3.6成功，接着安装numpy.接着安装tensorflow: 最后测试一下： ...

TensorFlow图像预处理完整样例

参考书《TensorFlow：实战Google深度学习框架》（第2版）以下TensorFlow程序完成了从图像片段截取，到图像大小调整再到图像翻转及色彩调整的整个图像预处理过程。#!/usr/bin/envpython#-*-coding:UTF-8-*-#coding=ut...

小编推荐

热门标签