gradient-descent - 编程之家

所以这是一个很难问的问题，因为我没有代码示例。我有一个任务，其中相同的神经网络预测单个时间

我正在 pytorch 中构建一个具有多个网络的模型。例如，让我们考虑 <code>netA</code> 和 <code>netB</code>。在损

我正在尝试在 sklearn 中调整 <a href="https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.HistGradientBoostingRegr

我正在为使用英语->德语的翻译器开发 Tensorflow 模型编码器/解码器模式。编码器和解码器由子模型组成

我编写了一个简单的脚本来尝试使用 JAX 进行梯度累积。这个想法是将大批量（例如 64）分成适合 GPU 内

所以我正在尝试解决 Andrew Ng 的 ML Coursera 课程中的第一个编程练习。我在八度音阶中实现线性梯度下降

我尝试从头开始使用梯度下降实现逻辑回归。在绘制成本函数与否后进行梯度下降。迭代次数我发现在

我正在尝试在 PyTorch 中执行约束优化。具体来说，优化的张量 H 需要所有元素都为非负，并且其总和必

我无法运行我的 SGD 代码，我不知道问题出在哪里。如果你能帮助我，那就太好了。这是我的代码： <

我不确定关于更新学习率的部分，我想使用这个功能： <a href="https://i.stack.imgur.com/1dP8e.png" rel="nofollow nore

我的训练循环给了我以下警告： <块引用> 警告：tensorflow：在最小化损失时，变量 ['noise:0'] 不存在

我目前正在为游戏 Snake 实施带有线性函数逼近的 Q-Learning，但我似乎没有让它发挥作用：权重越来越大

我想知道为什么所有常见的激活函数都倾向于随着 x 增加（或者像 ReLU 一样保持平坦）。我没有遇到过

我有一个编码器模型和一个解码器模型 (RNN)。我想计算梯度并更新权重。到目前为止，我在网上看到的

我打算用 C++ 制作我自己的神经网络库，我正在通过其他人的代码来确保我在正确的轨道上......下面是一

我完成了 <a href="https://www.coursera.org/learn/machine-learning" rel="nofollow noreferrer">Andrew Ng's ML course</a>，只是

据我所知，为了计算简单线性回归的权重和偏差，它遵循梯度下降算法，该算法用于寻找成本函数（曲

我正在尝试在 R 中实现梯度下降，但我一直得到的 theta 值太大而无法适应该函数 <pre><code>batchGD <-fu

我正在尝试应用均方误差梯度下降解决方案来找到某些数据的指数最佳拟合方程。我的解决方案有一半

这是来自 <a href="https://github.com/MoritzTaylor/ddpg-pytorch/blob/master/ddpg.py" rel="nofollow noreferrer">https://github.com/Mori