transformer - 编程之家

我应该如何修改下面的代码以使其起作用： <s>目标，预测= pipe.fit_predict（df）</s> <h2>编辑：</h2

我正在使用faceface变压器模型进行<strong>文本摘要</strong>。目前，我正在测试不同的模型，例如<strong> T5

在培训时，据我从“注意就是你所需要的”文件中了解到的那样，在解码器中使用屏蔽自我注意的方式

我正在尝试对音乐数据集（以整数表示的音符）执行无监督聚类任务。在使用 k-means 对它们进行聚类之

我有一个基本的概念性疑问。当我在句子上训练 bert 模型时说： <pre><code>Train: "went to get loan from ban

我有一个层次模型，其中使用自我关注（来自Transformer）对句子中的每个单词进行编码，然后使用另一个

我正在尝试理解Transformer（<a href="https://github.com/SamLynnEvans/Transformer" rel="nofollow noreferrer">https://github.com/Sam

我正在使用变压器模型来预测外汇市场。我转换了公开价格数据并计算了每30分钟间隔之间的差额。并将

#jupyter笔记本我正在尝试使用<a href="https://colab.research.google.com/drive/1pTuQhug6Dhl9XalKB0zUGf4FIdYFlpcX#scrollT

我下载了经过预训练的文件格式google，并使用官方脚本<a href="https://github.com/huggingface/transformers/blob/master/

我在总结具有较大vocab尺寸的长文章时遇到了问题。许多模型都有最大输入大小的限制。因此，它不是

我想构建一个机器学习系统，可以就文学小说进行对话，您可以询问，回答或输入句子，然后回答。我

我试图了解<a href="https://github.com/NVIDIA/Megatron-LM#inverse-cloze-task-ict-pretraining" rel="nofollow noreferrer">MegatronLM</a

我使用XLM-RoBERTa令牌生成器来获取一堆句子的ID，例如： <pre><code>["loving is great", "This is another

我正在尝试使用神经网络来实现一些相对标准的语言模型，以更好地理解它们，并希望将来使它们适应

我使用了Transformer模型进行图像字幕，该模型将图像作为输入，然后进行了一些卷积层处理，然后将结果

我对这两个结构感到困惑。从理论上讲，它们的输出都与它们的输入相连。什么魔术使“自我关注机制

我有兴趣使用<a href="https://magenta.tensorflow.org/" rel="nofollow noreferrer">Magenta toolbox</a>的<a href="https://magenta.tens

我正在使用gpt-simple python库。我微调了355M GPT2型号，并且包含该型号的文件夹包含以下文件。 <pre><cod

我正在寻找MBART预训练的模型，并发现该模型发表在拥抱的脸上。 <a href="https://huggingface.co/facebook/mbart-lar