transformer - 编程之家

我有一个大小超过 7.02 GB 的文本文件。我已经基于这个文本文件构建了一个分词器： <pre><code>from token

我有一个大小 > 7.02 GB 的文本文件。我已经基于这个文本文件构建了一个标记器。我想像这样构建一个数

我有一个文本文件，要由转换器进行训练。我已经构建了我的标记器。 <pre><code>from transformers import Lin

深度页面转换器此页面转换器使用默认的滑动动画向左滑动页面，同时使用“深度”动画向右滑动

我不明白什么时候同时使用“fit”和“transform”，而什么时候只使用“transform”。以下转换器同时

如果单词是长距离单词和短距离单词，我可以使用转换器读取单词序列并输出吗？。将 2 个输出输入 VAE

我正在学习 Transformer。这是 <a href="https://pytorch.org/docs/stable/generated/torch.nn.MultiheadAttention.html#torch.nn.Multihe

我正在研究带有压缩转换器的对抗性自动编码器，用于音乐生成和插值。解码器的输入是一个由 8 个柱

Pytorch 实现的 MultiheadAttention，TransformerEncoder，Batch size 居中。即查询维度的 (L,N,E)。但是在Tensorflow的《

我目前正在尝试实现一个变压器，但无法理解其损耗计算。我的编码器输入查找 batch_size=1 和 max_se

<块引用> <em>不知道为什么最后一行显示tar为0，形状为(None, None)。<br/> 但是，最后的第二行显示 tar 的形

我试图通过谷歌实现视觉转换器，但在推理过程中遇到了这个错误： <pre><code>RuntimeError: Unimplemented: DN

我只想将 Bert 用于嵌入，并将 Bert 输出用作我将从头开始构建的分类网络的输入。我不确定是否要

在<a href="http://nlp.seas.harvard.edu/2018/04/03/attention.html" rel="nofollow noreferrer">"The Annotated Transformer"</a>中

我最近尝试通过将 <strong>K 均值聚类</strong>应用于自注意力模块来提高 Transformer 在机器翻译任务上的性

当我尝试简单地 <code>app.R</code> 时，我收到此错误：导入错误：无法从 'packaging' (C:\Users\miria\packagin

我正在使用 SQuaD 数据集进行答案跨度选择。使用 <code>BertTokenizer</code> 标记段落后，对于某些样本，答案

我遇到了嵌入问题：IndexError: index out of range in self 如下所示： <pre><code> y = self.ensemble(x, mask) File "

我正在尝试使用预训练的 Huggingface 的 BERT 作为特征提取器，让模型从句子中预测单词。模型是这样的

我正在处理多语言数据的词级分类任务，我正在使用 XLM-R，我知道 XLM-R 使用 <code>sentencepiece</code> 作为分