transformer - 编程之家

也许是个疯狂的问题：但我想下载 gpt-2 模型框架，但我想随机初始化权重。所以好像模型仍然需要在 red

我有一种机器翻译任务，我必须将英语句子翻译成 Hinglish 句子。我尝试通过在我的自定义数据集上对其

Spacy 'train' 命令使用命令行选项 --gpu 0，允许在使用 GPU 和不使用 GPU 进行训练之间进行“最后一分钟”选

我正在尝试使用 PyTorch-Transformers 从示例文本中生成一长串文本。为此，我正在关注 <a href="https://www.analyt

我正在使用与变压器在同一组中的形状。我想保存舞台，稍后再打开以再次操作它。恢复保存的阶

我对 BERT 语言模型很陌生。我目前正在使用 Huggingface 转换器库，但在对输入进行编码时遇到错误。该模

在使用 RoBERTa 架构训练 NER 任务后，我得到以下结果 <pre><code>{ 'eval_loss': 0.003242955543100834, 'e

我正在尝试在 XLNet 中做这样的事情，但我在文档中找不到这部分，任何帮助都会很有价值，谢谢！ <p

当我尝试 Huggingface 模型时，它给出了以下错误消息： <pre><code>from transformers import AutoTokenizer, AutoModel t

<pre><code>https://huggingface.co/models </code></pre> 例如，我想下载“bert-base-uncased”，但找不到“下载”链接。

我正在关注本教程以了解培训师 API。 <a href="https://huggingface.co/transformers/training.html" rel="nofollow noreferrer">h

我正在测试这段代码： <pre><code>from transformers import BertTokenizer, BertModel, BertForMaskedLM tokenizer = BertTokeniz

我正在 Huggingface 中测试 Bert 基础和 Bert 蒸馏模型，有 4 种速度场景，batch_size = 1： <pre><code>1) bert-base-

我正在使用预训练的 Vision Transformer 模型来训练一个新模型，其中输入是图像，输出是这些图像的预测价

我想要用于语言翻译 PyTorch 的光束搜索代码，我想将它与此链接中的示例代码一起使用。 <a href="htt

我对使用 Huggingface 的预训练模型进行命名实体识别 (NER) 任务感兴趣，而无需进一步训练或测试模型。</p

我有一个 <code>org.w3c.dom.Document</code> 格式的合法 XML（经验证没有特殊字符）。为此，我一直在尝试转换

我正在使用 <a href="https://huggingface.co/transformers/task_summary.html#named-entity-recognition" rel="nofollow noreferrer">token

我无法理解一件事，当它说“BERT 的微调”时，它实际上是什么意思： <ol> <li>我们是否使用新数据再

我正在研究表征学习的用例，在深入分析之后开始使用 graph2vec/doc2vec。我创建了带有 --dimensions 64 的训练